参考:/a/1190000002497183
需求跟这个是类似的 要求是能全文检索(当然是中文全文) 放进去什么就能原样拿出来什么
现在的问题是 lucene也可以在索引的时候保持原字段内容
那么综合
*性能(不超过200次/s查询)、
*更新(希望数据更新后立刻能反映出来,但是检索可以延迟)、
*数据量(小于千万级,每条数据不会上M)
*扩展性(多源、每个源的格式、字段不太一样)
的考虑,需不需要把这个原始的数据存到数据库里 然后lucene只留一个主键,还是直接从lucene还原原始数据更好呢
以前做过类似项目是在mongo里存原始内容 没太考虑过这些
建议参考下elasticsearch的实现
我只用过solr,不过感觉思路应该是只用lucene作索引,存储还是放在mogondb上面就行了,每次查询的时候先查询lucene,在根据主键从mongodb里面取数据