參考:/a/1190000002497183
需求跟這個是類似的要求是能全文檢索(當然是中文全文) 放進去什麼就能原樣拿出來什麼
現在的問題是lucene也可以在索引的時候保持原字段內容
那麼綜合
*性能(不超過200次/s查詢)、
*更新(希望資料更新後立刻能反映出來,但是檢索可以延遲)、
*資料量(小於千萬級,每條資料不會上M)
*擴展性(多來源、每個來源的格式、欄位不太一樣)
的考慮,需不需要把這個原始的資料存到資料庫裡然後lucene只留一個主鍵,還是直接從lucene還原原始資料比較好呢
以前做過類似專案是在mongo裡存原始內容沒太考慮過這些
建議參考下elasticsearch的實作
我只用過solr,不過感覺思路應該是只用lucene作索引,存儲還是放在mogondb上面就行了,每次查詢的時候先查詢lucene,在根據主鍵從mongodb裡面取數據