84669 人が学習中
152542 人が学習中
20005 人が学習中
5487 人が学習中
7821 人が学習中
359900 人が学習中
3350 人が学習中
180660 人が学習中
48569 人が学習中
18603 人が学習中
40936 人が学習中
1549 人が学習中
1183 人が学習中
32909 人が学習中
在一个txt文档中有2000w行数据,数据的格式如下行尸走肉_Mother金蝉脱壳_Smile霸王别姬_Love逍遥法外_Eternity.......八仙过海_Destiny
请问如何快速检索出成语或者英文单词,麻烦请给我算法,谢谢大牛们
光阴似箭催人老,日月如移越少年。
你的目的到底是要确定某个成语/英文存在不存在还是要计算这个成语/单词出现的次数?我以为不论什么方法,最大的可能性就是把全文都要过一遍。如果你这个检索的频率很高,这2000万个数据放到内存中再索引存储下会最快,如果只运行一次,那么最快的时间就是把文件都读一遍的时间(计算出现次数)。
搭一个 solr,创建索引,这样搜索效率提升很大
你的目的到底是要确定某个成语/英文存在不存在还是要计算这个成语/单词出现的次数?
我以为不论什么方法,最大的可能性就是把全文都要过一遍。如果你这个检索的频率很高,这2000万个数据放到内存中再索引存储下会最快,如果只运行一次,那么最快的时间就是把文件都读一遍的时间(计算出现次数)。
搭一个 solr,创建索引,这样搜索效率提升很大