現在我是按標題分詞,每個標題3個字單獨建了個tags表,用來存放分的詞,每個詞一條記錄,讀取相關文章是隨機讀一條tag,之後查找tags表相同tag,以前數據少的時候還可以,現在tags表裡1億多條數據了,讀起來超級慢tags表只有2個字段,一個文章id,分詞,都做了索引,之後分區。 請問還有其他方法做相關文章的麼?現在每天新增資料5W
相關性的衡量,應該有好幾個維度:1,文章所屬板塊,例如娛樂2,文章中心思想或主題是啥,要提取出來3,時間和主要對象(人物、事件)相關
一篇文章可能有多個主體對象,可能跨板塊進行關聯
相關性的衡量,應該有好幾個維度:
1,文章所屬板塊,例如娛樂
2,文章中心思想或主題是啥,要提取出來
3,時間和主要對象(人物、事件)相關
一篇文章可能有多個主體對象,可能跨板塊進行關聯