文章詳情頁(yè)
mysql - 5千萬(wàn)文章,怎么做相關(guān)文章?
瀏覽:140日期:2022-06-12 18:04:51
問題描述
現(xiàn)在我是按標(biāo)題分詞,每個(gè)標(biāo)題3個(gè)詞單獨(dú)建了個(gè)tags表,用來(lái)存放分的詞,每個(gè)詞一條記錄,讀取相關(guān)文章是隨機(jī)讀一條tag,之后查找tags表相同tag,以前數(shù)據(jù)少的時(shí)候還可以,現(xiàn)在tags表里1億多條數(shù)據(jù)了,讀起來(lái)超級(jí)慢tags表只有2個(gè)字段,一個(gè)文章id,分詞,都做了索引,之后分區(qū)。請(qǐng)問還有其他方法做相關(guān)文章的么?現(xiàn)在每天新增數(shù)據(jù)5W+++
問題解答
回答1:相關(guān)性的衡量,應(yīng)該有好幾個(gè)維度:1,文章所屬板塊,比如娛樂2,文章中心思想或者主題是啥,要提取出來(lái)3,時(shí)間和主要對(duì)象(人物、事件)相關(guān)
一篇文章可能有多個(gè)主體對(duì)象,可能跨板塊進(jìn)行關(guān)聯(lián)
排行榜

熱門標(biāo)簽