久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

mysql - 5千萬(wàn)文章,怎么做相關(guān)文章?

瀏覽:140日期:2022-06-12 18:04:51

問題描述

現(xiàn)在我是按標(biāo)題分詞,每個(gè)標(biāo)題3個(gè)詞單獨(dú)建了個(gè)tags表,用來(lái)存放分的詞,每個(gè)詞一條記錄,讀取相關(guān)文章是隨機(jī)讀一條tag,之后查找tags表相同tag,以前數(shù)據(jù)少的時(shí)候還可以,現(xiàn)在tags表里1億多條數(shù)據(jù)了,讀起來(lái)超級(jí)慢tags表只有2個(gè)字段,一個(gè)文章id,分詞,都做了索引,之后分區(qū)。請(qǐng)問還有其他方法做相關(guān)文章的么?現(xiàn)在每天新增數(shù)據(jù)5W+++

問題解答

回答1:

相關(guān)性的衡量,應(yīng)該有好幾個(gè)維度:1,文章所屬板塊,比如娛樂2,文章中心思想或者主題是啥,要提取出來(lái)3,時(shí)間和主要對(duì)象(人物、事件)相關(guān)

一篇文章可能有多個(gè)主體對(duì)象,可能跨板塊進(jìn)行關(guān)聯(lián)

主站蜘蛛池模板: 乌拉特前旗| 天津市| 乡城县| 武定县| 上栗县| 汶川县| 沙雅县| 渝中区| 铜川市| 施甸县| 武汉市| 白山市| 巩留县| 禄丰县| 涟水县| 沙田区| 和静县| 沂水县| 东光县| 丰顺县| 乐亭县| 泰州市| 中方县| 玉门市| 平陆县| 二连浩特市| 孟连| 伊春市| 漯河市| 珠海市| 岳池县| 宜川县| 泸西县| 永德县| 普安县| 常德市| 苏尼特左旗| 元朗区| 高唐县| 屯门区| 万山特区|