18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

輿情去重算法的研究

大?。?/span>0.69 MB 人氣: 2017-11-03 需要積分:0

  近年來,輿情信息在大數(shù)據(jù)服務(wù)中廣泛被加工使用,但轉(zhuǎn)載、復(fù)制等操作使得采集的輿情信息重復(fù)量龐大,給后期的加工帶來困難。在這種情況下,針對輿情數(shù)據(jù)開展去重研究的卻相對較少。文中針對輿情去重不可避免但缺乏理論指導(dǎo)的問題,通過研究SimHash、MinHash、Jaccard等經(jīng)典去重算法,結(jié)合TF、TF-IDF、特征碼等不同特征選擇和3 000輿情樣本進(jìn)行實驗,最終發(fā)現(xiàn)MinHash+特征碼運(yùn)行時間最短;Jaccard的漏判數(shù)最少,召回率可達(dá)90%以上;MinHash算法的誤判數(shù)最少,去重精度可達(dá)100%,并且MinHash通過閾值的調(diào)整能夠獲得Jaccard同樣的召回率。

輿情去重算法的研究

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?