吴忠躺衫网络科技有限公司

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

TF-IDF算法的改進及在語義檢索中應用

大小:0.78 MB 人氣: 2018-01-02 需要積分:3

 針對傳統(tǒng)的TF-IDF算法、K-means算法、自適應遺傳算法在網(wǎng)絡檢索結果中含有大量不相關數(shù)據(jù)、語義檢索準確性不高的問題,研究了TF-IDF算法的改進及其在語義檢索中的應用。將正則表達式和語義分析技術相結合,從而實現(xiàn)對TF-IDF算法的改進。利用語義庫對搜索主題進行描述,根據(jù)正則原予語義的重要性和在網(wǎng)頁標簽中的不同位置進行加權計算,得到正則原子在文檔中的相似度。通過空間向量模型對文檔相似度和主題模型進行余弦運算,從而獲取最終的搜索結果。最后,將改進的TF-IDF算法、傳統(tǒng)的TF-IDF算法、K-means算法和自適應遺傳算法運用于聚焦主題網(wǎng)絡爬蟲中,對其檢索結果進行了對比分析。計算結果表明,在聚焦主題網(wǎng)絡爬蟲語義分析的垂直搜索中,改進TF-IDF算法的相似度準確率比傳統(tǒng)的TF-IDF算法檢索準確率提高了17.1個百分點,遺漏率降低了7.76個百分點;比K-means算法檢索準確率提高6個百分點;比自適應遺傳算法檢索準確率提高了8.1個百分點。總之,改進的TF-IDF算法可以有效地提高文檔相似度檢測的準確率,很好地改善聚焦主題網(wǎng)絡爬蟲在語義分析中的缺陷。

TF-IDF算法的改進及在語義檢索中應用

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關規(guī)定!

      ?
      尊龙百家乐娱乐| 百家乐平台要多少钱| 南江县| 红9百家乐的玩法技巧和规则 | 金濠娱乐城| CEO百家乐的玩法技巧和规则| 百家乐官网园云鼎娱乐平台| 博狗开户| 立博百家乐的玩法技巧和规则| 百家乐官网麻将筹码币镭射贴膜| 赙彩百家乐官网游戏规则| 大发888娱乐场下载zhidu| 百家乐出老千视频| 百家乐官网园选| 太阳城百家乐官网怎样开户| 娱乐城网址| 百家乐牡丹娱乐城| 百家乐最新首存优惠| 百家乐官网永利娱乐网| 百家乐官网大赢家小说| 瑞丰备用网址| bet365会员注册| 威尼斯人娱乐城打造| 百家乐赢钱战略| 永利百家乐官网的玩法技巧和规则 | 联众百家乐的玩法技巧和规则| 最好的百家乐投注| 百家乐破解之法| 百家乐官网出千桌| 南京百家乐官网的玩法技巧和规则| 澳门百家乐官网路子分析| 澳门百家乐游戏官网| 如何看百家乐的玩法技巧和规则| 百家乐桌颜色可定制| 百家乐开户优惠多的平台是哪家| 百家乐必胜下注法| 百家乐破解版下载| 百家乐折叠桌| 百家乐pc| 全讯网77| 大发888游戏平台 df888ylcxz46|