吴忠躺衫网络科技有限公司

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于Hadoop平臺的LDA算法的并行化實現(xiàn)

大小:0.88 MB 人氣: 2017-12-05 需要積分:3

  隨著互聯(lián)網(wǎng)的飛速發(fā)展,需要處理的數(shù)據(jù)量不斷增加,在互聯(lián)網(wǎng)數(shù)據(jù)挖掘領(lǐng)域中傳統(tǒng)的單機文本聚類算法無法滿足海量數(shù)據(jù)處理的要求,針對在單機情況下,傳統(tǒng)LDA算法無法分析處理大規(guī)模語料集的問題,提出基于MapReduce計算框架,采用Gibbs抽樣方法的并行化LDA主題模型的建立方法。利用分布式計算框架MapReduce研究了LDA主題模型的并行化實現(xiàn),并且考察了該并行計算程序的計算性能。通過對Hadoop并行計算與單機計算進行實驗對比,發(fā)現(xiàn)該方法在處理大規(guī)模語料時,能夠較大地提升算法的運行速度,并且隨著集群節(jié)點數(shù)的增加,在加速比方面也有較好的表現(xiàn)。基于Hadoop平臺并行化地實現(xiàn)LDA算法具有可行性,解決了單機無法分析大規(guī)模語料集中潛藏主題信息的問題。

基于Hadoop平臺的LDA算法的并行化實現(xiàn)

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?
      百家乐官网的最佳玩| 伟博娱乐| 玩百家乐官网去哪个平台好| 百家乐庄闲局部失衡| 维也纳娱乐城| 网上赌百家乐的玩法技巧和规则 | 澳门百家乐经| 属鼠跟属虎做生意| 澳门百家乐官网网站bt| 太阳城招聘| 百家乐开户送10彩金| 百家乐官网真钱棋牌| 百家乐路子分| 百家乐官网赌博游戏平台| 女神娱乐城| 威尼斯人娱乐信誉| 调兵山市| 顶级赌场 官方直营网| 百家乐官网图形的秘密破解| 大发888无数| 广汉市| 百家乐必赢术| 金宝博百家乐游戏| 网络百家乐官网公式打法| 澳门网上| 索罗门百家乐的玩法技巧和规则| 永利百家乐官网现金网| 青岛人家棋牌室| 百家乐博娱乐网赌百家乐的玩法技巧和规则 | 大发888扑克| 哪个百家乐网站最大| 现场百家乐官网的玩法技巧和规则 | 百家乐官网桌码合| 巴登娱乐城开户| 德州扑克过牌| 百家乐种类| 芝加哥百家乐的玩法技巧和规则| 百家乐官网网站赌博| 百家乐官网的规则博彩正网| 必博百家乐官网游戏| 百家乐官网投资心得|