吴忠躺衫网络科技有限公司

您好,歡迎來電子發(fā)燒友網! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網>源碼下載>數值算法/人工智能>

海量嘈雜數據決策樹算法

大小:0.73 MB 人氣: 2018-01-13 需要積分:2

  針對當前決策樹算法較少考慮訓練集的嘈雜程度對模型的影響,以及傳統(tǒng)駐留內存算法處理海量數據困難的問題,提出一種基于Hadoop平臺的不確定概率C4.5算法-IP-C4.5算法。在訓練模型時,IP-C4.5算法認為用于建樹的訓練集是不可靠的,通過用基于不確定概率的信息增益率作為分裂屬性選擇標準,減小了訓練集的嘈雜性對模型的影響。在Hadoop平臺下,通過將IP-C4.5算法以文件分裂的方式進行MapReduce化程序設計,增強了處理海量數據的能力。與C4.5和完全信條樹(CCDT)算法的對比實驗結果表明,在訓練集數據是嘈雜的情況下,IP-C4.5算法的準確率相對更高,尤其當數據嘈雜度大于10%時,表現更加優(yōu)秀;并且基于Hadoop的并行化的IP-C4.5算法具有處理海量數據的能力。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關規(guī)定!

      ?
      姚记娱乐城安全| 大发888 漏洞| 最新百家乐官网电脑游戏机| 大发888使用条款| 御金百家乐官网娱乐城| 盈乐博| 百家乐断缆赢钱| 庄闲和百家乐桌布| 百家乐发牌的介绍| 百家乐官网陷阱| 大发888官方 df888gfxzylc8| 百家乐在线小游戏| 百家乐官网赌博娱乐城大全| 瑞昌市| 百家乐网上最好网站| 百家乐官网娱乐网备用网址| 鸿利国际娱乐城| bet365娱乐场下载| 大发888娱乐城出纳| 百家乐官网博弈之赢者理论坛| 百家乐官网赢新全讯网| 大发888新网址| 太阳城御园| 沙龙百家乐娱乐| 任我赢百家乐软件中国有限公司| 百家乐官网定位胆技巧| 百家乐官网娱乐官网| 武汉百家乐官网庄闲和| 足球百家乐官网投注| 百家乐官网赢钱公式冯耕| 肇源县| 明升88| 娱乐城豪享博主推| 17pk棋牌游戏| 德州扑克外挂| 博彩公司排名| 皇冠国际| 足球赌球规则| 两当县| 美国百家乐官网怎么玩| 六合彩报码聊天室|