18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶(hù)?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

決策樹(shù)C4.5算法屬性取值優(yōu)化研究

大?。?/span>0.36 MB 人氣: 2017-12-12 需要積分:1

  決策樹(shù)算法是一種最簡(jiǎn)單、最直接、最有效的文本分類(lèi)算法。最早的決策樹(shù)算法是ID3算法,于1986年由Quinlan提出,該算法是一種基于信息熵的決策樹(shù)分類(lèi)算法。由于該算法是以信息熵作為屬性選擇的標(biāo)準(zhǔn),偏向于選擇屬性取值較多的屬性,而屬性取值較多的屬性往往分類(lèi)的貢獻(xiàn)不大。因此,于1993年Quinlan在ID3算法的基礎(chǔ)上又提出了一種改進(jìn)算法,即C4.5算法。該算法采用信息增益率作為屬性選擇的標(biāo)準(zhǔn),繼承了ID3算法的所有優(yōu)點(diǎn),克服了ID3算法中偏向于選擇屬性取值較多的屬性作為測(cè)試屬性的不足,同時(shí)還能對(duì)連續(xù)屬性與未知屬性進(jìn)行處理,在剪枝方面也有很大的改進(jìn)。

  C4.5算法作為經(jīng)典的決策樹(shù)分類(lèi)算法,己被廣泛的應(yīng)用到各個(gè)領(lǐng)域。但其仍然存在以下不足之處:1)在計(jì)算信息增益的過(guò)程中(包括:分類(lèi)所需信息量、信息熵、分割信息量)涉及的復(fù)雜的對(duì)數(shù)運(yùn)算,計(jì)算機(jī)每一次計(jì)算都需要調(diào)用庫(kù)函數(shù),增大了生成決策樹(shù)所需的時(shí)間開(kāi)銷(xiāo);2)生成決策樹(shù)中分支數(shù)量過(guò)多,部分分支還能進(jìn)行合并,進(jìn)一步精簡(jiǎn)生成決策樹(shù)的結(jié)構(gòu)。

  本文針對(duì)生成決策樹(shù)分支數(shù)量過(guò)多的不足,提出了一種新的屬性取值優(yōu)化方法,并用實(shí)例分析驗(yàn)證了該方法的有效性。
?

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶(hù)評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?