python决策树运用
生活随笔
收集整理的這篇文章主要介紹了
python决策树运用
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
什么是決策樹?
決策樹算法是一種逼近離散函數值的方法。它是一種典型的分類方法,首先對數據進行處理,利用歸納算法生成可讀的規則和決策樹,然后使用決策對新數據進行分析。本質上決策樹是通過一系列規則對數據進行分類的過程。
決策樹方法最早產生于上世紀60年代,到70年代末。由J Ross Quinlan提出了ID3算法,此算法的目的在于減少樹的深度。但是忽略了葉子數目的研究。C4.5算法在ID3算法的基礎上進行了改進,對于預測變量的缺值處理、剪枝技術、派生規則等方面作了較大改進,既適合于分類問題,又適合于回歸問題。
決策樹的目的(個人理解)
算出每一種情況發生的概率,從而進行最后的預測
里面涉及了一些優化方法
決策樹相關算法
ID3:
ID3算法由Ross Quinlan發明,建立在“奧卡姆剃刀”的基礎上:越是小型的決策樹越優于大的決策樹(be simple簡單理論)。ID3算法中根據信息增益評估和選擇特征,每次選擇信息增益最大的特征作為判斷模塊建立子結點。
C4.5:
C4.5算法用信息增益率來選擇屬性,繼承了ID3算法的優點。
決策樹的實際運用
數據:
代碼:
運行結果:
結果中的value是最終結果的類別
entropy是權值
samples是其夫節點判斷結果的樣本數
每一個框的第一個值是我們對數據處理后的一個判斷。(就像判斷一個人的年齡<30,如果是就根據指示跳到下一層,依次類推)
逐層判斷,最終得到預測值
總結
以上是生活随笔為你收集整理的python决策树运用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: uiautomatorViewer无法获
- 下一篇: js 鼠标右键事件