从零开始学python人工智能课程_从零开始学人工智能(12)--Python · 决策树(零)· 简介...
原標題:從零開始學人工智能(12)--Python · 決策樹(零)· 簡介
感謝關注天善智能,走好數據之路↑↑↑
歡迎關注天善智能,我們是專注于商業智能BI,人工智能AI,大數據分析與挖掘領域的垂直社區,學習,問答、求職一站式搞定!
對商業智能BI、大數據分析挖掘、機器學習,python,R等數據領域感興趣的同學加微信:tstoutiao,邀請你進入數據愛好者交流群,數據愛好者們都在這兒。
決策樹是聽上去比較厲害且又相對簡單的算法,但在實現它的過程中可能會對編程本身有更深的理解、尤其是對遞歸的利用
我個人的習慣是先說明最終能干什么、然后再來說怎么實現,這樣也能避免一些不必要的信息篩選。所以,這一部分主要用于讓已經知道一定的基礎知識的童鞋知道最后能走多遠,如果是想從頭開始學的話可以無視這一章直接看第一章
1. ID3 和 C4.5(可以控制最大深度),CART 可能會在假期實現
2. 可視化;比如在比較著名的蘑菇數據集上的最終結果為(隨機 5000 個訓練):正確率 100%(大概挺正常的……)。其中,每個 Node 最后那個括號里面,箭頭前面是特征取值,箭頭后面或者是類別、或者是下一個選取的特征的維度
運用 cv2 的話可以畫出比較傳統的決策樹的可視化圖,效果大致如下:
其中紅色數字標注了該 Node 選擇了數據的哪個維度,綠色字母表示該 Node 所屬的類別,白色字母代表著對應數據維度特征的取值
比如說如果樣本的第 4 維(從 0 開始計數)是 a、l 的話就判為類別 e,是 c、f、m、p、s、y 的話就判為類別 p,是 n 的話就再看樣本的第 7 維、以此類推
3. 雖說我這個決策樹暫時不支持連續型特征,但相對應的它有一個好處:你不用把離散型數據處理成數值形式、而可以直接把它輸入模型來訓練。據我所知,scikit-learn 的 DecisionTreeClassifier 還不支持這一點(自豪臉)(然而人家比你快 1~2 倍返回搜狐,查看更多
責任編輯:
總結
以上是生活随笔為你收集整理的从零开始学python人工智能课程_从零开始学人工智能(12)--Python · 决策树(零)· 简介...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: xmldocument如何创建一个不带结
- 下一篇: 围成一圈的排列组合问题_约瑟夫问题