数据挖掘领域十大经典算法初探
生活随笔
收集整理的這篇文章主要介紹了
数据挖掘领域十大经典算法初探
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
博主說明:
1、原文獻非最新文章,只是本人向來對算法比較敏感、感興趣,便把原文細看了下,
翻譯過程中,有參考一些網友翻譯的文章,但個人認為,闡述皆不夠精準,且都是泛泛而談,
故此,做了此份翻譯,希望,為讀者提供一個較權威而詳細的文檔資料。
2、同時,也可于閑余之際擇其一二好好研究、剖析下此數據挖掘領域的十大經典算法。
文中,添加了一些個人自己的理解,請自行辨明。
---------------------------------------------------------------------
1、原文獻非最新文章,只是本人向來對算法比較敏感、感興趣,便把原文細看了下,
翻譯過程中,有參考一些網友翻譯的文章,但個人認為,闡述皆不夠精準,且都是泛泛而談,
故此,做了此份翻譯,希望,為讀者提供一個較權威而詳細的文檔資料。
2、同時,也可于閑余之際擇其一二好好研究、剖析下此數據挖掘領域的十大經典算法。
文中,添加了一些個人自己的理解,請自行辨明。
---------------------------------------------------------------------
以下就是從參加評選的18種候選算法中,最終決選出來的十大經典算法:
一、C4.5
C4.5,是機器學習算法中的一個分類決策樹算法,
它是決策樹(決策樹也就是做決策的節點間的組織方式像一棵樹,其實是一個倒樹)核心算法
ID3的改進算法,所以基本上了解了一半決策樹構造方法就能構造它。
決策樹構造方法其實就是每次選擇一個好的特征以及分裂點作為當前節點的分類條件。
C4.5相比于ID3改進的地方有:
1、用信息增益率來選擇屬性。
ID3選擇屬性用的是子樹的信息增益,這里可以用很多方法來定義信息,ID3使用的是熵(entropy,熵是一種不純度度量準則),
也就是熵的變化值.
而
總結
以上是生活随笔為你收集整理的数据挖掘领域十大经典算法初探的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 随机样本选择——快速求解机器学习中的优化
- 下一篇: Meanshift解析