RIPPER算法原理
生活随笔
收集整理的這篇文章主要介紹了
RIPPER算法原理
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
在眾多分類算法中,決策樹作為一種基于有監督學習的層次模型被大量使用,其有一種其他算法難以比擬的優點:可解釋性強——通過將學習到的決策樹可以很輕易的轉換成“如果…那么”形式的規則。但決策樹規則的建立依賴于樹的生成,樹的建立過程是對整個空間的遞歸劃分、建立局部模型的過程,往往比較耗時,那么有沒有方法可以跳過這一過程呢?答案就是規則歸納算法。不同于樹歸納,其不需要建立搜索樹而是采用深度優先搜索策略直接從數據集生成規則且每次生成一條,在構造規則的過程中利用了決策樹的特點,通過諸如比較每個屬性的信息增益不斷貪心地添加規則前件,并且在每條規則的建立過程中使用后剪枝對規則進行裁剪,每條規則逐次生成然后加入到規則庫中直到無法再添加更多規則。為了盡可能減少過擬合現象,在規則加入到規則庫以后一樣有剪枝步,這使得歸納算法有較好的過擬合現象。規則歸納算法的一個例子是RIPPER算法,其從一系列算法的基礎上發展而來,與傳統決策樹算法如C4.5相比,其算法效率大大提升,而正確率相差不大。 先從一個很基礎的規則算法REP說起,REP的意思是Reduced Error Pruning,意即減少錯誤剪枝,其把訓練集分成獨立的生長集和剪枝集,在生長集上貪心地產生規則并在剪枝集上不斷被簡化直到規則的準確性下降。作為一個很基礎的算法其滿足規則歸納的各個要件,描繪了RIPPER算法大體框架。然后是在REP算法上發展起來的IREP,其最主要的改變是使用了先剪枝與后剪枝結合的辦法。接下來是IREP*算法,相比于IREP,其引入了最小描述長度用于判斷停止條件,并且在剪枝時使用了新的度量標準1。而RIPPER算法則是在IREP*的基礎上加入了優化階段,其產生在IREP*產生的規則上進一步調整后的結果。 首先從最簡單的二分類問題開始介紹RIPPER,先明確下若干概念:
<
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀
總結
以上是生活随笔為你收集整理的RIPPER算法原理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用PCA对特征数据进行降维
- 下一篇: 人工智能各种技术与算法