Random Forest 实用经验(转)
生活随笔
收集整理的這篇文章主要介紹了
Random Forest 实用经验(转)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
總結兩條關于random forest的實用經驗。給定數據和問題,對于算法選擇有參考價值。
小樣本情況下(1k~100k): RF相對與經典算法(SVM or Boosting)沒優勢,一般來說效果更差
大樣本情況下(1M+): 這時候其他算法基本上跑不動了。RF憑借著快速的 training 和 testing,成為唯一能夠實際操作的算法。 這也從一個側面證明了工業界的哲學:數據第一,算法第二
如何針對不同問題,設計使用RF的方法,從而能夠產生海量數據,是一門藝術
2. RF 與 KNN有相似的效果
RF 和 KNN 都可以看成對空間劈分的算法。RF 對空間的劈分是預計算的(在training過程中確定);而 KNN則是根據 testing sample adaptively劈分空間的。可以將RF視為KNN的一種快速算法。
KNN做不好的問題,RF也做不好
轉自于
https://www.douban.com/note/212245564/
關于Knn和Random Forests的感覺
http://kkx.github.io/
總結
以上是生活随笔為你收集整理的Random Forest 实用经验(转)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 子网掩码是4个255代表什么?
- 下一篇: 缓冲区溢出原理及防御(转)