kaggle上面的score以及ROC_AUC数值咋回事
生活随笔
收集整理的這篇文章主要介紹了
kaggle上面的score以及ROC_AUC数值咋回事
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
TP:真的傳染病患者被檢測為傳染病患者
FP:假的傳染病患者被檢測為傳染病患者
?
假如現在10000人
其中9900正常,100人禽流感。
如果你的分類器全部設定為正常,那么精度就是9900,但是這個我們關心嗎?我們不關心。
我們關心的是怎么把那100人找出來并且隔離,所以我們希望TP越高越高(正隔離),FP越低越好(錯隔離)
所以ROC曲線啥意思呢?
寧可錯殺一千(FP)也不肯放過一個(TP)
?
所以kaggle上面的Public LB采用的是ROC_AUC,并不是我們常見的分類器準確率。
ROC_AUC希望錯殺的越少越好,正殺的越多越好,對健康人放置不管。
------------------------------------------下面舉例-------------------------------------------
?? ? ? ?(a) ? ?(b) ? ?<-classified as
?? ? ?----- ?-----
?? ? 569014 ? ?863 ? ?(a): class -
?? ? ?10014 ?10649 ? ?(b): class +
這個例子來自IEEE-Fraud-detection 比賽。
這個結果提交到public LB以后,得分只有0.68,所以其實是使用了
?第二行中10014 ?10649中的數據。
總結
以上是生活随笔為你收集整理的kaggle上面的score以及ROC_AUC数值咋回事的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: awk获取+sed替换+paste命令追
- 下一篇: 谈下关于kaggle的反作弊规则