fasttext在二分类问题中,recall与precision值是相同的,why
通過研究fasttext官方文檔(https://fasttext.cc/docs/en/supervised-tutorial.html)中的如下部分:
很容易發(fā)現(xiàn)此處的召回率與精確率與平常所計(jì)算的方式不同;這里是專門針對(duì)多標(biāo)簽而計(jì)算的;而且針對(duì)一條樣本就可以計(jì)算出這兩個(gè)值 ;圖中實(shí)際標(biāo)簽為 equipment,cleaning,knives; 預(yù)測(cè)標(biāo)簽為food-safety,baking,equipment,substitutions,bread?; 只有equipment是正確的,1/5=0.2,即精確率;而召回率預(yù)測(cè)正確的標(biāo)簽數(shù)量除以真實(shí)的標(biāo)簽數(shù)量;1/3=0.33即recall;
按這種理論計(jì)算,由于分子是一樣的,分母是不一樣的;換句話說,如果分母相同,即標(biāo)簽數(shù)量相同,兩個(gè)指標(biāo)值就會(huì)相同;
對(duì)于二分類而言,每條樣本而言,分母永遠(yuǎn)都是一樣的,就是1;如果真實(shí)標(biāo)簽是spam,預(yù)測(cè)的標(biāo)簽也是spam,那么精確率為1,召回率也為1;如果預(yù)測(cè)標(biāo)簽是normal,則精確率為0,召回率也為0;所以兩者值完全相同;
本質(zhì)上而言,此處的recall是針對(duì)多標(biāo)簽設(shè)計(jì)的;對(duì)于 二分類單標(biāo)簽是沒有意義的;
總結(jié)
以上是生活随笔為你收集整理的fasttext在二分类问题中,recall与precision值是相同的,why的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: fastText原理和文本分类实战
- 下一篇: 通过正则表达式分句提取中文内容