當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

一文带你了解混淆矩阵！

發布時間：2024/8/23 编程问答 28 豆豆

生活随笔收集整理的這篇文章主要介紹了一文带你了解混淆矩阵！小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

來源 |?數據科學CLUB

封圖 | CSDN 下載自視覺中國

混淆矩陣是一個表，經常用來描述分類模型(或“分類器”)在已知真實值的一組測試數據上的性能。混淆矩陣本身比較容易理解，但是相關術語可能會令人混淆。

讓我們從一個二進制分類器的混淆矩陣示例開始(盡管它可以很容易地擴展到兩個以上的類):

我們能從這個矩陣中了解到什么?

現在讓我們定義最基本的術語:

我已經將這些項添加到混淆矩陣中，并且添加了行和列總數:

這是一個比率的列表，通常是從一個混淆矩陣的二元分類器里得出:

還有幾個術語也值得一提:

零錯誤率（Null Error Rate）: 這是如果你總是預測大多數類，你就會錯的頻率。(在我們的例子中，零錯誤率將是60/165=0.36，因為如果你總是預測yes，那么您只會在60個“no”的情況下出錯。)這可以作為比較分類器的基準度量。然而，對于一個特定的應用程序，最好的分類器有時會有比零錯誤率更高的錯誤率，正如 “Accuracy Paradox（精確度悖論）”所證明的那樣。
Cohen's Kappa: 這本質上是對分類器的性能的一種度量，與它僅僅是偶然的性能進行比較。換句話說，如果模型的準確率和零錯誤率之間有很大的差異，那么模型的Kappa分數就會很高。
F Score:這是真實陽性率(召回率)和正確率的加權平均值。
ROC曲線:這是一個常用的圖表，它總結了分類器在所有可能閾值上的性能。當你改變將觀察值分配給給定類的閾值時，通過繪制真陽性率（y軸）與假陽性率（x軸）來生成它。

以上是生活随笔為你收集整理的一文带你了解混淆矩阵！的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。