语音识别(ASR)评估指标-WER(字错误率)和SER(句错误率)
生活随笔
收集整理的這篇文章主要介紹了
语音识别(ASR)评估指标-WER(字错误率)和SER(句错误率)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前言
實際工作中,一般識別率的直接指標是“WER(詞錯誤率,Word Error Rate)”
定義
WER 字錯誤率句錯誤率
為了使識別出來的詞序列和標準的詞序列之間保持一致,需要進行替換、刪除或者插入某些詞,這些插入、替換或刪除的詞的總個數,除以標準的詞序列中詞的總個數的百分比,即為WER。
公式為:
Substitution——替換
Deletion——刪除
Insertion——插入
N——單詞數目
SER
SER,SER表述為句子中如果有一個詞識別錯誤,那么這個句子被認為識別錯誤,句子識別錯誤的的個數,除以總的句子個數即為SER
其計算公式如下所示:
注意事項
WER可以分男女、快慢、口音、數字/英文/中文等情況,分別來看。
因為有插入詞,所以理論上WER有可能大于100%,但實際中、特別是大樣本量的時候,是不可能的,否則就太差了,不可能被商用。
站在純產品體驗角度,很多人會以為識別率應該等于“句子識別正確的個數/總的句子個數”,即“識別(正確)率等于96%”這種,實際工作中,這個應該指向“SER(句錯誤率,Sentence Error Rate)”,即“句子識別錯誤的個數/總的句子個數”。不過據說在實際工作中,一般句錯誤率是字錯誤率的2~3倍,所以可能就不怎么看了。
參考文檔
AI產品經理需要了解的語音交互評價指標
語音識別評估標準-WER
總結
以上是生活随笔為你收集整理的语音识别(ASR)评估指标-WER(字错误率)和SER(句错误率)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux中去掉^M的方法
- 下一篇: 2018 Google kickstar