语音端点检测(Voice Activity Detection,VAD)
1、VAD的總體步驟:https://www.bbsmax.com/A/1O5EOo73z7/
2、基于短時能量和過零率的簡單實(shí)現(xiàn)(實(shí)際上精確度高的VAD會提取4種或更多的特征進(jìn)行判斷,這里只介紹兩種特征的基本方法):https://blog.csdn.net/weixin_42788078/article/details/89634363?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task
3、基于神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)(Alex):https://www.cnblogs.com/Vanessa-Feng/p/7452016.html
4、相關(guān)書籍:hand-book-of-speech-enhancement-and-recognition:https://shichaog1.gitbooks.io/hand-book-of-speech-enhancement-and-recognition/content/chapter7.html
5、WebRTC之VAD算法(python包):https://blog.csdn.net/benhuo931115/article/details/54909228
?
?
總結(jié)
以上是生活随笔為你收集整理的语音端点检测(Voice Activity Detection,VAD)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《Unity API常用方法和类详细讲解
- 下一篇: Bootstrap4使用Bootstra