语音模型
1 語音生成系統(tǒng)
??? 發(fā)聲器官:聲帶,聲道?
??? 聲帶:聲音的激勵(lì),開啟閉合一次形成濁音的激勵(lì)脈沖,其頻率為60-450hz,也稱為基音頻率
??? 聲道:從聲帶到嘴唇的呼吸通道,聲音的信道,決定一個(gè)人的聲紋
??? 人聲按照聲帶振動(dòng)與否,分為濁音與清音
人聲發(fā)音原理:
a 聲帶開啟與閉合,產(chǎn)生一定頻率的激勵(lì)信號(hào),通過聲道,產(chǎn)生濁音
b 聲帶不振動(dòng),由聲道(包括口腔、嘴唇等)變化產(chǎn)生聲音,并不是聲帶振動(dòng)引起的聲音,為清音
2 語音生成 模型
2.1 語音激勵(lì)模型
a 濁音激勵(lì)模型,詳細(xì)公式見網(wǎng)址:http://www.cnblogs.com/tanglei-young/archive/2013/03/18/speech.html
? 聲帶不斷的張開與關(guān)閉,產(chǎn)生了間歇的脈沖波,也就是濁音的激勵(lì)信號(hào)。其時(shí)域波形為以基音周期為周期的斜三角脈沖波
b 清音的激勵(lì)模型
? 發(fā)清音時(shí),聲道發(fā)生形狀變化形成的聲音,可以用白噪聲作為激勵(lì)。
? 單獨(dú)的將語音激勵(lì)分成清音和濁音兩種是不全面的,很多時(shí)候是清音與濁音混起來之后的混合激勵(lì)
2.2 聲道模型
a 元音:激勵(lì)順利的通過聲道,產(chǎn)生元音,要素有兩個(gè),一是聲帶振動(dòng),二是氣流通過口腔、鼻腔不受阻(不同的元音是通過舌、唇的調(diào)節(jié)而發(fā)出不同的聲音)
b 輔音:激勵(lì)通過聲道時(shí),聲道發(fā)生變化發(fā)出的聲音為輔音。這里要素也有兩個(gè),一是與聲帶振動(dòng)與否沒關(guān)系,二是氣流通過口腔時(shí)受到阻礙(即聲道發(fā)生變化)。
聲道可以看成一個(gè)諧振腔,聲道模型可以看成是一個(gè)共振峰模型,共振峰就是諧振腔中的諧振頻率。諧振腔可以改變?cè)菊Z音的頻譜特性,在諧振頻率上能量加強(qiáng),其他頻率上能量衰弱,有一定的濾波作用。能夠決定元音的音質(zhì),也反映的聲腔的頻率特性。
一般元音,可以用前三個(gè)共振峰去表示,而對(duì)于輔音、鼻音等則需要至少5個(gè)共振峰去表示。
一般元音可以用全極點(diǎn)模型來模擬,因?yàn)樵舭l(fā)音的口腔相對(duì)穩(wěn)定,一個(gè)音的后半部分具有一定的可預(yù)測(cè)性,其模型傳輸函數(shù)見上面的網(wǎng)址。
而輔音等則需要零極點(diǎn)模型來進(jìn)行模擬,因?yàn)檩o音或者鼻音等發(fā)音時(shí),口腔會(huì)帶來一定的突變,因此,需要零極點(diǎn)模型去進(jìn)行模擬,詳細(xì)公式見上面的網(wǎng)址。
總結(jié)
- 上一篇: 匹配中国人姓名的JavaScript正则
- 下一篇: 移动宽带光猫真正后台上网设置