变速与变调原理
自然語音的產(chǎn)生可以簡化為圖2-1模型,激勵(lì)源出來的聲門波信號與聲道模型進(jìn)行卷積,最后通過嘴唇輻射模型產(chǎn)生語音。其中,激勵(lì)源決定說話人的基頻的大小,即音調(diào)的高低。聲道模型反映“潤色”的頻譜信息,具體的講,共振峰決定了語義信息,諧波分布決定了音色,單位時(shí)間的音節(jié)數(shù)決定了語速。
?
圖2-1 語音產(chǎn)生模型
下面將根據(jù)語音產(chǎn)生模型來闡述變速變調(diào)的基本原理。
變速變調(diào)的改變可以包括變速不變調(diào)和變調(diào)不變速兩個(gè)部分。
語音變速不變調(diào)是指保持音調(diào)和語義保持不變,語速變快或變慢[28]。該過程表現(xiàn)為語譜圖在時(shí)間軸上如手風(fēng)琴般壓縮或者擴(kuò)展。那也就是說,基頻值幾乎不變,對應(yīng)于音調(diào)不變;整個(gè)時(shí)間過程被壓縮或者擴(kuò)展,聲門周期的數(shù)目減小或者增加,即聲道運(yùn)動(dòng)速率發(fā)生改變,語速也隨之變化。對應(yīng)于語音產(chǎn)生模型,激勵(lì)和系統(tǒng)經(jīng)歷與原始發(fā)音情況幾乎相同的狀態(tài),但持續(xù)時(shí)間相比原來或長或短[29]。
嚴(yán)格地講,基頻和音調(diào)是兩個(gè)不同的概念,基頻是指聲帶振動(dòng)的頻率,音調(diào)是指人類對基頻的主觀感知,但是兩者變化基本一致,即基頻越高,音調(diào)越高,基頻越低,音調(diào)越低,音調(diào)是由基頻決定的[30]。因此,語音變調(diào)不變速就是指改變說話人基頻的大小[44],同時(shí)保持語速和語義不變,即保持短時(shí)頻譜包絡(luò)(共振峰的位置和帶寬)和時(shí)間過程基本不變[31]。對應(yīng)于語音產(chǎn)生模型,變調(diào)改變了激勵(lì)源;聲道模型的共振峰參數(shù)幾乎不變,保證了語義和語速不變。
綜上所述,變速改變聲道運(yùn)動(dòng)速率,力求保持激勵(lì)源不變;變調(diào)改變激勵(lì)源,力求保持聲道的共振峰信息不變。但是聲源和聲道不是相互獨(dú)立的,在改變聲源時(shí),必然也會非線性的影響聲道,同樣地,改變聲道時(shí)也會或多或少的影響聲源,兩者之間相互影響,相互作用。
總結(jié)
- 上一篇: js关于数组的操作(合并数组、添加数组、
- 下一篇: linux 欢迎界面