声学前端信号处理常用名词及缩写
生活随笔
收集整理的這篇文章主要介紹了
声学前端信号处理常用名词及缩写
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
歡迎來我的知乎專欄進一步探討交流。
https://www.zhihu.com/column/c_1287066237843951616
學習過程中,碰到了很多聲學前端信號處理名詞的專用簡寫,特此記錄下,歡迎各位知友批評與指點。
每個概念深究的話,均是可以單獨成章的,后續有時間的話再進行細化。
會不斷更新與完善。。
?
| 縮寫 | 全稱 | 中文釋義 | 應用場景 |
| ABF | Adaptive Beamformer | 自適應波束形成器 | 波束形成方法。 |
| AGC | Automatic Gain Control | 自動增益控制 | 為了使輸出的語音信號增益盡量保持穩定,避免忽大忽小,需要進行自動增益控制。 |
| AR | Autoregressive model | 自回歸模型 | 基礎的時間序列模型 |
| ARMA | Autoregressive Moving Average Model | 自回歸-移動平均模型 | 基礎的時間序列模型 |
| BM | Beamforming Beamformer | 波束形成(器) | 多通道麥克風信號處理的一種常用方法。 |
| BM | Block Matrix | 阻塞矩陣 | GSC方法里的概念。 |
| DD | Decision-Directed Method | 判決引導法 | 估算參數值的一種方法。 |
| Der | Dereverberation | 去混響 | 一般在處理室內聲學信號時,經常存在混響,需要針對性的進行去混響。 |
| DOA | Direction-Of-Arrival | 波達方向估計 | 估計信號相對于麥克風的方向。 |
| DSB | Delay-and-Sum Beamformer | 延時相加波束形成器 | 波束形成方法。 |
| Fs | Frequency of Sampling | 采樣率 | 模數轉換時的采樣率,決定了頻域處理的頻段上限,滿足奈奎斯特采樣定律。 |
| GSC | Generalized Sidelobe Cancellation | 廣義旁瓣消除器 | 由 Griffiths 與 Jim 提出, 是一種自適應噪聲消除算法 。 |
| IBM | Ideal Binary Mask | 理想二值掩碼 | 常用于語音降噪下進行噪聲估計,比如現在深度學習下的降噪就用的很頻繁。 |
| IMCRA | Improved Minimum Controlled Regressive Average | 改進版遞歸式更新估計噪聲。 | 一種噪聲跟蹤統計方法 |
| IRM | Ideal Ratio Mask | 理想比值掩碼 | 常用于語音降噪下進行噪聲估計,比如現在深度學習下的降噪就用的很頻繁。 |
| ISTFT | Inverse Short-Time Fourier Transform | 逆短時傅里葉變換 | 將頻域語音信號變化為時域信號 |
| LCMV | Linearly Contrained Minimum Variance | 線性限制最小方差 | 一種計算固定波束形成系數的方法。 |
| LMS | Least Mean Square | 最小均方自適應濾波器 | 自適應學習參數的方法。 |
| LSA | Log-Spectral Amplitude | 對數譜幅度 | 估計語音信號。 |
| MA | Moving Average model | 移動平均模型 | 基礎的時間序列模型 |
| MCLP | Multichannel Linear Prediction | 多通道線性預測模型 | 實現語音信號去混響的一種方法。 |
| MCRA | the Minimum Controlled Regressive Average method | 遞歸式更新估計噪聲 | 一種噪聲跟蹤統計方法。 |
| MIMO | the Multiple-Input Multiple-Output system | 多通道輸入多通道輸出系統 | 語音處理系統輸入輸出通道數量的整體描述。 |
| MISO | The Multiple-Input Single -Output system | 多通道輸入單通道輸出系統 | 語音處理系統輸入輸出通道數量的整體描述。 |
| MMSE | Minimum Mean-Square Error | 最小均方誤差 | 衡量評價指標的一種策略。 |
| MOS | Mean Opinion Score | 平均意見得分 | 描述語音質量的指標,主觀指標。 |
| MS | Minimum Statistics | 最小統計跟蹤 | 一種噪聲跟蹤統計方法。 |
| MVDR | Minimum variance distortionless Response | 最小方差無失真響應 | 一種計算固定波束形成系數的方法。 |
| NLMS | Normalized Least Mean Square | 歸一化最小均方自適應濾波器 | 自適應學習參數的方法。 |
| NS | Noise Suppression | 噪聲抑制 | 就是語音降噪,另外一種叫法。 |
| OM-LSA | the Optimally-Modified Log-Spectral Amplitude | 最優修正對數譜幅度 | 估計語音信號。 |
| PESQ | Perceptual Evaluation of Speech Quality | 語音感知質量評價 | 最新評價語音質量的客觀工具,將話音的頻率、響度等物理特性與人類心理上的感知特性相對應關系用數學模型來表示, 即用客觀的數學模型評價來模擬主觀的評價。 |
| PF | Post-Filter | 后置濾波 | 一般在去混響、固定波束形成或者GSC之后應用,也就是單通道降噪。 |
| PSD | Power Spectrum Density | 功率譜密度 | 描述聲學信號的譜特性。 |
| RIR | Room Impulse Response | 房間沖擊響應 | 參照RTF,具體的一種場景,常用于去混響問題。 |
| RTF | Relative Transfer Functions | 相對傳輸函數 | 常用于描述兩個位置之間的聲學傳遞函數。 |
| SAP | Speech Absence Probability | 語言不存在概率 | 相對于SPP。 |
| SIMO | The Single-Input Multiple-Output system | 單通道輸入多通道輸出系統 | 語音處理系統輸入輸出通道數量的整體描述。 |
| SISO | the Single-Input Single-Output system | 單通道輸入單通道輸出系統 | 語音處理系統輸入輸出通道數量的整體描述。 |
| SNR | Signal-to-Noise Ratio | 信噪比 | 描述信號干凈程度,越大越好。 |
| SPP | Speech Presence Probability | 語言存在概率 | 當前時間段或者幀時的語音存在概率,常用于噪聲跟蹤。 |
| STFT | Short-Time Fourier Transform | 短時傅里葉變換 | 一段完整的語音信號通常是非穩態的,即其特征基本上是隨時間變化的,然而由于人的口腔與喉部發聲的固有特性,在一個短時間范圍內 ,一般為 之間,其特征基本保持不變,即語音信號是短時平穩的。所以在對語音信號進行頻域分析時需要一幀一幀的處理,幀長一般取 。 |
| TDOA | Time-Difference-Of-Arrival | 到達時間差 | 信號到達各個麥克風時間的時間差,常用于DOA。 |
| TVG | Time-Varying Gaussian model | 時變高斯模型 | 一種描述語音信號的模型。 |
| VAD | Voice Activity Detection | 語言激活檢測 | 檢查當前時間段或者幀時的語音存在概率,常用于噪聲估計或者跟蹤。 |
| WNG | White Noise Gain | 白噪聲增益 | 描述固定波束形成系數的穩定性的指標。 |
| WPE | Weighted Prediction Estimation | 權重預測估計方法 | 日本學者Takuya Yoshioka在其學位論文中系統提出的一種去混響方法。 |
?
?
發布于昨天 11:35
總結
以上是生活随笔為你收集整理的声学前端信号处理常用名词及缩写的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ubuntu 安装screen
- 下一篇: python 对论文插图制作局部放大图并