當前位置：首頁 > 前端技术 > HTML >内容正文

HTML

声学前端信号处理常用名词及缩写

發布時間：2024/3/24 HTML 42 豆豆

生活随笔收集整理的這篇文章主要介紹了声学前端信号处理常用名词及缩写小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

歡迎來我的知乎專欄進一步探討交流。

https://www.zhihu.com/column/c_1287066237843951616

學習過程中，碰到了很多聲學前端信號處理名詞的專用簡寫，特此記錄下，歡迎各位知友批評與指點。

每個概念深究的話，均是可以單獨成章的，后續有時間的話再進行細化。

會不斷更新與完善。。

縮寫	全稱	中文釋義	應用場景
ABF	Adaptive Beamformer	自適應波束形成器	波束形成方法。
AGC	Automatic Gain Control	自動增益控制	為了使輸出的語音信號增益盡量保持穩定，避免忽大忽小，需要進行自動增益控制。
AR	Autoregressive model	自回歸模型	基礎的時間序列模型
ARMA	Autoregressive Moving Average Model	自回歸-移動平均模型	基礎的時間序列模型
BM	Beamforming Beamformer	波束形成（器）	多通道麥克風信號處理的一種常用方法。
BM	Block Matrix	阻塞矩陣	GSC方法里的概念。
DD	Decision-Directed Method	判決引導法	估算參數值的一種方法。
Der	Dereverberation	去混響	一般在處理室內聲學信號時，經常存在混響，需要針對性的進行去混響。
DOA	Direction-Of-Arrival	波達方向估計	估計信號相對于麥克風的方向。
DSB	Delay-and-Sum Beamformer	延時相加波束形成器	波束形成方法。
Fs	Frequency of Sampling	采樣率	模數轉換時的采樣率，決定了頻域處理的頻段上限，滿足奈奎斯特采樣定律。
GSC	Generalized Sidelobe Cancellation	廣義旁瓣消除器	由 Griffiths 與 Jim 提出，是一種自適應噪聲消除算法。
IBM	Ideal Binary Mask	理想二值掩碼	常用于語音降噪下進行噪聲估計，比如現在深度學習下的降噪就用的很頻繁。
IMCRA	Improved Minimum Controlled Regressive Average	改進版遞歸式更新估計噪聲。	一種噪聲跟蹤統計方法
IRM	Ideal Ratio Mask	理想比值掩碼	常用于語音降噪下進行噪聲估計，比如現在深度學習下的降噪就用的很頻繁。
ISTFT	Inverse Short-Time Fourier Transform	逆短時傅里葉變換	將頻域語音信號變化為時域信號
LCMV	Linearly Contrained Minimum Variance	線性限制最小方差	一種計算固定波束形成系數的方法。
LMS	Least Mean Square	最小均方自適應濾波器	自適應學習參數的方法。
LSA	Log-Spectral Amplitude	對數譜幅度	估計語音信號。
MA	Moving Average model	移動平均模型	基礎的時間序列模型
MCLP	Multichannel Linear Prediction	多通道線性預測模型	實現語音信號去混響的一種方法。
MCRA	the Minimum Controlled Regressive Average method	遞歸式更新估計噪聲	一種噪聲跟蹤統計方法。
MIMO	the Multiple-Input Multiple-Output system	多通道輸入多通道輸出系統	語音處理系統輸入輸出通道數量的整體描述。
MISO	The Multiple-Input Single -Output system	多通道輸入單通道輸出系統	語音處理系統輸入輸出通道數量的整體描述。
MMSE	Minimum Mean-Square Error	最小均方誤差	衡量評價指標的一種策略。
MOS	Mean Opinion Score	平均意見得分	描述語音質量的指標，主觀指標。
MS	Minimum Statistics	最小統計跟蹤	一種噪聲跟蹤統計方法。
MVDR	Minimum variance distortionless Response	最小方差無失真響應	一種計算固定波束形成系數的方法。
NLMS	Normalized Least Mean Square	歸一化最小均方自適應濾波器	自適應學習參數的方法。
NS	Noise Suppression	噪聲抑制	就是語音降噪，另外一種叫法。
OM-LSA	the Optimally-Modified Log-Spectral Amplitude	最優修正對數譜幅度	估計語音信號。
PESQ	Perceptual Evaluation of Speech Quality	語音感知質量評價	最新評價語音質量的客觀工具，將話音的頻率、響度等物理特性與人類心理上的感知特性相對應關系用數學模型來表示，即用客觀的數學模型評價來模擬主觀的評價。
PF	Post-Filter	后置濾波	一般在去混響、固定波束形成或者GSC之后應用，也就是單通道降噪。
PSD	Power Spectrum Density	功率譜密度	描述聲學信號的譜特性。
RIR	Room Impulse Response	房間沖擊響應	參照RTF，具體的一種場景，常用于去混響問題。
RTF	Relative Transfer Functions	相對傳輸函數	常用于描述兩個位置之間的聲學傳遞函數。
SAP	Speech Absence Probability	語言不存在概率	相對于SPP。
SIMO	The Single-Input Multiple-Output system	單通道輸入多通道輸出系統	語音處理系統輸入輸出通道數量的整體描述。
SISO	the Single-Input Single-Output system	單通道輸入單通道輸出系統	語音處理系統輸入輸出通道數量的整體描述。
SNR	Signal-to-Noise Ratio	信噪比	描述信號干凈程度，越大越好。
SPP	Speech Presence Probability	語言存在概率	當前時間段或者幀時的語音存在概率，常用于噪聲跟蹤。
STFT	Short-Time Fourier Transform	短時傅里葉變換	一段完整的語音信號通常是非穩態的，即其特征基本上是隨時間變化的，然而由于人的口腔與喉部發聲的固有特性，在一個短時間范圍內，一般為之間，其特征基本保持不變，即語音信號是短時平穩的。所以在對語音信號進行頻域分析時需要一幀一幀的處理，幀長一般取。
TDOA	Time-Difference-Of-Arrival	到達時間差	信號到達各個麥克風時間的時間差，常用于DOA。
TVG	Time-Varying Gaussian model	時變高斯模型	一種描述語音信號的模型。
VAD	Voice Activity Detection	語言激活檢測	檢查當前時間段或者幀時的語音存在概率，常用于噪聲估計或者跟蹤。
WNG	White Noise Gain	白噪聲增益	描述固定波束形成系數的穩定性的指標。
WPE	Weighted Prediction Estimation	權重預測估計方法	日本學者Takuya Yoshioka在其學位論文中系統提出的一種去混響方法。

發布于昨天 11:35

總結

以上是生活随笔為你收集整理的声学前端信号处理常用名词及缩写的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： ubuntu 安装screen
下一篇： python 对论文插图制作局部放大图并

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

HTML

声学前端信号处理常用名词及缩写

歡迎來我的知乎專欄進一步探討交流。

https://www.zhihu.com/column/c_1287066237843951616

總結