LC-BLSTM结构快速解读
參考文獻如下:
(1) A Context-Sensitive-Chunk BPTT Approach to Training Deep LSTM/BLSTM Recurrent Neural Networks for Offline Handwriting Recognition
(2) Training Deep Bidirectional LSTM Acoustic Model for LVCSR by a Context-Sensitive-Chunk BPTT Approach
(3) Improving Latency-Controlled BLSTM Acoustic Models for Online Speech Recogintion
? ? ? ?前言? ? ? ?眾所周知,BLSTM是雙向的LSTM,它可以同時兼容上下文的信息,從而在一般序列任務上的表現很好。但是BLSTM有一個很致命的弱點,那就是因為有逆向LSTM的存在,它需要有后文的后驗,使得它無法在實時的序列任務上也有好的表現。基于實時任務的需求,出現了兩種BLSTM的變體——CSC-BLSTM和LC-BLSTM
1. CSC-BLSTM結構解析
? ? ? ?CSC-BLSTM結構全名——Context-Sensitive-Chunk Bidirectional Long Short-Term Memory,是BLSTM的第一種改進版本。請看結構圖:
? ? ? ?CSC-BLSTM首先把序列按照圖示的方法分割成多組chunk,除了首尾位置,其他位置處的都是由Nl+Nc+Nr構成,分割的大小事先給定,一般選做30幀+60幀+30幀的模式。
? ? ? ?其核心思想在于,Nl用來初始化Nc的前向細胞層狀態,Nr用來初始化Nc的后向細胞層狀態。Nl和Nr不參與誤差反向傳播。如下圖:
? ? ? ?很顯然,CSC-BLSTM的這種結構改進可以減小實時任務的延遲,用不著整段話都輸入完畢才有結果。但是從整體上看,它是以犧牲計算量為代價的。因為與BLSTM相比,它多出了Nl和Nr上的計算。在此基礎之上,為了減少這種計算量,又出現了更加簡化了的LC-BLSTM。
2. LC-BLSTM結構解析
? ? ? ?LC-BLSTM結構全名——Latency-Controlled Bidirectional Long Short-Term Memory,它改進了CSC-BLSTM。請看結構圖:
? ? ? ?可以發現,相比于CSC-BLSTM,LC-BLSTM取消了Nl,只保留了Nc+Nr。但是如此在計算上必然有差異。
? ? ? ?原來,LC-BLSTM的計算也并不復雜,同CSC-BLSTM一樣,Nr用來初始化Nc的后向細胞層狀態。但是,Nc的前向細胞層狀態直接由它的前一個Nc的輸出狀態得到。這樣,相比于CSC-BLSTM,LC-BLSTM避免了Nl的計算量。
? ? ? ?But!!!很不幸,通過實驗發現,為了保證準確率,LC-BLSTM必須要保證Nr劃分的足夠大,比如在原論文中,Nc=22的情況下,Nr需要有21,這幾乎使得Nr需要有Nc同樣的大小。在Nc=Nr=30的情況下,LC-BLSTM的計算量是傳統BLSTM的兩倍。
3. 改進的LC-BLSTM
? ? ? ?通過上述分析,LC-BLSTM的表現依然不好。阿里的研究人員改進了這個結構。他們總結LC-BLSTM的結構,多出來的計算量就在于Nr,但是Nr的作用無非兩點:
? ? ? ?于是作者分別采用了兩種簡化的網絡結構代替Nr的BLSTM結構。分別是LC-BLSTM-FABDI和LC-BLSTM-FABSR
3.1 LC-BLSTM-FABDI
? ? ? ?首先對于時間軸上正向移動的LSTM,去掉了Nr部分的計算。而對于時間軸上反向移動的LSTM,Nr部分的計算主要是為Nc提供cell的初始狀態,作者簡化了這部分的計算,使用正向全連接來代替LSTM,將f()的輸出取平均后作為Nc的初始狀態。
3.2 LC-BLSTM-FABSR
? ? ? ?首先對于時間軸上正向移動的LSTM,同樣去掉了Nr部分的計算。另外作者發現對于BLSTM模型,時間軸上反向傳播的LSTM不如時間軸上正向傳播的LSTM重要,因此使用簡單RNN模型來代替時間軸上反向傳播的LSTM。
? ? ? ?但RNN會有梯度爆炸的問題,所以對其進行strict gradient-clipping。同時為了利用未來的信息,加入了target delay。
作者在320小時的Switchboard數據集上進行測試,在不影響wer的情況下,這個兩種方法的解碼速度分別相對提升40%和27%。
轉載于:https://www.cnblogs.com/machine-lyc/p/10600300.html
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的LC-BLSTM结构快速解读的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【流水账】对Pupper的软件设备进行配
- 下一篇: CF Edu54 E. Vasya an