當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

理解RNN

發布時間：2025/3/19 编程问答 15 豆豆

生活随笔收集整理的這篇文章主要介紹了理解RNN 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

RNN與FNN的不同之處在于隱含層各個神經元之間是相互連接的，隱含層的輸入包括正常輸入和反饋輸入（也就是上一個時刻隱含層的輸出反饋個下一個時刻隱含層的輸入），其他結構和BP神經網絡相似

開始RNN的學習：

輸入層的輸出：x

隱含層的輸入：Ih

隱含層的輸出：Oh

輸出層的輸入：Io

輸出層的輸出：Oo

輸入層到隱含層的權值：W^Ih

隱含層到輸出層的權值：W^Ho

隱含層到隱含層的權值：W^Hh

隱含層的閾值：b^h

輸出層的閾值：b⁰

第t時刻隱含層第j個神經元的輸入：

Ih_j=(∑_{i=1 to m} W^Ih_ix_i+∑_{j=1 to n} W^Hh_jOh_j(t-1))

第t時刻隱含層第j個神經元的輸出：

Oh_j=f(Ih_j)

第t時刻輸出層第k個神經元的輸入：

Io_k=∑_{j=1 to m} W^HoOh_j

第t時刻輸出層第k個神經元的輸出：

Oo_k=g(Io_k)

第t時刻輸出層第k個神經元的誤差：

e_k=(d_k-Oo_k)

網絡總誤差為：

E=1/2∑_{k=1 to} s (e_k)²

RNN的學習算法是BPTT算法，與Bp的不同之處就是在隱含層的反饋上，按梯度下降更新權值和閾值：

ΔW^Ho=α*e*Oh*d(g(Io))

設輸入層的局部梯度為δ=e*d(g(Io))

ΔW^Ih=α*df(Ih)*x*∑_{k=1 to s} W^Hoδ

同樣地

ΔW^Hh=α*df(Ih)*Oh(t-1)*∑_{k=0 to s} W^Hoδ

推導方法都是鏈式求導法，容易得到上面三式

RNN容易出現梯度消失問題，具體就是當時間步t很大時，激活函數就會被多次累積，及其容易趨于0,導致梯度消失，RNN能記憶很長時間段的內容，例如，“他的名字叫李明，他姓X"，RNN需要記住上一個句子，才能準確的預測X，但是需要很長的時間步才能做到，梯度容易趨于0，”水是X色"，RNN只需要記住前面幾個詞即可預測X，一般不會出現梯度消失的情況，所以在RNN的t不適宜太大

轉載于:https://www.cnblogs.com/semen/p/6862319.html

總結

以上是生活随笔為你收集整理的理解RNN的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： [转载]HTTP协议详解
下一篇：关于Webstrom连接github的配

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

理解RNN

總結