神经网络到底是如何做出决策的?
(A,B)---m*n*2---(1,0)(0,1)
神經(jīng)網(wǎng)絡(luò)的衰變假設(shè):被概率密度表達的粒子A和B彼此互為粒子和環(huán)境,在相互作用中被彼此微擾產(chǎn)生衰變,衰變產(chǎn)物是B化A和A化B,網(wǎng)絡(luò)的分類準(zhǔn)確率是兩個粒子分類準(zhǔn)確率的算術(shù)和pave=Σpr。
?
用神經(jīng)網(wǎng)絡(luò)分類兩個數(shù)據(jù)集,讓A代表圍棋中白棋的可能走勢,B代表黑棋的可能走勢,
(白,黑)--m*n*2---(1,0)(0,1)
?
用兩色棋的未來的演化來訓(xùn)練這個網(wǎng)絡(luò),比如讓機器執(zhí)黑棋,用神經(jīng)網(wǎng)絡(luò)找到針對現(xiàn)在白棋盤面最優(yōu)的落子方法。按照神經(jīng)網(wǎng)絡(luò)衰變假設(shè),可以將白棋的盤面理解成環(huán)境,把黑棋的盤面看作是在白棋環(huán)境中的粒子。
?
可以理解要找的黑棋的最優(yōu)落子方法是在白棋環(huán)境中半衰期最長的黑棋粒子。因為半衰期越長表明粒子越穩(wěn)定,越不易受環(huán)境的影響。也就表明黑棋對整個盤面的掌控更強,走勢更為主動。表明黑棋可以在白棋的環(huán)境中活的更久。對棋牌游戲來說活得比對方更久和取得勝利這兩種表述顯然是一樣的。
?
計算過程,(1,0)位和(0,1)位的分類準(zhǔn)確率P10和P01是放射剩余,迭代次數(shù)N是時間,T是半衰期
如果白棋是(1,0)位那就是要找到P01最大的解,因為P01越接近1,半衰期T越大。
總結(jié)
以上是生活随笔為你收集整理的神经网络到底是如何做出决策的?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mnist 0与mnist x 相互衰变
- 下一篇: 一个稳定的粒子