学习+彭伟《揭秘深度强化学习》PDF+源代码+资料
深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning,DRL)是深度學(xué)習(xí)算法和強(qiáng)化學(xué)習(xí)算法的巧妙結(jié)合,它是一種新興的通用人工智能算法技術(shù),也是機(jī)器學(xué)習(xí)的前沿技術(shù),DRL 算法潛力無限,AlphaGo 是目前該算法成功的使用案例。
DRL 算法以馬爾科夫決策過程為基礎(chǔ),是在深度學(xué)習(xí)強(qiáng)大的非線性函數(shù)的擬合能力下構(gòu)成的一種增強(qiáng)算法。深度強(qiáng)化學(xué)習(xí)算法主要包括基于動(dòng)態(tài)規(guī)劃(DP)的算法以及基于策略優(yōu)化的算法。
《揭秘深度強(qiáng)化學(xué)習(xí)》是要把這兩種主要的算法(及設(shè)計(jì)技巧)講解清楚,使算法研究人員能夠熟練地掌握。
學(xué)習(xí)參考:
《揭秘深度強(qiáng)化學(xué)習(xí)》PDF,376頁,帶目錄,文字可以復(fù)制。配套源代碼。作者:彭偉
下載: https://pan.baidu.com/s/1eVCDyse_FveXboet8w5s6A
提取碼: 78ry
《揭秘深度強(qiáng)化學(xué)習(xí)人工智能機(jī)器學(xué)習(xí)技術(shù)叢書》共10 章,首先以AlphaGo 在圍棋大戰(zhàn)的偉大事跡開始,引起對(duì)人工智能發(fā) 展和現(xiàn)狀的介紹,進(jìn)而介紹深度強(qiáng)化學(xué)習(xí)的基本知識(shí)。然后分別介紹了強(qiáng)化學(xué)習(xí)(重點(diǎn)介紹蒙特卡洛算法和時(shí)序差分算法) 和深度學(xué)習(xí)的基礎(chǔ)知識(shí)、功能神經(jīng)網(wǎng)絡(luò)層、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),以及深度強(qiáng)化學(xué)習(xí)的理論基礎(chǔ)和 當(dāng)前主流的算法框架。介紹了深度強(qiáng)化學(xué)習(xí)在不同領(lǐng)域的幾個(gè)應(yīng)用實(shí)例。引例、基礎(chǔ)知識(shí)和實(shí)例相結(jié)合,方便讀者理解和學(xué)習(xí)。
《揭秘深度強(qiáng)化學(xué)習(xí) 人工智能機(jī)器學(xué)習(xí)技術(shù)叢書》內(nèi)容豐富,講解全面、語言描述通俗易懂,是深度強(qiáng)化學(xué)習(xí)算法入門的選擇。
?
轉(zhuǎn)載于:https://www.cnblogs.com/davvv/p/10706565.html
總結(jié)
以上是生活随笔為你收集整理的学习+彭伟《揭秘深度强化学习》PDF+源代码+资料的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 加密芯片大对比
- 下一篇: 乖离率背离公式_乖离率指标——BIAS