深度学习(三十八)——深度强化学习(1)教程
教程
http://incompleteideas.net/sutton/book/the-book-2nd.html
《Reinforcement Learning: An Introduction》,Richard S. Sutton和Andrew G. Barto著。
注:Richard S. Sutton,加拿大計算機科學家,麻省大學阿姆赫斯特分校博士(1984年),阿爾伯塔大學教授。強化學習之父,研究該領域長達三十余年。
Andrew G. Barto,麻省大學阿姆赫斯特分校教授。Richard S. Sutton的導師。
http://incompleteideas.net/sutton/609%20dropbox/slides%20(pdf%20and%20keynote)/
Sutton的pdf和keynote
注:資料中的.key文件即為keynote文件。這種格式是蘋果設備上的專用ppt格式,在其他系統中查看不了。
http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html
UCL Course on RL
David Silver,劍橋大學本科(1997年)+阿爾伯塔大學博士(2011年)。倫敦大學學院講師。現為DeepMind研究員。AlphaGo之父。
Silver的名聲直追他的導師Sutton,這個教程也流傳很廣。后續介紹的教程中,多有對它的抄襲。
http://www.meltycriss.com/2017/09/09/note-reinforcement-learning/
課程筆記《UCL強化學習》。這個blog包含大量的思維導圖。
https://mp.weixin.qq.com/s/_PVe7Gcq7Yk8nOFJFPcUQw
葉強:David Silver《深度強化學習》公開課教程學習筆記完整版
https://github.com/clamesc/reinforcement-learning-mindmap
另一個版本的David Silver課程的思維導圖。
http://web.stanford.edu/class/cs234/syllabus.html
CS234: Reinforcement Learning
http://rail.eecs.berkeley.edu/deeprlcourse/
CS 294: Deep Reinforcement Learning
以上1本書+4個課程,基本就是目前RL領域的黃金搭檔了。Stanford的課程內容比較新,但是很淺。UCB的課程通常都是給入門以后的人準備的,無論DL還是RL,都是這樣。Sutton和Silver的課程內容比較老,但是很有深度。和CV領域只需要學習DL,而不需要學習傳統方法不同,按照Sutton的說法,基本算法原理遠比神經網絡更重要。
http://www.eecs.wsu.edu/~taylorm/17_580/index.html
CptS 580: Reinforcement Learning
http://www.eecs.wsu.edu/~taylorm/2011_cs420/index.html
Artificial Intelligence。這個課程名義上叫AI,實則包括狀態空間搜索、強化學習和貝葉斯網絡三部分內容。
http://www.eecs.wsu.edu/~taylorm/2010_cs414/index.html
Introduction to Machine Learning。Matthew E. Taylor的本行是RL,所以不管什么課程,都有RL的內容。
Matthew E. Taylor,安默斯特學院本科(2001年)+德州大學奧斯汀分校博士(2008年)。華盛頓州立大學副教授。
https://katefvision.github.io/
CMU: Deep Reinforcement Learning and Control
https://course.ie.cuhk.edu.hk/~ierg6130/schedule.html
香港中文大學:Reinforcement Learning
https://github.com/aikorea/awesome-rl
提供了RL方面的資源網頁。aikorea還提供了同類的資源收集網頁:awesome-rnn, awesome-deep-vision, awesome-random-forest。
https://mp.weixin.qq.com/s/dS0oQbGtrdd4rS25cBNyoQ
面向Open AI, TensorFlow, Keras的強化學習書籍《Reinforcement Learning》
https://102.alibaba.com/downloadFile.do?file=1517812754285/reinforcement_learning.pdf
《強化學習在阿里的技術演進與業務創新》,這是阿里出品的RL實戰類書籍。
https://mp.weixin.qq.com/s/RbUcEOctRm8kX6_Ar4J0CA
446頁簡易Python強化學習教程書籍
https://mp.weixin.qq.com/s/7DlbuJI_gARJRABnlZQcxQ
伯克利大學ICML2018強化學習80頁教程
https://mp.weixin.qq.com/s/7WnlNvxk0KKVPYqvSi7fKA
40頁 PPT,BMM夏令營《強化學習簡明教程》
https://mp.weixin.qq.com/s/VelM7ndXfevXKfPno-T9jQ
微軟亞研130PPT教程:強化學習簡介
https://sites.ualberta.ca/~szepesva/RLBook.html
《Algorithms for Reinforcement Learning》
https://mp.weixin.qq.com/s/tZjIdNSLvIVzho-IlCvm6A
93頁隨機近似與強化學習教程分享
https://mp.weixin.qq.com/s/o1wLREqtIZpzH2NxLl9M7A
深度強化學習簡介
https://mp.weixin.qq.com/s/Y9DfxQJ-w23QXxKV0z26ag
MIT科學家Dimitri P. Bertsekas最新2019出版《強化學習與最優控制》
https://mp.weixin.qq.com/s/2cEd_FGmj-WVfm4KrQfMMg
《深度學習與機器人學》大牛Pieter Abbeel 105頁PPT下載
https://mp.weixin.qq.com/s/u49cuDV21ITs1aV9tJR85g
Pieter Abbeel:《深度學習在機器人中的應用》
https://mp.weixin.qq.com/s/z9MvLuqjY5Xmty18ZP10WQ
UC伯克利Pieter Abbeel教授強化學習教程-附59頁slides
https://github.com/enggen/DeepMind-Advanced-Deep-Learning-and-Reinforcement-Learning
DeepMind與UCL合作推出的深度學習與強化學習進階課程
https://mp.weixin.qq.com/s/CnL1uIWef2AjIr_AwL7t-w
DeepMind研究員Tor2019著作《賭博機算法》,555頁帶你學習專治選擇困難癥技術
https://zhuanlan.zhihu.com/c_168521441
在線學習(MAB)與強化學習(RL)
https://github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch
PyTorch實現多種深度強化學習算法
https://mp.weixin.qq.com/s/UrwP9t-Ox4M9QImKDUDcsA
140頁《深度強化學習入門》發布
https://simoninithomas.github.io/Deep_reinforcement_learning_Course/
老外寫的簡易深度強化學習入門
https://mp.weixin.qq.com/s/nSfvhr096aTeOHxDHy0NeA
434頁《Python強化學習實用指南》
https://www.starai.io/course/
StarAi的DRL教程
https://mp.weixin.qq.com/s/eMzrktlm93ZEZi-J5sipqA
莫斯科國立大學56頁《深度強化學習綜述》最新論文,帶你全面了解DRL最新方法
https://github.com/dennybritz/reinforcement-learning
GitHub 萬星資源:強化學習算法實現,教程代碼樣樣全,還有詳細學習規劃
論文
《A Brief Survey of Deep Reinforcement Learning》
《Asynchronous Methods for Deep Reinforcement Learning》
《Deep Reinforcement Learning for Dialogue Generation》
blog
https://zhuanlan.zhihu.com/sharerl
強化學習知識大講堂
https://zhuanlan.zhihu.com/intelligentunit
一個DL+RL的專欄
https://www.cnblogs.com/pinard/category/1254674.html
一個DRL的專欄
https://www.cnblogs.com/steven-yang/tag/強化學習/
一個RL的專欄
https://www.cnblogs.com/steven-yang/tag/博弈論/
一個博弈論的專欄
工具/框架
https://mp.weixin.qq.com/s/5ScRIl2MHNGaUyIEJJKnKw
DeepMind開源強化學習研究環境Control Suite
https://mp.weixin.qq.com/s/GTjNToprM2OO7uzSRQXkHw
DeepMind開源強化學習庫TRFL,關鍵算法可編寫RL智能體
https://mp.weixin.qq.com/s/PLFxehTAXcehzIrIMRfVpA
強化學習的基石:DeepMind開源框架TRFL
https://mp.weixin.qq.com/s/ew7vmvskp_q4aM7cJM-CXg
奪魁NeurIPS 2018強化學習大賽,百度正式發布RL模型庫和算法框架PARL
https://github.com/danaugrs/huskarl
基于TF2.0的深度強化學習平臺:Huskarl
https://mp.weixin.qq.com/s/ApP0zNuG5OP_-HzJC1v95Q
谷歌發布開源Dopamine 2.0,讓強化學習變得更靈活
https://mp.weixin.qq.com/s/Hod37LQ-eEe0EVtLfyXLGQ
DeepMind重磅開源強化學習框架!覆蓋28款游戲,24多個算法(OpenSpiel)
https://zhuanlan.zhihu.com/p/68462431
谷歌開源RL足球環境
https://mp.weixin.qq.com/s/BhTX4KQnLxUQLvPUfY3q6Q
物理實驗成本為零!南大LAMDA開源虛擬RL訓練環境
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的深度学习(三十八)——深度强化学习(1)教程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习(三十七)——CenterNet
- 下一篇: 古希腊三大数学书(二)