强化学习(RL)
強化學習-Reinforcement learning
參考:
1. 強化學習:基本概念 + 應用場景 + 主流算法
什么是強化學習?
強化學習并不是某一種特定的算法,而是一類算法的統稱。如果用來做對比的話,他跟監督學習,無監督學習 是類似的,是一種統稱的學習方式。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
強化學習算法的思路非常簡單,以游戲為例,如果在游戲中采取某種策略可以取得較高的得分,那么就進一步「強化」這種策略,以期繼續取得較好的結果。這種策略與日常生活中的各種「績效獎勵」非常類似。我們平時也常常用這樣的策略來提高自己的游戲水平。
強化學習和監督學習、無監督學習 最大的不同就是不需要大量的“數據喂養”,而是通過自己不停的嘗試來學會某些技能。
入門:
-
【強化學習】從強化學習基礎概念開始(2019-6)
-
強化學習如何入門?看這篇文章就夠了
-
強化學習通俗導論(一):什么是強化學習
-
「教程」深度學習、強化學習進階課程(YouTube視頻,需要科學上網)
?
總結
- 上一篇: 自编码器(AE)
- 下一篇: seq2seq编码器和解码器:Tenso