深入浅出强化学习_直播 | 深入浅出理解 A3C 强化学习
強化學習是一種比較傳統的人工智能手段,在近年來隨著深度學習的發展,強化學習和深度學習逐漸結合在了一起。
這種結合使得很多原來無法想象的工作有了可能,最令我們矚目的莫過于 AlphaGo 戰勝李世石,以及 OpenAI 團隊的機器人可以在團戰中戰勝人類。這些技術都是非常尖端的技術,而這背后的原理其實有著非常樸實的一面。
為了對近年來逐漸升溫的強化學習 A3C 技術以及強化學習整個的實現原理進行說明,我們邀請到了珠海金山軟件 AI 工程組技術負責人高揚老師,他將在1月10日的公開課中深入淺出地講解 A3C 強化學習。
課程信息
主題:深入淺出理解A3C強化學習
時間:1 月 10 日??20:00-21:00
地點:免費線上直播
掃碼報名,免費聽課
分享嘉賓
高揚,珠海金山軟件AI工程組技術負責人,前重慶工商大學研究生導師。曾任歡聚時代、金山軟件西山居游戲工作室人工智能、大數據相關部門技術負責人,技術暢銷書《白話大數據與機器學習》、《白話深度學習與Tensorflow》、《數據科學家養成手冊》著書人。專注于人工智能產品的落地與實現。
適合對象
1. 對強化學習感興趣的工程師?
2. 有基本的機器學習算法理解的工程師
課程大綱
1. 貫序決策(窮舉搜索、蒙特卡羅方法)
2. DQN原理(時間差分法和Q-Learning、Deep Q-Learning Network)
3. A3C原理(異步方法的好處)
4. 小恐龍網頁游戲的訓練方法
5. 進階資源推薦
課程安排
19:45—20:00?學員提前入場
20:00—20:50 講師課程分享
20:50—21:00 講師答疑環節
溫馨提醒
1. 開課前會有短信提醒或者郵件提醒,請報名的時候填寫正確的手機號碼及郵箱地址。
2. 開課后 2-3 個工作日內會上傳本節課的視頻回放,報名后回放視頻不限時觀看。
總結
以上是生活随笔為你收集整理的深入浅出强化学习_直播 | 深入浅出理解 A3C 强化学习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: php强制cookies,php Coo
- 下一篇: for循环里面有异步操作_JS 线程与异