“AlphaGo之父”获最新一届ACM计算奖
近日,2019 年 ACM 計算獎頒出,由于在計算機(jī)游戲領(lǐng)域取得突破性進(jìn)展,“AlphaGo 之父”、DeepMind 首席科學(xué)家、倫敦大學(xué)學(xué)院教授 David Silver 獲得最新一屆的 ACM 計算獎。
David Silver 是深度學(xué)習(xí)領(lǐng)域的先驅(qū)人物,他在人工智能領(lǐng)域的一系列成績中,又以帶領(lǐng)打造了 AlphaGo 最為人所知:David Silver 通過巧妙地結(jié)合深度學(xué)習(xí)、強化學(xué)習(xí)、蒙特卡洛搜索樹和大規(guī)模計算的思想,開發(fā)了 AlphaGo 算法,AlphaGo 戰(zhàn)勝了頂尖的人類棋手,更是被公為人工智能(AI)研究的一個里程碑。
(來源:ACM)
根據(jù) ACM 官方報道,最初,AlphaGo 會經(jīng)過來自人類專業(yè)棋手經(jīng)驗的小范圍訓(xùn)練,然后,它會通過強化學(xué)習(xí)來不斷改善性能。AlphaGo 之后, David Silver 和他的團(tuán)隊創(chuàng)造了更新穎的方法,來實現(xiàn)更高的性能和通用性,AlphaZero 就此誕生。與 AlphaGo 不同,AlphaZero 完全通過與自己玩游戲來進(jìn)行學(xué)習(xí),不需要任何人類數(shù)據(jù)或先驗知識(游戲規(guī)則除外)。而且,AlphaZero 同時在國際象棋、將棋和圍棋游戲中有超過人類的表現(xiàn),證明了其 AI 算法的通用性。
早在 David Silver 于艾伯塔大學(xué)(University of Alberta)攻讀博士學(xué)位時,他就開始探索開發(fā)一種可以掌握圍棋智慧的計算機(jī)程序,這也成為了他后續(xù)一直在專注的研究興趣。在 2013 年的 NeurIPS 會議上,Silver 展示了一種算法,它可以在雅達(dá)利游戲中展現(xiàn)達(dá)到人類水平的技巧。這個程序?qū)W會了在游戲過程中僅僅通過觀察像素和分?jǐn)?shù)來玩游戲。
2015 年, David Silver 和他的同事發(fā)布開創(chuàng)性論文“Human Level Control Through Deep Reinforcement Learning ”,在這個研究中,他們將強化學(xué)習(xí)與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合,論文發(fā)表在 Nature 雜志上,且至今被引用近 1 萬次,對該領(lǐng)域產(chǎn)生了巨大影響。隨后,Silver 和他的同事繼續(xù)用新技術(shù)改進(jìn)這些深度強化學(xué)習(xí)算法,這些算法仍然是機(jī)器學(xué)習(xí)中應(yīng)用最廣泛的工具之一。
2016 年 3 月,團(tuán)隊開發(fā)的 AlphaGo 擊敗世界圍棋冠軍李世石,這被被譽為 AI 里程碑式的時刻。同年,解析 AlphaGo 背后技術(shù)的論文 “ Mastering the Game of Go with Deep Neural Networks and Tree Search ” 公開發(fā)布在Nature雜志上。
AlphaGo 和 AlphaZero 之后,DeepMind 的游戲 AI 探索的另一個重點是征服《星際爭霸 II》。就在去年,由 Silver 領(lǐng)導(dǎo)的 DeepMind 團(tuán)隊開發(fā)了 AlphaStar,它掌握了多人即時戰(zhàn)略游戲《星際爭霸 II》,這類游戲被認(rèn)為是游戲 AI 需要攀登的高峰。
現(xiàn)在,在 DeepMind——這家谷歌旗下最星光熠熠的 AI 公司,David Silver 和他的同事仍在尋求將機(jī)器學(xué)習(xí)和神經(jīng)科學(xué)方面的進(jìn)展進(jìn)行技術(shù)融合,以構(gòu)建功能強大的通用學(xué)習(xí)算法。David Silver 在深度強化學(xué)習(xí)上的諸多工作也已被應(yīng)用于提高英國電網(wǎng)效率、幫助谷歌數(shù)據(jù)中心降低功耗、為歐洲航天局策劃太空探測器軌跡等領(lǐng)域。DeepMind 團(tuán)隊還將繼續(xù)推進(jìn)這些技術(shù),并為其找到更多的應(yīng)用場景。
-End-
總結(jié)
以上是生活随笔為你收集整理的“AlphaGo之父”获最新一届ACM计算奖的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 汇编语言——基础知识
- 下一篇: 各种汇编器masm masm32 fas