首届“开悟AI+游戏高校大赛”启动
8月18日,騰訊宣布首屆“開悟AI+游戲高校大賽”(下稱“大賽”)初賽正式啟動,這也是騰訊開悟平臺首次面向高校開放。該大賽由騰訊 AI Lab?攜手王者榮耀、騰訊高校合作、騰訊游戲?qū)W院等共同發(fā)起,邀請來自清華大學(xué)、北京大學(xué)、上海交通大學(xué)等國內(nèi)18所頂尖高校的100多名學(xué)生同臺競技。
開悟是騰訊牽頭構(gòu)建的AI多智能體與復(fù)雜決策開放研究平臺,依托騰訊AI Lab和「王者榮耀」在算法、脫敏數(shù)據(jù)、算力方面的核心優(yōu)勢,為學(xué)術(shù)研究人員和算法開發(fā)者開放的國內(nèi)領(lǐng)先、國際一流研究與應(yīng)用探索平臺。
本屆大賽依托王者榮耀的游戲測試環(huán)境和開悟平臺提供的算法、脫敏數(shù)據(jù)、計算平臺等資源,為研究者開放脫敏游戲數(shù)據(jù)集及游戲核心集群,并提供評估工具、計算平臺以及其他研究支持服務(wù),以測試并提升AI在復(fù)雜對戰(zhàn)游戲場景下的多維度決策水平。
參賽隊伍需要在指定的時間內(nèi),在給定的資源下訓(xùn)練出最優(yōu)模型,并最終部署好使用最優(yōu)模型的AI服務(wù)器,提交系統(tǒng)進行1V1、5V5對局。大賽總獎金池高達50萬元,最終成績將于今年12月發(fā)布。
騰訊AI Lab團隊表示,在2019年8月18日的王者榮耀“無限開放計劃交流會”上,騰訊AI Lab與王者榮耀和高校攜手,開啟了對“AI+游戲開放平臺”的共建。一年后的今天,騰訊正式開放開悟平臺,希望延續(xù)“818無限開放”的美好寓意,向開放生態(tài)推動科研與應(yīng)用的愿景持續(xù)邁進。
為進一步促進技術(shù)交流,騰訊 AI Lab “AI+游戲”系列高端講座視頻已于開悟官網(wǎng)免費開放,歡迎大家前來了解國內(nèi)“AI+游戲”研究最新進展:
官網(wǎng)地址
aiarena.tencent.com
課題挑戰(zhàn):讓AI學(xué)會像人一樣決策
《王者榮耀》是一款移動端MOBA類游戲。基本玩法是通過推塔、擊殺敵人、賺取經(jīng)濟來得到優(yōu)勢,勝利條件是摧毀敵方的水晶基地;但細節(jié)玩法因所選模式的不同而略有不同。
不論是王者“大神”還是新手“小白”,游戲水平并不妨礙人類玩家從游戲中得到樂趣,但這個游戲?qū)I來說是個巨大的挑戰(zhàn)——AI 要在不完全信息、高度復(fù)雜度的情況作出復(fù)雜快速的決策。在龐大且信息不完備的地圖上,10位參與者要在策略規(guī)劃、英雄選擇、技能應(yīng)用、路徑探索及團隊協(xié)作上面臨大量、不間斷、即時的選擇,這帶來了極為復(fù)雜的局面,預(yù)計有高達10的20000次方種操作可能性,而整個宇宙原子總數(shù)也只是10的80次方。
具體而言,要實現(xiàn)勝利目標(biāo),需要考查AI的多項能力:智能體解決方案、特征、動作空間、模型結(jié)構(gòu)設(shè)計、強化學(xué)習(xí)算法設(shè)計、獎勵函數(shù)設(shè)計、訓(xùn)練方式探索等。
首屆“開悟AI+游戲高校大賽”分為初賽和決賽兩個階段。初賽為1V1玩法,決賽為5V5玩法,兩種玩法的挑戰(zhàn)任務(wù)均為摧毀敵方基地水晶。
初賽期間,參賽隊伍需通過基準(zhǔn)測試(在1V1對局中擊敗主辦方提供的基準(zhǔn)模型),方可進入與對手模型對戰(zhàn)的階段。之后參賽隊伍將進入兩兩對戰(zhàn)階段,勝利者可獲得1分,通過循環(huán)對戰(zhàn)積分得出排行榜,最終前6名將進入決賽。
決賽期間,每支隊伍的AI將操縱五位英雄對戰(zhàn),更大的動作空間挑戰(zhàn),將更考驗AI之間的配合協(xié)作。
資源支持:平臺,算力,gamecore與知識
騰訊AI Lab聯(lián)合王者榮耀、騰訊高校合作、騰訊游戲?qū)W院等合作伙伴,共同為參賽團隊提供全方位資源支持,幫助他們完成開悟大賽的課題挑戰(zhàn):
游戲核心集群(gamecore):業(yè)內(nèi)唯一讀取“王者榮耀”游戲場景和控制英雄行為的數(shù)據(jù)接口 Gamecore API,讓研究者可以基于這款經(jīng)受億級玩家考驗的成熟MOBA游戲測試環(huán)境,借助10萬級脫敏對局數(shù)據(jù),進行在復(fù)雜對戰(zhàn)游戲場景下的多維度決策AI研究。
算力資源:免費提供騰訊云計算與大數(shù)據(jù)處理平臺,可用于訓(xùn)練強化學(xué)習(xí)和模仿學(xué)習(xí)算法和模型。
評估工具:基于 Linux 環(huán)境的游戲?qū)?zhàn)工具和對局錄像回放工具,幫助研究者即時有效地評估新算法和模型的性能表現(xiàn),便于調(diào)試。
自今年5月起,騰訊 AI Lab 為參賽選手提供賽前培訓(xùn),專人指導(dǎo)選手熟悉使用平臺,了解監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)知識。6月下旬,騰訊 AI Lab 組織“開悟”內(nèi)部交流會,邀請來自北京大學(xué)、中國科學(xué)院自動化研究所、上海交通大學(xué)等高校的多位頂尖教授學(xué)者,為學(xué)生們分享他們在“AI+游戲”領(lǐng)域的前沿研究成果。
目前,騰訊 AI Lab “AI+游戲”系列高端講座也同步于開悟官網(wǎng)免費開放,面向行業(yè)共享國內(nèi)“AI+游戲”研究最新進展。
《斗地主的游戲復(fù)雜度和智能體復(fù)雜度的度量方法研究》北京大學(xué)教授李文新??
AI 玩斗地主還是挺難的,因為洗牌是隨機的,而玩家初始手牌對勝率影響很大。北京大學(xué)李文新團隊研究了初始手牌對“地主”或“農(nóng)民”的獲勝難度有何影響;另外,他們還提出了另一種新方法,可以評價一個斗地主 AI 的牌技好不好。
《基于動態(tài)不后悔策略的多智能體合作學(xué)習(xí)》中科院自動化所研究員興軍亮
要讓多個智能體學(xué)會合作是很困難的,既要設(shè)定各個智能體的目標(biāo),還要分出主力和輔助關(guān)系,實現(xiàn)這樣的復(fù)雜設(shè)計成本很高。中國科學(xué)院自動化研究所興軍亮團隊提出了一種自我提升式強化學(xué)習(xí)框架,先讓智能體通過模仿來學(xué)習(xí),再通過自我互博來進階進化,加上他們提出的一種新策略,可有效緩解一些多智能學(xué)習(xí)的常見問題。
《Behavioral?Diversity?Generation?via?Multi-Agent?Determinantal?Q-Learning》上海交通大學(xué)教授溫穎
或許《王者榮耀》高手們會覺得人機AI看起來都不太聰明。上海交通大學(xué)溫穎提出了一種新技術(shù),能讓AI們的合作方式更多樣化,從而不那么容易暴露自己的套路,讓游戲變得更有挑戰(zhàn)性。另外,這個技術(shù)還可以用于訓(xùn)練自動駕駛汽車。
開悟愿景:助力產(chǎn)學(xué)研,共享AI+游戲新生態(tài)
AI業(yè)界普遍認為,下一個 AI 里程碑可能會在復(fù)雜策略游戲中誕生:若 AI 能在如此復(fù)雜的環(huán)境中,學(xué)會人一樣實時感知、分析、理解、推理、決策到行動,就可能在多變、復(fù)雜的真實環(huán)境中發(fā)揮更大作用。世界頂級科技公司均在推進此類研究,如Google Deepmind(星際爭霸2)、Facebook(星際爭霸2) 及 Open AI(Dota 2)等。
騰訊 AI Lab 一直是此類智能體研究的先行者。2016年起,研發(fā)的圍棋 AI “絕藝”(Fine Art),現(xiàn)擔(dān)任中國國家圍棋隊訓(xùn)練專用 AI ;2017年,基于《王者榮耀》游戲測試環(huán)境啟動MOBA策略協(xié)作型AI“絕悟”研發(fā),2019年達到職業(yè)電競水平;騰訊還在射擊類頂級 AI 競賽 VizDoom 奪冠,并在《星際爭霸2》首先研發(fā)出擊敗內(nèi)置 AI 的智能體。
在2018年對戰(zhàn)頂尖水平的非職業(yè)戰(zhàn)隊時,絕悟表現(xiàn)出即時策略+團隊協(xié)作能力:在賽區(qū)聯(lián)隊全隊覆滅后, 「絕悟」的兵線尚未到達,下路高地塔還有過半血量,「絕悟」果斷選擇四人輪流抗塔,無兵線強拆塔。
借助開悟平臺,騰訊 AI Lab 希望聯(lián)動更多有興趣的高校和學(xué)者參與,共同探討和研究這些難題,并進一步將在該游戲測試環(huán)境中探索得到的新技術(shù)和新方法,應(yīng)用于日常生活中的現(xiàn)實問題。
總結(jié)
以上是生活随笔為你收集整理的首届“开悟AI+游戏高校大赛”启动的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Embedding在腾讯应用宝的推荐实践
- 下一篇: 有意思的 Node.js 内存泄漏问题