直播 NO.5 | Facebook 田渊栋:用深度(强化)学习为组合优化寻找更好的启发式搜索策略...
↑↑↑↑↑點(diǎn)擊上方藍(lán)色字關(guān)注我們!
『運(yùn)籌OR帷幄』原創(chuàng)
對(duì)這次分享主題感興趣的小伙伴,
歡迎在文末留言提問(wèn),
我們會(huì)收集有價(jià)值的問(wèn)題,
請(qǐng)嘉賓在直播中親自解答。
分享提綱
主題:《用深度(強(qiáng)化)學(xué)習(xí)為組合優(yōu)化尋找更好的啟發(fā)式搜索策略》
嘉賓:田淵棟博士
時(shí)間:北京時(shí)間 2020年 2月23號(hào)(周日) 早 10:00
地點(diǎn):『運(yùn)籌OR帷幄』嗶哩嗶哩直播間
鏈接:live.bilibili.com/21459168
題目
Learning heuristic with Deep Learning and Reinforcement Learning for combinatorial optimization problems?
簡(jiǎn)介
本次直播我們有幸請(qǐng)到 Facebook AI Lab 的田淵棟博士,為大家介紹他和團(tuán)隊(duì)近期在頂會(huì) NeurIPS 和 ICLR 發(fā)表的三篇文章 [1] [2] [3],內(nèi)容涉及用(深度)強(qiáng)化學(xué)習(xí)和搜索方法搭配神經(jīng)網(wǎng)絡(luò)來(lái)尋找復(fù)雜優(yōu)化問(wèn)題的啟發(fā)式算法的一些工作。
近年來(lái),深度學(xué)習(xí)在處理自然數(shù)據(jù)輸入(如計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別和自然語(yǔ)言處理)方面成績(jī)斐然。然而,怎樣用深度神經(jīng)網(wǎng)絡(luò)來(lái)處理結(jié)構(gòu)化的數(shù)據(jù),(如日志,優(yōu)化問(wèn)題的結(jié)構(gòu)化描述,代碼),為一些離散優(yōu)化問(wèn)題找到一條替代人力啟發(fā)式策略的神經(jīng)網(wǎng)絡(luò)方案,仍然是個(gè)未解決的問(wèn)題。本次直播,我將簡(jiǎn)要介紹近期我們用強(qiáng)化學(xué)習(xí)和搜索方法搭配神經(jīng)網(wǎng)絡(luò),來(lái)尋找復(fù)雜優(yōu)化問(wèn)題的啟發(fā)式算法的一些工作。涉及到的應(yīng)用領(lǐng)域包括:化簡(jiǎn)符號(hào)表達(dá)式、在線事務(wù)調(diào)度、車輛路徑規(guī)化、神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索,以及從匯編代碼中反編譯出C代碼。
嘉賓介紹
?
田淵棟博士,臉書(Facebook)人工智能研究院研究員及經(jīng)理,研究方向?yàn)樯疃葟?qiáng)化學(xué)習(xí),多智能體學(xué)習(xí),及其在游戲中的應(yīng)用,和深度學(xué)習(xí)模型的理論分析。曾擔(dān)任圍棋開(kāi)源項(xiàng)目 DarkForest 及 ELF OpenGo 項(xiàng)目中研究及工程負(fù)責(zé)人和第一作者。2013-2014年在Google無(wú)人駕駛團(tuán)隊(duì)任軟件工程師。2005年及08年于上海交通大學(xué)獲本碩學(xué)位,2013年于美國(guó)卡耐基梅隆大學(xué)機(jī)器人研究所獲博士學(xué)位。曾獲得2013年國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)(ICCV)馬爾獎(jiǎng)提名(Marr Prize Honorable Mentions)。
? ? ? ?
掃描二維碼直達(dá)『運(yùn)籌OR帷幄』B 站直播間
對(duì)這次分享主題感興趣的小伙伴,歡迎在文末留言提問(wèn),我們會(huì)收集有價(jià)值的問(wèn)題,請(qǐng)嘉賓在直播中親自解答
參考文獻(xiàn):
[1] Chen, X., & Tian, Y. (2019). Learning to perform local rewriting for combinatorial optimization. In?Advances in Neural Information Processing Systems?(pp. 6278-6289).
[2] Fu, C., Chen, H., Liu, H., Chen, X., Tian, Y., Koushanfar, F., & Zhao, J. (2019). Coda: An end-to-end neural program decompiler. In?Advances in Neural Information Processing Systems?(pp. 3703-3714).
[3] Wang, L., Xie, S., Li, T., Fonseca, R., & Tian, Y. (2019). Sample-efficient neural architecture search by learning action space.?arXiv preprint arXiv:1906.06832.
相關(guān)文章推薦
強(qiáng)化學(xué)習(xí)已經(jīng)取得像AlphaGo這樣舉世矚目的成績(jī),也成為最近的一個(gè)研究熱點(diǎn)。組合優(yōu)化是應(yīng)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)、運(yùn)籌學(xué)等領(lǐng)域的重要問(wèn)題,在調(diào)度、資源分配、物流、城市規(guī)劃、電路設(shè)計(jì)、制藥等領(lǐng)域應(yīng)用廣泛。強(qiáng)化學(xué)習(xí)與組合優(yōu)化結(jié)合,能產(chǎn)生什么新機(jī)會(huì)?本次『運(yùn)籌OR帷幄』社群線上直播,我們有幸邀請(qǐng)到了人工智能公司attain.ai.創(chuàng)始人,加拿大阿爾伯塔大學(xué)計(jì)算機(jī)系博士李玉喜先生,結(jié)合具體場(chǎng)景,為我們講解強(qiáng)化學(xué)習(xí)在組合優(yōu)化中的應(yīng)用。
點(diǎn)擊藍(lán)字標(biāo)題,即可閱讀《直播回顧 | Attain.ai 創(chuàng)始人李玉喜:強(qiáng)化學(xué)習(xí)遇見(jiàn)組合優(yōu)化》
往期直播回顧
直播NO.1 | PLM 合伙人李偉:從第一方物流到第五方物流,淺談物流服務(wù)的演進(jìn)
直播 NO.2 | 胡武華博士:運(yùn)籌優(yōu)化理論在物流行業(yè)中的應(yīng)用實(shí)踐
直播 NO.3 | 滴滴 AI Labs 秦志偉:深度強(qiáng)化學(xué)習(xí)在網(wǎng)約車交易市場(chǎng)中的應(yīng)用
直播 NO.4 | 李玉喜博士:強(qiáng)化學(xué)習(xí)遇見(jiàn)組合優(yōu)化
文案:p、張長(zhǎng)浩
技術(shù):小王
審核編輯:阿春
微信編輯:葡萄
總結(jié)
以上是生活随笔為你收集整理的直播 NO.5 | Facebook 田渊栋:用深度(强化)学习为组合优化寻找更好的启发式搜索策略...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 一篇文章把Self-Attention与
- 下一篇: 一些在NLP的面试中提问频率非常高的问题