GMIS 2017 大会余凯演讲:深度学习引领驾驶革命
GMIS 2017 大會余凱演講:深度學習引領駕駛革命
2017-05-27 16:32:37 ???深度學習???創業公司???人工智能應用???自動駕駛??? 0?0?0全球機器智能峰會(GMIS 2017),是全球人工智能產業信息服務平臺機器之心舉辦的首屆大會,邀請了來自美國、歐洲、加拿大及國內的眾多頂級專家參會演講。本次大會共計 47 位嘉賓、5 個 Session、32 場演講、4 場圓桌論壇、1 場人機大戰,兼顧學界與產業、科技巨頭與創業公司,以專業化、全球化的視角為人工智能從業者和愛好者奉上一場機器智能盛宴。
5 月 27 日,機器之心主辦的為期兩天的全球機器智能峰會(GMIS 2017)在北京 898 創新空間順利開幕。中國科學院自動化研究所復雜系統管理與控制國家重點實驗室主任王飛躍為本次大會做了開幕式致辭,他表示:「我個人的看法是再過幾年,我們 90% 的工作是人工智能提供的,就像我們今天大部分工作是機器提供的一樣。我們知道人工智能會給我們提供一個更美好的未來。」大會第一天重要嘉賓「LSTM 之父」Jürgen Schmidhuber、Citadel 首席人工智能官鄧力、騰訊 AI Lab 副主任俞棟、英特爾 AIPG 數據科學部主任 Yinyin Liu、GE Transportation Digital Solutions CTO Wesly Mukai 等知名人工智能專家參與峰會,并在主題演講、圓桌論壇等互動形式下,從科學家、企業家、技術專家的視角,解讀人工智能的未來發展。
下午,地平線機器人創始人余凱發表了主題為《深度學習引領駕駛革命》的演講,他探討分享了如何在自動駕駛中構建深度學習。以下是該演講的主要內容:
每個人都在談深度學習,深度學習改變了語音識別、圖像識別、自然語言、搜索,當然還有下圍棋。那么,深度學習會引起下一個革命,并且對人類生活影響最深遠的是什么?我個人的答案是自動駕駛。
2025 年,每年將有五千萬輛新車銷售,這是很大的市場。去年,美國銷售了 1700 萬輛汽車,中國銷售了 2800 萬輛,成為世界第一大汽車市場。但中國面臨著很多挑戰,一是堵車,二是中國的司機欠缺規則意識。三是中國交通事故造成的死亡率排名世界第一。
我們能否用技術使交通出行更加便捷,人們的生活更加安全?深度學習是否可以發揮作用?
過去,我在圖像、語音,包括自然語言、互聯網搜索,做了很多項目,深度學習對整個 AI 的改變,我深有體會。
我們看到深度學習在很多領域,有巨大的進展。舉兩個例子,其一,我過去曾負責一個搜索項目,當時我所在的百度希望用深度學習提升搜索的相關性,但是用深度學習訓練,需要大量數據。如果用人工標注這樣的數據,花費時間大,各方面的成本都很高。我們想到,或許我們可以使用互聯網數據。比如,我們觀測到用戶點擊了這個網頁,卻沒有點擊另外一個網頁,這說明用戶隱含做了一個投票,投票不是跟點擊的網頁相關,而是點擊的網頁與沒有點擊的網頁更相關。這樣一個三元組,不需要人工標注,收集起來很容易,幾乎是無限制的訓練樣本,可以訓練大規模的神經網絡。實際上,我們正是這樣做的,用一千個樣本訓練有一億個參數的模型,提升搜索引擎排序相關性。Google 做的一個項目,也有相似的想法和模型。
另外一個例子,AlphaGo2.0 給我們帶來一個啟示,那就是,你不僅可以從過去人類棋手的歷史數據中學習,還可以產生虛擬數據去學習,這種方法也不需要人工標注的數據。
這兩個例子表明,我們可能要拋棄過去訓練系統的模式,構建一個學習系統,使系統自己學習,隨著不斷地嘗試,它能不斷演進。
從自動駕駛的角度來講,從司機、使用者的自然行為去學習,或者構建一個仿真系統,在封閉環境中,讓汽車充分暴露控制算法里各種邊界的問題,然后去自我提升。實際上,這兩種方法都有非常顯著的優越性,因為一輛車每天搜集的數據,規模大到你無法想象,如果用人工去標注,是不可能實現的。
但是,構建深度學習系統,是系統性的工程,軟件算法、系統軟件,計算架構、處理器,云端大數據的訓練,仿真系統,都需要重新構建。
首先,在軟件算法方面,我們關注三方面。
一,Transparency,可解釋性。在駕駛領域,黑匣子是不可接受的,如果有什么異常的行為發生,一定要知道原因,因而它必須是可以解釋的。
二,端到端的學習,讓這個系統能自我演進,而不是被人工標注訓練。
三,讓軟件跟硬件適配,優化計算性能,使其低功耗。未來大量的車將會使用電池,如果功耗很高,發熱將是問題。
90 年代,在機器學習領域,有一個比深度學習更加主流的框架——Bayes Networks,在不確定條件下,使智能系統去推理、學習。如果我們把深度神經網絡與 Bayes Networks 結合,就有可能構建一個子模塊由深度神經網絡組成的可解釋的大系統。
這是我們公司構建的雨果自動駕駛的軟件系統,實際上,它是一個巨大的網絡,由轉接神經網絡及其他形式的神經網絡構建。這既可以使每個子模塊用傳統方法來學習,也可以使整個系統進行端到端學習。而這個系統每個模塊的接口都清晰可定義,有清晰的語義,因此,可以添加政府的規章制度以及新的法律法規,形成一個 Learning Cars,使它從真實的數據中學習。除此之外,它能使軟件系統充分調用硬件資源,能解決 GPU 功耗太高、延遲較多的問題。
另外,整個駕駛到感知、決策,中間所有的步驟都有不同的計算模式,因而需要構造不同的硬件去優化這種計算。因此我們公司從成立開始,就決心做自己的硬件,使硬件適應算法專家構想的新算法。
舉個例子,某個 GPU 的訓練,計算力是最強大的,但它計算的效率,每瓦的功耗所完成的計算,卻是不高的。我們構造的處理器架構,計算效率逼近物理極限。
對我們的處理器,我們構建了超過上百類的實時識別,從整個場景中抽取對自動駕駛來說非常重要的方面,比如我們不關心這輛公共汽車的窗戶數量,但我們關心它在哪個位置,朝向哪個方向,因為這關乎它下個 5 秒向哪個方向行駛。而這是目前的 GPU 做不到的。
不過,我們當前的這代處理器架構主要是為感知設計的,未來處理器的架構,更多地要為決策設計,這將比今天 AlphaGo 所面對的決策問題更加復雜,因為自動駕駛是一個龐大的系統。
另外,一輛自動駕駛的汽車,每天在路上收集的數據就有 6Million。一千輛自動駕駛汽車收集的數據,比百度圖像搜索引擎所見所得的總和還要多。但是,不只是要在現實世界駕駛,還要通過數百億仿真系統在虛擬場景駕駛,這對云端計算的要求非常高,我們也面臨這樣的挑戰。
最后,我總結一下今天的核心內容:
一,未來的自動駕駛一定會像其他產業,構建一輛自主學習的汽車,而不是被人工標注數據訓練的汽車。二,我們需要努力設計神經網絡的結構,使它透明,可理解,可以被控制。三,軟件重要,硬件同樣重要,我們要聯合軟件和硬件,最大化整個計算的效率、安全性和系統的可靠性。
總結
以上是生活随笔為你收集整理的GMIS 2017 大会余凯演讲:深度学习引领驾驶革命的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: GMIS 2017 大会陈雨强演讲:机器
- 下一篇: GMIS 2017大会戴文渊演讲:构建A