“人工智能的数理基础”主题论坛,五位学者从数学角度解决AI问题
導語:來自北京大學的五位學者參加了“人工智能的數理基礎”主題論壇,他們從數學、統計和計算的角度做了學術報告。
智東西5月9日消息,圍繞當前人工智能面臨的可計算性、可解釋性、泛化性、穩定性的重大理論挑戰,北京智源人工智能研究院從數學、統計和計算的角度,發起了“人工智能的數理基礎”主題論壇,并將邀請眾多學者將分享他們在這一領域的研究經驗。本次論壇由北京大學數學科學學院夏壁燦主持。
在本次論壇上做學習報告的學者有:北京大學國際數學研究中心長聘副教授、主任助理,北京大數據研究院深度學習實驗室研究員、生物醫學影像分析實驗室副主任董彬、北京大學數學科學學院及統計科學中心研究員林偉、北京大學數學科學學院副教授邵嗣烘、北京大學數學科學學院及統計科學中心研究員王涵以及北京大學數學科學學院統計學長聘教授、大數據研究中心數據科學教授張志華。這五位學者也都是首批智源學者候選人。
智源學者計劃是由智源人工智能研究院為選拔和培養一批人工智能人才而提出的。首批智源學者中,“人工智能數理基礎”研究方向首席科學家由中國科學院院士、北京大學數學科學學院張平文教授擔任,夏壁燦教授擔任智能研究項目經理。
下文將簡要介紹五位學者在此次主題論壇上的報告。
一、董璇:用微分方程來指導深層神經網絡構架設計
董斌今天的報告主題是《Bridging Deep Neural Networks and Differential Equations for Image Analysis and Beyond》。
他在報告中展示了自己將兩大類數學方法小波和PDE方法相聯系,證明了常用的小波模型可以漸進逼近各類變分和PDE模型,該研究既為小波方法注入了幾何直觀,也賦予了PDE方法稀疏逼近的解釋,讓其設計出結合兩類方法優點的新模型。
他介紹了他們團隊將PDE和深度學習建立起聯系,率先提出以數值(偏)微分方程離散格式為指導的深層神經網絡構架設計的新思想,為圖像處理、圖像識別、未知物理模型反衍、模型約簡等重要問題設計全新、精簡、高效的深層神經網絡。
二、林偉:維數不只是詛咒,還應該是祝福
林偉的報告題目是《破解機器學習中的維數災難:從可辨識性談起》。
他在報告中指出,近年來,以深度學習為代表的“黑箱”機器學習算法在應用中獲得了巨大成功,但缺乏可解釋性和嚴格的理論基礎。深度神經網絡可被視為一類過參數化模型,與經典統計模型存在很大差別。
他認為,可辨識性和維數災難是從統計學角度理解機器學習的關鍵。他從統計模型的可辨識性談起,簡要介紹了高維統計中克服維數災難的主要方法,及其對解釋深度神經網絡泛化能力的有益啟示。
他說:“維數不只是詛咒,還應該是祝福?!?/p>
三、邵嗣烘:通過連續問題發展高效算法
邵嗣烘帶來了《面向智能的數學》為題的報告,他用人類的終結問題——人從哪來要到哪去,人如何意識到自己是自己本身來引出自己的報告。
人類智能的物質基礎是由約1000億個神經元組成的腦神經網絡,該網絡如何產生智能一直以來都是懸而未決的終極問題,因為追蹤其中任何兩個神經元之間的連接或關聯無論對數學理論還是算法設計而言都是巨大的挑戰。
為了在腦神經網絡上建立合適的數學模型來刻畫由物質世界的物理定律演變成思想世界的意識智能的過程,他的項目將從兩個角度在這個方向上開展探索。一方面,基于量子力學的維格納函數描述,他和團隊將試圖在腦神經網絡上運行維格納量子動力學來計算不同神經元間的量子關聯;另一方面,作為更基礎的部分,需要發展網絡或圖上的數學,他們將通過建立和離散問題等價的連續問題發展高效的算法,同時在網絡上引入更多現代數學的概念。
四、王涵:基于深度學習的分子動力學數字方法
王涵的報告題目為《Deep Learning for Multiscale Molecular Modeling》。
王涵介紹了他和合作者發展的基于深度學習的原子間相互作用建模方法——深度勢能。這種通過模型一致性估計深度勢能模型誤差的方法,從本質上改善了原子間相互作用的建模精度。
他們的研究成果被英國皇家學會外籍院士Parrinello所發展應用在研究硅的熔化上,克服了傳統原子間相互作用模型無法同時精確刻畫硅的固相和液相的困難。王涵還介紹,他們的成果也被背景師范大學的崔剛龍教授所擴展,用于對非絕熱激發態分子動力學建模,克服了傳統方法在能量面交接錐處模型精度低的難題。
五、張志華:機器學習是解決人工智能的王者之道
張志華的報告題目為《數學工程——理解機器學習的一種角度》。他介紹了機器學習的現狀和技術路線。
機器學習是從數據中挖掘出有價值的信息。數據本身是無意識的,它不能自動呈現出有用的信息。怎樣才能找出有價值的東西呢?第一步要給數據一個抽象的表示;接著基于表示進行建模;然后估計模型的參數,也就是計算。
張志華認為機器學習的第一個階層是基于規則的學習,這個階段的歷程比較成熟,它的目的就是規則,用規則去做預測。代表的形態有專家系統和句法模式識別。
后來,研究人員慢慢發現要做到從數據到表示牽涉深入的領域背景知識。比如,自然語言處理需要生活與的語言學背景,視覺或圖像則需要通過認知、神經科學等來獲取表示。
研究人員也慢慢發現,基于規則去學習出現了一些問題,比如,基于規則的模型對于淺層推理有效,但沒法用來進行深層次的推理。如果規則過多,要做到在規則里面進行搜索,就容易出現維數災難的問題。
為了解決這個問題,一個簡單的思路是弱化從數據到表示的環節,基于這樣的理論,機器學習進入了第二個階段,即統計推理學習。
從1995年到2005年的十年,是統計機器學習黃金發展的十年。我們看到的應用領域,比如計算機識別、語音識別,他們的核心方法是統計方法。
統計學習是統計建模和算法計算的結合。神經網絡在這個時期表現的并不是很好,處于低落階段。
但當統計學習發展到一定階段,人們發現數據到表示這件事情還是無法繞過。研究人員就順其自然地想要讓機器通過學習,也就是通過一個自動化的方式去解決表示問題。
所以機器學習進入了第三個階段即基于深度表示的學習。在這個時期,大模型+大數據+大計算使得這個思路變得可行。
張志華認為機器學習的關鍵在于表示學習,表示需要適合預測和適合計算。深度表示目前遇到的挑戰在于,由于大數據的需要可能導致過參數化,并且由于多層的表示,導致問題高度非凸化。
機器學習的基礎原則是可預測性、可計算性以及穩定性。
張教授也介紹了機器學習的關鍵技術思路:深度表示、規范技術、平均化技術。其中,規范技術用來處理過擬合、病態、非穩定性的問題。
張志華最后總結到,統計為解決問題提供了數據驅動的建模途徑,概率論、隨機分析、微分方程、微分流形等工具可以引入來研究AI的數學機理。無論從統計角度還是數學角度來研究AI,其實際性能最后都要通過計算呈現出來。
在回答現場觀眾的問題時,張志華說機器學習是現代統計學,機器學習是解決人工智能的王者之道。
結語:智源學者計劃支持人工智能數理基礎學者勇闖AI“無人區”
據北京智源人工智能研究院副院長劉江介紹,此次論壇為智源的首次論壇。他認為,我國現在對于人工智能的研究還算不錯,但相比與美國還存在很大差距。而智源想要把北京市真正有能力的科學家組織起來,支持他們勇闖人工智能“無人區”。
今天論壇上做學術報告的五位學者從數學、統計和及計算的角度,為迎接人工智當下面對的挑戰做出了自己的努力。學界優秀的學者將會推進我國智能研究的進一步發展。
總結
以上是生活随笔為你收集整理的“人工智能的数理基础”主题论坛,五位学者从数学角度解决AI问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 到2020年,将有60%的工作被人工智能
- 下一篇: 深度学习基础入门(一):基本概念和术语解