慕尼黑工业大学最新综述:深度神经网络中的不确定性
?PaperWeekly 原創 ·?作者?|?王馨月
學校?|?四川大學本科生
研究方向?|?自然語言處理
概要
在過去的十年中,神經網絡幾乎遍及所有科學領域,并成為各種現實世界應用的重要組成部分。由于日益普及,對神經網絡預測的置信度變得越來越重要。然而,基本的神經網絡不能提供確定性的估計,或者存在自信過度或不足的問題,即校準不當。為了克服這個問題,許多研究人員一直致力于理解和量化神經網絡預測中的不確定性。因此,已經確定了不確定性的不同類型和來源,并且已經提出了各種測量和量化神經網絡中不確定性的方法。
這項工作全面概述了神經網絡中的不確定性估計,回顧了該領域的最新進展,突出了當前的挑戰,并確定了潛在的研究機會。它旨在為對神經網絡中的不確定性預測感興趣的人提供廣泛的概述和介紹,而無需預先假定該領域的先驗知識。
論文標題:
A Survey of Uncertainty in Deep Neural Networks
論文鏈接:
https://arxiv.org/pdf/2107.03342.pdf
為此,這項工作全面介紹了最重要的不確定性來源,并將它們分為可減少的模型不確定性和不可減少的數據不確定性。介紹了基于確定性神經網絡、貝葉斯神經網絡、神經網絡集成和測試時間數據增強方法對這些不確定性的建模,并討論了這些領域的不同分支以及最新發展。
對于實際應用,我們討論了不同的不確定性度量、神經網絡校準方法,并概述了現有基線和可用實現。來自醫學圖像分析、機器人和地球觀測領域的廣泛挑戰的不同示例給出了有關神經網絡實際應用中不確定性的需求和挑戰的想法。此外,還討論了用于重視任務和安全的現實世界應用的神經網絡中不確定性量化方法的實際局限性,并給出了對此類方法更廣泛使用的下一步的展望。
引言
在過去十年中,深度神經網絡(DNN)取得了巨大進步,激勵著它們在需要對復雜系統進行建?;蚶斫獾母鞣N研究領域中進行調整,例如地球觀測、醫學圖像分析或機器人技術。盡管 DNN 在醫學圖像分析或自動駕駛車輛控制等高風險領域變得有吸引力,但它們在重視任務和安全的現實世界應用中的部署仍然有限。造成這種限制的主要因素是:
深度神經網絡的推理模型缺乏表現力和透明度,這使得很難相信他們的結果
無法區分領域內和領域外樣本以及對領域遷移的敏感性
無法為深度神經網絡的決策和頻繁發生的過度自信的預測提供可靠的不確定性估計
對于對抗性攻擊的敏感性,使深層神經網絡容易受到破壞
這些因素主要基于數據中已經包含的不確定性(數據不確定性)或缺乏對神經網絡的了解(模型不確定性)。為了克服這些限制,必須提供不確定性估計,以便可以忽略不確定的預測或將其傳遞給人類專家。提供不確定性估計不僅對高風險領域的安全決策很重要,而且在數據源高度不均勻且標記數據稀少的領域(例如遙感)也至關重要。同樣對于不確定性構成學習技術關鍵部分的領域,例如主動學習或強化學習,不確定性估計非常重要。
如圖,是數據、模型以及分類和回歸模型的分布不確定性的可視化。
近年來,研究人員對估計 DNN 中的不確定性表現出越來越大的興趣。估計預測的不確定性(預測不確定性)的最常見方法是基于對模型引起的不確定性(認知或模型不確定性)和數據引起的不確定性(任意或數據不確定性)進行單獨建模。
雖然模型不確定性可以通過改進 DNN 學習的模型來簡化,但數據不確定性是不可簡化的。對這種分離進行建模的最重要方法是貝葉斯推理、集成方法、測試時間數據增強方法或包含表示模型和數據不確定性的顯式組件的單一確定性網絡。
估計預測不確定性不足以進行安全決策。此外,確保不確定性估計是可靠的至關重要。為此,研究了 DNN 的校準特性(可靠性程度),并提出了重新校準方法以獲得可靠(校準良好)的不確定性估計。
有幾項工作介紹和概述了統計建模中的不確定性。Ghanem 等人出版了一本關于不確定性量化的手冊,其中包括對不確定性量化的不同概念的詳細而廣泛的描述,但沒有明確關注神經網絡的應用。Gal 和 Kendall 的論文很好地概述了貝葉斯神經網絡,尤其是蒙特卡羅(MC)Dropout 方法及其在計算機視覺任務中的應用。
Malinin 的論文還包含對先驗網絡的非常好的介紹和其他見解。王等人貢獻了兩項關于貝葉斯深度學習的調查,他們介紹了貝葉斯神經網絡(BNN)的一般框架和概念描述,然后介紹了用于神經網絡中不確定性量化的貝葉斯方法、特別關注推薦系統、主題模型和控制。在深度學習中的不確定性量化評估中,通過展示和比較基于 softmax 輸出、網絡集成、貝葉斯神經網絡和 MNIST 數據集上的自動編碼器的不確定性量化來給出。
關于不確定性量化方法在現實生活任務和安全關鍵應用中的實用性,Gustafsson 等人引入了一個框架來測試現實世界計算機視覺應用程序所需的穩健性,并比較了兩種流行的方法,即 MC Dropout 和 Ensemble 方法。Hullermeier 等人介紹了神經網絡中任意和認知不確定性的概念,并討論了對它們進行建模和量化的不同概念。與此相反,Abdar 等人概述了神經網絡中的不確定性量化方法,并為不同的應用領域提供了廣泛的參考清單,并討論了開放挑戰。
在這項工作中,我們對在處理神經網絡中的不確定性時必須考慮的所有概念進行了廣泛的概述,同時牢記在現實世界應用中的適用性。我們的目標是為讀者提供從不確定性來源到需要不確定性估計的應用的清晰線索。此外,我們指出了當前方法的局限性,并討論了未來要解決的進一步挑戰。
為此,我們對不同的方法和基本概念進行了廣泛的介紹和比較。該調查主要面向已經熟悉深度學習概念并計劃將不確定性估計納入其預測的人員。但對于已經熟悉該主題的人來說,這篇評論提供了對神經網絡中不確定性的整個概念及其在不同領域中的應用的有用概述。
總之,我們全面討論了:
不確定性的來源和類型
用于估計 DNN 中不確定性的最新研究和方法
評估不確定性估計的質量和影響的不確定性度量和方法
校準 DNN 的最新研究和方法
對常用評估數據集、可用基準和實施的概述
使用不確定性估計的實際應用概述
關于當前挑戰和未來進一步研究方向的討論
一般來說,如果沒有不同的說明,估計不確定性和校準 DNN 的原則和方法可以應用于所有回歸、分類和分割問題。為了更深入地了解這些方法的明確應用,我們參考了應用部分和參考文獻中的進一步閱讀。
如圖,是本文介紹的四種不同類型的不確定性量化方法(基于確定性神經網絡、貝葉斯神經網絡、神經網絡集成和測試時間數據增強)以及基本原理的可視化。
如圖,是本文介紹的不同類型不確定度校準方法(正則化方法、后處理方法、不確定性估計方法)的可視化。
總結與展望
總結——當前的不確定性量化方法在現實世界中的應用效果如何?
盡管過去幾年神經網絡在不確定性量化方面取得了許多進展,但它們在實際任務和安全關鍵應用中的采用仍然有限。造成這種情況的原因有很多,下面一一討論:
缺少對現實世界問題現有方法的驗證:盡管 DNN 已成為解決眾多計算機視覺和醫學圖像處理任務的事實標準,大多數現有模型還是無法適當量化其推論所固有的不確定性,特別是在實際應用中。
這主要是因為基線模型大多是使用標準數據集開發的,例如 Cifar10/100、ImageNet 或特定于特定用例的眾所周知的回歸數據集,因此不容易適用于復雜的現實世界環境,例如低分辨率衛星數據或其他受噪聲影響的數據源。盡管來自其他領域的許多研究人員在他們的領域中應用了不確定性量化,但基于不同現實世界應用的現有方法的廣泛和結構化評估尚不可用。
缺乏標準化的評估協議:評估估計不確定度的現有方法更適合比較基于可測量的不確定度量化方法,例如校準或分布外檢測的性能。這些測試是在機器學習社區內的標準化集上執行的。此外,這些實驗的細節可能因不同論文的實驗設置而異。然而,仍然沒有一個明確的標準化測試協議,能夠對不確定性量化方法進行測試。
對于來自其他領域的研究人員來說,很難直接找到他們感興趣的領域的最先進的方法,更不用說關于關注不確定性量化的哪個子領域的艱難決定了。這使得對最新方法的直接比較變得困難,并且也限制了當前用于不確定性量化的現有方法的接受和采用。
無法評估與單一決策相關的不確定性:用于評估估計不確定性(例如:預期校準誤差)的現有措施基于整個測試數據集。這意味著,相較于不平衡數據集上的分類任務,與單個樣本或小樣本組相關的不確定性可能會偏向于數據集其余部分的性能。
但是對于實際應用,評估預測置信度的可靠性將比基于某些與當前情況無關的測試數據的聚合可靠性提供更多的可能性。特別是對于重視任務和安全的應用程序,逐點評估措施可能是最重要的,因此這種評估方法是非??扇〉?。
缺乏真實的不確定性:當前的方法是根據經驗評估的,其性能通過合理且可解釋的不確定性值得到強調??捎糜隍炞C的真實不確定性通常不可用。此外,即使現有方法在給定數據集上進行校準,也不能簡單地將這些結果轉移到任何其他數據集,因為人們必須意識到數據分布的變化,而且許多領域只能覆蓋實際數據的一小部分環境。
在 EO(地球觀測)等應用領域,準備大量訓練數據既困難又昂貴,因此可以使用合成數據來訓練模型。對于這種人工數據,應考慮標簽和數據中的人工不確定性,以便更好地了解不確定性量化性能。真實數據和合成數據之間的差距,或估計的不確定性和真實的不確定性之間的差距進一步限制了采用當前現有的不確定性量化方法。
可解釋性問題:現有的神經網絡不確定性量化方法提供了確定性的預測,而沒有任何關于可能導致不確定性的線索。盡管這些確定性值對于人類觀察者來說通常看起來是合理的,但人們不知道這些不確定性是否實際上是基于人類觀察者所做的相同觀察而預測的。但是,如果不確定單個不確定性估計的原因和動機,從一個數據集到另一個數據集的正確轉移,甚至只是域轉移,在保證性能的情況下實現起來要困難得多。
關于安全關鍵的現實生活應用,缺乏可解釋性使得可用方法的應用變得更加困難。除了神經網絡決策的可解釋性之外,現有的不確定性量化方法在更高層次上還沒有得到很好的理解。例如,解釋單一確定性方法、集成或貝葉斯方法的行為是當前的研究方向,仍然難以掌握每一個細節。然而,了解這些方法如何運作和捕獲不確定性以識別改進途徑、檢測和表征不確定性、故障和重要缺陷是至關重要的。
展望
通用評估框架:正如上面已經討論過的,關于不確定性方法的評估仍然存在問題,如缺乏“ground truth”不確定性、無法在單個實例上進行測試以及標準化的基準測試協議等。為了應對這些問題,提供包含涵蓋所有類型不確定性的各種具體基線數據集和評估指標的評估協議無疑將有助于促進不確定性量化的研究。
此外,還應考慮對風險規避和最壞情況的評估。這意味著,具有非常高預測不確定性的不確定性預測永遠不會失敗,例如對紅色或綠色交通燈的預測。這種通用協議將使研究人員能夠輕松地將不同類型的方法與既定的基準以及現實世界的數據集進行比較。會議和期刊應鼓勵采用這種標準評估協議。
基線的專家和系統比較:目前還沒有對現實世界應用中不確定性估計的現有方法進行廣泛和結構化的比較。在當前的機器學習研究論文中,對現實世界數據的評估甚至不是標準。因此,對于特定的應用,尚不清楚哪種不確定性估計方法效果最好,以及最新方法是否在現實世界的例子中也優于舊方法。
這也部分是由于這樣一個事實,即來自其他領域的研究人員使用不確定性量化方法,通常在特定問題或手工數據集上成功應用單一方法。考慮到這一點,可以采用幾點以便在不同研究領域內進行更好的比較。例如,領域專家還應該將不同的方法相互比較,并展示該領域中單一方法的弱點。
同樣,為了更好地在多個領域之間進行比較,可以在中央平臺上收集和交換不同現實世界領域中所有作品的集合。這樣的平臺還可以幫助機器學習研究人員在現實世界中提供額外的挑戰來源,并將為廣泛突出當前最先進方法的弱點鋪平道路。谷歌關于神經網絡不確定性基線的存儲庫可能是這樣一個平臺,也是朝著實現這一目標邁出的一步。
不確定性基本事實:由于缺乏不確定的基本事實,驗證現有方法仍然很困難??梢砸灶愃?ImageNet 的方式比較方法的實際不確定性基礎事實將使對單個樣本的預測的評估成為可能。為了實現這一點,可能會更詳細地調查對數據生成過程和發生的不確定性來源(例如標記過程)的評估。
可解釋性和物理模型:了解錯誤的高確定性或低確定性的實際原因可以更容易地為現實生活應用設計方法,這再次增加了人們對此類方法的信任。最近,Antoran 等人聲稱發表了關于可解釋不確定性估計的第一部著作。
一般來說,不確定性估計是邁向可解釋人工智能的重要一步??山忉尩牟淮_定性估計將更深入地了解神經網絡的決策過程,在 DNN 的實際部署中,神經網絡應結合所需的規避風險能力,同時在現實世界中保持適用(尤其是安全關鍵應用)。
此外,使用基于物理的論點提高可解釋性的可能性提供了巨大的潛力。雖然 DNN 非常靈活和高效,但它們并沒有直接嵌入領域特定的專家知識,這些知識通??捎脭祵W或物理模型來描述,例如地球系統科學問題。這種物理引導模型提供了多種可能性,可以將顯性知識和實際的不確定性表示包含到深度學習框架中。
更多閱讀
#投 稿?通 道#
?讓你的文字被更多人看到?
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。?
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學術熱點剖析、科研心得或競賽經驗講解等。我們的目的只有一個,讓知識真正流動起來。
?????稿件基本要求:
? 文章確系個人原創作品,未曾在公開渠道發表,如為其他平臺已發表或待發表的文章,請明確標注?
? 稿件建議以?markdown?格式撰寫,文中配圖以附件形式發送,要求圖片清晰,無版權問題
? PaperWeekly 尊重原作者署名權,并將為每篇被采納的原創首發稿件,提供業內具有競爭力稿酬,具體依據文章閱讀量和文章質量階梯制結算
?????投稿通道:
? 投稿郵箱:hr@paperweekly.site?
? 來稿請備注即時聯系方式(微信),以便我們在稿件選用的第一時間聯系作者
? 您也可以直接添加小編微信(pwbot02)快速投稿,備注:姓名-投稿
△長按添加PaperWeekly小編
????
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結
以上是生活随笔為你收集整理的慕尼黑工业大学最新综述:深度神经网络中的不确定性的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 银行卡输错密码被锁了几天可以自动解锁
- 下一篇: 电瓶车有多大火灾隐患 发生意外后果不堪设