什么是小样本学习?这篇综述文章用166篇参考文献告诉你答案
一只小狐貍帶你解鎖 煉丹術(shù)&NLP?秘籍
來源:機(jī)器之心
什么是小樣本學(xué)習(xí)?它與弱監(jiān)督學(xué)習(xí)等問題有何差異?其核心問題是什么?來自港科大和第四范式的這篇綜述論文提供了解答。
數(shù)據(jù)是機(jī)器學(xué)習(xí)領(lǐng)域的重要資源,在數(shù)據(jù)缺少的情況下如何訓(xùn)練模型呢?小樣本學(xué)習(xí)是其中一個解決方案。來自香港科技大學(xué)和第四范式的研究人員綜述了該領(lǐng)域的研究發(fā)展,并提出了未來的研究方向。
這篇綜述論文已被 ACM Computing Surveys 接收,作者還建立了 GitHub repo,用于更新該領(lǐng)域的發(fā)展。
論文地址:https://arxiv.org/pdf/1904.05046.pdf
GitHub 地址:https://github.com/tata1661/FewShotPapers
機(jī)器學(xué)習(xí)在數(shù)據(jù)密集型應(yīng)用中取得了很大成功,但在面臨小數(shù)據(jù)集的情況下往往捉襟見肘。近期出現(xiàn)的小樣本學(xué)習(xí)(Few-Shot Learning,FSL)方法旨在解決該問題。FSL 利用先驗知識,能夠快速泛化至僅包含少量具備監(jiān)督信息的樣本的新任務(wù)中。
這篇論文對 FSL 方法進(jìn)行了綜述。首先,該論文給出了 FSL 的正式定義,并厘清了它與相關(guān)機(jī)器學(xué)習(xí)問題(弱監(jiān)督學(xué)習(xí)、不平衡學(xué)習(xí)、遷移學(xué)習(xí)和元學(xué)習(xí))的關(guān)聯(lián)和差異。然后指出 FSL 的核心問題,即經(jīng)驗風(fēng)險最小化方法不可靠。
基于各個方法利用先驗知識處理核心問題的方式,該研究將 FSL 方法分為三大類:
數(shù)據(jù):利用先驗知識增強(qiáng)監(jiān)督信號;
模型:利用先驗知識縮小假設(shè)空間的大小;
算法:利用先驗知識更改給定假設(shè)空間中對最優(yōu)假設(shè)的搜索。
最后,這篇文章提出了 FSL 的未來研究方向:FSL 問題設(shè)置、技術(shù)、應(yīng)用和理論。
論文概覽
該綜述論文所覆蓋的主題見下圖:
我們選取介紹了該綜述論文中的部分內(nèi)容,詳情參見原論文。
什么是小樣本學(xué)習(xí)
FSL 是機(jī)器學(xué)習(xí)的子領(lǐng)域。
我們先來看機(jī)器學(xué)習(xí)的定義:
計算機(jī)程序基于與任務(wù) T 相關(guān)的經(jīng)驗 E 學(xué)習(xí),并得到性能改進(jìn)(性能度量指標(biāo)為 P)。
基于此,該研究將 FSL 定義為:
小樣本學(xué)習(xí)是一類機(jī)器學(xué)習(xí)問題,其經(jīng)驗 E 中僅包含有限數(shù)量的監(jiān)督信息。
下圖對比了具備充足訓(xùn)練樣本和少量訓(xùn)練樣本的學(xué)習(xí)算法:
FSL方法分類
根據(jù)先驗知識的利用方式,FSL方法可分為三類:
FSL 方法解決少樣本問題的不同角度。
基于此,該研究將現(xiàn)有的 FSL 方法納入此框架,得到如下分類體系:
數(shù)據(jù)
此類 FSL 方法利用先驗知識增強(qiáng)數(shù)據(jù) D_train,從而擴(kuò)充監(jiān)督信息,利用充足數(shù)據(jù)來實現(xiàn)可靠的經(jīng)驗風(fēng)險最小化。
如上圖所示,根據(jù)增強(qiáng)數(shù)據(jù)的來源,這類 FSL 方法可分為以下三個類別:
模型
基于所用先驗知識的類型,這類方法可分為如下四個類別:
算法
根據(jù)先驗知識對搜索策略的影響,此類方法可分為三個類別:
文章最后從問題設(shè)置、技術(shù)、應(yīng)用和理論四個層面探討了小樣本學(xué)習(xí)領(lǐng)域的未來發(fā)展方向。
可
能
喜
歡
在深度學(xué)習(xí)頂會ICLR 2020上,Transformer模型有什么新進(jìn)展?
算法工程師的效率神器——vim篇
推薦系統(tǒng)的價值觀
硬核推導(dǎo)Google AdaFactor:一個省顯存的寶藏優(yōu)化器
賣萌屋上線Arxiv論文速刷神器,直達(dá)學(xué)術(shù)最前沿!
夕小瑤的賣萌屋
_
關(guān)注&星標(biāo)小夕,帶你解鎖AI秘籍
訂閱號主頁下方「撩一下」有驚喜哦
總結(jié)
以上是生活随笔為你收集整理的什么是小样本学习?这篇综述文章用166篇参考文献告诉你答案的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 视频问答兴起,多跳问答热度衰退,92篇论
- 下一篇: 号外号外,第一届沙雕项目竞赛,这些项目以