【NLP】首个任务型对话系统中生成模块资源库Awesome-TOD-NLG-Survey开源!
原創作者:覃立波、黎州揚、婁杰銘、禹棋贏、車萬翔
代碼鏈接:https://github.com/yizhen20133868/Awesome-TOD-NLG-Survey
簡介
自然語言生成(Natural Language Generation, NLG)作為任務型對話系統中的核心模塊,越來越受到學術界和工業界的關注。NLG模塊的目的是將系統生成的語義表示(Meaning Representations,MR),包括對話動作(Dialog Act)和一系列槽值對(Slot Pairs),轉化為用戶可以理解的自然語言系統回復。
以圖1為例,NLG模塊的輸入包含對話動作inform和槽值對(name=Blue Spice,priceRange=low,familyFriendly=yes),NLG的作用是將輸入轉換為對應的自然語言回復:“The Blue Spice is a low cost venue. It is a family friendly location.”
圖1? NLG模塊的輸入輸出
近些年來,隨著深度神經網絡和預訓練語言模型的發展,NLG 的研究已經取得了重大的突破。盡管目前 NLG 模型在標準數據集上達到了相當高的性能,但在實際應用中, 仍有許多問題需要解決。那么該方向的研究現狀如何,未來的熱點又是什么呢?
為此,我們整理了一個倉庫,詳細、全面地總結了 NLG 領域發展過程中的工作,包括方法分類和一些相關的開源資源,并且涵蓋了一些前沿方向的討論。我們希望該工作能夠對促進該領域發展貢獻力量,也相信該資源庫值得對 NLG 領域感興趣的同學們了解和關注。倉庫的總體目錄如圖2所示。
圖2 倉庫總體目錄
倉庫內容
1. 新分類,全總結
我們將目前的 NLG 方法總體分類為傳統方法和基于深度學習的方法,并分別按照細分的小類歸納整理。其中, 基于深度學習的方法分為基于 RNN 、基于 Seq2Seq 和基于 Transformer 的三種方法進行分類。
圖3?不同的NLG方法總體架構
2.?開源的NLG論文倉庫整理
我們介紹了現有的 NLG 相關的論文和已經開源的倉庫,并標注了論文使用的相關數據集,可以幫助大家利用代碼學習。
圖4 論文目錄
3. 數據集整理及下載地址
對于 NLG 使用的經典數據集,我們不僅提供了描述、簡介和下載地址,還對數據集的細節、規模和狀態進行了總結,幫助大家方便地了解和找到相關的數據集。
圖5?數據集及下載地址
4.?Leaderboard 整理
對于主流的數據集,我們還整理了 leaderboard,方便大家跟蹤進展。
圖6?leaderboard 整理
5. 未來挑戰方向及相關工作整理
為了促進該領域的發展,我們還總結了NLG的未來方向,并且整理了目前為止的發表的頂會工作,如跨語言 NLG,可解釋 NLG 等。
希望這個倉庫能幫助大家快速了解 NLG 領域,并進行新的探索,點擊閱讀原文能夠查看倉庫內容,歡迎大家 PR 以及 Star!
本期責任編輯:丁? ?效
本期編輯:鐘蔚弘
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯黃海廣老師《機器學習課程》視頻課 本站qq群851320808,加入微信群請掃碼: 與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的【NLP】首个任务型对话系统中生成模块资源库Awesome-TOD-NLG-Survey开源!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Python】Pandas中的宝藏函数
- 下一篇: 【深度学习】利用CNN来检测伪造图像