新的一年,想发有关对话系统的paper?快关注时下最大热点:智能化与个性化...
TL;DR: 為大家介紹和分析一個即將成為未來一年研究熱點的 sub-topic: Personalized Dialog System!有強烈發 paper 的小伙伴們注意啦,上面這句話對你們來說翻譯過來就是:這就是 19 年最有可能 get paper accepted 的任務之一咯!
作者丨駱梁宸
學校丨北京大學本科在讀
研究方向丨Dialogue/NLP/ML Theory
個人主頁丨https://www.luolc.com/
NLP的四個Open Problems & 對話系統的重要性
相信很多 NLP 研究者都已經拜讀過由 Sebastian Ruder 在 Deep Learning Indaba 2018 上的 talk 整理而來的文章:The 4 Biggest Open Problems in NLP。
http://ruder.io/4-biggest-open-problems-in-nlp/
這篇含金量十足的文章來自于對包括 Yoshua Bengio 在內的 20 余位領域內頂級研究者的訪談整理而來。
四個 open problems 中排名第一的是 Natural Language Understanding(自然語言理解)問題,解決它是許多 NLP tasks 能否順利實現的先決條件。與此同時,非常多的研究人員同時提到 Dialogue System(對話系統),特別是 Goal-Oriented(任務型)Dialogue System 也是一個非常重要的 open problem,或者說,是檢驗 NLU 問題是否可解的一種終極方式。?
從大約 2016、2017 年起,針對 Dialogue System 的研究逐漸從鮮有人問津到逐漸引起 NLP 社區內的重視。在剛剛過去的一年里,相關工作的數量增長迅猛,顯示出其成為 NLP 領域內新一 (hǎo) 熱 (guàn) 點 (shuǐ) 方向的潛質。?
而另一方面,隨著發展初期通過將 Neural Machine Translation 中的方法直接換湯不換藥的遷移到 Dialogue 的快速灌水階段逐漸結束,如今再想要在這一 track 下發表文章已經不能再像從前那樣簡單粗暴,而必須要想辦法聚焦到 Dialogue 中更加核心、更加有價值的點。?
在上文提到的訪談中 Kevin Gimpel 提到:
We should develop systems that read and understand text the way a person does, by forming a representation of the world of the text, with the agents, objects, settings, and the relationships, goals, desires, and beliefs of the agents, and everything else that humans create to understand a piece of text. Until we can do that, all of our progress is in improving our systems’ ability to do pattern matching.
從這段話其實也能推斷出 Dialogue 任務為什么被認為“非常困難”。以 NMT 作為對比,我們可以發現在大部分情形下,除非涉及很高的文學技巧或極深的歷史背景,通常而言 NMT 只需要聚焦在所翻譯的文本本身即可,幾乎沒有任何外沿 —— 一個好的翻譯系統,其實就是要穩定準確且還原本意即可。
而對話則大有不同,想象人類對話的場景,決定我們如何產生或回復一句話的因素來自方方面面:對話的場合、談話的目的、雙 (多) 方的身份和心理與情緒狀態等。這些通通隱藏在一句句對白的背后,是同樣需要 forming 的 representation. 我們需要設法構造更加智能化的系統以關注到這些問題。?
其中最為重要,也即將成為未來一段時間熱點之一的,是 Dialogue System 的個性化問題。
Personalization in Dialogue System
對話的一個顯著特點,同時也是與其他 NLP 場景如翻譯、摘要和閱讀理解等最大的不同,是談話者具有的身份特征。很容易理解,一句話的風格隨著其說出者的不同可以有極大變化;此外,在人們日常交流中,根據對方的身份和偏好靈活調整談話的內容、風格和策略是非常自然的行為——而這些在 conventional dialogue model 中完全無法得以體現。?
在以 Jiwei Li 的工作 [1] 為代表的早期研究中,研究者們對個性化問題的前一部分,即為 chatbot 賦予特定人格進行了一定探索。但這一類工作的實用性是有明顯限制的——我們更加期望 Agent 能夠根據我們每個人的自身特點對我們進行個性化服務,而并不在意面對的 Agent 是性格溫和、暴躁、還是傲嬌的——實際上這類模型最具前景的實用化方向大概就是游戲 NPC 構建了。?
而個性化中意義更大的另一方面,即設法讓 Agent 可以感知用戶身份和偏好并以此提供個性化的對話,難度要大很多。這主要是受限于數據集的缺失——我們長期缺少額外標注有對話者的信息的數據集。
而上段提到的賦予人格,其實非常類似于 language style transfer/assignment 任務,并不過多受限于 Dialogue 的形式,因而可以通過其他類型的帶身份標注的語料進行補充。而針對對方身份進行個性化,則是無論如何無法繞過帶身份信息的 dialogue dataset 的。?
而我們之所以能推測個性化對話系統很快將成為研究熱點,便是因為數據集這一關鍵問題已經被解決了。?
做 Dialogue System 的同學一定都知道 FAIR 的一個組:Team PerlAI。其不僅產出了 NLP 領域近十年來最重要的成果之一 Memory Network,更重要的是在近年持續的發布新鮮高質量的對話數據集。
在 2018 年初他們新 release 了名為 Persona-Chat 的數據集 [2],其中每段對話都包含了對談話雙方的 natural text 形式的描述。在 NeurIPS 2018 上還進一步擴充并完善了數據集作為 shared competition task。
更近的時候,ParlAI 還發布了和 CV 結合的 personalized image chat 數據集 [3]。此外,除了以上基于 chitchat 的數據集,ParlAI 也收錄 personalized bAbI dialog 這一個性化 goal-oriented 數據集 [4]。
Learning Personalized End-to-End Goal-Oriented Dialog
值得一提的是,以上這些個性化對話的研究都是基于 chitchat 的。而任務型對話,例如餐館預定服務、個人助理等,也同樣非常需要針對用戶進行個性化服務。這一方向的研究數量還較少,但具有很高的實用價值和繼續探索的空間,是非常適合繼續深入(& 發 paper)的藍海。?
在本文的最后,簡略介紹一篇即將于本周四(2019.1.31)在 AAAI-19 上 presenting 的文章,有關任務型對話的個性化:
https://www.luolc.com/publications/personalized-goal-oriented-dialog/
上方鏈接的文章 website 中還較為詳細的概況了最近一段時間有關 Personalization 的其他相關進展,比本文所述更為詳盡,可以先閱讀了解。
▲?Figure 1(a): Three example dialogs are chosen from the personalized bAbI dialog dataset. Personalized and content-based responses are generated by the Personalized MemN2N and a standard memory network, respectively.
▲?Figure 1(b): Examples of valid candidates from a knowledge base that match the user request.
我們從一個例子出發,直觀感受一下 conventional model 在不考慮個性化的情況下有什么不足。?
圖中的對話發生在餐館預定的場景中。Dialogue agent 需要根據用戶的請求推薦餐館,并在必要的時候提供額外信息。在三組對話中,用戶輸入的請求都是完全相同的。前兩組對話的用戶是一位年輕男性,非素食偏好;第三組對話的用戶是一位年長女性,素食偏好。Figure 1(b) 是 KB 中檢索到的滿足用戶要求的兩個餐館。?
可以觀察到:?
1. 傳統模型的回復是樸素和無趣的,且無法像個性化模型一樣根據用戶身份調整語氣和稱呼;
2. 在推薦餐館階段,傳統模型只能按隨機順序給出推薦 (即無法判斷兩個可能的選擇中哪個更可能受顧客青睞),而個性化模型則可以動態的調整推薦策略,在上例中,即是正確的考慮到了用戶是否有素食偏好;
3. 最后,注意到用戶請求中的「contact」既可以被解讀成 KB 中的「phone」也可以被解讀為「social media」。個性化模型在訓練中可以學習到年輕人傾向社交媒體賬號而年長者傾向電話號碼這一事實,從而解決歧義而給出用戶更期望的信息。
這些現象反映了目前模型中對應的三個問題:?
無法靈活調整語言風格 [5]?
缺少根據用戶信息動態調整對話策略的能力 [4]?
難以處理用戶請求中的歧義項?
而個性化任務型對話系統的目標便是解決上述問題。需要注意的是,在任務型對話中的個性化與 chitchat 有顯著不同。區別于給 Agent 賦予一個 consistent 的個性,任務型對話中的個性化要更多的聚焦在用戶的個性并需要 Agent 擁有對不同對話者進行調整從而提升對話效率和用戶滿意度的能力。
▲?Figure 2: Personalized MemN2N architecture.
文章提出的模型 Personalized MemN2N 基于適用任務型對話的經典模型 End-to-End Memory Network,包含三個主要部分:profile embedding、global memory、personalized preference。
用戶輸入會被 encode 為一個 query vector,模型會讀取 memory(左上部分)尋找相關的對話歷史并生成 attention weights,之后加權求和并做線性變換得到輸出 vector,這一部分即是原始的 MemN2N。
Profile Embedding
以 K-V 對表示的用戶信息在 One-Hot 編碼后經過一個可學習的參數矩陣變換為 profile embedding,在每一次 memory network 的迭代中加入到 query vector 中,并且用于修正 candidate pool 中的回復(根據用戶身份直接過濾掉語氣不得體的一部分 candidates)。
Global Memory
這一部分(左下)和 MemN2N 的結構相同,區別在于 memory 中儲存的并非當前對話歷史,而是其他類似的用戶發生的其他對話的內容。這是基于類似的用戶可能具有對答案類似的傾向而設計的。
Personalized Preference
這一部分用于處理用戶請求的歧義部分,模型可以對 KB 中的每一列學習到一個 preference term,然后基于此對 logits 進行修正,以推薦用戶更偏好的信息。
在任務型對話個性化數據集 personalized bAbI dialog 上,文章提出的模型在完整數據集上刷新了原先 state-of-the-art 模型超過 7 個百分點。?
除此之外,文章進行了許多定量和定性分析,包括中間參量的可視化,可解釋性討論和對照實驗等。同時,在人工評測中,新模型也在任務完成率和用戶滿意度兩項指標上獲得顯著提升。在此不做詳細闡述,具體細節可以瀏覽文章的 Analysis 章節。
總結
對話系統中的個性化無疑將成為新的一年里最值得探索的方向之一,尤其是對于希望盡快發 paper 的同學,是非常不錯的一個新坑。而 Persona-Chat 和 Personalized MemN2N 則分別代表了 chitchat 和 goal-oriented 兩類 dialogue 任務中的最新 state-of-the-art,后者更是填補了任務型對話中的空白。如果希望做一些這方面新的工作,這兩篇文章是很重要的參考。
提前祝各位新春快樂!新的一年多發 paper 喲~ ^.^
參考文獻
[1] Jiwei Li, Michel Galley, Chris Brockett, Georgios P. Spithourakis, Jianfeng Gao, Bill Dolan. A Persona-Based Neural Conversation Model. ACL 2016.?
[2] Saizheng Zhang, Emily Dinan, Jack Urbanek, Arthur Szlam, Douwe Kiela, Jason Weston. Personalizing Dialogue Agents: I have a dog, do you have pets too?. ACL 2018.?
[3] Kurt Shuster, Samuel Humeau, Antoine Bordes, Jason Weston. Engaging Image Chat: Modeling Personality in Grounded Dialogue. arXiv:1811.00945, 2018.?
[4] Chaitanya K. Joshi, Fei Mi, Boi Faltings. Personalization in Goal-Oriented Dialog. NIPS 2017.?
[5] Jonathan Herzig, Michal Shmueli-Scheuer, Tommy Sandbank and David Konopnicki. Neural Response Generation for Customer Service based on Personality Traits. INLG 2017.?
點擊以下標題查看更多往期內容:?
Airbnb實時搜索排序中的Embedding技巧
圖神經網絡綜述:模型與應用
近期值得讀的10篇GAN進展論文
自然語言處理中的語言模型預訓練方法
從傅里葉分析角度解讀深度學習的泛化能力
兩行代碼玩轉Google BERT句向量詞向量
AI Challenger 2018 機器翻譯參賽總結
Google BERT應用之紅樓夢對話人物提取
深度長文:NLP的巨人肩膀(上)
NLP的巨人肩膀(下):從CoVe到BERT
#投 稿 通 道#
?讓你的論文被更多人看到?
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢? 答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。?
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學習心得或技術干貨。我們的目的只有一個,讓知識真正流動起來。
??來稿標準:
? 稿件確系個人原創作品,來稿需注明作者個人信息(姓名+學校/工作單位+學歷/職位+研究方向)?
? 如果文章并非首發,請在投稿時提醒并附上所有已發布鏈接?
? PaperWeekly 默認每篇文章都是首發,均會添加“原創”標志
? 投稿郵箱:
? 投稿郵箱:hr@paperweekly.site?
? 所有文章配圖,請單獨在附件中發送?
? 請留下即時聯系方式(微信或手機),以便我們在編輯發布時和作者溝通
?
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?| 獲取最新論文推薦
總結
以上是生活随笔為你收集整理的新的一年,想发有关对话系统的paper?快关注时下最大热点:智能化与个性化...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AAAI 2019 Oral | 让TA
- 下一篇: 从Wasserstein距离、对偶理论到