1-通用对话系统-阿里大文娱-李亚楠
整理自2019AI科學前沿大會分會場2-自然語言處理,如有侵權,請聯系作者刪除。
圖片下載鏈接: https://pan.baidu.com/s/1M_n9OX3H6U7AujsYFIpHOw 提取碼: iz2x?
1-通用對話系統-阿里大文娛-李亞楠
對于對話系統的理解,我們想象中是像經常在電影里看到的比如賈維斯等的,但是回歸到現實世界中,有時候會覺得對話系統有些智障。本次的分享主要以技術報告的形式,我們先看看對話系統的發展過程,上個世紀60年代,出現了Elisa(對話機器人),甚至后來用于心理咨詢師等等。我們從工業界、搜索引擎的角度出發來看,第一代互聯網的出現時因為信息量增多,楊致遠和他的舍友通過手動編輯的方式,也就是當時的Yahoo,后來有發展到了Google網頁搜索階段,再后來web搜索。
大致經歷了中國雅虎搜索、阿里云搜索、神馬搜索、UC頭條、夸克。
也就是說,我們需要一個跨平臺多終端的智能助手,主要分為三個方面:業務產品:UC瀏覽器、UC頭條等;技術設施:搜索、推薦、智能交互;內容生態:阿里的大魚號、知識圖譜、用戶畫像、非結構化的網頁生態等等。
通用對話平臺的結構框架如下:核心是對話系統SDS
對話系統中的五個組成部分:自動語音識別(ASR),自然語言理解(NLU),對話管理(DM),自然語言生成(NLG)和文本到語音合成(TTS)。
?
遷移學習主要有半監督和監督兩種方式。數據量大,會采用小樣本學習的方法。
對話管理(DM)的目的是在有著不同知識的不同領域中通過使用NLP的方法進行流暢地表達,涉及到眾多領域,同時聊天也有很多技術,如聊天術等等的,如何將他們統一起來,進行靈活地處理,是一個難點,同時也需要注意到它的可擴展性,不能說稍有變動就重頭來過,因此提出了這個業務與引擎分離的思想,業務就是上層的一些機構和分支,DST層就是引擎層。
?
?
?
?
?
除了檢索式對話系統,還有生成式的對話系統,生成式的對話系統的概念,是當前的一個學術熱點,但是目前應用不成書,準確率低。
?
目前對話系統在古詩生成、對聯生成等方面做的較好,但是在簡單的日常對話上表現欠佳。
?
Q:對知識圖譜的查詢是否會消耗大量的時間,知識圖譜的存儲。
答:知識圖譜的建立經過很長時間,大概三四年,需要一個慢慢積累的過程,尤其是長尾數據。知識圖譜存在于圖數據庫中,對它做關系抽取、驗證,時間是挑戰之一,如果規模大,那么相應的靈活性相應地較小,目前只用于處理一些比較簡單的問題,如一輪推理。
總結
以上是生活随笔為你收集整理的1-通用对话系统-阿里大文娱-李亚楠的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 当p.1引脚的电平正跳变c语言程序,数字
- 下一篇: Java学习资料(一)——Java书籍