下一代对话系统中的关键技术(下篇)
上期,我們從理解力、擬人化、以及與人互動(dòng)這三個(gè)聊天機(jī)器人在對(duì)話中的主要技術(shù),說(shuō)明了當(dāng)前對(duì)話系統(tǒng)面臨的主要挑戰(zhàn),本期我們將從滿足信息需求和社交需求的角度,簡(jiǎn)述下一代談話系統(tǒng)應(yīng)具備的基本能力,并從技術(shù)和倫理兩個(gè)方面探討未來(lái)對(duì)話系統(tǒng)發(fā)展中值得考慮的問(wèn)題。
01
類人對(duì)話系統(tǒng)的關(guān)鍵特征
類人對(duì)話系統(tǒng)應(yīng)同時(shí)具備情商和智商,能在多領(lǐng)域多場(chǎng)景綜合運(yùn)用多技能,來(lái)滿足用戶的信息需求和社交需求。在智商方面,能夠幫助用戶完成任務(wù)、信息獲取、推薦等;在情商方面,能夠理解情感情緒,表達(dá)共情,實(shí)現(xiàn)情感陪伴、情緒疏導(dǎo)等社交類任務(wù)。因此,我們可以從滿足信息需求能力、滿足社交需求的能力這兩個(gè)維度去衡量對(duì)話系統(tǒng)的類人水平,這主要體現(xiàn)在以下三個(gè)關(guān)鍵特征:
1、有知識(shí),言之有物:實(shí)現(xiàn)一定程度的理解,并運(yùn)用知識(shí)生成高質(zhì)量的回復(fù)。
2、有個(gè)性,擬人化:要求機(jī)器體現(xiàn)固定、一致的個(gè)性和風(fēng)格,具有固定的人設(shè)和個(gè)性。
3、有情感,有溫度:具備情緒感知、情感支持和心理疏導(dǎo)的能力,從而讓聊天過(guò)程更有溫度,滿足用戶的情感需求。
然而在上期我們就探討過(guò),當(dāng)前的對(duì)話系統(tǒng)在理解力、擬人化和與人互動(dòng)方面面臨著巨大的挑戰(zhàn),距離人類水平的對(duì)話互動(dòng)能力還相去甚遠(yuǎn)。比如任務(wù)導(dǎo)向型對(duì)話系統(tǒng)具有很強(qiáng)的任務(wù)完成能力,但是社交能力比較低;而對(duì)于開(kāi)放域?qū)υ捪到y(tǒng)來(lái)講,它的主要目標(biāo)是社交,任務(wù)完成能力相對(duì)較弱。為了提高對(duì)話系統(tǒng)的信息處理和社交連接能力,需要綜合考慮不同系統(tǒng)的技術(shù)實(shí)現(xiàn)思路并進(jìn)行融合。
比如,借鑒任務(wù)導(dǎo)向型對(duì)話系統(tǒng)的實(shí)體識(shí)別、意圖理解、語(yǔ)義分析以及填槽等技術(shù),以提高對(duì)話系統(tǒng)的理解力;對(duì)于開(kāi)放域?qū)υ捪到y(tǒng),我們注重其弱語(yǔ)義處理的能力,包括利用數(shù)據(jù)驅(qū)動(dòng)的方法、端到端的系統(tǒng)框架,以及如何充分利用當(dāng)前的深度學(xué)習(xí)模型以及大規(guī)模語(yǔ)言模型。
因此,在構(gòu)建下一代類人對(duì)話系統(tǒng)時(shí),我們應(yīng)綜合考慮任務(wù)型和開(kāi)放域?qū)υ捪到y(tǒng)的技術(shù)方法,從知識(shí)運(yùn)用、個(gè)性體現(xiàn)、情感識(shí)別與表達(dá)三個(gè)層次入手,綜合運(yùn)用多種技能,提高對(duì)話系統(tǒng)的理解力、擬人化和互動(dòng)性,使其在多種場(chǎng)景和領(lǐng)域中實(shí)現(xiàn)更接近于人類的對(duì)話能力,以滿足用戶的需求。
1、知識(shí)運(yùn)用
在知識(shí)運(yùn)用層面,通過(guò)引入知識(shí),來(lái)加強(qiáng)對(duì)話系統(tǒng)的理解力和推理能力。在下圖所示的對(duì)話中,討論的是一個(gè)關(guān)于歌手汪峰的主題 。在這樣的對(duì)話過(guò)程中,系統(tǒng)將對(duì)話內(nèi)容對(duì)應(yīng)到一個(gè)特定的知識(shí)領(lǐng)域,從而使對(duì)話過(guò)程言之有物。在進(jìn)行會(huì)話時(shí),將相關(guān)的實(shí)體與知識(shí)圖譜進(jìn)行了聯(lián)系,然后將結(jié)構(gòu)知識(shí)表達(dá)為向量,實(shí)現(xiàn)了知識(shí)的編碼與解碼。通過(guò)這樣的編碼和解碼處理,可以達(dá)到某種程度的理解,讓回答變得更有說(shuō)服力,增加了對(duì)話過(guò)程中產(chǎn)生的信息量。
2、個(gè)性體現(xiàn)
高質(zhì)量的對(duì)話活動(dòng)需要贏得對(duì)方的信任,而具有固定、一致的個(gè)性、身份是其中的關(guān)鍵因素。具有固定一致個(gè)性的對(duì)話交互技術(shù),在情感陪護(hù)、心理咨詢等對(duì)話場(chǎng)景中有著非常重要的應(yīng)用。在對(duì)話的過(guò)程中缺乏一致的身份和個(gè)性,會(huì)使得系統(tǒng)在對(duì)話的過(guò)程中難以取得用戶的信任,因此難以進(jìn)行有效的社交互動(dòng)。
圍繞類人對(duì)話系統(tǒng)的個(gè)性體現(xiàn),以Emohaa與用戶的對(duì)話為例:在對(duì)話中,Emohaa先是用語(yǔ)言直接地表達(dá)了自己的身份(女生)和很可愛(ài)的個(gè)性,面對(duì)客戶的反問(wèn)“為什么覺(jué)得自己很可愛(ài)”,Emohaa也能夠回復(fù)“因?yàn)榭蓯?ài),所以可愛(ài)”這樣的個(gè)性化描述,強(qiáng)化自己可愛(ài)的特性。
個(gè)性體現(xiàn)還涉及到更深層次的說(shuō)話風(fēng)格。在說(shuō)話風(fēng)格的研究中,我們發(fā)現(xiàn)對(duì)話可以實(shí)現(xiàn)正式與非正式互相之間的轉(zhuǎn)換,以及禮貌和非禮貌之間的轉(zhuǎn)換。但這種用自然語(yǔ)言表達(dá)角色和個(gè)性通常是微妙和含蓄的,研究也極具挑戰(zhàn)。
3、情感識(shí)別與表達(dá)
1997年,MIT教授Picard提出了情感計(jì)算的概念,指出「情感感知和情緒表達(dá)是人類智能行為中的重要特征」。情緒感知和情感表達(dá)在人類的智能交互里至關(guān)重要,這不僅能提高系統(tǒng)表現(xiàn)和用戶滿意度,還能很大程度上體現(xiàn)系統(tǒng)的情商,避免對(duì)話陷入僵局。
清華大學(xué)的CoAI課題組在2018年提出了情緒化聊天機(jī)器人(Emotional Chatting Machine, ECM)系統(tǒng),希望能夠讓對(duì)話系統(tǒng)像人類一樣表達(dá)喜怒哀樂(lè)。當(dāng)指定一個(gè)情緒類別時(shí),對(duì)話系統(tǒng)能生成對(duì)應(yīng)情緒類別、且適合對(duì)話上文的回復(fù)內(nèi)容。
實(shí)現(xiàn)情緒化的對(duì)話過(guò)程,是類人對(duì)話系統(tǒng)實(shí)現(xiàn)情感智能的一小步。而在日常對(duì)話中對(duì)他人表達(dá)同理心,是情緒有效表達(dá)的必要條件之一。它使系統(tǒng)能夠理解、感知和適當(dāng)?shù)鼗貞?yīng)用戶的情況和感受,從而很大程度地改善用戶體驗(yàn)和滿意度。因此,如何讓對(duì)話系統(tǒng)中具備共情能力,是邁向類人對(duì)話系統(tǒng)的關(guān)鍵一步。體現(xiàn)共情,通常要求對(duì)話系統(tǒng)具備情緒疏導(dǎo)或心理疏導(dǎo)的能力,以完成復(fù)雜的情感交流任務(wù)。
為此,CoAI課題組借鑒心理咨詢的中助人技巧理論,提出了一個(gè)三階段理論模型。第一階段先確認(rèn)用戶的具體問(wèn)題,第二階段通過(guò)共情、理解表達(dá)支持,第三個(gè)階段為用戶提供解決方案、出路。在每一個(gè)階段都設(shè)計(jì)了相應(yīng)的策略,如提供信息、直接指導(dǎo)、挑戰(zhàn)、解釋等。通過(guò)這些策略,才能實(shí)現(xiàn)有效的情緒疏導(dǎo)和心理疏導(dǎo)。這個(gè)技術(shù),正是Emohaa背后最核心的技術(shù),Emohaa學(xué)習(xí)了人類咨詢師的助人技術(shù),能實(shí)現(xiàn)一定程度的共情技巧,真正幫人實(shí)現(xiàn)情緒支持和心理疏導(dǎo)。
共情是一個(gè)廣泛的概念,包括情感和認(rèn)知兩個(gè)方面。情感方面涉及對(duì)用戶體驗(yàn)的情感模擬,而認(rèn)知方面旨在理解用戶的處境和隱性的情感?,F(xiàn)有的研究方法通常只關(guān)注情感方面,即通過(guò)檢測(cè)和利用用戶的情感來(lái)產(chǎn)生共情的交互。
然而,實(shí)現(xiàn)共情,除了識(shí)別用戶的情緒外,還應(yīng)該考慮對(duì)用戶處境的認(rèn)知。為此,CoAI課題組提出了一種新的共情響應(yīng)生成方法,即利用常識(shí)來(lái)加強(qiáng)認(rèn)知,獲取更多關(guān)于用戶情況的信息,并利用這些額外的信息進(jìn)一步增強(qiáng)生成響應(yīng)中的共情表達(dá)。
02
未來(lái)的發(fā)展:技術(shù)和倫理
對(duì)話交互技術(shù)的研究對(duì)我們未來(lái)的社會(huì)進(jìn)步和發(fā)展都有巨大的意義。設(shè)想一下,當(dāng)前老齡化問(wèn)題導(dǎo)致人口越來(lái)越少,而機(jī)器人在大眾生活中越來(lái)越普遍,未來(lái)將會(huì)發(fā)展成人機(jī)共融的社會(huì)。
在這種情況下,我們希望機(jī)器人能夠扮演更重要的社會(huì)角色,這要求它們不僅具備機(jī)器的功能,更重要的是具備類人的能力,既要有知識(shí),又有個(gè)性和情感。我們相信,這樣的機(jī)器人可以極大地豐富和改善人們的生活,甚至產(chǎn)生媲美人與人之間感情的情誼。
然而,類人對(duì)話系統(tǒng)的研究十分具有挑戰(zhàn)性。首先在技術(shù)上,構(gòu)建一個(gè)足夠聰明并且有一定情緒理解和思想表達(dá)能力的對(duì)話系統(tǒng)是極其困難的。當(dāng)下的研究雖有一定程度上的技術(shù)突破,但如今的大規(guī)模神經(jīng)對(duì)話系統(tǒng)依然面臨著嚴(yán)峻的類人性不足問(wèn)題,比如個(gè)性和情感的缺乏。僅依賴數(shù)據(jù)驅(qū)動(dòng)的做法難以從根本上解決類人性的問(wèn)題,我們需要進(jìn)一步處理機(jī)器人內(nèi)部情感狀態(tài)。比如構(gòu)建人工心理,對(duì)機(jī)器內(nèi)部的情感心理進(jìn)行有效地建模。
與此同時(shí),我們也需要在各種技術(shù)上實(shí)現(xiàn)外在行為能力突破,比如肢體動(dòng)作表現(xiàn)、終端執(zhí)行能力等。為機(jī)器人賦予這些技能,才能夠?qū)崿F(xiàn)更美好的人機(jī)共融的社會(huì)愿景。
此外,機(jī)器人倫理是值得討論的問(wèn)題。機(jī)器人是否應(yīng)該與人類產(chǎn)生社會(huì)連接并形成社會(huì)性依賴?想象一下,如果人跟機(jī)器戀愛(ài),是否會(huì)影響到人與人之間的情感交流,甚至對(duì)人類社會(huì)的繁衍造成一定的威脅。在未來(lái)的十年、二十年甚至五十年里,機(jī)器人對(duì)人類社會(huì)的發(fā)展會(huì)產(chǎn)生哪些潛在的影響。
這種風(fēng)險(xiǎn)需要從研究上和社會(huì)規(guī)范上一起去做探討。我們認(rèn)為這個(gè)方向是需要廣大研究者,包括自然科學(xué)和社會(huì)科學(xué)的研究者,一起去努力解決的難題。
當(dāng)前對(duì)話系統(tǒng)理論和技術(shù)日益成熟,我們主要探討聊天機(jī)器人中對(duì)話交互技術(shù)的研究現(xiàn)狀及面臨的技術(shù)挑戰(zhàn)。下一代類人對(duì)話系統(tǒng)應(yīng)同時(shí)具備完成任務(wù)和社交連接的能力,在知識(shí)、個(gè)性和情感三個(gè)方面實(shí)現(xiàn)擬人化的語(yǔ)言交互。在未來(lái),讓機(jī)器像人一樣自然流暢地說(shuō)話聊天,在一定條件下可以實(shí)現(xiàn),但無(wú)論是在科學(xué)技術(shù)上,還是在社會(huì)倫理道德上,都需要我們?nèi)プ龊芏嗌钊氲奶剿骱退伎肌?/p>
更多閱讀
#投 稿?通 道#
?讓你的文字被更多人看到?
如何才能讓更多的優(yōu)質(zhì)內(nèi)容以更短路徑到達(dá)讀者群體,縮短讀者尋找優(yōu)質(zhì)內(nèi)容的成本呢?答案就是:你不認(rèn)識(shí)的人。
總有一些你不認(rèn)識(shí)的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學(xué)者和學(xué)術(shù)靈感相互碰撞,迸發(fā)出更多的可能性。?
PaperWeekly 鼓勵(lì)高校實(shí)驗(yàn)室或個(gè)人,在我們的平臺(tái)上分享各類優(yōu)質(zhì)內(nèi)容,可以是最新論文解讀,也可以是學(xué)術(shù)熱點(diǎn)剖析、科研心得或競(jìng)賽經(jīng)驗(yàn)講解等。我們的目的只有一個(gè),讓知識(shí)真正流動(dòng)起來(lái)。
📝?稿件基本要求:
? 文章確系個(gè)人原創(chuàng)作品,未曾在公開(kāi)渠道發(fā)表,如為其他平臺(tái)已發(fā)表或待發(fā)表的文章,請(qǐng)明確標(biāo)注?
? 稿件建議以?markdown?格式撰寫,文中配圖以附件形式發(fā)送,要求圖片清晰,無(wú)版權(quán)問(wèn)題
? PaperWeekly 尊重原作者署名權(quán),并將為每篇被采納的原創(chuàng)首發(fā)稿件,提供業(yè)內(nèi)具有競(jìng)爭(zhēng)力稿酬,具體依據(jù)文章閱讀量和文章質(zhì)量階梯制結(jié)算
📬?投稿通道:
? 投稿郵箱:hr@paperweekly.site?
? 來(lái)稿請(qǐng)備注即時(shí)聯(lián)系方式(微信),以便我們?cè)诟寮x用的第一時(shí)間聯(lián)系作者
? 您也可以直接添加小編微信(pwbot02)快速投稿,備注:姓名-投稿
△長(zhǎng)按添加PaperWeekly小編
🔍
現(xiàn)在,在「知乎」也能找到我們了
進(jìn)入知乎首頁(yè)搜索「PaperWeekly」
點(diǎn)擊「關(guān)注」訂閱我們的專欄吧
·
總結(jié)
以上是生活随笔為你收集整理的下一代对话系统中的关键技术(下篇)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 保单失效退保能退多少
- 下一篇: 龙腾出行贵宾室怎么用