交互搜索中的自然语言理解技术
交互搜索
交互搜索是一種新的產(chǎn)品形態(tài),可以和用戶對(duì)話,記住用戶的購(gòu)物需求和偏好,提供購(gòu)物知識(shí)和建議。在搜索頁(yè)面下拉就可以進(jìn)入了,類似于微信的小程序的進(jìn)入方式。
自然語(yǔ)言理解
對(duì)話和搜索的最大區(qū)別就是對(duì)話是多輪的,而搜索是單輪的。另外對(duì)話中,特別是語(yǔ)音輸入中,會(huì)有更多的自然語(yǔ)言,而搜索中更多的是商品語(yǔ)言。因此,對(duì)話中的核心技術(shù)就是自然語(yǔ)言理解(NLU),在交互過程中,理解用戶的購(gòu)物需求和意圖。
上面是用戶多輪對(duì)話購(gòu)物的一個(gè)例子,在用戶每次輸入后,Query理解模塊(QU)都會(huì)識(shí)別他本次對(duì)話的意圖、類目和屬性,對(duì)話狀態(tài)管理模塊(DST)都會(huì)更新當(dāng)前最終的意圖、類目和屬性。
-
意圖(intent):
- 購(gòu)物:我想買連衣裙
- 知識(shí)問答:高端手機(jī)品牌有哪些,怎么除甲醛
- 購(gòu)物攻略:怎么挑連衣裙
- 搭配:紅色連衣裙搭配什么鞋子
- 促銷活動(dòng):iphone8活動(dòng)
- 產(chǎn)品比較:iphone8 mate10 哪個(gè)好
- 類目(category):商品的類目或者品類。
- 屬性(attribute):類目或品類下,商品的屬性(CPV)。
NLU技術(shù)點(diǎn)
自然語(yǔ)言理解的模塊如下:
意圖識(shí)別 很多時(shí)候,用戶的意圖是不明確的,比如搜“手機(jī)”,可能既想買手機(jī),也不知道怎么挑。但是從概率上來(lái)說(shuō),“手機(jī)”這個(gè)query的主要意圖還是購(gòu)物。而“怎么挑手機(jī)”,則主要是找購(gòu)物攻略。因此,我們可以從querylog中找出用戶在輸入某些短語(yǔ)(如“怎么挑”)的時(shí)候,是想找購(gòu)物攻略的。意圖識(shí)別就是把這些短語(yǔ)挖掘出來(lái),對(duì)query的意圖分類。
Session切分 在用戶的一次購(gòu)物過程中,可能會(huì)買多種類目(品類)的商品,同一個(gè)類目的商品屬于一個(gè)購(gòu)物需求或者一個(gè)session。因此,每次用戶輸入后,都要識(shí)別用戶是繼續(xù)說(shuō)的,還是新的需求。有的時(shí)候,這種session切換會(huì)包含歧義,如先搜“手機(jī)”,再搜"蘋果",這時(shí)可能是“蘋果手機(jī)”,或者是“蘋果水果”,這時(shí)需要根據(jù)概率出默認(rèn)的語(yǔ)義(蘋果手機(jī)),并且給用戶其他的選項(xiàng)(蘋果水果)。
類目預(yù)測(cè) 如果session切分是正確的,類目預(yù)測(cè)就會(huì)比較容易了。不過,多輪的時(shí)候,用戶的需求更復(fù)雜,對(duì)類目預(yù)測(cè)的要求也更高。當(dāng)然,如果session切分錯(cuò)了,類目預(yù)測(cè)也會(huì)出錯(cuò)。由于session切分和類目預(yù)測(cè)都是對(duì)類目需求的理解,這兩個(gè)任務(wù)之間有很多共同點(diǎn),所以我們也在考慮一起優(yōu)化。
屬性填充Slot filling 不同的葉子類目有不同的屬性集合,淘寶的上萬(wàn)個(gè)葉子類目中,也有上萬(wàn)個(gè)屬性(Slot)。高頻的屬性值可以通過知識(shí)圖譜中的CPV來(lái)直接匹配,但中低頻的屬性值則需要用到更多的信息。很多屬性值有不同的說(shuō)法,比如:iphone8plus、iphone8p、8plus、8p,這4個(gè)詞都是指"型號(hào):iphone8plus"。還有很多屬性值并不在CPV中,比如“3到4歲”的奶粉。這些都需要識(shí)別到某一個(gè)CPV屬性,或者一個(gè)文本屬性,或者是沒有意義的詞。
對(duì)話狀態(tài)管理State Tracking 這里主要是進(jìn)行屬性值的追加或者替換,比如先搜“only連衣裙”,再搜“zara”,這時(shí)的狀態(tài)是“zara連衣裙”。更復(fù)雜的是文本屬性的替換,比如先搜“便宜的手機(jī)”,再搜“貴的”,這時(shí)的狀態(tài)是“貴的手機(jī)”。
State Tracking之后,用戶對(duì)話的語(yǔ)義理解就完成了,會(huì)輸出表示當(dāng)前搜索語(yǔ)義的“標(biāo)準(zhǔn)Query”和tagging的結(jié)果,給后續(xù)的對(duì)話策略、排序等模塊使用。
后記
交互搜索中的自然語(yǔ)言理解就給大家簡(jiǎn)單介紹到這里,真正想要理解自然語(yǔ)言的語(yǔ)義,任重而道遠(yuǎn)。舉幾個(gè)語(yǔ)音搜索中的例子,作為未來(lái)的目標(biāo),“1.5米寬兒童上下床帶衣柜”,“我要夜蘿莉精靈夢(mèng)中的蘿莉公主最好便宜的”,“必背小孩子玩的玩具”。
總結(jié)
以上是生活随笔為你收集整理的交互搜索中的自然语言理解技术的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Windows系统盘符错乱导致桌面无法加
- 下一篇: 开发工具 | git、github使用场