NIPS’20 Spotlight | 精准建模用户兴趣,广告CTR预估准确率大幅提升!
源 | 京東零售技術(shù)
在以人工智能技術(shù)為支持的推薦、搜索、廣告等業(yè)務(wù)中,點(diǎn)擊率預(yù)估(CTR)一直是技術(shù)攻堅(jiān)的核心,同時(shí)也是人工智能技術(shù)在業(yè)務(wù)落地中最難實(shí)現(xiàn)的技術(shù)方向之一。第一期介紹了視覺(jué)信息使用幫助提高點(diǎn)擊率預(yù)估的準(zhǔn)確度(Category-Specific CNN for Visual-aware CTR Prediction at JD.com KDD2020)。本次介紹京東廣告團(tuán)隊(duì)在用戶行為建模中的工作:基于卡爾曼濾波的注意力機(jī)制——廣告點(diǎn)擊率預(yù)估中的用戶行為建模。
此次工作《Kalman Filtering Attention for User Behavior Modeling in CTR Prediction》被機(jī)器學(xué)習(xí)領(lǐng)域中含金量最高的頂級(jí)國(guó)際會(huì)議NeurIPS 2020成功收錄為Spotlight論文。本次會(huì)議的Oral+Spotlight共收錄了385篇論文,占9454篇總投稿量的4%。
介紹之前,首先致謝京東零售數(shù)據(jù)算法通道委員會(huì)的支持。2020年京東零售建立數(shù)據(jù)算法通道委員會(huì)后,推出了適合算法工作特點(diǎn)的評(píng)價(jià)體系機(jī)制,算法技術(shù)氛圍變的更濃厚,使得算法工作能朝向長(zhǎng)期深入的方向去深耕,也為算法工程師去嘗試風(fēng)險(xiǎn)較高的創(chuàng)新項(xiàng)目提供信心保障,將視野投向行業(yè),敢于去挑戰(zhàn)業(yè)界的難題。
任務(wù)背景
廣告點(diǎn)擊率(Click Through Rate, CTR)預(yù)測(cè)問(wèn)題,即已知戶信息()、商品信息()、和環(huán)境信息(),預(yù)測(cè)該用戶點(diǎn)擊該廣告的概率,即:
CTR預(yù)測(cè)是廣告領(lǐng)域的最根本問(wèn)題之一。精準(zhǔn)的廣告點(diǎn)擊率預(yù)測(cè)是整個(gè)廣告系統(tǒng)的基石,直接關(guān)系到京東數(shù)億活躍用戶的使用體驗(yàn)與百萬(wàn)廣告主的切身商業(yè)利益。
在電商場(chǎng)景下,用戶在平臺(tái)上產(chǎn)生了大量的瀏覽、點(diǎn)擊、購(gòu)買行為。相比于用戶年齡、性別等靜態(tài)屬性,這些行為包含了更多、更細(xì)力度、更實(shí)時(shí)的用戶偏好信息。因此,對(duì)用戶行為建模,能有效挖掘用戶興趣偏好,從而為CTR預(yù)測(cè)提供強(qiáng)有力的支持。
本文的目標(biāo)是:提出了一種用戶行為建模方法,能從用戶豐富的歷史行為中,提取能精準(zhǔn)地表達(dá)用戶實(shí)時(shí)興趣偏好的特征向量,從而助力后續(xù)的CTR預(yù)測(cè)。
現(xiàn)有方法
現(xiàn)有用戶行為建模模塊,均采用經(jīng)典的注意力機(jī)制(Attention)來(lái)融合用戶歷史行為的特征表示。具體地建模過(guò)程都可以看成一種對(duì)用戶行為序列的某種加權(quán)求和:給定特定用戶的 1)當(dāng)前搜索詞,2)長(zhǎng)度為的歷史行為和,3)其對(duì)應(yīng)歷史搜索詞,預(yù)估用戶對(duì)當(dāng)前搜索詞的興趣偏好。具體為:
其中,是歷史行為的權(quán)重。以最基礎(chǔ)的Vanilla Attention為例:
直觀地,與當(dāng)前搜索詞相關(guān)的行為會(huì)被賦予更大的權(quán)重,是幾乎所有現(xiàn)有注意力機(jī)制的共同設(shè)計(jì)理念。State-of-the-art的算法包括DIN [1]、DIEN[2]、Transformer[3]等。
然而這些現(xiàn)存的注意力機(jī)制都存在著兩個(gè)缺點(diǎn):
傳統(tǒng)的注意力機(jī)制大都假設(shè)用戶此刻的興趣一定被歷史行為覆蓋。然而實(shí)際的電商場(chǎng)景中,用戶的當(dāng)前興趣,經(jīng)常是與他們相關(guān)歷史行為無(wú)關(guān)的新商品(圖一,左)。在這種情況下,無(wú)論權(quán)重如何分配,都無(wú)法用歷史行為的加權(quán)平均來(lái)刻畫用戶此刻的興趣。
傳統(tǒng)的注意力機(jī)制將所有用戶行為等價(jià)看待,而忽略電商領(lǐng)域中用戶行為的嚴(yán)重的頻次不均。所以,在加權(quán)求和的過(guò)程中,高頻用戶行為(復(fù)購(gòu)周期很短的食品、消耗品)相比于低頻用戶行為(例如奢侈品、電器)會(huì)獲得較大的總權(quán)重(圖一,右),導(dǎo)致用戶興趣偏好預(yù)估有偏。
圖一、電商場(chǎng)景下傳統(tǒng)Attention結(jié)構(gòu)的缺點(diǎn)。左:隨著用戶行為序列長(zhǎng)度的加長(zhǎng),目標(biāo)商品類別更可能在用戶歷史行為中有所體現(xiàn)。但即使序列長(zhǎng)度高達(dá)400時(shí),仍存在10%以上的行為屬于新的訴求。右:絕大多數(shù)情況用戶行為都被被高頻行為占據(jù),而高頻行為有很大可能性與目標(biāo)無(wú)關(guān)。當(dāng)目標(biāo)商品為復(fù)購(gòu)率低的商品如手機(jī)、手表時(shí),情況更加嚴(yán)峻。以上兩個(gè)問(wèn)題都限制了用戶興趣抽取的精度,影響后續(xù)CTR預(yù)估的準(zhǔn)確性。
我們的算法原理
針對(duì)電商場(chǎng)景中,用戶經(jīng)常出現(xiàn)歷史行為中沒(méi)有表現(xiàn)過(guò)的新的興趣,對(duì)不同品類商品行為頻次嚴(yán)重不均衡這兩個(gè)問(wèn)題,我們提出了新的用戶行為建模算法。該技術(shù)旨在克服已有基于Attention算法的不足,并基于卡爾曼濾波給出一套新的算法框架。在新框架中,算法一方面能做不局限于用戶歷史行為的興趣抽取,另一方面能夠克服用戶行為中頻次差異巨大的問(wèn)題。相比于現(xiàn)有的用戶行為建模算法,我們提取的用戶興趣更精準(zhǔn)、無(wú)偏,從而提升CTR預(yù)估準(zhǔn)確性。
1. 基于卡爾曼濾波注意力機(jī)制的用戶行為建模
卡爾曼濾波是原本用于多傳感器融合的算法:假設(shè)各傳感器都存在一定測(cè)量誤差(置信程度),融合得到誤差更小、更精確的目標(biāo)變量估計(jì)值。在這里我們借鑒卡爾曼濾波的思想,對(duì)傳統(tǒng)的注意力機(jī)制進(jìn)行改進(jìn)。以下將方法命名為Kalman Filtering Attention,簡(jiǎn)稱KFAtt。
給定當(dāng)前搜索詞,我們假設(shè)用戶對(duì)當(dāng)前搜索詞的興趣偏好服從高斯先驗(yàn)分布。這里的隨機(jī)變量,刻畫了不同的用戶,在相同搜索詞下的興趣偏好。具體地,代表著用戶興趣偏好的平均值,即在搜索詞下的爆款商品;代表著興趣分布差異,即對(duì)于越具體的搜索詞,興趣分布差異越小。
同時(shí),我們將用戶歷史行為看成當(dāng)前興趣偏好 的次獨(dú)立的、不確定性不同的傳感器的觀測(cè)值。并假設(shè)這些觀測(cè)值服從高斯分布:
其中不確定性可以認(rèn)為是傳感器和待測(cè)量量的距離,在用戶行為建模場(chǎng)景下可以認(rèn)為是當(dāng)前搜索詞和歷史搜索詞的距離。
因此對(duì)當(dāng)前搜索詞的興趣偏好,就可以通過(guò)最大后驗(yàn)估計(jì)(MAP)得到:
其中表示高斯概率密度函數(shù)。該MAP存在解析解:
通過(guò)引入興趣先驗(yàn),對(duì)用戶沒(méi)有在歷史行為中表現(xiàn)過(guò)的新訴求,KFAtt也都可以很好地建模。借助,KFAtt得以從其他用戶的興趣表達(dá)中學(xué)到當(dāng)前用戶的先驗(yàn)。借助,KFAtt得以在興趣先驗(yàn)和用戶行為后驗(yàn)之間折中。
實(shí)際操作中,和都可以輸入通過(guò)兩層全連接層得到。可以通過(guò)和的距離得到,例如取則最終得到的計(jì)算表達(dá)式和傳統(tǒng)Attention的表達(dá)式非常類似。如果進(jìn)一步讓(在不考慮用戶興趣先驗(yàn)的情況),KFAtt將退化為傳統(tǒng)Attention,也說(shuō)明了本方法的合理性。
2. 帶頻次控制的卡爾曼濾波注意力機(jī)制
在KFAtt基礎(chǔ)上,我們進(jìn)一步針對(duì)用戶行為中不同品類商品行為頻次嚴(yán)重不均衡的問(wèn)題做了方法改進(jìn):Kalman Filtering Attention with Frequency Capping,簡(jiǎn)稱KFAtt-freq。
沿用KFAtt的假設(shè),我們依然假設(shè)用戶對(duì)當(dāng)前搜索詞的興趣偏好服從高斯先驗(yàn)分布。不同的是,為了處理不同種類商品的頻次不均問(wèn)題。我們對(duì)歷史搜索詞進(jìn)行去重,對(duì)歷史行為按搜索詞歸并。
具體地,用戶行為建模可以抽象為用個(gè)相互獨(dú)立的傳感器,對(duì)進(jìn)行的測(cè)量。在傳感器上,我們得到個(gè)測(cè)量值. 顯然。
每個(gè)測(cè)量值中的誤差中,包含兩個(gè)獨(dú)立的部分:
系統(tǒng)誤差,由傳感器本身帶來(lái)的誤差。傳感器和目標(biāo)的距離越遠(yuǎn)系統(tǒng)誤差越大。
測(cè)量誤差,傳感器精度帶來(lái)的誤差。這部分誤差通過(guò)多次重復(fù)測(cè)量可以降低。
假設(shè)這兩部分誤差都服從高斯分布,那么:
其中是排除掉測(cè)量誤差外的,傳感器的測(cè)量值。而測(cè)量值:
因此和KFAtt類似,KFAtt-freq也可以通過(guò)最大似然估計(jì)(MAP),得到對(duì)目標(biāo)對(duì)當(dāng)前搜索詞的興趣偏好:
該MAP存在解析解:
其中 ?,表示同一個(gè)傳感器下的多個(gè)測(cè)量值的均值。KFAtt-freq相比KFAtt,由于將用戶同商品品類的多個(gè)行為當(dāng)成同一個(gè)傳感器的多次測(cè)量而多次重復(fù)測(cè)量只會(huì)降低測(cè)量誤差,無(wú)法降低系統(tǒng)誤差。因此這些行為對(duì)最終的總貢獻(xiàn)會(huì)存在上限,進(jìn)而可以解決行為中頻次差異巨大帶來(lái)的問(wèn)題,做到精確、無(wú)偏的用戶興趣抽取。?
實(shí)驗(yàn)效果
我們首先在亞馬遜商品推薦數(shù)據(jù)集上,測(cè)試KFAtt和KFAtt-freq算法的表現(xiàn)。如前文討論,我們算法的收益來(lái)自 1)引入全局信息解決用戶當(dāng)前新興趣不被歷史行為覆蓋的問(wèn)題 2)通過(guò)頻次控制解決不同種類行為頻次不均帶來(lái)的權(quán)重有偏的問(wèn)題。為了證明這一點(diǎn),我們從亞馬遜數(shù)據(jù)集里額外抽取了兩個(gè)挑戰(zhàn)更大的子測(cè)試集New(與都來(lái)自不同類別)和Infreq(與同類的極為低頻,即). 實(shí)驗(yàn)結(jié)果如下:
我們的算法(最右兩列)的AUC明顯高于所有被比較State-of-the-art算法,并且在New和Infreq上的優(yōu)勢(shì)更為明顯。這不但證明了我們算法的優(yōu)越性,也驗(yàn)證了我們的兩項(xiàng)Motivation的合理性。
我們的算法可以廣泛適配于多種現(xiàn)存注意力機(jī)制,并獲得一致性的提升。
我們的算法應(yīng)用于京東具體搜索業(yè)務(wù),在百億樣本的巨大工業(yè)數(shù)據(jù)集上,和在真實(shí)的線上流量里,獲得了較大的效果提升。
我們的算法在線上系統(tǒng)中的耗時(shí),遠(yuǎn)低于DIEN,與最高效的STOA算法平齊。?
結(jié)論
我們提出了一種基于卡爾曼濾波的注意力機(jī)制,用于工業(yè)級(jí)廣告點(diǎn)擊率預(yù)測(cè)系統(tǒng)中的用戶行為建模任務(wù)。通過(guò)卡爾曼濾波建模,有效地引入特定搜索詞的全局先驗(yàn)信息,并有效控制高頻商品在用戶行為中的權(quán)重,從而得到比現(xiàn)存注意力機(jī)制更適配用戶行為建模任務(wù)的算法,有效提升用戶行為建模及其后續(xù)廣告點(diǎn)擊率預(yù)估的準(zhǔn)確性。
后臺(tái)回復(fù)關(guān)鍵詞【入群】
加入賣萌屋NLP/IR/Rec與求職討論群
有頂會(huì)審稿人、大廠研究員、知乎大V和妹紙
等你來(lái)撩哦~
?
[1] Dzmitry Bahdanau, Kyunghyun Cho, and Yoshua Bengio. 2014. Neural machine translation by jointly learning to align and translate.
[2] Guorui Zhou, Xiaoqiang Zhu, Chenru Song, Ying Fan, Han Zhu, Xiao Ma, Yanghui Yan, Junqi Jin, Han Li, and Kun Gai. 2018. Deep interest network for click-through rate prediction.
[3] Guorui Zhou, Na Mou, Ying Fan, Qi Pi, Weijie Bian, Chang Zhou, Xiaoqiang Zhu, and Kun Gai. 2019. Deep interest evolution network for click-through rate prediction.
[4] Feng, Y., Lv, F., Shen, W., Wang, M., Sun, F., Zhu, Y., & Yang, K. (2019). Deep session interest network for click-through rate prediction. arXiv preprint arXiv:1905.06482.
總結(jié)
以上是生活随笔為你收集整理的NIPS’20 Spotlight | 精准建模用户兴趣,广告CTR预估准确率大幅提升!的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: NLP哪个细分方向最具社会价值?
- 下一篇: 数据还是模型?人类知识在深度学习里还有用