KDD 2021 | 小红书推荐多样性解决方案:SSD在质量、多样性之间获得较好权衡
?作者?|?小紅書(shū)推薦技術(shù)團(tuán)隊(duì)
來(lái)源?|?機(jī)器之心專欄
來(lái)自小紅書(shū)的研究者在多樣化推薦中,從用戶體驗(yàn)和系統(tǒng)應(yīng)用的視角出發(fā),提出了一種滑動(dòng)頻譜分解(SSD)的方法,該方法可以捕捉用戶在瀏覽長(zhǎng)項(xiàng)目序列時(shí)對(duì)多樣性的感知。通過(guò)理論分析、離線實(shí)驗(yàn)和在線 A/B 測(cè)試,驗(yàn)證了該方法的有效性。
多樣化推薦(diversified recommendation)是推薦系統(tǒng)中一個(gè)重要的課題。從用戶視角分析,多樣性可以幫助用戶擴(kuò)展和發(fā)現(xiàn)新的興趣,但是繁多的內(nèi)容則會(huì)令人厭倦。從平臺(tái)視角分析,多樣性可以幫助系統(tǒng)探索用戶喜好,防止內(nèi)容越推越窄的情況,同時(shí)也可以讓小眾和長(zhǎng)尾的內(nèi)容得到曝光,促進(jìn)生態(tài)發(fā)展。
在一個(gè)大規(guī)模的推薦系統(tǒng)中,我們可以從三個(gè)角度來(lái)理解多樣化的推薦結(jié)果,如上圖所示。首先是推薦質(zhì)量(quality),即推薦的結(jié)果需要匹配用戶的興趣,可能是用戶歷史交互過(guò)的,也可能是第二點(diǎn),即多樣性所考慮的,用戶興趣的擴(kuò)展和發(fā)現(xiàn)。除此之外,我們還需要考慮公平性(fairness),無(wú)論是衡量質(zhì)量還是多樣性,都要兼顧小眾興趣和長(zhǎng)尾內(nèi)容。推薦質(zhì)量使得我們可以對(duì)點(diǎn)擊率、時(shí)長(zhǎng)等行為建模,進(jìn)而轉(zhuǎn)換為一個(gè)分類 / 回歸問(wèn)題。推薦結(jié)果的多樣性,一般由兩兩之間的相似性(similarity)得到,例如 DPP(Determinantal Point Process)。
本文介紹的工作,即小紅書(shū)發(fā)表于 KDD 2021 的《Sliding Spectrum Decomposition for Diversified Recommendation》一文,將從用戶體驗(yàn)和系統(tǒng)應(yīng)用的視角,試圖解決其中的兩個(gè)問(wèn)題:如何在質(zhì)量和多樣性之間獲得一個(gè)較好的權(quán)衡(trade-off),以及如何公平地衡量相似性。
論文地址:
https://arxiv.org/pdf/2107.05204.pdf
研究動(dòng)機(jī)
小紅書(shū)是國(guó)內(nèi)最大的社交平臺(tái)之一,擁有超過(guò)一億的月度活躍用戶。
小紅書(shū)中的 item 展示為「筆記」的形式,上圖是小紅書(shū)的 Explore Feed 推薦的一個(gè)示意圖。用戶可以在雙列中下滑瀏覽,同時(shí)可以點(diǎn)擊感興趣的筆記進(jìn)入詳情頁(yè)查看更多內(nèi)容,或者與博主進(jìn)行互動(dòng)。與固定列表的推薦不同,用戶可以選擇在 Feed 中進(jìn)行持續(xù)的瀏覽,多樣性的衡量需要考慮這種長(zhǎng)序列的情況。另外受限于手機(jī)屏幕的大小,或者短時(shí)記憶的影響,研究者在建模多樣性的同時(shí)也應(yīng)該考慮「瀏覽窗口大小」。
從用戶的視角來(lái)看,Feed 就像是他們觀測(cè)到的一個(gè)一維時(shí)間序列,每個(gè)時(shí)刻為一篇筆記。在經(jīng)典的時(shí)間序列分析中,如西瓜的單價(jià),我們可以將其分解為經(jīng)營(yíng)成本、季節(jié)、噪聲,如上圖所示。類比到推薦場(chǎng)景,如果我們也能將筆記序列分解成幾個(gè)正交的部分,或許就能得到一個(gè)較好的多樣性衡量辦法。
方法介紹
滑動(dòng)頻譜分解(Sliding Spectrum Decomposition,SSD)
該研究將用戶觀測(cè)到的 Feed 序列,轉(zhuǎn)換為下圖所示的 Tensor。
其中序列總長(zhǎng)度為T(mén),用戶瀏覽窗口大小為w,推薦的 item 序列為,滑動(dòng)步長(zhǎng)為 1,為筆記在向量空間中的表示。是一個(gè)三維的張量,但是直接研究它有些困難。可以先考慮較為特殊的情況:w = T,即窗口大小等于序列總長(zhǎng)度。此時(shí)僅需要考慮一個(gè)窗口內(nèi)的筆記,那如何衡量他們的多樣性呢?下圖展示了一個(gè)簡(jiǎn)單的例子,可以看到,固定的情況下,相較、,可以提供更多的多樣性。在二維平面情況下,面積是一個(gè)很好的度量,與圍成的平行四邊形面積更大,于是他們組合的多樣性也就更好。擴(kuò)展到更一般的情況,我們可以用體積來(lái)計(jì)算一個(gè)窗口內(nèi)筆記的多樣性。
回到長(zhǎng)序列問(wèn)題上,我們需要處理的問(wèn)題含有多個(gè)窗口。多個(gè)窗口聯(lián)合的體積是沒(méi)有一個(gè)直觀定義的,SSD 對(duì)這種情況下的體積做了一個(gè)推廣。具體而言,一個(gè)窗口內(nèi)筆記的體積,可以用矩陣的奇異值乘積來(lái)表示,這里的矩陣即是 Tensor的一行,注意到奇異值分解在 Tensor 情況下是有定義的,于是我們對(duì) Tensor做奇異值分解,將分解得到的奇異值,作為了 Tensor的體積,即多個(gè)窗口聯(lián)合的多樣性。與每篇筆記的質(zhì)量結(jié)合,即可得到如下的 trade-off 目標(biāo),其中 Z 是候選集合,是一個(gè)平衡系數(shù)。
基于內(nèi)容與基于協(xié)同過(guò)濾的方法(CB2CF)
在 SSD 中,該研究依賴于筆記的向量表示來(lái)衡量多樣性,向量?jī)蓛芍g的相似性需要符合用戶對(duì)于多樣性的感知。有兩種直觀的思路來(lái)得到這些向量。一是基于內(nèi)容(content-based)的方法,即構(gòu)造一個(gè)基于筆記圖片和文字內(nèi)容的監(jiān)督任務(wù),將監(jiān)督模型的中間層結(jié)果作為向量表示。二是基于協(xié)同過(guò)濾方法,即通過(guò)全體用戶的交互歷史,構(gòu)造 CF 向量。
然而在實(shí)際應(yīng)用中,單純使用這兩種方法都有一定的缺陷。基于內(nèi)容的方法依賴于大量的先驗(yàn)知識(shí),而基于協(xié)同過(guò)濾的方法對(duì)長(zhǎng)尾興趣和新內(nèi)容卻非常不友好。于是該研究設(shè)計(jì)了上圖所示的 CB2CF (Content-based to Collaborative Filter)方法,通過(guò)內(nèi)容信息預(yù)估協(xié)同過(guò)濾的結(jié)果。在輸入上僅使用內(nèi)容,這樣即使對(duì)于新內(nèi)容也能依賴模型的泛化能力得到較好的結(jié)果。在輸出上依賴全體用戶的協(xié)同標(biāo)注,使得研究者能夠在統(tǒng)計(jì)上學(xué)習(xí)用戶感知的信號(hào)。
實(shí)驗(yàn)結(jié)果
在離線實(shí)驗(yàn)中,研究者對(duì)比了 CF 和 CB2CF 在長(zhǎng)尾上的表現(xiàn)。在四個(gè)高區(qū)分度的類目下,由實(shí)驗(yàn)結(jié)果可得 CB2CF 有著較好的區(qū)分能力。
在線上實(shí)驗(yàn)中,研究者用 SSD 與 SOTA 的 DPP 模型做了 A/B 實(shí)驗(yàn),在時(shí)長(zhǎng)(Time)、互動(dòng)(Engage)、ILAD(用戶瀏覽筆記之間的平均距離,即曝光多樣性)、MRT(用戶平均閱讀類目數(shù),即消費(fèi)多樣性)上都取得了一定的收益。
小紅書(shū)目前有超過(guò)一億的月度活躍用戶,在算法和工程上都有著很多有趣并富有挑戰(zhàn)的問(wèn)題。除了推薦多樣性外,我們還在召回、排序、強(qiáng)化學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)、CV、NLP 等多個(gè)方向進(jìn)行著持續(xù)的探索和落地,職級(jí)、薪水 open,base 上海 / 北京,如有任何問(wèn)題,請(qǐng)直接聯(lián)系 yanhuahuang@xiaohongshu.com。
????
現(xiàn)在,在「知乎」也能找到我們了
進(jìn)入知乎首頁(yè)搜索「PaperWeekly」
點(diǎn)擊「關(guān)注」訂閱我們的專欄吧
·
總結(jié)
以上是生活随笔為你收集整理的KDD 2021 | 小红书推荐多样性解决方案:SSD在质量、多样性之间获得较好权衡的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 奥迪a4l中央刹车灯在哪
- 下一篇: 汽贸买车为什么便宜?