2020年推荐系统工程师炼丹手册RecSys-Long Paper版
煉丹要練好,須有好丹方,何處尋好的丹方,答曰:頂會!本文繼前文繼續推出第二彈!如果沒看到第一彈的,可以點開下面的文章:
https://zhuanlan.zhihu.com/p/247941842本文同樣不扯蛋,就扯扯這RecSys2020年頂會必看的推薦系統的論文 & 其摘要。如有興趣煉丹提升自己開發推薦系統效果的,可以持續關注我們的公眾號!我們會每周更新一到多篇頂會Paper的閱讀 & 評論 或者 福利 Code復現,助我們的煉丹師練出頂級“丹藥”。
本文我們匯總了20篇RecSys2020與推薦系統相關的論文&其對應的摘要。
我們首先總結了從商業服務構建數據集的三個挑戰:(1)匿名化業務指標;(2)維護公平性;(3)減少受歡迎程度偏差(popularity bias)。然后,我們將構建和發布數據集的問題描述為一個優化問題,該優化問題尋求用戶的采樣權重,并將挑戰編碼為適當的損失函數。我們應用我們的方法從真實世界的移動新聞傳遞服務的原始數據構建數據集。原始數據有超過1000000個用戶和100000000個交互。每個數據集都是在不到10分鐘內構建的。通過對數據集的統計分析和典型推薦系統算法的性能分析,我們討論了該方法的特點。
2.A Ranking Optimization Approach to Latent Linear Critiquing in Conversational Recommender System
Critiquing是一種會話式推薦方法,它根據用戶的偏好反饋逐步調整推薦。具體地,迭代地向用戶進行商品推薦和這些商品的屬性描述;然后用戶可以接受推薦或選擇評論屬性以生成新的建議。最近一個被稱為潛在線性批評(LLC)的方向采用了一種基于嵌入的現代方法,該方法尋求基于主觀項描述(即來自用戶評論的關鍵短語)的用戶偏好嵌入與評論嵌入的優化組合;LLC通過探索嵌入的線性結構以有效地優化在線性規劃(LP)公式中的權重。在本文中,我們回顧LLC,并注意到其基于分數的優化方法為了最大化喜歡和不喜歡商品之間的預測分數gap會鼓勵極端權重。注意到最終任務的總體目標是重新排序而不是重新評分,在本文中我們采用了一種排序優化方法,該方法基于先前臨界迭代中觀察到的秩沖突來優化嵌入權重。我們在包含用戶評論的兩個推薦數據集上評估了所提出框架的效果。實證結果表明,基于排名的LLC在各種數據集、評判風格以及滿意度和會話長度性能指標方面通常優于基于評分的LLC和其他Baseline。3.Cascading Hybrid Bandits: Online Learning to Rank for Relevance and Diversity
相關性排序和結果多樣化是現代推薦系統的兩個核心領域。相關性排序的目的是建立一個按商品相關性降序排序的排序列表,而結果多樣化則側重于生成涵蓋廣泛主題的項目的排名列表。在本文中,我們研究了一個在線學習環境,旨在推薦一個包含K個商品的排名列表,該列表的排名效用最大化,即一個商品相關且主題多樣的列表。我們將其描述為級聯混合bandits(CHB)問題。CHB假設級聯用戶行為,即用戶從上到下瀏覽顯示的列表,單擊第一個吸引人的項目,然后停止瀏覽其余項目。為了解決這個問題,我們提出了一種混合上下文bandit方法。使用兩個獨立的函數對項目相關性和主題多樣性進行建模,同時從用戶點擊反饋中學習這些功能。我們在兩個真實的推薦數據集上進行了實驗評估:MovieLens和Yahoo音樂數據集。實驗結果表明,它的性能優于基線。此外,我們證明了n步性能的理論保證,證明了該方法的可靠性。4.Content-Collaborative Disentanglement Representation Learning for Enhanced Recommendation
現代推薦系統通常需要考慮用戶行為數據(如點擊)中的協作特征和關于用戶和物品的內容信息(如用戶年齡或物品圖片)來改進推薦。雖然結果很鼓舞人,但從這些協作和基于內容視角得到的未被發現的用戶喜好表示可能會由于相互影響的混合而被糾纏,從而導致次優的不穩定的推薦。因此,我們建議將從用戶行為數據和內容信息中學習到的表示進行分離開來。具體地,我們提出了一種新的支持內容協同解離和特征解離的兩級解離生成推薦模型(DICER):對于內容協同解離,DICER基于內容和用戶項交互作用,通過邊緣分布對特征進行分解,以保證特征的安全性每種類型的學習特征在統計學上是獨立的。對于特征分離,通過分解Kullback-Leibler散度,我們從理論上證明了每種類型中提取的特征都是在一個粒度級別上進行分離的。此外,DICER使用一個協解碼器,該解碼器同時解碼內容和用戶項交互,以確保所學特征的高質量。通過對三個真實數據集的大量實驗,結果表明DICER在NDCG中的平均命中率和NDCG的平均命中率分別比其他目前最好的方法高出13.5%和14.4%。5.Contextual and Sequential User Embeddings for Large-Scale Music Recommendation
推薦系統在提供在線音樂流媒體服務方面起著重要作用。然而,音樂領域對推薦系統提出了獨特的挑戰:曲目很短,聽了很多遍,通常在與其他曲目的會話中消耗掉,相關性高度依賴于上下文的信息。在本文中,我們認為在會話開始時對用戶的偏好進行建模是解決這些問題的一種切實有效的方法。使用Spotify(一種流行的音樂流媒體服務)的數據集,我們觀察到a)最近的消費和b)會話級別的上下文變量(例如一天中的時間或使用的設備類型)確實比靜態的平均偏好更能預測用戶將流傳的曲目。在這些發現的驅動下,我們提出了CoSeRNN,一種神經網絡架構,它將用戶的偏好建模為embedding 序列,每個會話對應一個。CoSeRNN在會話開始時根據過去的消費歷史和當前的環境預測偏好向量。通過使用近似近鄰搜索算法,該偏好向量可用于下游任務,從而有效地生成與上下文相關的即時推薦。我們對CoSeRNN的session和track排名任務進行了評估,發現在不同的排名指標上,CoSeRNN的性能比當前的技術水平高出10%以上。仔細分析我們方法的性能,我們發現序列信息和上下文信息都是至關重要的。6.Contextual User Browsing Bandits for Large-Scale Online Mobile Recommendation
在線推薦服務向用戶推薦多種商品。目前,相當一部分用戶通過移動設備訪問電子商務平臺。由于移動設備的屏幕尺寸有限,物品的位置對點擊量有顯著影響:1)位置越高,一種商品的點擊量越大。2) “偽曝光”問題:乍一看只有幾個推薦的商品顯示,用戶需要滑動屏幕來瀏覽其他商品。因此,一些排名靠后的推薦項目沒有被用戶看到,將這類項目作為負樣本處理是不恰當的。雖然許多研究將在線推薦建模為情境Bandit問題,但很少考慮位置的影響,因此對獎勵函數的估計可能會有偏差。本文旨在解決這兩個問題,以提高在線移動推薦的性能。我們的貢獻是四方面的。首先,由于我們關注一組推薦商品的報酬,我們將在線推薦建模為一個上下文組合bandit問題,并定義了推薦集的報酬。第二,我們提出了一種新的上下文組合bandit方法UBM-LinUCB,通過采用用戶瀏覽模型(UBM)來解決與位置相關的兩個問題。第三,我們提供了一個形式化的后悔分析,并證明了我們的算法實現了次線性后悔,而不依賴于商品數。最后,我們用一種新的無偏估計器在兩個真實的數據集上評估我們的算法。淘寶網是世界上最受歡迎的電子商務平臺之一,淘寶網也在進行在線實驗。兩個CTR度量的結果表明,我們的算法優于其他上下文bandit算法。7. Debiasing Item-to-Item Recommendations With Small Annotated Datasets
商品間推薦(例如,“喜歡這樣的人也喜歡…”)是現實世界系統中普遍存在的一種重要的推薦類型。在這些環境中,來自歷史交互日志的觀測數據比比皆是。然而,由于幾乎所有觀測數據都存在偏差,例如庫存時間或界面偏差,推薦算法必須考慮這些偏差。本文提出了一種基于因果推理的商品對商品推薦的原則性方法,并提出了一種從小標注數據集中估計因果參數的實用高效方法。從經驗上講,我們發現我們的方法大大改進了現有的方法,同時只需要少量的注釋數據。8. Deconstructing the Filter Bubble: User Decision-Making and Recommender Systems
通過數值模擬研究了推薦系統環境下的用戶決策模型。我們的模型為Nguyen等人(2014)的研究結果提供了解釋,在推薦系統通常部署的環境中,即使沒有推薦,用戶也會隨著時間的推移消費越來越相似的物品。我們發現,推薦緩解了這些自然的過濾泡沫效應,但它也會導致用戶之間同質性的增加,從而在用戶消費的同質化和用戶消費的多樣化之間做出權衡。最后,我們討論我們的模型如何強調收集用戶信念及其隨時間演變的數據的重要性,以設計更好的建議并進一步了解其影響。9.Doubly Robust Estimator for Ranking Metrics with Post-Click Conversions
點擊后轉換(Post-click conversion)是一種重要的反饋形式,因為它直接為最終收入做出貢獻,并準確地捕捉用戶對商品的偏好,而不是模棱兩可的點擊。然而,天真地使用點擊后轉換會導致學習或評估推薦者時出現嚴重偏差,因為點擊和未點擊的數據之間存在選擇偏差。在這項研究中,我們解決了有偏見后點擊轉換的離線評估問題的算法推薦問題。解決這一偏差的一個可能的解決辦法是使用反向傾向分數估計,因為它可以提供一個無偏的評價,即使有選擇偏差。然而,眾所周知,這種估計器受到方差和不穩定性問題的影響,這在推薦設置中可能很嚴重,因為反饋通常非常稀疏。為了克服以往無偏估計器的這些局限性,我們提出一個雙穩健估計器,以評估推薦者的基本真實性排名表現。我們提出的估計器對真實值的排序度量是無偏的,改進了現有無偏估計量的方差和估計誤差尾界。最后,為了評估所提出估計器的經驗效能,我們使用半合成和兩個公開的真實世界資料集進行實證評估。結果表明,與現有的基線指標相比,該指標具有更好的模型評價性能,特別是在存在嚴重選擇偏差的情況下。10.Ensuring Fairness in Group Recommendations by Rank-Sensitive Balancing of Relevance
對于組推薦,一個目標是向組推薦一組有序的項目,即top-N,這樣每個單獨的推薦都與每個人相關。一種常見的方法是使用所謂的“聚合策略”來選擇小組能夠達成一致的項目。這些聚合策略的一個缺點是它們彼此獨立地選擇項目。因此,它們不能保證適用于整個建議集的公平性等屬性。在本文中,我們給出了一個公平的定義,它以一種等級敏感的方式“平衡”推薦項目在小組成員中的相關性。非正式地說,如果top-N中的每個前綴在組成員之間的相關性是平衡的,那么一組有序的推薦項目被認為對一個組是公平的。換句話說,前N中的第一個項目應該盡可能平衡所有組成員的利益;前兩項加在一起必須做同樣的事情;前三項也是如此,直到N。在本文中,我們形式化了秩敏感平衡的概念,并提供了一個貪婪算法(GFAR)來尋找滿足我們定義的top-N組推薦集。
我們將GFAR的性能與文獻中五種方法在兩個數據集上(分別來自電影和音樂領域)的性能進行了比較。評估42種不同配置(兩個數據集、七個不同的組大小、三個不同的組類型)和十個評估指標的性能。我們發現,在43%的情況下,GFAR的性能明顯優于所有其他算法;只有10%的情況下,有明顯優于GFAR的算法。此外,GFAR在最困難的情況下表現尤其出色,在這些情況下,群體規模龐大,群體內部的利益存在分歧。我們將GFAR的成功歸因于它的等級敏感性和它平衡相關性的方式。目前的方法并沒有以等級敏感的方式定義公平性(盡管有些方法通過使用貪婪算法來達到一定程度的等級敏感性),也沒有一種方法像我們這樣定義平衡。
11. Exploiting Performance Estimates for Augmenting Recommendation Ensembles
通過疊加將多個推薦系統集合起來,可以有效地提高協同推薦的效率。最近的工作擴展了堆疊,使用額外的用戶性能預測器(例如,用戶所做的評分總數)來幫助確定每個基本推薦者應該為集成貢獻多少。盡管如此,盡管手工制作有區別的預測值(通常需要深入了解集成中每個推薦者的優缺點)的成本,但只觀察到一些微小的改進。為了克服這一局限性,我們建議通過利用用戶自己的歷史評分來直接評估這些性能,而不是設計復雜的特征來預測給定用戶的不同推薦者的性能。對來自多個領域的真實數據集進行的實驗表明,使用性能估計作為附加特征可以顯著提高最先進的集成器的精度,在nDCG@20上,平均提高了23%。12. Exploring Clustering of Bandits for Online Recommendation System
bandit集群策略以協作過濾的方式利用上下文bandits,幫助在線推薦系統(RecSys)中的個性化服務。當觀測值不足時,由于知識共享,bandit集群策略可以取得更顯著的效果。bandit集群策略的目標是最大化用戶的累積反饋,如點擊量。然而,在他們的目標實現方式上存在著兩種不確定性。首先,群bandit算法根據其對用戶興趣的不確定性估計提出建議。第二,bandit算法的聚類將相關知識轉移到不確定且有噪聲的用戶群上?,F有的算法只考慮第一種算法,而不涉及后一種算法。為了共同應對這兩個挑戰,本文提出了在線RecSys的ClexB策略。一方面,ClexB通過可探索的聚類,更準確地估計用戶聚類,且不確定性更小。另一方面,ClexB還通過在用戶集群內部和之間共享信息來利用和探索用戶的興趣??傊?#xff0c;ClexB探索了知識轉移,并進一步幫助推斷用戶的興趣。此外,我們還對合成數據集和真實數據集以及遺憾分析進行了大量的實證實驗,進一步驗證了ClexB的優勢。13. FISSA: Fusing Item Similarity Models with Self-Attention Networks for Sequential Recommendation
序列推薦是一個研究熱點,它通過捕獲序列信息,具有實用性強、準確性高等優點。隨著基于深度學習(DL)的方法被廣泛應用于用戶行為序列下局部和動態偏好的建模,用戶全局和靜態偏好的建模往往被低估,通常只引入一些簡單粗糙的用戶潛在表征。而且,現有的大多數方法都假設用戶的意圖可以通過考慮歷史行為來完全捕捉,而忽略了用戶在現實中可能存在的不確定性,這可能會受到待推薦候選項的出現的影響。本文針對這兩個問題進行了研究,即大多數基于DL的序列推薦方法對用戶全局偏好的建模不完善和候選項對用戶意圖的不確定性,提出了一種基于自注意網絡的商品相似性模型融合方法(FISSA)。具體地說,我們將最先進的自聚焦序列推薦(SASRec)模型作為局部表征學習模塊,在FISA中捕捉用戶行為序列下的動態偏好,并進一步提出了一個全局表示學習模塊,以改進用戶全局偏好的建模和一個全局表示學習模塊考慮到候選項的局部表示和局部平衡。全局表征學習模塊可以看作是一個基于位置的注意層,能夠很好地適應自我注意框架的并行化訓練過程。選通模塊利用MLP層對候選項、最近交互項和每個用戶的全局偏好之間的關系進行建模來計算權重。對五個常用數據集的大量實證研究表明,我們的FISA在兩個常用指標方面顯著優于八個最好的基線算法。14. From the Lab to Production: A Case Study of Session-Based Recommendations in the Home-Improvement Domain
電子商務應用程序在很大程度上依賴于基于會話的推薦算法來改善客戶的購物體驗。基于會話的推薦算法的最新進展顯示了巨大的前景。然而,將這一承諾轉化為現實世界的成果是一項具有挑戰性的任務,原因有很多,但主要是由于現有模型的數量多且特性各異。在這篇論文中,我們討論了在家居裝修領域的一個領先的電子商務應用程序中識別和部署一個成功的基于會話的推薦算法的過程中的方法和經驗教訓。為此,我們首先在離線環境下對14個基于會話的推薦算法進行了評估,在三個數據集上使用了8個不同的流行評估指標。結果表明,離線評估并不能提供足夠的洞察力來做出明智的決策,因為在所有指標上都沒有明確的獲勝方法。另外,我們發現標準的離線評估指標不適合這個應用程序。具體地說,只有當算法預測到用戶下一次點擊或最終購買的商品時,他們才會獎勵它。然而,在實際情況下,有一些幾乎相同的產品,盡管它們被分配了不同的標識符,但它們應該被視為同樣好的建議。為了克服這些局限性,我們進行了另一輪評估,在這一輪評估中,人類專家為五種算法的建議提供客觀和主觀反饋,這些算法在離線評估中表現最好。我們發現,專家的意見往往與線下評估結果不同。對反饋的分析證實,當我們評估與之相關的幾乎相同的產品推薦時,所有模型的性能都顯著提高。最后,我們使用在人類評估階段表現最好的模型之一運行A/B測試。與領先的第三方解決方案相比,該治療模式的轉化率提高了15.6%,每次就診的收入增加了18.5%。15. Global and Local Differential Privacy for Collaborative Bandits
協作式bandit學習已經成為個性化推薦的一個新的研究熱點。它利用用戶依賴性進行聯合模型估計和推薦。由于此類在線學習解決方案直接向用戶學習,例如結果點擊,它們在隱私保護方面帶來了新的挑戰。盡管最近有關于上下文bandit算法中隱私的研究,但是如何在協作bandit學習環境中有效地保護用戶隱私仍然是個未知數。本文在全局差分隱私和局部差分隱私的概念下,提出了一個在協同bandit算法中實現差分隱私的通用解決方案框架。其核心思想是在bandit模型的充分統計數據中注入噪聲(要么在服務器端實現全局差異隱私,要么在客戶端實現局部差異隱私),并根據用戶之間的協作結構校準噪聲等級。我們研究了兩種常用的協同bandit算法來說明我們的解決方案框架的應用。理論分析證明,與線性bandits算法相比,我們所導出的私有算法減少了隱私保護機制帶來的額外遺憾,即協作實際上有助于在相同注入噪聲的情況下獲得更強的隱私。我們還對合成數據集和真實世界數據集的算法進行了實證評估,以證明隱私性和實用性之間的權衡。
16. Goal-driven Command Recommendations for Analysts
最近,數據分析軟件應用程序已成為分析師決策過程中不可或缺的一部分。這些軟件應用程序的用戶生成大量的非結構化日志數據。這些日志包含了用戶目標的線索,傳統的推薦系統很難從日志數據中隱式地建模。有了這個假設,我們想通過命令推薦來幫助用戶分析過程。我們根據完成手頭任務的目的將命令分為軟件類和數據類。在數據命令之前的命令序列是后者的良好預測器的前提下,我們設計、開發和驗證了各種序列建模技術。在本文中,我們提出了一個框架,通過利用非結構化日志向用戶提供目標驅動的數據命令建議。我們使用基于網絡的分析軟件的日志數據來訓練我們的神經網絡模型并量化它們的性能,與相關的和競爭的基線進行比較。我們提出了一個定制的損失函數,以根據外部提供的目標信息定制推薦的數據命令。我們還提出了一個評估指標,它可以捕捉到建議的目標導向程度。我們通過使用所提出的度量來評估模型,并通過離線評估展示了我們的模型在對抗性示例(用戶活動與所選目標不一致)的情況下的穩健性。17. ImRec: Learning Reciprocal Preferences Using Images
互惠推薦系統是為連接人與人之間的社交平臺而設計的推薦系統。它們通常用于在線約會、社交網絡和招聘服務。這些推薦者與傳統的用戶商品推薦者之間的主要區別在于,他們必須考慮雙方的利益。在這項研究中,我們提出了一種新的方法,提出了一種基于圖像數據的相互推薦方法??紤]到用戶對其他用戶圖像的積極和消極偏好表達的歷史,我們訓練一個siamese網絡來識別符合用戶個人偏好的圖像。我們提供了一個算法來解釋這些個體偏好指標為一個相互的偏好關系。我們的評估是在一個流行的在線約會服務提供的大型真實數據集上進行的。基于此,我們的服務大大改進了以前最先進的基于內容的解決方案,并且在冷啟動情況下的性能也優于協作過濾解決方案。該模型的成功為圖像在網上約會中的重要性提供了經驗證據。18. In-Store Augmented Reality-Enabled Product Comparison and Recommendation
我們提出了一種將實體零售商店中基于AR的產品屬性表示與僅在線提供的商品推薦相結合的方法。該系統支持用戶的決策過程,通過提供功能來比較商品之間的產品特性,包括實物和在線產品,并提供基于選擇店內產品的建議。因此,物理產品可以作為形成用戶偏好的錨定,并且在親自探索產品時提供更豐富和更吸引人的體驗??陀^產品屬性和物理產品的視覺外觀都用于從在線空間生成推薦。這樣,網上購物和店內購物的優勢可以結合起來,為商家創造了新的多渠道機會。實證分析表明,比較和推薦功能得到了用戶的認可,并暗示了混合實體網絡購物支持系統的一些可能的好處。盡管這項研究有局限性,但有足夠的證據認為這是一種可行的方法,值得進一步探討.19. Keeping Dataset Biases out of the Simulation: A Debiased Simulator for Reinforcement Learning based Recommender Systems
強化學習推薦(RL4Rec)方法作為一種提高用戶長期參與度的有效方法越來越受到關注。然而,在線應用RL4Rec會帶來風險:探索可能會導致有害的用戶體驗。此外,很少有研究人員能夠訪問現實世界中的推薦系統。模擬已經被提出作為一種解決方案,其中用戶反饋是根據記錄的歷史用戶數據來模擬的,從而實現優化和評估,而無需在線運行。雖然模擬器不會給用戶體驗帶來風險,而且可以廣泛使用,但我們發現現有模擬方法的一個重要局限性。它們忽略了日志用戶數據中存在的交互偏差,因此,這些偏差會影響結果模擬。作為這個問題的解決方案,我們在模擬管道中引入了一個去借方步驟,它在用于模擬用戶行為之前糾正日志數據中存在的偏差。為了評估偏差對RL4Rec仿真的影響,我們提出了一種新的模擬器評估方法,該方法考慮了使用模擬器優化的策略的性能。我們的結果顯示,來自記錄數據的偏差會對結果策略產生負面影響,除非使用我們的借記方法進行糾正。雖然我們的借記方法可以應用于任何模擬器,但我們將完整的管道公開作為離線學習和評估的模擬器(SOFA):第一個在優化和評估之前解釋交互偏差的模擬器。20. KRED: Knowledge-Aware Document Representation for News Recommendations
新聞文章通常包含知識實體,如名人或組織。文章中的重要實體傳遞關鍵信息,有助于以更直接的方式理解內容。一個工業新聞推薦系統包含了個性化推薦、商品間推薦、新聞分類、新聞熱度預測和地方新聞檢測等多種關鍵應用。我們發現,為了更好地理解文檔而合并知識實體對這些應用程序始終有好處。但是,現有的文件理解模型要么不考慮知識實體(如BERT),要么依賴于特定類型的文本編碼模型(如DKN),從而影響了泛化能力和效率。在本文中,我們提出了KRED,它是一個快速有效的用知識圖增強任意文檔表示的模型。KRED首先通過在知識圖中集中鄰域的信息來豐富實體的嵌入。然后應用上下文嵌入層對不同實體的動態上下文(如頻率、類別和位置)進行注釋。最后,信息蒸餾層在原始文檔表示的指導下,對嵌入的實體進行聚合,并將文檔向量轉化為新的文檔向量。我們主張用多任務框架對模型進行優化,使不同的新聞推薦應用程序能夠統一起來,在不同的任務之間共享有用的信息。在一個真實的微軟新聞數據集上的實驗表明,KRED大大有利于各種新聞推薦應用程序。總結
以上是生活随笔為你收集整理的2020年推荐系统工程师炼丹手册RecSys-Long Paper版的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 推荐系统炼丹笔记:令人着迷的时间动态CF
- 下一篇: 炼丹笔记 | 讲讲我们的故事