浅谈数据中的偏差问题和推荐系统去偏最新研究进展
?作者?|?楊晨
來源?|?RUC AI Box
本文首先回顧了數據中的偏差問題,通俗易懂地做一個解釋和引入,并基于最近兩年發表在頂級會議(KDD、SIGIR、WWW、AAAI 等)的推薦系統去偏相關論文,介紹最新研究工作,梳理其背后的技術脈絡,本文旨在幫助相關研究人員快速熟悉和理解偏差問題以及推薦系統去偏的最新研究進展,如有遺漏或錯誤,歡迎大家指正。
從辛普森悖論說起
看一個例子[1],一所美國高校的兩個學院,分別是法學院和商學院,新學期招生,人們懷疑這兩個學院有性別歧視(偏向男性),于是對招生人數做了統計,如下:
好的,看起來是這樣的,接下來我們去深究一下這樣性別歧視出現的原因究竟在哪?
首先來看法學院:
嗯哼?看起來女生錄取率比男生要高,而且高的很顯著,那么顯然問題不在法學院,那就一定在商學院了。
再看商學院:
誒?奇怪,商學院這邊看起來也是女生錄取率要高一些。那這到底是怎么回事?法學院沒有性別歧視,商學院也沒有性別歧視,這個性別歧視是從哪里來的?
進一步分析
聰明的讀者應該能發現,其實本質上沒有性別歧視,只是統計數據使得其看起來像是學院招生時對性別有了偏向。進一步分析這個問題,這個現象可以很簡單的進行解釋,只需要注意到以下兩點:
法學院總體錄取率低,商學院總體錄取率高
報名法學院的女生多,報名商學院的男生多
所以,女生錄取率低只是因為更多的女生報名了低錄取率的學院(因此拉低了女生總體錄取率),而不是學院招生時對性別有歧視。
辛普森悖論雖然叫做悖論,其實并不是一個悖論,只是一個數據偏差導致的認知錯誤。在這個問題的開始,我們關注的是錄取率,同時認為影響錄取率的因子只有性別,這種情況下得到了錯誤的結論。當然,看到這里,原因顯而易見,是因為忽略了“學院”這個因素,使得錯誤地判斷了性別對于錄取率的影響。
類比到深度學習
在深度學習的框架下,模型學到的東西來源于訓練數據,如果數據存在偏差(比如上面的數據量不均衡,沒有消除混雜因素的影響等),也會給模型帶來偏差(bias),使得模型的預測出現偏向及不公平等現象。
后文中所涉及的偏差(bias)問題,本質大同小異,而只是導致偏差的原因、解決的方法有所差異。
推薦系統偏差
接下來回顧一下推薦系統中的偏差問題,以下分類沿用之前推文(Debiased Recommendation: 推薦系統去偏研究進展概述)中的分類方式,并給出一句話為讀者進行總結和通俗解釋,以便更好的理解偏差類型和具體來源。
選擇偏差:用戶的主觀選擇使數據帶有偏向
一致性偏差:用戶打分會有從眾現象
曝光偏差:未曝光的數據認為不感興趣
流行度偏差:流行度高的物品越來越流行
公平性問題:對特定群體有偏袒,比如性別
循環偏差:偏差的惡性循環
歸納偏置:模型歸納的經驗(不算錯誤/誤差)
淺談一下推薦系統對社會的影響
偏差問題不僅僅會影響推薦系統的效果,還會造成一定的社會效應,推薦系統不僅僅是信息搜索工具,還控制著資源如何在不同的各方之間分配,下面簡單地提了一些實際例子,來說明一下這種影響,以進一步明確我們為什么需要關注以及研究偏差問題。
首先,為什么推薦系統需要公平?
推薦曝光的位置有限,曝光哪些商品?
社交平臺用戶注意力有限,曝光哪些資訊?
打車軟件,用戶有限,哪些司機接單?
面試機會有限,面試哪些候選人?
其次,推薦偏差是如何引入的?
訓練數據引入社會偏見
模型本身可能會呼應甚至強化數據中的偏差
上圖中訓練數據引入了一些社會偏見(男性 = 軟件工程師 = 高收入,女性 = 護士 = 低收入),由此訓練出的模型也帶有了偏見,因為AI并不明白哪些是敏感屬性(性別)。這種不公平性會導致許多不良影響,例如信息不對等、馬太效應、回音室等等[3]。
最新研究進展
下面基于最近兩年發表在頂級會議(KDD、SIGIR、WWW、AAAI等)的推薦系統去偏的相關論文,介紹部分最新研究工作,簡單梳理其背后的技術脈絡,也是在上一篇推文的基礎上做一個補充和更新。
Causal Intervention for Leveraging Popularity Bias in Recommendation. SIGIR 2021
這篇工作針對流行度偏差提出了一個新穎的角度:如何利用流行度偏差來提高推薦效果?并不是所有的數據偏差都是有害的,盲目地追求無偏學習可能會移除掉數據中一些有益的模式。本文主要針對以下兩個問題:
訓練階段如何移除流行度偏差的負面影響?
推理階段如何利用流行度偏差?
該工作提出了一種新的訓練和推理范式,在模型訓練時移除混雜的流行度偏差,同時通過因果干預來利用流行度偏差對預測得分進行調整。
在訓練階段,繪制因果圖,將流行度定義為混雜因素并切斷其與物品之間的因果關系,利用do算子來計算交互概率,以此完成去混淆排名。
在推理階段,高效利用流行度偏差(比如希望推廣那些可能受歡迎的物品),使用簡單的時間序列預測方法來設置流行度,利用do算子干預來進行模型推斷。
Model-Agnostic Counterfactual Reasoning for Eliminating Popularity Bias in Recommender System. KDD 2021
關鍵詞:popular bias
現有研究大部分通過逆傾向權重(IPW)處理流行度偏差,但是IPW方法對加權策略高度敏感,難以調整。本文核心關注點在于從因果關系的角度來探討流行度偏差問題。
為了消除流行偏見,需要回答一個反事實的問題:如果模型只使用物品屬性,排名得分會是多少?該工作設計了一個模型不可知的反事實推理(MACR)框架,該框架通過多任務學習來訓練推薦人,通過反事實推理來進行去偏推薦。
該模型包含三個部分,用戶-物品匹配 / 物品模塊 / 用戶模塊,對應三個優化損失目標同時優化。消除流行度偏差的關鍵在于從排名分數中去除路徑𝐼→𝑌的直接影響,按照以下目標計算最終得分:
Dual Unbiased Recommender Learning for Implicit Feedback. SIGIR 2021
關鍵詞:popular bias
現有的研究主要處理正反饋中的偏差而沒有考慮缺失的反饋中的偏差,這篇短文提出一個雙重的推薦學習框架,核心關注點在于同時消除點擊和未點擊數據中的偏差。
該研究提出的損失函數采用了兩種傾向加權方法,從點擊和未點擊數據中有效估計出真實的正和負偏好:
其使用了兩個無偏項來分別表示點擊和未點擊數據,其中,propensity score 計算公式如下:
Controlling Fairness and Bias in Dynamic Learning-to-Rank. SIGIR 2020
關鍵詞:popular bias / Fairness
在雙邊市場(購物,音樂等)中,物品的排序不僅對用戶有效用,而且還決定了物品提供者(供應商、工作室等)的效用(曝光、收入等),只針對用戶優化排序算法會對物品提供者不公平。本文核心針對的兩個問題:
馬太效應:流行的越來越流行(rich-get-richer)
公平性:針對用戶的排序算法導致的對物品提供者不公平問題
論文中定義了兩種衡量公平性差異的指標:
基于曝光的公平性差異:
基于反饋的公平性差異:
其中,分母表示偏好,最終衡量的是單位偏好上的曝光/反饋差異,以此達到去偏的目的。融合以上指標,提出了 FairCo 的排名策略:
以上策略包括了一個無偏基數相關估計量,它既可以作為公平的無偏價值評估,也可以作為排名標準,該算法采用控制器的形式,集成了公平性和效用的無偏估計,在可用數據增多后可對兩者進行動態調整。
Popularity Bias in Dynamic Recommendation. KDD 2021
關鍵詞:popular bias / dynamic
流行度偏差是推薦系統中長期存在的挑戰:受歡迎的物品被過度推薦,造成了用戶可能感興趣的不太受歡迎的物品被犧牲,這種偏差對用戶和物品提供者都產生了不利影響。大多數現有工作將流行度偏差置于靜態環境中,僅針對單輪推薦分析偏差,這些工作沒有考慮到現實推薦過程的動態性,主要針對以下幾個問題:
流行度偏差在動態場景中如何演變?
動態推薦過程中的獨特因素對偏差有什么影響?
如何在這個長期動態過程中消除偏差?
這項工作將動態推薦和流行偏好進行形式化,利用基尼指數來定量衡量流行度偏差,提出影響流行度偏差主要有四個因素:內在用戶規模不均衡 / 模型偏差 / 位置偏差 / 封閉反饋循環,同時在半合成數據集中進行了實驗驗證。
在其他工作的基礎上,進一步提出了一個的假陽性校正 (FPC)方法進行去偏,首先利用任意有偏的推薦模型獲取一個原始得分,然后利用歷史交互中多個時間點的假陽性信號對模型得分進行修正:
通過上式可得到去偏后得分,并且,該方法可與其它方法進行集成,以進一步提高性能。
Maximizing Marginal Fairness for Dynamic Learning to Rank.?WWW 2021
關鍵詞:Fairness?/ Dynamic LTR
傳統的排名框架對文檔的相關性進行排序不可避免地帶來不公平的結果曝光,現有的關于動態學習排序公平性的研究,往往通過顯著犧牲排名前的結果的結果相關性和公平性的表現來實現排名列表中文件曝光的整體公平性。
這篇工作希望在在線排名系統中控制和平衡結果的相關性和公平性,其從理論上選擇top-k結果中相關和曝光不足的文檔,以最大化邊際相關性和公平性。
首先定義了一個衡量top-k總體公平性的指標,表示為列表中所有文檔對的平均視差:
MMF算法包括了三個子模塊:
1. 最大化邊際公平性:貪心地進行的文檔選擇以最大化文檔邊際公平性。
2. 最大化相關性:基于文檔的相關性進行文檔選擇。
3. 平衡top-k相關性和公平性的控制器:通過最大化邊際公平性和最大化相關性可以得到兩個文檔,隨后基于一個概率λ,從這兩個中選擇一個作為最終文檔。
Cross-Positional Attention for Debiasing Clicks.?WWW 2021
關鍵詞:position bias
現有的針對位置偏差的研究都把位置簡單看作一個排序列表,這難以捕捉復雜的現實世界的用戶行為,而且很難推廣到web應用程序中的現代用戶界面(UI),這篇論文核心關注點在于具有UI界面的位置偏差。
該論文假設一個項目的點擊概率不僅取決于他自己的位置,而且受到其他所有項目的位置和相關性影響。模型的輸入包括項目特征和項目位置,通過項目特征計算相關性得分,利用注意機制捕捉項目之間的交叉位置信號,以計算點擊預測得分,最后融合兩個得分,得到預測點擊概率(下圖)。
Mitigating Sentiment Bias for Recommender Systems.?SIGIR 2021
關鍵詞:sentiment bias
本文首次提出推薦系統中一種新的偏差:情感偏差,具體表現為許多推薦模型對具有更多積極反饋的用戶/物品提供的推薦更準確(相比于具有更多消極反饋的用戶/物品)。情感偏差給那些嚴厲的用戶以及小眾的物品(具有更多負面反饋)帶來了低質量的推薦,并且這種偏差同流行度偏差存在區別。
如上圖所示,將用戶和物品分為積極和消極兩類,實驗表明推薦系統在積極用戶(物品)上的明顯表現優于消極用戶(物品)。
這項工作發現,降低物品情感偏差很可能會同時降低用戶情感偏差,所以論文針對物品做分類處理,針對推薦系統提出了一個新的優化損失目標(下式),包括一個原始的推薦損失函數和三個額外的正則化項,分別對應物品偏差正則化 / 信息熵正則化 / 嵌入正則化。
參考文獻
[1]?https://zh.wikipedia.org/wiki/辛普森悖論?
[2] A survey on bias and fairness in machine learning.?
[3] Tutorial on Fairness of Machine Learning in Recommender Systems. SIGIR 2021.?
[4] Model-Agnostic Counterfactual Reasoning for Eliminating Popularity Bias in Recommender System. KDD 2021?
[5] Causal Intervention for Leveraging Popularity Bias in Recommendation. SIGIR 2021?
[6] Dual Unbiased Recommender Learning for Implicit Feedback. SIGIR 2021?
[7] Controlling Fairness and Bias in Dynamic Learning-to-Rank. SIGIR 2020?
[8] Popularity Bias in Dynamic Recommendation. KDD 2021?
[9] Maximizing Marginal Fairness for Dynamic Learning to Rank. WWW 2021?
[10] Cross-Positional Attention for Debiasing Clicks. WWW 2021?
[11] Mitigating Sentiment Bias for Recommender Systems. SIGIR 2021
特別鳴謝
感謝 TCCI 天橋腦科學研究院對于 PaperWeekly 的支持。TCCI 關注大腦探知、大腦功能和大腦健康。
更多閱讀
#投 稿?通 道#
?讓你的文字被更多人看到?
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。?
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學術熱點剖析、科研心得或競賽經驗講解等。我們的目的只有一個,讓知識真正流動起來。
📝?稿件基本要求:
? 文章確系個人原創作品,未曾在公開渠道發表,如為其他平臺已發表或待發表的文章,請明確標注?
? 稿件建議以?markdown?格式撰寫,文中配圖以附件形式發送,要求圖片清晰,無版權問題
? PaperWeekly 尊重原作者署名權,并將為每篇被采納的原創首發稿件,提供業內具有競爭力稿酬,具體依據文章閱讀量和文章質量階梯制結算
📬?投稿通道:
? 投稿郵箱:hr@paperweekly.site?
? 來稿請備注即時聯系方式(微信),以便我們在稿件選用的第一時間聯系作者
? 您也可以直接添加小編微信(pwbot02)快速投稿,備注:姓名-投稿
△長按添加PaperWeekly小編
🔍
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
·
總結
以上是生活随笔為你收集整理的浅谈数据中的偏差问题和推荐系统去偏最新研究进展的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: WGAN新方案:通过梯度归一化来实现L约
- 下一篇: 经纬仪该如何正确使用呢?