文献记录(part69)--公平性机器学习中基于分类间隔的歧视样本发现和消除算法
學習筆記,僅供參考,有錯必糾
關鍵詞:公平性學習 , 分類間隔 , 目標集 , 加權距離度量 , 歧視性
公平性機器學習中基于分類間隔的歧視樣本發現和消除算法
摘要
公平性學習是機器學習領域的研究熱點 , 預防歧視的目的在于執行預測任務之前消除不公平訓練集對于分類器的影響.為了保證分類公平性和準確性 , 本文通過發現和消除原始數據集中的歧視樣本尋找生成公平數據集的方法 , 即提出了一種基于分類間隔的加權方法用于處理二分類任務中的歧視現象 , 并在 demographic parity和equalized odds公平性判定準則上實現分類公平.
為了不影響分類準確性 , 本文基于最大間隔原理將樣本投影之后選出目標集 , 對于目標集中的每個樣本 , 通過加權距離度量方法判定該樣本是否具有歧視性 , 并進行修正 .
通過在 3 個真實數據集上與已有方法進行實驗對比 , 本文的方法能夠獲得更好的分類公平性和準確性 , 并且不局限于特定的公平性判定準則和分類器.
引言
近年來 , 機器學習越來越受到各界人士的關注 . 然而 , 機器學習系統容易受到歷史數據的影響 , 并對少數群體、弱勢群體和歷史上處于不利地位的群體產生歧視行為 . 因此 , 有必要使用公平性準則來約束機器學習系統在某些應用場景中的行為 , 例如貸款、就業、刑事司法和廣告 , 并期望保護弱勢群體 , 從而在分類公平性和準確性之間達到一個平衡.
目前 , 機器學習公平性的研究成果大致歸為以下 3 大類:
-
第 1 類方法通過數據預處理消除歧視樣本 . 主要策略是通過修改訓練集來平衡
總結
以上是生活随笔為你收集整理的文献记录(part69)--公平性机器学习中基于分类间隔的歧视样本发现和消除算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 筛选法求素数
- 下一篇: 中国平安全称叫什么 中国平安公司全名称