Pymetrics开源公平性感知机器学习算法Audit AI
Pymetrics是一件專注于向企業(yè)提供招聘服務(wù)的初創(chuàng)企業(yè)。最近,Pymetrics在Github上開源了企業(yè)使用的偏差檢測(cè)(bias detection)算法,稱為“Audio AI”。Audit AI用于降低存在于訓(xùn)練數(shù)據(jù)集中的判別模式。這些判別模式會(huì)改進(jìn)或影響機(jī)器學(xué)習(xí)算法在選取總體上的概率。
\\現(xiàn)在,越來越多的工作任務(wù)借助于機(jī)器學(xué)習(xí)實(shí)現(xiàn)過程自動(dòng)化。重要的是應(yīng)確保這些算法不會(huì)產(chǎn)生可從中不當(dāng)受益的偏差。Pymetrics一直致力于確保機(jī)器學(xué)習(xí)算法的公平性。
\\\我們研究的總體目標(biāo),就是提出一種合理的考慮問題方式,使機(jī)器學(xué)習(xí)算法更公平。即便識(shí)別了訓(xùn)練數(shù)據(jù)集中存在的偏差,使用該訓(xùn)練集訓(xùn)練的機(jī)器學(xué)習(xí)算法并不足以解決其中的判別問題。當(dāng)前,越來越多的決策使用人工智能自動(dòng)做出。人們需要理解并識(shí)別算法的公平或偏差程度,這是朝正確方向邁出的一步。
\\\企業(yè)對(duì)多樣性的關(guān)注與日俱增。一些人擔(dān)心算法學(xué)習(xí)偏差的方式事實(shí)上可能會(huì)破壞這些多樣性努力。最近,法國(guó)宣布希望成為能在國(guó)際舞臺(tái)占有一席之地的人工智能強(qiáng)國(guó)。今年三月,法國(guó)總統(tǒng)Emmanuel Macron發(fā)布了人工智能國(guó)家戰(zhàn)略,其中包括在未來五年內(nèi)支出18.5億美元,發(fā)展可與硅谷和中國(guó)競(jìng)爭(zhēng)的生態(tài)系統(tǒng)。總統(tǒng)做出如此層次的AI投資,這無疑是經(jīng)過了仔細(xì)的考慮:
\\\我認(rèn)為AI完全可能危及民主。例如,我們正在使用人工智能來組織學(xué)生訪問大學(xué),對(duì)算法委以重任。很多人認(rèn)為算法是一個(gè)黑箱,他們并不明白選取學(xué)生的過程是如何發(fā)生的。但當(dāng)他們開始明白這依賴于某種算法時(shí),算法就具有了特定的責(zé)任。要避免爭(zhēng)議的發(fā)生,必須為算法創(chuàng)造公平性和完全透明性的條件。這樣的算法中并不存在偏見,至少不存在歧視性偏見,我對(duì)此充滿信心。
\\\對(duì)于法國(guó)而言,“公平”的算法可確保在性別、年齡及其它個(gè)體特征上不存在偏見。如果算法中并未建立公平性和透明度,那么Macron總統(tǒng)預(yù)計(jì)“人們最終會(huì)拒絕這種創(chuàng)新”。
\\Pymetrics的客戶包括消費(fèi)品企業(yè)、技術(shù)企業(yè)和研究企業(yè)。Pymetrics提供的部分產(chǎn)品是為應(yīng)聘候選者給出了一套參與性游戲。這些游戲通常完成于招聘的前期過程,完全不考慮應(yīng)聘者的種族、性別和教育水平等個(gè)體特征,而是基于應(yīng)聘者的記憶、對(duì)風(fēng)險(xiǎn)的態(tài)度等近80個(gè)特征做出評(píng)估。之后,Pymetrics就能夠針對(duì)已有的最佳表現(xiàn)者對(duì)應(yīng)聘者做出評(píng)定,預(yù)測(cè)應(yīng)聘者在應(yīng)聘職位上可能的未來表現(xiàn)。
\\出于社會(huì)責(zé)任上的考慮,Pymetrics選擇開源Audit AI。Pymetrics的產(chǎn)品負(fù)責(zé)人Priyanka Jain給出了解釋:
\\\作為技術(shù)的創(chuàng)造者,我們十分強(qiáng)烈地感受到,我們的責(zé)任就是構(gòu)建人工智能,努力創(chuàng)造一個(gè)人人希望生活于其中的未來。如果我們可以為其他技術(shù)創(chuàng)造者繼續(xù)構(gòu)建特性提供幫助,那么我們責(zé)無旁貸應(yīng)做出共享。
\\\在Audit AI的Github代碼庫(kù)中,開發(fā)人員可以看到一個(gè)用于實(shí)現(xiàn)上述“公平”的機(jī)器學(xué)習(xí)算法的Python軟件庫(kù),該軟件庫(kù)是基于pandas和sklearn構(gòu)建的。此外,代碼庫(kù)還給出了兩個(gè)示例數(shù)據(jù)集,場(chǎng)景分別涉及德國(guó)的學(xué)分和學(xué)生的成績(jī)。
\\查看英文原文:?Pymetrics Open-Sources Fairness-Aware Machine Learning Algorithms
總結(jié)
以上是生活随笔為你收集整理的Pymetrics开源公平性感知机器学习算法Audit AI的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java集合容器系列04-HashMap
- 下一篇: 第二天面试