AI大牛“认输”退网:多人种人脸数据可以有效去偏见
作為第四次工業(yè)革命的新引擎,人工智能的高速發(fā)展已經(jīng)到了關(guān)鍵時(shí)刻,但是以算法偏見為代表的技術(shù)倫理問題逐漸成為人工智能發(fā)展的絆腳石。
近日,杜克大學(xué)研究人員研發(fā)的PULSE算法被質(zhì)疑存在“嚴(yán)重種族歧視”,人工智能領(lǐng)軍人物Yann LeCun對(duì)此作出回應(yīng),評(píng)論一出便引發(fā)了關(guān)于算法偏見的激烈論戰(zhàn)。
在CVPR 2020上,杜克大學(xué)的研究人員提出了一種超分辨率算法(PULSE),該算法可以將部分模糊的人臉圖像進(jìn)行清晰化處理。
算法計(jì)算生成的圖片甚至可以清晰呈現(xiàn)人臉上毛孔、皺紋以及發(fā)絲,效果不可謂不震撼。
有網(wǎng)友用美國前總統(tǒng)奧巴馬的模糊照片進(jìn)行試驗(yàn),但超分辨率處理后的結(jié)果是一張白人的面孔,因此PULSE算法被質(zhì)疑存在偏見。
人工智能專家Yann LeCun將此現(xiàn)象歸因?yàn)閿?shù)據(jù)集的偏差,因?yàn)樗惴ㄋ玫挠?xùn)練數(shù)據(jù)集中大多是白人的人臉,因此特征的分布會(huì)向白人人臉傾斜。
雖然Yann LeCun從技術(shù)路徑解釋了這一問題,但是由于話題的高度敏感性,該解釋并不能說服廣大推特用戶。話題不斷發(fā)酵,甚至出現(xiàn)了對(duì)算法推理機(jī)制不可知論的擔(dān)憂。
同樣的問題也發(fā)生在MIT開發(fā)的Tiny Images數(shù)據(jù)集上。該數(shù)據(jù)集創(chuàng)建于2008年,適用于訓(xùn)練AI的系統(tǒng),在圖像識(shí)別等機(jī)器學(xué)習(xí)模型中得到了廣泛的運(yùn)用。
但是該數(shù)據(jù)同樣涉及種族歧視、性別歧視等問題,使得系統(tǒng)在識(shí)別人像的時(shí)候可能會(huì)自動(dòng)地將有色人種或女性標(biāo)記上含歧視性質(zhì)的標(biāo)簽。因此,MIT永久下架了近億條數(shù)據(jù)。
算法偏見,就是人工智能算法在收集、分類、生成和解釋數(shù)據(jù)時(shí)產(chǎn)生的與人類相同的偏見或歧視,主要表現(xiàn)為種族歧視、年齡歧視、性別歧視、消費(fèi)歧視、就業(yè)歧視、弱勢(shì)群體歧視等現(xiàn)象。
根據(jù)皮尤研究中心2018年發(fā)布的《Public Attitudes Toward Computer Algorithms》顯示,58%的美國人認(rèn)為計(jì)算機(jī)程序反映出一定程度的人為偏見,并且40%的人認(rèn)為可以通過無偏見的方式設(shè)計(jì)這些程序。
消除偏見最有效、最直接的方法就是開發(fā)更加豐富的數(shù)據(jù)源類型,平衡采集的數(shù)據(jù)中關(guān)于種族、膚色、年齡、性別的分布,構(gòu)建更公平的數(shù)據(jù)集。
為了規(guī)避這一“偏見”帶來的風(fēng)險(xiǎn),數(shù)據(jù)堂面向多人種人臉處理識(shí)別技術(shù),設(shè)計(jì)并制作了23349人多色人種人臉多姿態(tài)數(shù)據(jù)。數(shù)據(jù)堂嚴(yán)格遵守GDPR條款,已獲得質(zhì)量管理體系認(rèn)證和信息安全管理體系認(rèn)證,所采集的多色人種人臉均已獲得被采集人的授權(quán)。
東南亞人人臉多姿態(tài)樣例
數(shù)據(jù)集包含黃種人、黑人、白人、棕色人種和印度人,每個(gè)人采集29張圖像,涵蓋28張多光照、多姿態(tài)、多場(chǎng)景圖片和1張證件照。
印度人人臉多姿樣例
通過對(duì)AI行業(yè)目前比較缺乏的人種人臉進(jìn)行采集,本數(shù)據(jù)集旨在改善客戶算法中的特征偏移,提高客戶算法的特征描述準(zhǔn)確性。
谷歌此前提出了AI研究的七大準(zhǔn)則:有益于社會(huì)、避免創(chuàng)造或增強(qiáng)偏見、為保障安全而建立和測(cè)試、對(duì)人們有說明義務(wù)、整合隱私設(shè)計(jì)原則、堅(jiān)持高標(biāo)準(zhǔn)的科學(xué)探索、根據(jù)原則確定合適的應(yīng)用。
數(shù)據(jù)堂始終堅(jiān)持加強(qiáng)技術(shù)倫理建設(shè)、堅(jiān)持科技向善的理念。目前,數(shù)據(jù)堂在多色人種人臉標(biāo)注方面積累了豐厚的經(jīng)驗(yàn),能夠有效避免因數(shù)據(jù)集的偏差帶來的算法偏見,客戶可以放心使用。
備注:文中所示的人臉采集樣例均已獲得被采集人授權(quán)
總結(jié)
以上是生活随笔為你收集整理的AI大牛“认输”退网:多人种人脸数据可以有效去偏见的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 非985/211面试大厂校招经历经验总结
- 下一篇: 随机数生成器python_python安