【竞赛总结】CCF多人种人脸识别
題目:多人種人臉識(shí)別
類型:人臉識(shí)別
https://datafountain.cn/competitions/348
賽題背景
人臉識(shí)別已經(jīng)在生活中快速的普及開來, 但是人臉識(shí)別技術(shù)在實(shí)際應(yīng)用中遇到的一個(gè)廣為人知的問題是它在不同人種的性能有差異。如何快速的提升人臉識(shí)別系統(tǒng)在不同人種的性能, 是一個(gè)實(shí)用的人臉識(shí)別算法應(yīng)該考慮的問題。
賽題任務(wù)
本次比賽目標(biāo)是提高人臉識(shí)別模型在不同人種上面的性能。以人臉1:1 比對(duì)為場(chǎng)景, 參賽隊(duì)需要同時(shí)優(yōu)化人臉識(shí)別模型在不同人種上的性能,提高在低誤識(shí)率情況下不同人種的通過率。
評(píng)分標(biāo)準(zhǔn)
根據(jù)提交結(jié)果畫出不同人種的 ROC 曲線, 然后按照FAR=1e-2, 1e-3 和 1e-4 時(shí)候?qū)?yīng)的不同人種TAR的平均值進(jìn)行結(jié)果排名。
天才兒童團(tuán)隊(duì)
我們搭建了一套面向?qū)嶋H場(chǎng)景的人臉識(shí)別方案。首先提出了適合人臉圖像的數(shù)據(jù)增強(qiáng)方法,構(gòu)建了有監(jiān)督與無監(jiān)督模型結(jié)合的人臉識(shí)別模型,并搭建了一種推理模型。團(tuán)隊(duì)本次復(fù)賽A榜0.6582, B榜0.6583,均為線上第一。
數(shù)據(jù)集分布
人臉識(shí)別分為4個(gè)過程:人臉檢測(cè)、人臉對(duì)齊、特征提取、特征匹配。 數(shù)據(jù)集已經(jīng)進(jìn)行了人臉檢測(cè)和人臉對(duì)齊,我們只需要專注于特征提取和特征匹配。
訓(xùn)練集給出的4個(gè)人種圖片中,按數(shù)量多少順序分別為白種人、印度人、亞洲人、非洲人,其中白種人圖片數(shù)量相對(duì)其他人種非常多。
數(shù)據(jù)處理
圖像預(yù)處理的主要目的是改善圖像的視覺效果,增強(qiáng)圖像中的有用信息,抑制圖像中的背景噪聲。
圖像增強(qiáng)方法主要有:水平翻轉(zhuǎn),旋轉(zhuǎn),色度變化,銳度變化,對(duì)比度變化,直方圖均衡化,拉普拉斯圖像增強(qiáng)等。
為了有效評(píng)價(jià)增強(qiáng)圖像的效果,根據(jù)各指標(biāo)的意義和圖像通用評(píng)價(jià)方法,設(shè)計(jì)了圖像增強(qiáng)的驗(yàn)證方法,最終得到一種適合于人臉的圖像增強(qiáng)方法。
技術(shù)路線
現(xiàn)有的人臉識(shí)測(cè)試過程,通常是提取人臉特征向量,再通過向量距離比如余弦相似度進(jìn)行對(duì)比,而非直接通過網(wǎng)絡(luò)推理得到標(biāo)簽。
特征提取作為人臉識(shí)別最關(guān)鍵的步驟,已經(jīng)有了很多成熟的網(wǎng)絡(luò)模型。接下來我們主要從神經(jīng)網(wǎng)絡(luò)的損失函數(shù),骨干網(wǎng)絡(luò)2個(gè)角度進(jìn)行分析.
有監(jiān)督模型:ArcFace、Focal Loss
無監(jiān)督模型:CDP半監(jiān)督人臉樣本聚類
模型融合:線性加權(quán)3個(gè)模型
愛小童團(tuán)隊(duì)
我們針對(duì)人種偏差客觀存在的問題,在數(shù)據(jù)和算法方面提出采用基于參考人臉圖的分水嶺算法,和針對(duì)多人種問題的多模型融合算法。
參考人臉圖
參考人臉圖(Reference Face Graph)是以參考人臉(Reference Face, RF)做為節(jié)點(diǎn),參考人臉相似度為邊權(quán)重的網(wǎng)絡(luò)圖。每個(gè)參考人臉包含多張姿態(tài)、表情、光照不同的圖像,這些圖像具有較高的直接相似度,它們構(gòu)成的集合稱為參考基礎(chǔ)集合。
為方便集合劃分,先對(duì)數(shù)據(jù)集中任意兩張圖像計(jì)算人臉相似度,形成鄰接矩陣。相似度為兩張人臉圖像特征向量的余弦相似度。
參考基礎(chǔ)集合的劃分采用分水嶺算法實(shí)現(xiàn)。分水嶺算法是圖像切割常用的方法之一,它基本思想是把圖像看作是測(cè)地學(xué)上的拓?fù)涞孛病_w移到圖模型上,將圖像相似度作為海拔高度,將聯(lián)通區(qū)域作為參考集合。
多人種模型融合
我們進(jìn)行遷移學(xué)習(xí),訓(xùn)練出針對(duì)各個(gè)人種的多人種人臉識(shí)別模型。從而能夠?qū)崿F(xiàn)多人種模型融合。我們選擇五個(gè)模型融合。我們選擇五個(gè)模型融合,采用一個(gè)模型作為主模型,設(shè)定多模型投票取最小值策略。
閃閃紅星閃閃團(tuán)隊(duì)
在比賽中,我們嘗試了許多的人臉識(shí)別模型resnet101、insightfacel2k、switchable norm resnet、mobilefacenet和cosface,采用不同的損失函數(shù),比如:focal loss、soft max loss和triplet loss。
數(shù)據(jù)增強(qiáng)
由于數(shù)據(jù)有限,我們使用多種手段在模型訓(xùn)練時(shí)和人臉特征提取時(shí)進(jìn)行數(shù)據(jù)增強(qiáng)。
人臉對(duì)齊
數(shù)據(jù)增強(qiáng)
歸一化
模型融合
我們總共使用三個(gè)模型進(jìn)行融合,進(jìn)行兩兩迭代融合。
中科大多模態(tài)交互團(tuán)隊(duì)
在模型訓(xùn)練階段基于insightface框架,更換了不同的backbone來進(jìn)行訓(xùn)練,得到了三個(gè)性能各異的模型。
在測(cè)試階段分別使用單個(gè)模型對(duì)測(cè)試集進(jìn)行依存,然后對(duì)多個(gè)模型的結(jié)果進(jìn)行平均。
龍盈智達(dá)-天龍戰(zhàn)隊(duì)團(tuán)隊(duì)
我們首先拿到圖像數(shù)據(jù),確定該任務(wù)為人臉識(shí)別的識(shí)別部分,按照人險(xiǎn)識(shí)別一般流程檢測(cè)、糾正、特征提取、人臉比對(duì)識(shí)別流程。
在此基礎(chǔ)上我們按照不同圖像色階直方圖抽取一定比例,使用Insightface 進(jìn)行 inference識(shí)別測(cè)試。
我們使用平移、翻轉(zhuǎn)、色彩抖動(dòng)、尺度變換數(shù)據(jù)增強(qiáng)方法在同樣的數(shù)遠(yuǎn)集上進(jìn)行。在模型方面首先我們按照控制變量法,數(shù)據(jù)集與優(yōu)化方法,我們對(duì)模型采用比賽公開的數(shù)起集,在預(yù)訓(xùn)練模型訓(xùn)練后測(cè)試,獲得線上評(píng)分和模型微調(diào)之后進(jìn)行對(duì)比,確定模型優(yōu)化方法是否采用遷移學(xué)習(xí)。
往期精彩回顧適合初學(xué)者入門人工智能的路線及資料下載中國(guó)大學(xué)慕課《機(jī)器學(xué)習(xí)》(黃海廣主講)機(jī)器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印機(jī)器學(xué)習(xí)在線手冊(cè)深度學(xué)習(xí)筆記專輯《統(tǒng)計(jì)學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯 AI基礎(chǔ)下載本站qq群955171419,加入微信群請(qǐng)掃碼:總結(jié)
以上是生活随笔為你收集整理的【竞赛总结】CCF多人种人脸识别的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 跨平台RTSP/RTMP转RTMP转发S
- 下一篇: Elasticsearch Curato