CVPR2014: DeepID解读
生活随笔
收集整理的這篇文章主要介紹了
CVPR2014: DeepID解读
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
上周五就要發(fā)的,拖........拖.......拖到現(xiàn)在,文中有不準確的地方,歡迎批評指正。 DeepID是一種特征提取的算法,由港中文湯曉鷗團隊于2014年提出,發(fā)表于CVPR2014。其應(yīng)用領(lǐng)域是人臉識別的子領(lǐng)域——人臉驗證,就是判斷兩張圖片是不是同一個人。之前的人臉驗證任務(wù)主要的方法是使用過完備的(over-complete)低層次特征,結(jié)合淺層的機器學(xué)習(xí)模型進行的。過去的方法常常是將人臉提取出幾萬乃至幾百萬的特征,然后將特征進行降維,再計算兩個特征的相似度,本文提出一種使用深度學(xué)習(xí)提取人臉深層次特征(稱之為DeepID)的方法。DeepID特征由人臉分類任務(wù)學(xué)習(xí)得到,此特征可以用于人臉驗證中,最終在LFW數(shù)據(jù)集上取得了97.45%的成績。 一、網(wǎng)絡(luò)架構(gòu) DeepFace的架構(gòu)并不復(fù)雜,層數(shù)也不深。網(wǎng)絡(luò)架構(gòu)由4個卷積層 + 1個全連接層構(gòu)成。 二、從實現(xiàn)過程,理解網(wǎng)絡(luò) (一)做patch 1.截區(qū)域 按照人臉特征點的分布,在1張輸入圖片上取10個區(qū)域,如下圖所示: 2.數(shù)據(jù)增強 (1)將每個區(qū)域,resize成3中不同尺度的pic,如下圖所示: (2)將圖像進行水平翻轉(zhuǎn) (3)提取灰度圖 (4)patches總量 經(jīng)過前3步的數(shù)據(jù)增強,此時的1張image,產(chǎn)生了10 * 3 * 2 * 2 = 120個區(qū)域,將每1個區(qū)域與其水平翻轉(zhuǎn)的區(qū)域,送入網(wǎng)絡(luò),進行特征提取。此步共訓(xùn)練60個神經(jīng)網(wǎng)絡(luò)。輸出160*2維的DeepID 3.增加patches效果 由下圖可見,增加patches數(shù)量后,網(wǎng)絡(luò)性能,相對于只用了1整張image的原始結(jié)構(gòu),提升明顯,感覺就是數(shù)據(jù)增強的原因。 (二)過ConvNets 以1個區(qū)域的輸入為例,如果區(qū)域是長方形,則resize成39*31,如果如果區(qū)域是正方形,則resize成31*31,假設(shè)本次輸入的區(qū)域是長方形,喂入網(wǎng)絡(luò),如上圖所示。 圖片經(jīng)過4層卷積,第3層,和第4層的feature map分別是3*2*60,和2*1*80維。將最后2層的feature map分別過全連接層,concatenate成1個160維的vector Concatenate方式:在同一維度上疊加 不同hierarchy的Feature map疊加在一起,分類器可以看到多尺度的圖像。想當(dāng)于聯(lián)系了上下文,網(wǎng)絡(luò)性能更好。 DeepID自身的分類錯誤率在40%到60%之間震蕩,雖然較高,但DeepID是用來學(xué)特征的,并不需要要關(guān)注自身分類錯誤率 將上文160維的vector送入soft-max進行分類,輸出10000分類的結(jié)果。60個網(wǎng)絡(luò),各自對應(yīng)各自預(yù)測的cls結(jié)果,如下圖所示: 三、利用DeepID做verification 本來以為做完cls,這個paper就可以結(jié)束了,然鵝,看了paper后面密密麻麻的2張,才意識到這個paper是關(guān)于verification的,之所以要做cls,主要是多分類的訓(xùn)練,可以提高ConvNet的提取特征的能力,終其目的,還是為了拿到提取的特征,做其關(guān)心的verification (一)用前面訓(xùn)練好的網(wǎng)絡(luò),對2張圖片做verification 每張照片,根據(jù)是否水平翻轉(zhuǎn),分為2組,每組有60個patches(10個區(qū)域,每個區(qū)域3個size,每個size有RGB和Grey2種模式) 將每1個區(qū)域與其水平翻轉(zhuǎn)對應(yīng)的部分,聯(lián)合要對比的圖片的同一個區(qū)域,組著在一起,送入網(wǎng)絡(luò),進行特征提取。此步調(diào)用了60個神經(jīng)網(wǎng)絡(luò)。 每張輸入的160維vector,即為那個區(qū)域的identity,可視化160維的數(shù)據(jù)如下,可以看出相同人臉的identity相似度高,不同人臉的identity區(qū)別較大。 1張image經(jīng)過網(wǎng)絡(luò),輸出120(60個patches,每個patch里2張圖)*160=19200維vector,以此vector表征人臉的identity。 將2張face的identity,送入joint Bayesian,判斷是否為同1個人。 下面介紹一下classifier里面的joint Bayesian分類器 (二)Joint Bayesian (1)經(jīng)典Bayesian Face 在介紹joint Bayesian之前,先看一下joint Bayesian出現(xiàn)之前,業(yè)界廣泛使用的經(jīng)典Bayesian Face,算法描述如下 但是經(jīng)典bayesian從2維投射到1維時,會喪失一些分區(qū)信息,導(dǎo)致在2維平面上可分的目標(biāo),在1維平面上變得不可區(qū)分。 從上圖中可以看到,2-D的數(shù)據(jù)通過差分x-y映射到1-D上。O附近的點交錯在一起, 使得在O附近的Class-1 和Class-2 無法區(qū)分開來。這就是經(jīng)典Bayesian Face的缺陷 (2)joint Bayesian 針對經(jīng)典Bayesian Face出現(xiàn)的問題,中科大,港中文以及亞研院的4位同學(xué),在孫劍的指導(dǎo)下于2012年提出來joint Bayesian方法 (三)神經(jīng)網(wǎng)絡(luò)分類器 14年,當(dāng)時的verification sota 分類器還是joint Bayesian,神經(jīng)網(wǎng)絡(luò)成績一般,作者試了這2種方法后,選擇了性能更優(yōu)的joint Bayesian 四、網(wǎng)絡(luò)成績 DeepID相對于傳統(tǒng)的PCA方法,表征能力進一步增強 DeepID在LFW數(shù)據(jù)集上取得了97.45%的準確率,相比于DeepFace的97.35%,獲得了進一步的提高。ROC曲線如下: 五、數(shù)據(jù)指標(biāo) 簡單的介紹下ROC,以前看的時候沒有仔細去弄明白這個指標(biāo),最近看好多paper上都有這個東西,查閱了資料,總結(jié)如下 ROC全名叫receiver operating characteristic curve,中文譯為:接收者操作特征曲線,用以說明二分類器在識別閾值變化時的診斷能力。 ROC將偽陽性率(FPR)定義為 X 軸,真陽性率(TPR)定義為 Y 軸。繪圖方法如下 (一)統(tǒng)計樣本分類score 將一系列樣本,按照positive可能性得分,進行排序 (二)計算真陽率和假陽率 以score作為閾值,依次對排好序的樣本進行判斷,score > threshold, 則判定為Positive, 否則判為Negative,每一個threshold計算1次真陽率和假陽率,做出這個20個樣本的真陽率-假陽率對應(yīng)圖。 (三)ROC曲線優(yōu)勢 為什么要使用ROC呢?因為ROC曲線有個很好的特性:當(dāng)測試集中的正負樣本的分布變換的時候,ROC曲線能夠保持不變。在實際的數(shù)據(jù)集中經(jīng)常會出現(xiàn)樣本類不平衡,即正負樣本比例差距較大,而且測試數(shù)據(jù)中的正負樣本也可能隨著時間變化。下圖是ROC曲線和Presision-Recall曲線的對比。 (a)和(c)為Roc曲線,(b)和(d)為Precision-Recall曲線。(a)和(b)展示的是分類其在原始測試集(正負樣本分布平衡)的結(jié)果,(c)(d)是將測試集中負樣本的數(shù)量增加到原來的10倍后,分類器的結(jié)果,可以明顯的看出,ROC曲線基本保持原貌,而Precision-Recall曲線變化較大。 六、小結(jié) 分類數(shù)提高,可以學(xué)到表征力更強的identity 用更多的分類來訓(xùn)練網(wǎng)絡(luò),測試的error rate持續(xù)降低。一開始還疑惑DeepID初衷是做verification,為什么一開始要用softmax做cls,其實原因到這里就明了了,分類越多,學(xué)到的160維的identity表征力越強。
轉(zhuǎn)載于:https://www.cnblogs.com/jiangshaoyin/p/10895927.html
總結(jié)
以上是生活随笔為你收集整理的CVPR2014: DeepID解读的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HDU-2072 单词数 水题一枚
- 下一篇: iOS开发常用输入校验