【知识星球】这几年人脸都有哪些有意思的数据集?
歡迎大家來到《知識(shí)星球》專欄,人臉一直是整個(gè)圖像領(lǐng)域里最大的方向,最近幾個(gè)月咱們?cè)谥R(shí)星球里分享了非常多的這幾年新出的人臉數(shù)據(jù)集,簡(jiǎn)單介紹其中幾個(gè)如下。
作者&編輯 | 言有三
有三AI知識(shí)星球-數(shù)據(jù)集
MeGlass
MeGlass是一個(gè)仿真的帶眼鏡的人臉識(shí)別數(shù)據(jù)集,包括1710個(gè)人的14 832張有眼鏡圖和33087張無眼鏡圖,各自至少有兩張。
作者/編輯 言有三
眼鏡對(duì)人臉識(shí)別問題會(huì)造成一定的困擾,MeGlass是一個(gè)仿真的戴眼鏡人臉識(shí)別數(shù)據(jù)集,包括1710個(gè)人的14 832張有眼鏡圖和33087張無眼鏡圖,所有的圖片來自于MegaFace。
統(tǒng)計(jì)信息如下:
一些圖片案例如下:
參考文獻(xiàn)
[1] Guo J, Zhu X, Lei Z, et al. Face synthesis for eyeglass-robust face recognition[C]//Chinese Conference on Biometric Recognition. Springer, Cham, 2018: 275-284.
有三AI知識(shí)星球-數(shù)據(jù)集
Makeup Transfer
Makeup Transfer是一個(gè)妝造遷移人臉數(shù)據(jù)集,有3384張女性人臉圖。
作者/編輯 言有三
Makeup Transfer包括3834張女性人臉圖,其中1115張無妝造人臉,2719張有妝造人臉。妝造類型包括不同程度的煙熏妝(smoky-eyes makeup style), 華麗妝(flashy makeup style),復(fù)古妝(Retro makeup style),韓式妝(Korean makeup style)以及日式妝(Japanese makeup style)。
參考文獻(xiàn)
[1] Li T, Qian R, Dong C, et al. Beautygan: Instance-level facial makeup transfer with deep generative adversarial network[C]//Proceedings of the 26th ACM international conference on Multimedia. 2018: 645-653.
有三AI知識(shí)星球-數(shù)據(jù)集
DFW?
DFW(Disguised Faces in the Wild)是一個(gè)妝造和偽造人臉數(shù)據(jù)集,有1000個(gè)人的11157張圖。
作者/編輯 言有三
DFW是IBM發(fā)布的一個(gè)妝造人臉數(shù)據(jù)集,有1000人的11157 張圖片,主要包括遮擋和偽造人臉。每一個(gè)人都有一張正臉圖,其中903張人有一個(gè)驗(yàn)證圖,兩者構(gòu)成正常的人臉驗(yàn)證對(duì)。所有1000個(gè)人都有一些包括妝造圖,874個(gè)人有一些被識(shí)別成該人(故意的或者非故意的)的偽造圖,最終總共1000張整成圖, 903張驗(yàn)證圖,4814張妝造圖, 4440張偽造(另一個(gè)人)圖。
上圖是一些樣本,第一張是正常圖,黃色底色是驗(yàn)證圖,綠色底色是妝造圖,藍(lán)色底色是偽造(另一個(gè)人)圖。
參考文獻(xiàn)
[1]?Kushwaha V, Singh M, Singh R, et al. Disguised faces in the wild[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops. 2018: 1-9.
有三AI知識(shí)星球-數(shù)據(jù)集
Cartoonset10k/100k
Cartoonset10k/100k是一個(gè)漫畫人臉數(shù)據(jù)集,包括100000張具有不同藝術(shù)風(fēng)格的人臉頭像,可以用于人臉風(fēng)格化等應(yīng)用。
作者/編輯 言有三
CartoonSet10k和CartoonSet100k,分別包含10000和100000張卡通人臉圖。每一張卡通人臉圖都有16個(gè)組件,其中12個(gè)面部屬性和4個(gè)顏色屬性。
下面是它的樣本和屬性標(biāo)注,其中csv內(nèi)容每一行是名字,屬性index,以及該屬性的種類。
參考文獻(xiàn)
[1]?Royer A, Bousmalis K, Gouws S, et al. Xgan: Unsupervised image-to-image translation for many-to-many mappings[M]//Domain Adaptation for Visual Understanding. Springer, Cham, 2020: 33-49.
有三AI知識(shí)星球-數(shù)據(jù)集
FairFace
由于當(dāng)前很多的人臉數(shù)據(jù)集中存在人種的不均衡,比如白人居多黑人居少,fairface建立了一個(gè)更加均衡的數(shù)據(jù)集。
作者/編輯 言有三
目前很多開源數(shù)據(jù)集中人種比例非常不平衡,下面是一個(gè)統(tǒng)計(jì)。
針對(duì)這個(gè)現(xiàn)象,FairFace數(shù)據(jù)集被整理出來,它是一個(gè)人臉屬性數(shù)據(jù)集,共包括white,black,Indian,East Asian,Southeast Asian,Middle East以及Latino7類人種,圖片來源于YFCC-100M Flickr數(shù)據(jù)集,標(biāo)注屬性包括人種(race),性別(gender),年齡組(age group)。
數(shù)據(jù)集共有108501張圖,和其他數(shù)據(jù)集對(duì)比一覽如下:
參考文獻(xiàn)
[1]?K?rkk?inen K, Joo J. FairFace: Face Attribute Dataset for Balanced Race, Gender, and Age[J]. arXiv preprint arXiv:1908.04913, 2019.
除了上面這些,我們還分享了數(shù)十個(gè)各種各樣的大型小型人臉數(shù)據(jù)集,下面是其中一些預(yù)覽案例,供感興趣的你獲取,所有數(shù)據(jù)集在星球中提供下載,經(jīng)常會(huì)更新!
6 關(guān)于數(shù)據(jù)集
有三AI知識(shí)星球是我們繼公眾號(hào)之后重點(diǎn)打造的原創(chuàng)知識(shí)學(xué)習(xí)社區(qū),其中數(shù)據(jù)集板塊專注于給大家介紹重要數(shù)據(jù)集和新奇好玩的數(shù)據(jù)集,包括
(1) 經(jīng)典大型數(shù)據(jù)集,ImageNet,CityScape,AffectNet,AVA等。
(2) 各類新奇好玩的數(shù)據(jù)集,等你來發(fā)掘啦。
超過1T的資源,還可以進(jìn)行數(shù)據(jù)集求助!希望你喜歡。
知識(shí)星球其他內(nèi)容板塊如下,強(qiáng)烈建議不熟悉的同學(xué)讀一下以下的生態(tài)介紹(最近快一周年,加入半價(jià)噢,年費(fèi)低至138!)
【雜談】為什么邀請(qǐng)大家加入硬核知識(shí)星球有三AI
【年終總結(jié)】2019年有三AI知識(shí)星球做了什么,明年又會(huì)做什么
以上所有內(nèi)容
加入有三AI知識(shí)星球即可獲取
來日方長(zhǎng)
點(diǎn)擊加入
不見不散
更多精彩
每日更新
轉(zhuǎn)載文章請(qǐng)后臺(tái)聯(lián)系
侵權(quán)必究
往期精選
【雜談】有三AI知識(shí)星球最近都GAN了哪些內(nèi)容?
【雜談】GAN對(duì)人臉圖像算法產(chǎn)生了哪些影響?
【雜談】那些底層的圖像處理問題中,GAN能有什么作為?
【雜談】為了讓大家學(xué)好深度學(xué)習(xí)模型設(shè)計(jì)和優(yōu)化,有三AI都做了什么
【完結(jié)】12篇GAN的優(yōu)化文章大盤點(diǎn),濃濃的數(shù)學(xué)味兒
總結(jié)
以上是生活随笔為你收集整理的【知识星球】这几年人脸都有哪些有意思的数据集?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【总结】只需5步,给所有想入行人工智能/
- 下一篇: 【GAN】如何生动有趣地对GAN进行可视