公开人脸识别数据集
1. FaceMask CelebA數(shù)據(jù)集
FaceMask CelebA是模擬的口罩人臉數(shù)據(jù)集,粘貼的人臉蒙版圖像(RGBA)從從網(wǎng)上下載,裁剪完面部的最小區(qū)域后,將其粘貼到相應(yīng)的位置。FaceMask_CelebA數(shù)據(jù)集中,包括 202599 張口罩人臉圖像和人臉bbox標(biāo)簽。
應(yīng)用項目:人臉檢測
URL:?https://github.com/sevenHsu/FaceMask_CelebA
2. Flicker-Faces-HQ數(shù)據(jù)集
Flickr-Faces-HQ數(shù)據(jù)集是高質(zhì)量的人臉圖像數(shù)據(jù)集,主要目的為訓(xùn)練生成對抗網(wǎng)絡(luò)(GAN)模型。數(shù)據(jù)集在年齡,種族和圖像背景方面均存在很大差異,此外,還覆蓋了諸如眼鏡,太陽鏡,帽子等附件。圖像是從Flickr抓取的,從而繼承了該網(wǎng)站的所有偏見,并使用dlib算法自動對齊和裁剪。Flickr-Faces-HQ數(shù)據(jù)集包含70000張分辨率為1024×1024的高質(zhì)量PNG圖像。
應(yīng)用項目:人臉生成
URL:https://github.com/NVlabs/ffhq-dataset
3.?Make up數(shù)據(jù)集
Make up數(shù)據(jù)集為了研究人臉化妝,對面部識別的影響而匯總的女性面部圖像的數(shù)據(jù)集。主要收集了4個數(shù)據(jù)集:
(1)YMU(YouTube化妝):人臉圖像是從YouTube視頻化妝教程中獲得的。
(2)VMU(虛擬化妝):對FRGC存儲庫(http://www.nist.gov/itl/iad/ig/frgc.cfm)中白人女性的面部圖像,經(jīng)過合成獲得,從而實現(xiàn)模擬化妝的效果。
(3)MIW:從互聯(lián)網(wǎng)上抓取已經(jīng)化妝、和沒有化妝的人臉面部圖像。
(4)MIFS(化妝誘發(fā)的面部欺騙):從YouTube視頻化妝教程中獲取對象的面部圖像,并從互聯(lián)網(wǎng)上獲取相關(guān)目標(biāo)對象的面部圖像。
不同類型的數(shù)據(jù)集,數(shù)量各不相同。
?
應(yīng)用項目: 人臉美妝
URL:Makeup datasets
4.?VoxCeleb數(shù)據(jù)集
VoxCeleb數(shù)據(jù)集是一個視聽數(shù)據(jù)集,包含人類語音的簡短剪輯,摘錄自上傳到Y(jié)ouTube的采訪視頻。VoxCeleb數(shù)據(jù)集包含來自不同種族,口音,專業(yè)和年齡的700位演講者的演講。所有說話的臉部表情都被抓取,并帶有背景聊天,笑聲,重疊語音,姿勢變化和不同的照明條件。此外,在時長上,VoxCeleb數(shù)據(jù)集包含2000個小時的音頻和視頻,每個片段至少3秒長。
應(yīng)用項目:說話人識別、情緒識別、人臉生成
URL:VoxCeleb
?
5. Anime-Face-Dataset數(shù)據(jù)集
Anime-Face-Dataset中的動漫人臉,全都來自高質(zhì)量動畫的網(wǎng)站www.getchu.com,然后使用動畫面部檢測算法https://github.com/nagadomi/lbpcascade_animeface,對人臉進(jìn)行檢測,并縮放到90*90-120*120大小。
應(yīng)用項目:人臉生成
URL:https://github.com/bchao1/Anime-Face-Dataset
6. Generated Faces數(shù)據(jù)集
Generated Faces數(shù)據(jù)集是一個用于多樣化的合成數(shù)據(jù)集,需要注意的是,此數(shù)據(jù)集并不可以直接下載,而是根據(jù)自己的需要進(jìn)行購買下載,可以按照下方類型進(jìn)行定制:
(1)可自定義的背景:彩色,透明,攝影
(2)多樣性:種族,人口統(tǒng)計學(xué),面部表情和頭部姿勢
應(yīng)用項目:生成人臉,情緒識別、人臉識別
URL:https://generated.photos/datasets#
7. RMFD口罩人臉數(shù)據(jù)集
在疫情期間,基于口罩人臉數(shù)據(jù),設(shè)計相應(yīng)的口罩遮擋人臉檢測和識別算法,幫助社區(qū)封閉時的人員進(jìn)出管控,車站,機場的人臉識別閘機以及人臉門禁考勤設(shè)備的升級,成為一種需要。RMFD口罩人臉數(shù)據(jù)集,共匯總了多種口罩人臉數(shù)據(jù),可以用來做人臉檢測和人臉識別算法的訓(xùn)練。RMFD口罩人臉數(shù)據(jù)集中,包含多種口罩人臉數(shù)據(jù)。
(1)真實口罩人臉識別數(shù)據(jù)集:從網(wǎng)絡(luò)爬取樣本,經(jīng)過整理,清洗和標(biāo)注后,含525人的5千張口罩人臉,9萬正常人臉。
(2)模擬口罩人臉識別數(shù)據(jù)集:給公開數(shù)據(jù)集中的人臉戴上口罩,得到1萬人,50萬張人臉的模擬口罩人臉數(shù)據(jù)集。
(3)真實口罩人臉驗證數(shù)據(jù)集:包括426個人的4015張人臉圖像,組合成3589對相同身份和3589對不同身份的人臉樣本對(口罩人臉/正常人臉)。
應(yīng)用項目:人臉檢測、人臉識別
URL:https://github.com/X-zhangyang/Real-World-Masked-Face-Dataset
8.?Glint360K數(shù)據(jù)集
Glint360K是格靈深瞳開源,通過清理,合并和發(fā)布最大和最干凈的面部識別數(shù)據(jù)集。Glint360K數(shù)據(jù)集,包含360232個人的17091657張圖片
應(yīng)用項目:人臉識別
URL:https://github.com/deepinsight/insightface/tree/master/recognition/partial_fc#glint360k
9.?Celebrity in Places數(shù)據(jù)集
Celebrity in Places數(shù)據(jù)集包含不同類型場景,以及不同的名人。這些圖像全部是使用Google圖像搜索獲得的,并通過人工注釋進(jìn)行了驗證。
比如第一張圖片的標(biāo)簽為:阿曼達(dá)●塞弗里德-機場航站樓
第二張圖片的標(biāo)簽為:大衛(wèi)●卡梅隆-宴會廳
數(shù)據(jù)集包含不同類型場景中約36k名人的圖像。有4611位名人和16個地方參與其中。
應(yīng)用項目:人臉識別、場景分類
URL:https://www.robots.ox.ac.uk/~vgg/data/celebrity_in_places/
10.?Public Figures Face人臉數(shù)據(jù)集
從互聯(lián)網(wǎng)收集的人臉數(shù)據(jù)集。包括 200 個人的 58797 張圖像。同一人的圖像具有不受控的參數(shù)環(huán)境,包括不同的姿勢、光照、場景、鏡頭、攝像參數(shù)等。
應(yīng)用項目:人臉識別
URL:http://www.cs.columbia.edu/CAVE/databases/pubfig/
11.?NIST Mugshot Identification人臉數(shù)據(jù)集
國家標(biāo)準(zhǔn)及技術(shù)研究所發(fā)布的人面部自動化識別測試數(shù)據(jù)。包含?1573位個人(男1495、女78),?3248張?面部照片,照片包括正臉照和側(cè)臉照。其中131人有一張以上正臉照,1418人只有一張正臉照。89人有一張以上側(cè)臉照,1268人只有一張側(cè)臉照。
應(yīng)用項目:人臉識別
URL:https://www.nist.gov/srd/nist-special-database-18
12.?Caltech 10k Web Faces人臉數(shù)據(jù)集
人臉圖像數(shù)據(jù),來自Google圖像搜索后的人工標(biāo)注。包含?10524張?人臉圖像和標(biāo)注信息,標(biāo)注眼睛、鼻子和嘴巴的位置,并且在不同的設(shè)置中,例如,肖像圖像,人群等。
應(yīng)用項目:人臉檢測、人臉對齊
URL:http://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/
13.?IMDB-WIKI 500k跨年齡人臉數(shù)據(jù)集
包含名人人臉圖像、年齡、性別的數(shù)據(jù)集,圖像和年齡、性別信息從?IMDB 和 WiKi 網(wǎng)站抓取??傆?524230 張名人人臉圖像及對應(yīng)的年齡和性別。其中,獲取自 IMDB 的 460723 張,獲取自 WiKi 的 62328 張。
應(yīng)用項目:人臉識別、年齡識別
URL:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
14.?300 Face in Wild人臉檢測數(shù)據(jù)集
一個人臉識別和輪廓標(biāo)注數(shù)據(jù),該數(shù)據(jù)及也是機器視覺等級會議 ICCV 2013 人臉檢測競賽所使用的數(shù)據(jù)集。
應(yīng)用項目:人臉檢測
URL:https://ibug.doc.ic.ac.uk/resources/300-W/
15.?Facial-keypoints人臉關(guān)鍵點數(shù)據(jù)集【Kaggle競賽】
人臉關(guān)鍵點標(biāo)定競賽,為圖像中的人臉標(biāo)定15個關(guān)鍵位置點,圖像時96x96像素的,每個關(guān)鍵點對應(yīng)一個二維位置坐標(biāo)用以標(biāo)識關(guān)鍵點的位置。
應(yīng)用項目:人臉對齊
URL:https://www.kaggle.com/c/facial-keypoints-detection
16. MegaFace人臉識別數(shù)據(jù)庫
最大的公開面部識別數(shù)據(jù)集,所有數(shù)據(jù)都是華盛頓大學(xué)從 Flickr(雅虎旗下圖片分享網(wǎng)站)組織收集的。包含一百萬張圖片,代表 690000 個獨特的人。
應(yīng)用項目:人臉識別
URL:http://megaface.cs.washington.edu/dataset/download.html
17.?Wider-Face人臉檢測數(shù)據(jù)集
人臉檢測基準(zhǔn)數(shù)據(jù)集,主要用于身份鑒定,?2016 年由香港中文大學(xué)的 Yang,Shuo and Luo,Ping and Loy,Chen Change and Tang,Xiaoou 收集發(fā)布。它包含 32203 個圖像和 393703 個人臉圖像,在尺度,姿勢,閉塞,表達(dá),裝扮,關(guān)照等方面表現(xiàn)出了大的變化。該數(shù)據(jù)集基于 61 個事件類進(jìn)行組織。對于每個事件類,隨機選擇了 40%/ 10%/ 50%的數(shù)據(jù)作為培訓(xùn),驗證和測試集。
應(yīng)用項目:人臉檢測
URL:http://shuoyang1213.me/WIDERFACE/
18.?IJB-B 數(shù)據(jù)集
美國國家標(biāo)準(zhǔn)化研究院(NIST)發(fā)布的大型人臉數(shù)據(jù)集,包括從互聯(lián)網(wǎng)采集的靜態(tài)人臉圖像和視頻。共有1845個對象,11754張圖片,55026視頻幀,7011個視頻和10044非人臉圖像。該數(shù)據(jù)集在采集上與其它流行的人臉數(shù)據(jù)集不重疊,如:牛津大學(xué)VGG人臉數(shù)據(jù)集Face?Challenge、CASIA?WEBFace數(shù)據(jù)集等。數(shù)據(jù)集被用于NIST舉辦的?Face?Challenge?競賽,進(jìn)行校驗、搜索、檢測、聚類、標(biāo)注等人臉識別任務(wù)。
應(yīng)用項目:人臉聚類、人臉識別
URL:https://www.nist.gov/programs-projects/face-challenges
19.?MS-Celeb-1M數(shù)據(jù)集
MSR IRC是目前世界上規(guī)模最大、水平最高的圖像識別賽事之一,由MSRA(微軟亞洲研究院)圖像分析、大數(shù)據(jù)挖掘研究組組長張磊發(fā)起,每年定期舉辦。從1M個名人中,根據(jù)他們的受歡迎程度,選擇100K個。然后,利用搜索引擎,給100K個人,每人搜大概100張圖片。共100K*100=10M個圖片,測試集包括1000個名人,這1000個名人來自于1M個明星中隨機挑選。而且經(jīng)過微軟標(biāo)注。每個名人大概有20張圖片,這些圖片都是網(wǎng)上找不到的。
應(yīng)用項目:人臉識別,人臉檢測
URL:https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/
20.?Casia-webface數(shù)據(jù)集
2014年中科院發(fā)布,收集了10000多個名人的照片。包含453453幅人臉圖像的數(shù)據(jù)集,經(jīng)人臉檢測后共識別出超過10575個身份,然而,這些照片是在網(wǎng)上用爬蟲扒下來的,所以有一些數(shù)據(jù)存在問題,這里對這個數(shù)據(jù)集做清洗
應(yīng)用項目:人臉識別
?URL:http://www.cbsr.ia.ac.cn/english/CASIA-WebFace-Database.html
21.?LFW數(shù)據(jù)集
人臉圖片均通過 Viola-Jones 人臉檢測算法從互聯(lián)網(wǎng)上檢索搜集。包含 13000 張從互聯(lián)網(wǎng)上獲取的人臉圖像,每張圖片都標(biāo)有該人的姓名,其中有 1680 個人的有超過2張圖像,共有四個子數(shù)據(jù)集,分別為 原始數(shù)據(jù)集(lfw)、funneled images、LFW-a、deep funneled images 四組。
?應(yīng)用項目:人臉識別
URL:http://vis-www.cs.umass.edu/lfw/
總結(jié)
- 上一篇: 华为 eNSP 模拟器安装教程(内含下载
- 下一篇: 解决vista/win7安装window