生活随笔
收集整理的這篇文章主要介紹了
                                
各种数据集链接
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.                        
 
                                
                            
                            
                            CVonline:圖像數據庫
 
 (Google直譯的結果,希望對大家有幫助)
 
按主題索引
 
行動數據庫屬性識別自主駕駛生物/醫藥相機校準臉和眼/虹膜數據庫指紋一般圖像一般RGBD和深度數據集一般視頻手,掌握,手動和手勢數據庫圖像,視頻和形狀數據庫檢索對象數據庫人(靜),人體姿勢人員檢測和跟蹤數據庫(另見監控)遙感場景或地點分割或分類分割同時本地化和映射監視和跟蹤(另見人物)紋理城市數據集其他收藏頁雜項主題
另一個有用的網站是YACVID頁面。
 
行動數據庫
 
3D在線動作數據集?- 有七個動作類(微軟和南洋理工大學)50沙拉?- RGB-D視頻+加速度計數據的完整注釋4.5小時數據,捕獲25人準備兩個混合沙拉(鄧迪大學,塞巴斯蒂安·斯坦因)ActivityNet?- 人類活動理解的大規模視頻基準(200個課堂,每班100個視頻,648個視頻小時)(Heilbron,Escorcia,Ghanem和Niebles)ASLAN行動相似性標簽挑戰數據庫(Orit Kliper-Gross)視頻中的動作檢測?- MERL購物數據集由106個視頻組成,每個視頻都是大約2分鐘的序列(Michael Jones,Tim Marks)演員和動作數據集?–3782視頻,七個演員執行八個不同的動作(徐,謝,熊,科索)針對動作識別的各種標簽視頻數據集的分析整理(Kevin Murphy)BEHAVE交互人視頻數據與標記(Scott Blunsden,Bob Fisher,Aroosha Laghaee)BU動作數據集?- 與視頻數據集UCF101和ActivityNet的類別具有1:1對應關系的三個圖像動作數據集(BU101,BU101-未過濾,BU203未過濾)。(S.Ma,SABargal,J.Zhang,L.Sigal,S.Sclaroff。)伯克利MHAD:綜合多式聯運行動數據庫(Ferda Ofli)伯克利多式聯運行動數據庫?- 擴大應用領域的五種不同方式(加利福尼亞大學伯克利分校和約翰霍普金斯大學)早餐數據集?- 這是一個數據集,有1712個視頻剪輯,顯示10個廚房活動,手動分為48個原子動作類。(H.Kuehne,AB Arslan和T. Serre)布里斯托爾中心對象交互數據集?- 包含從六位不同位置執行任務的3-5位用戶(第一人稱(自我中心))拍攝的視頻(Dima Damen,Teesid Leelaswassuk和Walterio Mayol-Cuevas,Bristol University)棕色早餐動作數據集?- 70小時,400萬幀10種不同的早餐準備活動(Kuehne,Arslan和Serre)CAD-120數據集?- 專注于高水平的活動和對象互動(康奈爾大學)CAD-60數據集?- CAD-60和CAD-120數據集包括人類執行活動的RGB-D視頻序列(康奈爾大學)CVBASE06:注釋體育視頻(Janez Pers)Charades?數據集?- 來自267名志愿者的10,000個視頻,每個注釋有多個活動,標題,對象和時間本地化。(Sigurdsson,Varol,Wang,Laptev,Farhadi,Gupta)組合活動數據集?- 提供了由14個科目和注釋執行的26個原子行為的16種活動類別的不同組合(智利大學和智利大學)康乃爾活動數據集CAD 60,CAD 120(康奈爾機器人學習實驗室)DMLSmartActions數據集?- 十六名科目以自然方式進行了12種不同的行動(不列顛哥倫比亞大學)深度包含的人類行動視頻數據集?- 它包含23個不同的動作(中國科學院CITI)DogCentric活動數據集?- 從安裝在*狗*上方的相機拍攝的第一人稱視頻(Michael Ryoo)ETS曲棍球比賽事件數據集?- 此數據集包含使用固定攝像機捕獲的兩個曲棍球游戲的素材。(M.-A.Carneau,AJRaymond,E.Granger,和G.Gagnon)FCVID:復旦 - 哥倫比亞視頻數據集?- 91,223根據239類手動注釋的網絡視頻(Jiang,Wu,Wang,Xue,Chang)G3D?- 使用Microsoft Kinect(Victoria Bloom)捕獲的20場游戲動作的同步視頻,深度和骨架數據G3Di?- 此數據集包含12對科目分為6對(金斯頓大學)游戲3D數據集?- 游戲場景中的實時動作識別(金士頓大學)佐治亞州技術中心活動 - 凝視(+)?- 人們觀看的視頻和他們的目光位置(Fathi,Li,Rehg)HMDB:大型人體運動數據庫(Serre Lab)好萊塢3D數據集?- 650個3D視頻剪輯,跨越14個動作類(Hadfield和Bowden)人類行為和場景數據集(Marcin Marszalek,Ivan Laptev,Cordelia Schmid)HumanEva:用于評估人體運動的同步視頻和運動捕獲數據集(布朗大學)I-LIDS視頻事件圖像數據集(智能檢測系統的圖像庫)(Paul Hosner)I3DPost多視圖人體動作數據集(Hansung Kim)IAS實驗室行動數據集?- 包含充分的行動和執行行動的人數(帕多瓦大學的IAS實驗室)INRIA Xmas運動采集序列(IXMAS)(INRIA)InfAR數據集 - 不同時期的紅外線動作識別神經計算(陳強強,銀河杜江江,Jing Lv,Luyu Yang,Deyu Meng,Alexander G. Hauptmann)JPL第一人稱交互數據集?- 從第一人稱角度拍攝的7種人類活動視頻(Michael S. Ryoo,JPL)耶拿動作識別數據集?- 愛博犬行動(Korner和Denzler)K3Da - Kinect 3D活動數據集?- K3Da(Kinect 3D活動)是一個現實的臨床相關的人類行動數據集,包含骨骼,深度數據和相關的參與者信息(D.Lightley,MH Yap,J.Corulson,Y.Banouin和JSMcPhee)KIT Robo-Kitchen活動數據集?- 共有17人組成的540個剪輯,進行12個復雜的廚房活動(L。Rybok,S. Friedberger,UD Hanebeck,R. Stiefelhagen)KTH人類動作識別數據庫(KTH?CVAP實驗室)卡爾斯魯厄動作,意圖和活動數據集(MINTA)?- 7種日常生活活動,包括全部運動原始部分(D。Gehrig,P.Krauthausen,L.Rybok,H.Kuehne,UDHanebeck,T.Schultz, Stiefelhagen)LIRIS人類活動數據集?- 包含(灰色/ rgb /深度)視頻,顯示執行各種活動的人(法國國家科學研究中心)LIRIS人類活動數據集?- 2個相機,注釋,深度圖像(Christian Wolf,et al)MEXaction2行動檢測和本地化數據集?- 支持在相對較大的視頻數據庫中“發現”短時間動作的方法的開發和評估:77小時,117視頻(Michel Crucianu和Jenny Benois-Pineau)MPII烹飪活動數據集(M. Rohrbach)MSR-Action3D?- 基準RGB-D動作數據集(Microsoft Research Redmond和臥龍崗大學)MSRActionPair數據集?- :深度序列活動識別的面向4D法線的直方圖(佛羅里達州中部和微軟大學)MSRC-12 Kinect手勢數據集?- 來自執行12個手勢的人的594個序列和719,359個幀(Microsoft Research Cambridge)MSRC-12數據集?- 代表身體部位的人類運動序列,以及相關的手勢(Microsoft Research Cambridge and Cambridge of Cambridge)MSRDailyActivity3D數據集?- 有16項活動(微軟和西北大學)ManiAc?RGB-D動作數據集:不同的操作動作,15個不同的版本,30個不同的對象被操縱,20個長和復雜的鏈接操作序列(Eren Aksoy)Mivia數據集?- 由14個科目執行的7個高級動作組成。(Salemo大學的Mivia Lab)MuHAVi?- Multicamera人類行動視頻數據(Hossein Ragheb)多模式動作檢測(MAD)數據集?- 它包含20個主題執行的35個連續動作。(卡內基梅隆大學)Multiview 3D事件數據集?- 此數據集包括由8名科目(加利福尼亞大學洛杉磯分校)執行的8類事件,NTU RGB + D動作識別數據集?- NTU RGB + D是人類行動識別的大規模數據集(Amir Shahroudy)西北UCLA Multiview Action 3D?- 有10個動作類別:(西北大學和加利福尼亞大學洛杉磯分校)基于牛津電視的人際交往(Oxford Visual Geometry Group)議會?- 議會數據集是228個視頻序列的集合,描述了希臘議會的政治演講(Michalis Vrigkas,Christophoros Nikou,Ioannins A. kakadiaris)RGB-D活動數據集?-?數據集中的每個視頻包含涉及與不同對象交互的2-7個動作。(康奈爾大學和斯坦福大學)RGBD-Action-Completion-2016?- 此數據集包含414個完整/不完整的對象交互序列,跨越六個動作并呈現RGB,深度和骨架數據。(Farnoosh Heidarivincheh,Majid Mirmehdi,Dima Damen)RGBD-SAR數據集?- RGBD-SAR數據集(中國和微軟電子科技大學)羅切斯特日?;顒訑祿顒?#xff08;Ross Messing)SBU Kinect交互數據集?- 它包含八種類型的交互(石溪大學)SBU-Kinect-Interaction數據集v2.0?- 它由人類執行互動活動(Kiwon Yun等)的RGB-D視頻序列組成SDHA人類活動的語義描述2010年比賽 - 人類互動(Michael S.?Ryoo,JK Aggarwal,Amit K. Roy-Chowdhury)SDHA人類活動語義描述2010年比賽 - 空中觀點(Michael S. Ryoo,JK Aggarwal,Amit K. Roy-Chowdhury)SFU排球組活動識別?-?排球視頻的?2個級別注釋數據集(9個玩家的動作和8個場景的活動)(M。Ibrahim,S. Muralidharan,Z.Deng,A.Vahdat和G. Mori / Simon Fraser University)SYSU 3D人對象交互數據集?- 四十個科目進行12個不同的活動(中山大學)ShakeFive數據集?- 只包含兩個動作,即手搖和高5。(烏特勒支大學)ShakeFive2?- 在153個高清視頻中的八個類別上具有肢體等級注釋的二元人機交互數據集(Coert van Gemeren,Ronald Poppe,Remco Veltkamp)野蠻體育視頻(SVW)?- SVW由Coach Eye智能手機應用程序用戶完全由智能手機拍攝的4200個視頻,由TechSmith公司開發的運動訓練領先應用程序(Seyed Morteza Safdarnejad,Xiaoming Liu)斯坦福體育賽事數據集(佳麗)利茲活動數據集 - 早餐(LAD - 早餐)?- 由15個注釋的視頻組成,代表五個不同的人吃早餐或其他簡單的餐點; (John Folkesson等人)THUMOS?- 在時尚未剪輯的視頻中的行動識別! - 430小時的視頻數據和4500萬幀(Gorban,Idrees,Jiang,Zamir,Laptev Shah,Sukthanka)TUM廚房數據集日常操作活動(Moritz Tenorth,Jan Bandouch)電視人類交互數據集(Alonso Patron-Perez)墮落檢測數據集?- 兩個風景中的六個科目連續進行了一系列行動(德克薩斯大學)TJU數據集?- 包含由兩個不同環境中的20個科目執行的22個動作; 共有1760個序列。(天津大學)UCF-iPhone數據集?- 9在Apple iPhone 4智能手機上使用慣性測量單元(IMU)從(6-9)科目記錄有氧運動。(Corey McCall,Kishore Reddy和Mubarak Shah)UPCV動作數據集?- 數據集由20個對象執行10次動作兩次。(帕特雷大學)UC-3D運動數據庫?- 可用的數據類型包括采用Xsens和Microsoft Kinect RGB和深度圖像的MVN Suit采集的高分辨率運動捕捉(葡萄牙科英布拉系統與機器人研究所)UCF 101動作數據集?101個動作類,超過13k個剪輯和27小時的視頻數據(佛羅里達州中部大學)UCFKinect?- 數據集由16個動作組成(中佛羅里達州奧蘭多大學)UCR Videoweb多攝像機廣域活動數據集(Amit K. Roy-Chowdhury)UTD-MHAD?- 八個科目進行了四次動作四次。(得克薩斯大學達拉斯分校)UTKinect數據集?- 由10名受試者(德克薩斯大學)進行了兩次人類行為,UWA3D多視角活動數據集?- 10個人(西澳大利亞大學)進行了30?次活動,中央佛羅里達大學 - 50實際視頻中的行動類別識別(3 GB)(Kishore Reddy)中央佛羅里達大學 - ARG天文攝像機,屋頂攝像機和地面攝像機(UCF計算機視覺實驗室)佛羅里達州中部大學 - 特色影片動作數據集(佛羅里達州中部大學)佛羅里達州中部大學 - 體育行動數據集(佛羅里達州中部大學)佛羅里達州中部大學 - YouTube行動數據集(體育)(佛羅里達州中部大學)烏特勒支多人運動基準(UMPM)。?- 基于運動捕捉數據的人物視頻錄像和地面實況的集合(NP van der Aa,X.Ro,GJ Giezeman,RT Tan,RC Veltkamp。)VIRAT視頻數據集?- 涉及人類和車輛的兩大類活動(單個對象和兩個對象)的事件識別。(Sangmin Oh等)維羅納社交互動數據集(Marco Cristani)ViHASi:虛擬人類動作剪影數據(userID:VIHASI密碼:虛擬$虛擬)(金斯頓大學Hossein Ragheb)Videoweb(multicamera)活動數據集(B.Bhanu,G.Dinina,C.Ding,A.Ivers,A.Kalal,C.Ravishankar,A.Roy-Chowdhury,B.Varda)WVU多視圖動作識別數據集(西維吉尼亞大學)鍛煉SUU-10?Kinect數據集練習動作(Ceyhun Akgul)WorkoutSU-10數據集?- 包含由專業培訓師選擇用于治療目的的鍛煉動作。(Sabanc大學)手腕攝像機視頻數據集?- 對象操縱(Ohnishi,Kanehira,Kanezaki,原田)YouCook?- 88個帶有注釋的開源YouTube烹飪視頻(Jason Corso)YouTube-8M數據集?- 視頻理解研究(Google Inc.)的大型多樣化標簽視頻數據集
屬性識別
 
鳥類這個數據庫包含六個不同類別鳥類的600張圖像(每個100個樣本)(Svetlana Lazebnik,Cordelia Schmid和Jean Ponce)蝴蝶這個數據庫包含619個不同類別的蝴蝶的圖像。(Svetlana Lazebnik,Cordelia Schmid和Jean Ponce)CALVIN研究組數據集?- 眼睛跟蹤對象檢測,imagenet邊界框,同步活動,stickman和身體姿勢,youtube對象,臉,馬,玩具,視覺屬性,形狀類(CALVIN ggroup)CelebA?- 大型CelebFaces屬性數據集(Ziwei Liu,Ping Luo,Xiaogang Wang,Xiaoou Tang)HAT數據庫的27個人類屬性(Gaurav Sharma,Frederic Jurie)LFW-10數據集,用于學習相對屬性?- 具有10個屬性的實例級注釋的10,000對面部圖像的數據集(CVIT,IIIT Hyderabad。)個人照片集中的人物識別?- 我們為評估和長時間屬性注釋和每張照片時間戳元數據引入了三個更難的劃分(噢,Seong Joon和Benenson,Rodrigo和Fritz,Mario和Schiele,Bernt)可視屬性數據集超過500個對象類(動畫和無生命)的視覺屬性注釋,都在ImageNet中表示。每個對象類都基于具有636個屬性的分類法(例如,具有金屬制成的毛皮,圓形)的視覺屬性來注釋。WIDER屬性數據集?- WIDER屬性是一個大規模的人類屬性數據集,其中13789個圖像屬于30個場景類別,每個57524個人體邊界框分別用14個二進制屬性注釋(Li,Yining和Huang,Chen,Loy,Chen Change和唐,小ou)
自主駕駛
 
AMUSE?- 在多個測試驅動器中采用實際交通場景的汽車多傳感器(AMUSE)數據集。(Philipp Koschorrek等)自主駕駛?- 語義分割,行人檢測,虛擬世界數據,遠紅外,立體聲,駕駛員監控(CVC研究中心,UAB和UPC大學)自主駕駛(JAAD)的共同關注?- 數據集包括主要用于在自主駕駛中進行行為研究和檢測的行人和汽車的實例(Iuliia Kotseruba,Amir Rasouli和John K. Tsotsos)LISA車輛檢測數據集?- 在各種照明和交通條件下駕駛視頻的顏色第一人稱(Sivaraman,Trivedi)遺失和找到的數據集?- 失物招領數據集解決了自主駕駛應用中發現意外的小型道路危險(通常由貨物丟失造成的)的問題。(Sebastian Ramos,Peter Pinggera,Stefan Gehrig,Uwe Franke,Rudolf Mester,Carsten Rother)SYNTHIA?- 大型(約五十萬)虛擬世界圖像,用于訓練自主車輛。(計算機視覺中心的ADAS集團)圖像和注釋的合成集合?- 在駕駛場景的背景下輔助語義分割和相關場景理解問題的目的(計算機視覺中心,UAB)
生物/醫藥
 
2008年MICCAI MS病變分期挑戰(國家衛生研究院神經科學研究藍圖)ASU DR-AutoCC數據?- 糖尿病視網膜病變分類數據集的多實例學習特征空間(Ragav Venkatesan,Parag Chandakkar,Baoxin Li - Arizona State University)Aberystwyth葉評估數據集?- 用手標記植物圖像,用手標記一段時間的葉級分割,以及植物犧牲的生物數據。(Bell,Jonathan; Dee,Hannah M.)脊柱CT脊柱CT數據庫用于脊柱定位的定位,125例,242次掃描(Ben Glockern)BRATS?- 大腦多參數磁共振圖像中腫瘤結構的識別和分割(TU Munchen等)CRCHisto表型 - 標記細胞核數據?- 結腸直腸癌組織學圖像由近30,000個點狀細胞核組成,超過22,000個標記細胞類型(Rajpoot + Sirinukunwattana)CREMI:MICCAI 2016挑戰?- 6卷神經組織電子顯微鏡,神經元和突觸分割,突觸伴侶注釋。(Jan Funke,Stephan Saalfeld,Srini Turaga,Davi Bock,Eric Perlman)Cavy?Action數據集?- 具有以每秒7.5幀(fps)記錄的640×480分辨率的16個序列,總共有大約31621506幀(272GB)的相互作用的空穴(豚鼠)(Al-Raziqi和Denzler)細胞跟蹤挑戰數據集?- 具有地面真相的2D / 3D延時視頻序列(Ma et al。,Bioinformatics 30:1609-1617,2014)計算機斷層掃描肺氣腫數據庫(Lauge?Sorensen)DIADEM:軸突和樹突狀形態學競賽的數字重建(艾倫腦科學研究所等)DIARETDB1 - 標準糖尿病視網膜病變數據庫(Lappeenranta Univ of Technology)驅動:用于血管提取的數字視網膜圖像(烏得勒支大學)DeformIt 2.0?- 圖像數據增強工具:從單個圖像分割對(Brian Booth和Ghassan Hamarneh)模擬具有地面真實分割的新穎圖像可變形圖像注冊實驗室數據集?- 用于客觀和可靠地評估可變形圖像配準(DIR)空間精度性能。(Richard Castillo等人)皮膚鏡像(Eric Ehrsam)EPT29。該數據庫包含4842個EPTs分類群的1613個標本的圖像(Tom等)FIRE眼底圖像注冊數據集?- 134視網膜圖像對和注冊真實(FORTH-ICS)IRMA(醫學應用中的圖像檢索)?- 該集合編輯匿名X射線照片(Deserno TM,Ott B)KID?- 用于醫療決策支持的膠囊內窺鏡數據庫(Anastasios Koulaouzidis和Dimitris Iakovidis)葉片分割挑戰煙草和擬南芥植物圖像(Hanno Scharr,Massimo Minervini,Andreas Fischbach,Sotirios A. Tsaftaris)MIT CBCL自動鼠標行為識別數據集(Nicholas Edelman)MUCIC:Ma??saryk大學細胞圖像收集?- 2D / 3D合成圖像的細胞/組織為基準(Masaryk大學)MiniMammographic數據庫(Mammographic Image Analysis Society)蛾精細識別?- 675個相似的類,5344個圖像(Erik Rodner等)小鼠胚胎跟蹤數據庫?- 細胞分裂事件檢測(Marcelo Cicconet,Kris Gunsalus)OASIS?- 開放獲取系統的成像研究 - 大腦的500+ MRI數據集(華盛頓大學,哈佛大學,生物醫學信息學研究網絡)植物表型數據集?- 適用于植物和葉片檢測,分割,跟蹤和物種識別的植物數據(M. Minervini,A.Fischbach,H. Scharr,SA Tsaftaris)視網膜眼底圖像 - 血管分叉和交叉的地面實況(格羅寧根大學)視網膜的結構分析?- 描述(400+視網膜圖像,具有地面真實分段和醫學注釋)脊柱和心臟數據(倫敦安大略省數字成像組,碩士)Stonefly9該數據庫包含826個973個分類群的Stoneflies(Tom等)的圖像,合成遷移細胞?- 超過98個時間幀的人造遷移細胞(嗜中性粒細胞),各種級別的高斯/泊松噪聲和不同路徑特征與地面實況。(Constantino Carlos Reyes-Aldasoro博士)佛羅里達州中部大學 - DDSM:用于篩查乳房X線攝影的數字數據庫(佛羅里達州中部大學)VascuSynth?- 120具有地面真相結構的3D血管樹(Mengliu Zhao,Ghassan Hamarneh)VascuSynth?- 血管合成器在3D體積中產生血管。(Ghassan Hamarneh,Preet Jassi,Mengliu Zhao)約克心臟MRI數據集(Alexander Andreopoulos)
相機校準
 
反折射相機校準圖像(Yalin Bastanlar)GoPro-Gyro數據集?- 該數據集由許多具有相應陀螺儀測量(Hannes等)的廣角滾動快門視頻序列組成,LO-RANSAC?-LO-RANSAC用于估計單應力和對極幾何的庫(K.Lebeda,J.Matas和O.Chum)
臉和眼/虹膜數據庫
 
300視頻(300 VW)?- 68面部地標跟蹤(Chrysos,Antonakos,Zafeiriou,Snape,Shen,Kossaifi,Tzimiropoulos,Pantic)3D面具攻擊數據庫(3DMAD)?- 使用Kinect RGBD與眼睛位置的1765人的幀(Sebastien Marcel)3D面部表情?- 賓漢頓大學3D靜態和動態面部表情數據庫(Lijun Yin,Jeff Cohn和隊友)用于面部和揚聲器識別的視聽數據庫(Mobile Biometry MOBIO http://www.mobioproject.org/)BANCA面部和語音數據庫(薩里大學)Binghampton Univ 3D靜態和動態面部表情數據庫(Lijun Yin,Peter Gerhardstein和隊友)賓漢頓匹茲堡4D自發面部表情數據庫?- 由2D自發面部表情視頻和FACS代碼組成。(Lijun Yin等)BioID面部數據庫(BioID組)BioVid熱痛數據庫?- 這個視頻(和生物醫學信號)數據集包含受試驗誘發的熱痛的87名研究參與者的面部和生理心理反應(馬格德堡大學(神經信息技術組)和烏爾姆大學(情緒實驗室) )生物識別數據庫?- 與虹膜識別相關的生物識別數據庫(Adam Czajka)Biwi 3D視聽情感語料庫?- 1000個高質量,動態的面部3D掃描,同時發布一套英文句子。博斯普魯斯3D / 2D數據庫的FACS注釋面部表情,頭部姿勢和面部遮擋(Bogazici大學)漫畫/ Photomates數據集?- 具有正面和相應漫畫線圖的數據集(Tayfun Akgul)CASIA-IrisV3(中國科學院,TN Tan,Z. Sun)CASIR凝視估計數據庫?- RGB和深度圖像(來自Kinect V1.0)和面部特征的地面真值相對于注視估計基準的實驗:(Filipe Ferreira等)CMU面部表情數據庫(CMU / MIT)CMU姿勢,照明和表達(PIE)數據庫(Simon Baker)CMU / MIT正面(CMU / MIT)CMU / MIT正面(CMU / MIT)CSSE面部正面強度和范圍圖像(Ajmal Mian)CelebA?- 大型CelebFaces屬性數據集(Ziwei Liu,Ping Luo,Xiaogang Wang,Xiaoou Tang)Cohn-Kanade AU編碼表達數據庫?- 由激活的動作單元(Affect Analysis Group,Univ。of Pittsburgh)編碼的100+個受試者的500+表達序列Cohn-Kanade AU編碼表達數據庫?- 用于自動面部圖像分析和綜合以及感知研究的研究(Jeff Cohn等人)哥倫比亞凝視數據集?- 5,880張超過5頭姿勢的56人的圖像和21個凝視方向(Brian A. Smith,Qi Yin,Steven K. Feiner,Shree K. Nayar)計算機視覺實驗室面部數據庫(CVL面部數據庫)?- 數據庫包含114個人的798張圖像,每人7張圖像,可免費提供研究用途(Peter Peer等)DISFA +:自發面部動作數據庫的擴展丹佛強度?- DISFA(MH Mahoor)的擴展DISFA:自發面部動作數據庫的丹佛強度?- 一個非擬人?臉部表情數據庫,用于開發自動動作單元檢測的計算機算法以及由FACS描述的強度的人員。(MH Mahoor)EURECOM面部化妝品數據庫?- 389張圖片,50個/不含化妝品,關于應用化妝品的數量和位置的注釋(Jean-Luc DUGELAY等)EURECOM Kinect面部數據庫?- 52人,2次會議,9個變化,6個面部地標(Jean-Luc DUGELAY等)EYEDIAP數據集?- EYEDIAP數據集設計用于訓練和評估RGB和RGB-D數據的注視估計算法。它包含參與者的多樣性,頭部姿勢,注視目標和感測條件(Kenneth Funes和Jean-Marc Odobez)FDDB:面部檢測數據集和基準 - 學習無約束面部檢測(馬薩諸塞大學計算機視覺實驗室)FG-Net老齡化不同年齡人臉(手勢識別研究網絡)面部識別大挑戰數據集(FRVT - 面部識別供應商測試)面部超分辨率數據集?- 地面實況使用雙攝像頭設置拍攝的HR-LR臉部圖像(Chengchao Qu等)FaceScrub?- 一個擁有超過100,000張臉型的數據集,530人(男性和女性50:50)(H.-W. Ng,S. Winkler)FaceTracer數據庫 - 15,000面(Neeraj Kumar,PN Belhumeur和SK Nayar)面部表情數據集?- 該數據集由現實世界條件下記錄的242張面部視頻(168,359幀)組成。(Daniel McDuff等人)面部識別技術(FERET)數據庫(美國國家標準與技術研究所)漢娜和她的姐妹數據庫?- 一個密集的視聽人物面孔,語言段,拍攝邊界的地面真理注釋(Patrick Perez,Technicolor)香港臉譜數據庫IDIAP頭部姿勢數據庫(IHPD)?- 數據集包含一組會議視頻以及個人參與者的頭部基礎(約128分鐘)(Sileye Ba和Jean-Marc Odobez)IMDB-WIKI?- 具有年齡和性別標簽的500k +臉部圖像(Rasmus Rothe,Radu Timofte,Luc Van Gool)印度電影面孔數據庫(IMFDB)?- 一個大型無約束的臉部數據庫,包含從100多個視頻(Vijay Kumar和CV Jawahar)收集的100位印度演員的34512張圖像,伊朗面部數據庫?- IFDB是中東第一個圖像數據庫,包含年齡,姿勢和表情的彩色面部圖像,其主題在2-85范圍內。(Mohammad Mahdi Dehshibi)日本女性面部表情(JAFFE)數據庫(Michael J. Lyons)LFW:在野外標記的面孔?- 無約束的臉部識別麻省理工學院CBCL人臉識別數據庫(生物與計算學習中心)麻省理工學院面部數據庫整理(Ethan Meyers)MIT眼睛跟蹤數據庫(1003圖像)(Judd等人)MMI面部表情數據庫?- 2900個視頻和75個主題的高分辨率靜態圖像,注釋為FACS AU。MORPH(顱面縱向形態面部數據庫)(北卡羅來納州威爾明頓大學)MPIIGaze數據集?- 在不同照明條件和自然頭部運動下,具有眼睛圖像和注視目標的213,659個樣本,在日常使用期間從15名參與者收集筆記本電腦。(Xucong Zhang,Yusuke Sugano,Mario Fritz,Andreas Bulling)曼徹斯特注釋會話視頻數據集(Timothy Cootes)MegaFace?- 100萬面孔在邊框(Kemelmacher-Shlizerman,Seitz,Nech,Miller,Brossard)音樂視頻數據集?- 來自YouTube的8個音樂視頻,用于在無約束環境中開發多面部跟蹤算法(Shang Zhang,Jia-Bin Huang,Ming-Hsuan Yang)NIST面部識別大挑戰(FRGC)(NIST)NIST mugshot識別數據庫(美國國家標準與技術研究所)NRC-IIT面部視頻數據庫?- 該數據庫包含一對短視頻剪輯,每個視頻剪輯顯示坐在顯示器前面的計算機用戶的臉,表現出廣泛的面部表情和方向(Dmitry Gorodnichy)圣母瑪利亞圖像數據集(Patrick J. Flynn)巴黎圣母院的臉,紅臉,3D臉,表情,人群和眼睛生物特征數據集(巴黎圣母院)ORL面部數據庫:40人有10個意見(ATT劍橋實驗室)OUI-Adience Faces?- 未過濾的面部,用于性別和年齡分類以及3D臉部(OUI)牛津:臉,花,多視圖,建筑物,物體類別,運動分割,仿射協變區域,雜項(牛津視覺幾何組)PubFig:公眾人臉數據庫(Neeraj Kumar,Alexander C. Berg,Peter N. Belhumeur和Shree K. Nayar)重新標記在野外的臉?- 原始圖像,但使用“深漏斗”方法對齊。(馬薩諸塞大學,阿默斯特)SCface?- 監控攝像機面部數據庫(Mislav Grgic,Kresimir Delac,Sonja Grgic,Bozidar Klimpak))人類視覺輸入的注視對齊記錄的顯著特征?- 人類注視 - 野外數據的結核(Frank Schumann等)SiblingsDB?- SiblingsDB包含兩個描述與兄弟關系相關的個人圖像的數據集。(都靈視覺/計算機圖形與視覺組)CMU Multi-PIE Face數據庫?- 超過75萬張337人的影像,記錄在五個月的四個會議期間。(Jeff Cohn等人)UNBC-McMaster肩痛表達檔案數據庫?- 痛苦的數據:UNBC-McMaster肩痛癥狀表達檔案數據庫(Lucy等)特隆赫姆Kinect RGB-D人重新識別數據集(Igor Barros Barbosa)UB KinFace數據庫?- 布法羅大學親屬驗證和識別數據庫UBIRIS:嘈雜可見波長虹膜圖像數據庫(貝拉大學)UTIRIS交叉光圈虹膜圖像數據庫(Mahdi Hosseini)VIPSL數據庫?- VIPSL數據庫用于面部素描 - 照片合成和識別的研究,包括200個科目(每張科目1張照片和5張素描)(王南南)華盛頓面部表情數據庫(FERG-DB))?- 具有7個注釋面部表情的6個風格化(Maya)角色的數據庫(Deepali Aneja,Alex Colburn,Gary Faigin,Linda Shapiro和Barbara Mones)寬面:臉部檢測基準?- 32,203張有393,703張貼面的圖像,61個事件班(Shuo Yang,Ping Luo,Chen Change Loy,Xiaoou Tang)XM2VTS面部視頻序列(295):擴展的M2VTS數據庫(XM2VTS) -(薩里大學)耶魯臉數據庫 - 10人的11個表達(A. Georghaides)耶魯臉數據庫B - 576人觀看條件(A. Georghaides)約克大學眼睛跟蹤數據集(120圖像)(Neil Bruce)YouTube Faces DB?- 3,425個視頻,1,595個不同的人。(Wolf,Hassner,Maoz)蘇黎世自然圖像?- 用于在一系列眼睛跟蹤研究中創建自然刺激的圖像材料(Frey等人)
指紋
 
FVC指紋驗證競賽2002數據集(博洛尼亞大學)FVC指紋驗證競賽2004數據集(博洛尼亞大學)指紋手冊明細標記(FM3)數據庫:?- 指紋手冊細節標記(FM3)數據庫(Mehmet Kayaoglu,Berkay Topcu和Umut Uludag)NIST指紋數據庫(美國國家標準與技術研究所)SPD2010指紋單點檢測比賽(SPD 2010委員會)
一般圖像
 
用于實際低光圖像降噪的數據集?- 它包含由低光照相機噪聲和低噪聲對應物損壞的像素和強度對齊的圖像對。(J.Anaya,A.Barbu)與Vincent van Gogh相關的繪畫數據庫?- 這是為“從印象派到表現主義:自動識別梵高的繪畫”(Guilherme Folego和Otavio Gomes and Anderson Rocha)的論文VGDB-2016,AMOS:許多戶外場景的檔案(20 + m)(Nathan Jacobs)空中圖像使用不變顏色特征和陰影信息從空間圖像構建檢測(Beril Sirmacek)BGU自然場景的高光譜圖像數據庫(Ohad Ben-Shahar and Boaz Arad)布朗大二進制圖像數據庫(Ben Kimia)CMP門面數據庫?- 包括606個修正的外墻圖像,具有12個建筑類別的地方(Radim Tylecek)Caltech-UCSD鳥類200-2011(凱瑟琳華)哥倫比亞多光譜圖像數據庫(F. Yasuma,T. Mitsunaga,D. Iso和SK Nayar)DAQUAR(視覺圖靈挑戰)?- 包含有關真實室內場景的問題和答案的數據集(Mateusz Malinowski,Mario Fritz)美國電影預告片的數據集2010-2014?- 包含474份好萊塢電影預告片的鏈接以及相關的元數據(類型,預算,運行時,版本,MPAA評分,發布的屏幕,續集指標)(USC信號分析和解釋實驗室)一般100數據集?- General-100數據集包含100個bmp格式的圖像(無壓縮),非常適合超分辨率訓練(Dong,Chao和Loy,Chen Change和Tang,Xiaoou)HIPR2圖像不同類型圖像的目錄(Bob Fisher等)用于自然場景中局部照明的空間分布的高光譜圖像?-?自然場景的三十個校準的高光譜輻射圖像,用于局部照明估計的探針球。(Nascimento,Amano&Foster)自然場景的高光譜圖像 - 2002(David H. Foster)自然場景的高光譜圖像 - 2004(David H. Foster)ISPRS多平臺攝影測量數據集?- 1)天底和斜面航空圖像加2)組合無人機和陸地圖像(Francesco Nex和Markus Gerke)LIVE的圖像和視頻質量評估?- 用于開發圖像質量算法(德克薩斯大學奧斯汀分校)ImageNet大型視覺識別挑戰?- 目前有200個對象類和500 + K圖像(Alex Berg,Jia Deng,Fei-Fei Li等)ImageNet語言組織(WordNet)分層圖像數據庫 - 10E7圖像,15K類(李飛飛,賈登,郝蘇,凱麗)改進的3D稀疏映射用于具有低成本全向機器人的運動的高性能結構 - 評估數據集?- 研究論文中使用的數據集doi:10.1109 / ICIP.2015.7351744(Breckon,Toby P.,Cavestany,Pedro)LabelMeFacade數據庫?- 945標簽的建筑圖像(Erik Rodner等)局部照明超光譜輻射圖像?- 具有嵌入式探針球的自然場景的三十個高光譜輻射圖像用于局部照度估計(Sgio MC Nascimento,Kinjiro Amano,David H.Foster)麥吉爾校準彩色圖像數據庫(Adriana Olmos和Fred Kingdom)乘以扭曲圖像數據庫?- 用于評估多重扭曲圖像的圖像質量評估指標的結果的數據庫(費周)NPRgeneral?- 用于評估圖像風格化算法的圖像的標準化集合。(David Mold,Paul Rosin)紐約大學對稱數據庫?- 176個單對稱和63個多對稱圖像(Marcelo Cicconet和Davi Geiger)OTCBVS熱成像基準數據集收集(俄亥俄州立團隊)PAnorama稀疏結構區數據集?- 用于評估圖像對齊的PASSTA數據集(Andreas Robinson)自然場景的超時光高光譜圖像 - 一天中采用的自然場景的7-9個校準高光譜輻射圖像的四個延時序列。(Foster,DH,Amano,K.,&Nascimento,SMC)延時高光譜輻射圖像?- 自然場景的7-9個校準高光譜圖像的四個延時序列,10 nm間隔的光譜(David H. Foster,Kinjiro Amano,Sgio MC Nascimento)微圖像數據集?79萬32x32彩色圖像(Fergus,Torralba,Freeman)視覺問題回答?- 254K imags,764K問題,地面實況(Agrawal,Lu,Antol,Mitchell,Zitnick,Batra,Parikh)視覺問題生成?- 15k圖像(包括以對象為中心和以事件為中心的圖像),有75k個自然問題涉及可以引起進一步交談的圖像(Nasrin Mostafazadeh,Ishan Misra,Jacob Devlin,Margaret Mitchell,Xiao Dong He,Lucy Vanderwende )YFCC100M:多媒體研究中的新數據?- 這個公開的1百萬張照片和視頻的策劃數據集是免費的,所有人都是合法的(Bart ThomeeYahoo Labs和Flickr在舊金山等)
一般RGBD和深度數據集
 
注意:在其他地方也有3D數據集,例如在?對象,場景和動作中。
 
3D打印RGB-D對象數據集?- 5個具有groundtruth CAD模型和攝像機軌跡的對象,采用各種高質量的RGB-D傳感器(Siemens&TUM)3DCOMET?- 3DCOMET是一種用于測試3D數據壓縮方法的數據集(Miguel Cazorla,Javier Navarrete,Vicente Morell,Miguel Cazorla,Diego Viejo,Jose Garcia-Rodriguez,Sergio Orts)用于從RGB-D數據進行非剛性重建的數據集 - 用于從RGB-D數據重建非剛性幾何的八個場景,每個都包含數百個幀以及我們的結果。(Matthias Innmann,Michael Zollhoefer,Matthias Niessner,Christian Theobalt,Marc Stamminger)對象掃描的大數據集?- 39個對象在9個卡斯,每個數百幀(崔,周,米勒,科爾屯)鉸接對象挑戰?- 由1D旋轉和棱柱連接連接的鉆石部件組成的4個關節物體,具有6D姿態估計注釋的7000+ RGBD圖像(Frank Michel,Alexander Krull,Eric Brachmann,Michael Y.Yang,Stefan Gumhold,Carsten Rother )BigBIRD?- 每個對象有100個對象,600個3D點云和600個高分辨率彩色圖像,涵蓋所有視圖(Singh,Sha,Narayan,Achim,Abbeel)CAESAR平民美國和歐洲表面人體測量資源項目 - 4000 3D人體掃描(SAE國際)CIN 2D + 3D對象分類數據集?- 來自18個類別的普通家庭和辦公室對象的對象的分段顏色和深度圖像(Bj?rn Browatzki等)CoRBS?- 一個RGB-D SLAM基準測試,提供真實深度和顏色數據的組合以及相機的地面真實軌跡和場景的地面真相3D模型(Oliver Wasenmuller)CTU服裝折疊照片數據集?- 衣服折疊各個階段的色彩和深度圖像(Sushkov R.,Melkumov I.,Smutn y V.(捷克技術大學在布拉格))CTU服裝分類數據集?- 服裝圖像數據集,詳細的立體圖像,深度圖像和重量(Petrik V.,Wagner L.(捷克技術大學在布拉格))服裝零件數據集?- 服裝零件數據集包括用Kinect獲取的圖像和深度掃描,鋪設在桌子上的服裝,使用多邊形面具超過一千個注釋(領,袖口,罩等)(Arnau Ramisa, Guillem Aleny,Francesc Moreno-Noguer和Carme Torras)康奈爾RGBD數據集?- 辦公場景(Hema Koppula)代爾夫特風車內部和外部激光掃描點云?- (Beril Sirmacek)EURECOM Kinect面部數據庫?- 52人,2次會議,9個變化,6個面部地標(Jean-Luc DUGELAY等)EURECOM Kinect面部數據庫?- 52人,2次會議,9個變化,6個面部地標(Jean-Luc DUGELAY等)G4S元房?- RGB-D數據150掃描每掃描18幅圖像。(John Folkesson等人)Goldfinch:GOOGLe圖像搜索精細粒子數據集 - 精細的鳥類(11K種類),蝴蝶(14K種),飛機(409種)和狗(515種)識別的大規模數據集(Jonathan Krause,Benjamin Sapp, Andrew Howard,Howard Zhou,Alexander Toshev,Tom Duerig,James Philbin,Li Fei-Fei)IMPART多視圖/多模態2D + 3D電影制作數據集?- LIDAR,視頻,3D模型,球形相機,RGBD,立體聲,動作,面部表情等(薩里大學)Kinect v2數據集?- 使用內核密度估計的高效多頻相位展開(Felix等)McGill-Reparti人工感知數據庫?- 來自四個攝像機的RGBD數據和兩個人類對象的未過濾的Vicon骨架數據,在車門上執行模擬裝配任務(Andrew Phan,Olivier St-Martin Cormier,Denis Ouellet,Frank P. Ferrie)。元間房?- RGB-D數據由28個對準的深度相機圖像組成,通過使機器人進入特定位置并以各種傾斜進行360度的平移而收集。(John Folkesson等人)MHT RGB-D?- 由林肯大學在16天內每5分鐘由機器人收集。(John Folkesson等人)用于具有全姿態估計的對象識別的多傳感器3D對象數據集 - 用于對象識別和姿勢估計的多傳感器3D對象數據集(Alberto Garcia-Garcia,Sergio Orts-Escolano,Sergiu Oprea等)NTU RGB + D動作識別數據集?- NTU RGB + D是人類行動識別的大規模數據集(Amir Shahroudy)NYU深度數據集V2?- RGBD圖像的室內分割和支持推理奧克蘭3點云數據集(Nicolas Vandapel)Pacman項目?- 來自20個課程的400個對象的合成RGB-D圖像。由3D網格模型生成(Vladislav Kramarev,Umit Rusen Aktas,Jeremy L. Wyatt。)SceneNN:場景網格數據集,帶有NNotations?- 具有100多個室內場景的RGB-D場景數據集,標記為三角形網格,體素和像素。(Hua,Pham,Nguyen,Tran,Yu和Yeung)語義8:8類三維點云分類(蘇黎世蘇黎世科技大學)小型辦公室數據集?- 從2014年4月開始每5秒鐘運行一次Kinect深度圖像,并持續進行。(John Folkesson等人)具有實況的立體聲和ToF數據集?- 數據集包含采用飛行時間傳感器和立體聲設置獲取的5種不同場景。還提供了地面真相信息(Carlo Dal Mutto,Pietro Zanuttigh,Guido M. Cortelazzo)SYNTHIA?- 大型(約五十萬)虛擬世界圖像,用于訓練自主車輛。(計算機視覺中心的ADAS集團)TUM RGB-D基準?- 用于評估RGB-D視覺測距和SLAM算法的數據集和基準(BCrgen Sturm,Nikolas Engelhard,Felix Endres,Wolfram Burgard和Daniel Cremers)UC-3D運動數據庫?- 可用的數據類型包括采用Xsens和Microsoft Kinect RGB和深度圖像的MVN Suit采集的高分辨率運動捕捉(葡萄牙科英布拉系統與機器人研究所)USF范圍圖像數據庫?- 400+激光測距儀和結構光照相機圖像,許多具有地面真實分割(Adam et al。)華盛頓RGB-D對象數據集?- 300個普通家庭對象和14個場景。(華盛頓大學和英特爾實驗室西雅圖)Witham碼頭?- 對于由林肯大學在10天內每10分鐘由機器人收集的8個地點的RGB-D。(John Folkesson等人)
一般視頻
 
AlignMNIST?- 人工擴展版本的MNIST手寫數據集。(恩·豪伯格)DAVIS:視頻對象分割數據集?- 密集注釋的VIdeo分割(F.Perazzi,J.Pont-Tuset,B.McWilliams,L.VanGol,M.Gross和A.Sorkine-Hornung,SC Prat)GoPro-Gyro數據集?- 以自我為中心的視頻(Linkoping Computer Vision Laboratory)LIVE的圖像和視頻質量評估?- 用于開發圖像質量算法(德克薩斯大學奧斯汀分校)大型YouTube視頻數據集?- 從YouTube視頻(易陽)抓取的156,823個視頻(2,907,447個關鍵幀)MovieQA?- 每臺機器通過回答有關他們的問題來了解故事。15000多項選擇QAs,400多部電影(M。Tapaswi,Y. Zhu,R. Stiefelhagen,A. Torralba,R. Urtasun和S. Fidler)多光譜可見NIR視頻序列?- 注釋多光譜視頻,可見+ NIR(LE2I,布爾戈尼大學)Sports-1M?- 體育視頻分類數據集,包含487類和1.2M影片(Andrej Karpathy和George Toderici,Sanketh Shetty,Thomas Leung,Rahul Sukthankar和Li Fei-Fei)。視頻序列用于基于對相機的最小假設(Kenton McHenry)的歐幾里德升級研究視頻堆疊數據集?- 手機視頻堆疊在智能手機上的虛擬三腳架(Erik Ringaby等)YFCC100M視頻?- YFCC100M的視頻子集的基準,包括視頻,他的視頻內容功能和API到最先進的視頻內容引擎(Lu Jiang)YFCC100M:多媒體研究中的新數據?- 這個公開的1百萬張照片和視頻的策劃數據集是免費的,所有人都是合法的(Bart Thomee,Yahoo Labs和Flickr在舊金山等)YouTube-8M?- 野外視頻分類的數據集,包含8M視頻和4800課程的預提取幀級功能(Sami Abu-El-Haija,Nisarg Kothari,Joonseok Lee,Paul Natsev,George Toderici,Balakrishnan Varadarajan, Sudheendra Vijayanarasimhan)YouTube-8M數據集?- 視頻理解研究(Google Inc.)的大型多樣化標簽視頻數據集
手,掌握,手動和手勢數據庫
 
單眼圖像的3D鉸接手姿態估計(Tang,Chang,Tejani,Kim,Yu)人機操作數據集?- 25對象和6動作的RGB-D(Alessandro Pieropan)手勢檢測數據集(Javier Molina等)A-STAR注釋手深圖像數據及其性能評估?- 深度數據和數據手套數據,30位志愿者,中文號碼和美國手語(徐和成)的29張圖像,Bosphorus手幾何數據庫和手靜脈數據庫(Bogazici大學)EgoHands?- 一個大型數據集,擁有超過15,000個像素級分割的手從相互交互的人的自我中心攝像頭記錄下來。(Sven Bambach)FORTH手跟蹤庫(FORTH)一般手冊:一般手??檢和姿勢挑戰?- 22個不同手勢,活動和觀點的序列(UC Irvine)掌握不確定(GUN-71)數據集?- 使用71個細粒度抓圖的分類法注釋的物體操縱場景的12,000個第一人稱RGB-D圖像(Rogez,Supancic和Ramanan)手勢和海洋剪影(Euripides GM Petrakis)HandNet:鉸接手的注釋深度圖像214971由手姿勢的RealSense RGBD傳感器捕獲的手的注釋深度圖像。注釋:每像素類,6D指尖姿勢,熱圖。圖片 - >火車:202198,測試:10000,驗證:2773.記錄在GIP實驗室,Technion。IDIAP手姿勢/手勢數據集(Sebastien Marcel)Kinect和Leap運動手勢識別數據集?- 數據集包含與Leap Motion和Kinect設備一起獲得的1400種不同手勢(Giulio Marin,Fabio Dominio,Pietro Zanuttigh)Kinect和Leap運動手勢識別數據集?- 數據集包含使用Creative Senz3D攝像頭獲取的幾種不同的靜態手勢(A。Memo,L. Minto,P. Zanuttigh)LISA CVRR-HANDS 3D?- 由8名作為汽車司機和乘客(Ohn-Bar和Trivedi)執行的19個手勢LISA車輛檢測數據集?- 在各種照明和交通條件下駕駛視頻的顏色第一人稱(Sivaraman,Trivedi)MPI Dexter 1用于3D關節手運動跟蹤評估的數據集?- Dexter 1:7具有挑戰性,緩慢和快速手動運動的序列,RGB +深度(Sridhar,Oulasvirta,Theobalt)MSR實時和可靠的深度跟蹤?- (錢,孫,魏,唐,孫)手機和網絡攝像頭手圖像數據庫?- MOHI和WEHI - 200人,每張30張(Ahmad Hassanat)紐約大學手勢數據集?- 8252測試集和72757訓練集幀捕獲的RGBD數據與地面真相手勢,3視圖(湯普森,斯坦因,萊昆,佩林)Sahand動態手勢數據庫?- 該數據庫包含11種動態手勢,旨在傳達鼠標和觸摸屏功能到計算機(Behnam Maleki,Hossein Ebrahimnezhad)謝菲爾德手勢數據庫?- 2160 RGBD手勢序列,6個科目,10個手勢,3個姿勢,3個背景,2個照明(Ling Shao)UT掌握數據集?- 4個對象用各種掌握抓住各種對象(蔡,北谷,佐藤)耶魯人類掌握數據集?- 27小時視頻,帶有標記的抓握,對象和任務數據,來自兩位管家和兩名機械師(Bullock,Feix,Dollar)
圖像,視頻和形狀數據庫檢索
 
ANN_SIFT1M?- 由128D SIFT描述符編碼的1M Flickr圖像(Jegou等)Brown Univ 25/99/216形狀數據庫(Ben Kimia)來自10個類的CIFAR-10?- 60K 32x32圖像,512D GIST描述符(Alex Krizhevsky)CLEF-IP 2011專利圖像評估結構查詢和空間關系的數據集 - 關于圖像的結構化查詢的數據集,強調空間關系(Mateusz Malinowski,Mario Fritz)DeepFashion?- 大型時尚數據庫(劉紫偉,平羅,石秋,王小剛王曉棠)EMODB?- picsearch圖像搜索引擎中的圖像縮略圖以及picsearch情感關鍵詞(Reiner Lenz等)ETU10剪影數據集?- 數據集由10個對象的720個剪影組成,每個對象有72個視圖(M。Akimaliev和MF Demirci)魚形數據庫?- 它是一個魚形數據庫,具有100,2D點集的形狀。(Adrian M. Peter)Flickr 30K?- 圖像,動作和標題(Peter Young等)Flickr15k - 基于草圖的圖像檢索(SBIR)基準?- 330個草圖和15,024張照片的數據集,包括33個對象類別,通常用于評估基于草圖的圖像檢索(SBIR)算法的基準數據集(Hu and Collomosse,CVIU 2013)IAPR TC-12圖像基準(Michael Grubinger)IAPR-TC12分段和注釋圖像基準測試(SAIAPR TC-12):(?Hugo Jair Escalante)ImageCLEF 2010概念檢測和注釋任務(Stefanie Nowak)ImageCLEF 2011概念檢測和注釋任務?- Flickr照片中的多標簽分類挑戰METU商標數據集?METU數據集由全球超過900K個真實標志組成。(Usta Bilgi Sistemleri AS和Grup Ofis Marka專利AS)MPI電影描述數據集 - 文本和視頻(A. Rohrbach)麥吉爾3D形狀基準(Siddiqi,Zhang,Macrini,Shokoufandeh,Bouix,Dickinson)多視覺立體聲評估?- 每個數據集通過激光掃描過程獲得的“地面真相”3D模型進行注冊(Steve Seitz等)NIST SHREC - 其他NIST檢索比賽數據庫和鏈接(美國國家標準與技術研究所)NIST SHREC 2010 - 非剛性3D模型的形狀檢索比賽(美國國家標準與技術研究所)NIST TREC視頻檢索評估數據庫(美國國家標準與技術研究所)NUS-WIDE?- 269K Flickr圖像用81個概念標簽注釋,作為500D BoVW描述符加密等等)普林斯頓形狀基準(Princeton Shape Retrieval and Analysis Group)昆士蘭跨媒體數據集?- 數百萬圖像和文本文件,用于“跨媒體”檢索(易陽)TOSCA 3D形狀數據庫(Bronstein,Bronstein,Kimmel)YouTube-8M數據集?- 視頻理解研究(Google Inc.)的大型多樣化標簽視頻數據集
對象數據庫
 
2.5D / 3D各種對象和場景的數據集(Ajmal Mian)3D對象識別立體數據集該數據集由9個對象和80個測試圖像組成。(Akash Kushal和Jean Ponce)3D攝影數據集是我們實驗室(Yasutaka Furukawa和Jean Ponce)收集的十個多視圖數據集的集合,3D打印RGB-D對象數據集?- 5個具有groundtruth CAD模型和攝像機軌跡的對象,采用各種高質量的RGB-D傳感器(Siemens&TUM)3DNet數據集?- 3DNet數據集是從點云數據中獲取對象類識別和6DOF姿態估計的免費資源。(John Folkesson等人)阿姆斯特丹對象圖書館(ALOI):1K物體的100K視圖(阿姆斯特丹大學/智能感官信息系統)B3DO:伯克利3-D對象數據集?- 家庭對象檢測(Janoch等人)超越PASCAL:野外3D對象檢測的基準?- 12個類,每個具有3D注釋的3000多個圖像(Yu Xiang,Roozbeh Mottaghi,Silvio Savarese)布里斯托爾中心對象交互數據集?- 與同心目的的自我中心對象交互(Dima Damen)CORE圖像數據集?- 幫助學習更詳細的模型和探索對象識別中的跨類別泛化。(Ali Farhadi,Ian Endres,Derek Hoiem和David A. Forsyth)傳播服裝的CTU顏色和深度圖像數據?- 具有注釋角落的散布服裝的圖像(Wagner,L.,Krejov D.,Smutn V.(捷克技術大學在布拉格))Caltech 101(現256)類別對象識別數據庫(李飛飛,Marco Andreeto,Marc’Aurelio Ranzato)卡塔尼亞魚類物種識別?- 15種魚類,約20,000個樣本訓練圖像和附加測試圖像(Concetto Spampinato))哥倫比亞COIL-100 3D對象多視圖(哥倫比亞大學)密集抽樣對象視圖:2500個視圖的2個對象,例如基于視圖的識別和建模(Gabriele Peters,Universiteit Dortmund)EDUB-Obj?- 用于對象定位和分割的Egocentric數據集(MarcBola?os和Petia Radeva。)橢圓查找數據集(Dilip K. Prasad等)GDXray:用于X射線測試和計算機視覺的X射線圖像?- GDXray包括五組圖像:鑄件,焊縫,行李,自然和設置。(智利天主教大學Domingo Mery)GRAZ-02數據庫(自行車,汽車,人)(A. Pinz)GTSDB:德國交通標志檢測基準(Ruhr-Universitat Bochum)ICubWorld?- iCubWorld數據集是通過從iCub類人形機器人的攝像機記錄而收集的圖像,同時觀察日常物體(Giulia Pasquale,Carlo Ciliberto,Giorgio Metta,Lorenzo Natale,Francesca Odone和Lorenzo Rosasco)。關鍵點5數據集?- 具有二維關鍵點標簽的五種家具數據集(吳嘉鈞,田天凡,約瑟夫·林,田東田,何塞·Tenenbaum,安東尼奧·托拉爾巴,比爾·弗里曼)KTH-3D-TOTAL?- RGB-D數據與桌面上的對象注釋。20個書桌,每天3次,超過19天。(John Folkesson等人)LISA交通信號燈數據集?- 各種照明條件下的6種燈光類(Jensen,Philipsen,Mogelmose,Moeslund和Trivedi)LISA交通標志數據集?- 在6610幀(Mogelmose,Trivedi和Moeslund)上的47個美國標志類型的視頻,7855個注釋Linkoping 3D對象姿勢估計數據庫(Fredrik Viksten和Per-Erik Forssen)Linkoping交通標志數據集?- 2088張圖像中的3488個交通標志(Larsson和Felsberg)Longterm Labeled?- 此數據集包含來自longterm數據集(上述longterm數據集)的觀察數據的一部分。(John Folkesson等人)麻省理工學院CBCL汽車數據(生物和計算學習中心)麻省理工學院CBCL StreetScenes挑戰框架:(Stan Bileschi)Microsoft COCO?- 上下文中的常見對象(Tsung-Yi Lin et al)Microsoft對象類識別圖像數據庫(Antonio Criminisi,Pushmeet Kohli,Tom Minka,Carsten Rother,Toby Sharp,Jamie Shotton,John Winn)微軟突出對象數據庫(由邊界框標注)(劉,孫正,唐,舒)ModelNet?- 127,915 CAD模型,662對象類別,10個具有注釋方向的類別(Wu,Song,Khosla,Yu,Zhang,Tang,Xiao)移動Labled?- 此數據集在KTH的同一辦公環境中擴展了更多位置的longterm數據集。(John Folkesson等人)NABirds數據集?- 北美通常觀察到的400種鳥類的70,000張注釋照片(Grant Van Horn)NEC玩具動物識別或分類數據庫(Hossein Mobahi)NORB 50玩具圖像數據庫(NYU)NTU-VOI:NTU視頻對象實例數據集?- 具有用于評估大型視頻中的對象實例搜索和本地化的對象實例的幀級邊界框注釋的視頻剪輯(Jingjing Meng等人)對象姿勢估計數據庫?- 該數據庫包含16個對象,每個對象以兩個旋轉軸(F. Viksten等)以5度角增量進行采樣,對象識別數據庫該數據庫具有8個對象的建模鏡頭和包含多個對象的51個雜亂的測試鏡頭(Fred Rothganger,Svetlana Lazebnik,Cordelia Schmid和Jean Ponce)PacMan數據集?- 用于可抓取的炊具和陶器的RGB和3D合成和實際數據(Jeremy Wyatt)PASCAL 2007挑戰圖像數據庫(摩托車,汽車,奶牛)(PASCAL聯盟)PASCAL 2008挑戰圖像數據庫(PASCAL Consortium)PASCAL 2009挑戰圖像數據庫(PASCAL聯盟)PASCAL 2010挑戰圖像數據庫(PASCAL聯盟)PASCAL 2011挑戰圖像數據庫(PASCAL聯盟)PASCAL 2012挑戰圖像數據庫類別分類,檢測和分割以及靜態圖像動作分類(PASCAL Consortium)PASCAL圖像數據庫(摩托車,汽車,奶牛)(PASCAL Consortium)PASCAL零件數據集?- PASCAL VOC與物體語義部分的分割注釋(Alan Yuille)PASCAL-Context數據集?- 400多個附加類別的注釋(Alan Yuille)物理101數據集?- 五種不同場景中的101種物體的視頻數據集(Jiajun Wu,Joseph Lim,Hongyi Zhang,Josh Tenenbaum,Bill Freeman)雨滴檢測?- 使用組合形狀和顯著性描述符與場景背景隔離改進的雨滴檢測 - 評估數據集(Breckon,Toby P.,Webster,Dereck D.)瑞典葉數據集?- 這些圖像包含15個treeclasses的葉子(Oskar JO S?derkvist)T-LESS?- 用于6D姿勢估計無紋理對象的RGB-D數據集(Tomas Hodan,Pavel Haluza,Stepan Obdrzalek,Jiri Matas,Manolis Lourakis,Xenophon Zabulis)TUW對象實例識別數據集?- 從各種觀點觀察并表示為Kinect RGB-D點云的對象實例及其6DoF姿態對于混亂室內場景的注釋(Thomas,A. Aldoma,M.Zillich,M.Vincze)TUW數據集?-?TUW的幾個RGB-D地面真值和注釋數據集。(John Folkesson等人)UAH交通標志數據集(Arroyo等)UIUC汽車影像數據庫(UIUC)UIUC數據集3D對象類別(S. Savarese和L. Fei-Fei)威尼斯3D對象在雜波識別和分割(Emanuele Rodola)可視屬性數據集超過500個對象類(動畫和無生命)的視覺屬性注釋,都在ImageNet中表示。每個對象類都基于具有636個屬性的分類法(例如,具有金屬制成的毛皮,圓形)的視覺屬性來注釋。視覺基因組:使用群眾密集圖像注釋連接語言和視覺?- 視覺基因組是一個數據集,知識庫,持續的將結構化圖像概念與語言連接的努力(Ranjay Krishna,Yuke Zhu,Oliver Groth,Justin Johnson,Kenji Hata, Joshua Kravitz,Stephanie Chen,Yannis Kalantidis,Li Jia-Li,David Ayman Shamma,Michael Bernstrein,Li Fei-Fei)視覺船體數據設置一組視覺船體數據集(Svetlana Lazebnik,Yasutaka Furukawa和Jean Ponce)
人(靜),人體姿勢
 
在電影院標記的幀(?FLIC?)?- 標有人體姿勢的20928幀(Sapp,Taskar)利茲體育姿勢數據集?- 2000姿態大多數體育運動人物的注釋圖像(約翰遜,永恒)MPII人體姿態數據集?- 25K幅圖像,包含超過40K個具有注釋的身體關節的人物,410人類活動{Andriluka,Pishchulin,Gehler,Schiele)MPII人體姿態數據集?- MPII人體姿勢數據集是用于評估關節人臉姿態估計的事實上的標準基準。(Mykhaylo Andriluka,Leonid Pishchulin,Peter Gehler,Bernt Schiele)人物相冊?- 社會媒體照片數據集與Flickr的圖像,手動注釋的人頭和他們的身份(寧張和Manohar Paluri和Yaniv泰格曼和Rob Fergus和Lubomir Bourdev)個人照片集中的人物識別?- 我們為評估和長時間屬性注釋和每張照片時間戳元數據引入了三個更難的劃分(噢,Seong Joon和Benenson,Rodrigo和Fritz,Mario和Schiele,Bernt)指點’04 ICPR車間頭姿圖數據庫UC-3D運動數據庫?- 可用的數據類型包括采用Xsens和Microsoft Kinect RGB和深度圖像的MVN Suit采集的高分辨率運動捕捉(葡萄牙科英布拉系統與機器人研究所)VGG人體姿態估計數據集,包括BBC姿勢(20個視頻與重疊的手語翻譯),擴展BBC姿勢(72個額外的訓練視頻),短BBC姿勢(5個1小時視頻與手語簽名者)和ChaLearn姿勢(23小時的Kinect數據27人執行20意大利手勢)。(Charles,Everingham,Pfister,Magee,Hogg,Simonyan,Zisserman)
人員檢測和跟蹤數據庫
 
3D KINECT性別步行數據庫(L。Igual,A. Lapedriza,R. Borrà s來自UB,CVC和UOC,西班牙)AGORASET:人群視頻分析數據集(Nicolas Courty等)CASIA步態數據庫(中國科學院)CAVIAR項目視頻序列跟蹤和行為基礎真相(CAVIAR團隊/愛丁堡大學 - EC項目IST-2001-37540)CMU?Panoptic?Studio數據集?- 由500多臺同步攝像機捕獲的多人社交互動數據集,具有3D全身骨骼和校準數據。(H. Joo,T. Simon,Y. Sheikh)大眾人群數據集?- 來自215個擁擠場景的474個視頻片段(邵,洛和王)CUHK01數據集:具有3,884個行人圖像的人員重新編號數據集(Rui Zhao等人)CUHK02數據集:具有五個攝像機視圖設置的人員重新編號數據集。(Rui Zhao et al)CUHK03數據集:擁有1,360名行人13,164張圖像的人物重新編號數據集(芮釗等)Caltech行人數據集(P. Dollar,C.Wojek,B.Schiele和P. Perona)戴姆勒行人檢測基準?21790圖像與56492行人和空場景(DM Gavrila等人)驅動程序監控視頻數據集(RobeSafe + Jesus Nuevo-Chiquero)DukeMTMC:杜克多目標多攝像機跟蹤數據集?- 8個攝像頭,85分鐘,2米幀,2000人視頻(Ergys Ristani,Francesco Solera,Roger S. Zou,Rita Cucchiara,Carlo Tomasi)愛丁堡高架攝像頭人物跟蹤數據集(Bob Fisher,Bashia Majecka,Gurkirt Singh,Rowland Sillito)GVVPerfcapEva?- 人體形態和性能捕獲數據庫,包括全身骨骼,手跟蹤,身體形態,面部表現,交互(Christian Theobalt)HAT數據庫的27個人類屬性(Gaurav Sharma,Frederic Jurie)INRIA人物數據集(Navneet Dalal)即時數據集?- 此數據集專為估計個人關系而設計。(Xiao Chu et al。)Inria運動基準的穿戴式人體?- 包含不同主題,運動和服裝風格的3D運動序列的基準測試,可以定量測量身體形狀估計的準確性(Jinlong Yang,Jean-Sbastien Franco,Franck H = E9troy-Wheeler,和Stefanie Wuhrer)伊茲密爾(Izmir)?- 用于人類和汽車檢測(Yalin Bastanlar)的全向和全景圖像數據集(帶注釋)自主駕駛(JAAD)的共同關注?- 數據集包括主要用于在自主駕駛中進行行為研究和檢測的行人和汽車的實例(Iuliia Kotseruba,Amir Rasouli和John K. Tsotsos)MAHNOB:MHI-Mimicry數據庫?- 一個2人,多個攝像頭和麥克風數據庫,用于在人與人之間的交互場景中學習模擬。(Sun,Lichtenauer,Valstar,Nijholt和Pantic)MIT CBCL行人數據(生物與計算學習中心)MPI DYNA?- 動態人形運動模型(Max Planck Tubingen)MPI FAUST數據集包含300個真實,高分辨率人類掃描的數據集,具有自動計算的地面真相對應關系(Max Planck Tubingen)MPI JHMDB數據集?- 聯合注釋的人體運動數據庫 - 21個動作,928個剪輯,33183幀(Jhuang,Gall,Zuffi,Schmid和Black)MPI MOSH運動和形狀捕捉從標記。MOCAP數據,3D形狀網格,3D高分辨率掃描。(馬克斯·普朗克·圖賓根)MVHAUS-PI?- 一種多視角人類交互識別數據集(Saeid et al。)市場1501數據集?- 最多6臺相機的1,501個身份的32,668個注釋邊界框(梁正等)摩德納和雷焦艾米利亞第一人稱動議視頻(摩德納和雷焦艾米利亞大學)日常生活的多式聯運活動?- 包括視頻,音頻,生理,睡眠,運動和插頭傳感器。(Alexia Briasouli)多目標跟蹤基準?- 具有實地真相的數據集合,以及一個績效聯盟表(ETHZ,U. Adelaide,TU Darmstadt)多光譜可見NIR視頻序列?- 注釋多光譜視頻,可見+ NIR(LE2I,布爾戈尼大學)紐約大學多目標跟蹤基準(Konrad Schindler等)閉合的人體數據集?- 身體姿勢提取和跟蹤在閉塞下,6個RGB-D序列(3500幀)與一個,兩個和三個用戶,基于標記的地面真相數據(Markos Sigalas,Maria Pateraki,Panos Trahanias)PARSE數據集附加數據?- 面部表情,凝視方向和性別(Antol,Zitnick,Parikh)鉸鏈機構的PARSE數據集?- 300張人和馬的圖像(拉曼)PETS 2009 Crowd Challange數據集(Reading University& James Ferryman)PETS冬季2009年研討會數據(Reading University& James Ferryman)PETS:跟蹤和監視的績效評估(Reading University& James Ferryman)PIROPO?- 具有透視和全向相機的室內紅寶石的人員,擁有超過100,000個注釋框架(GTI-UPM,西班牙)人民藝術?- 一張數據庫,內含人物貼上照片和藝術作品(齊武和泓平蔡)Photo-Art-50?- 一個數據庫,包含照片和圖畫中標注的50個對象類(Qi Wu and Hongping Cai)基于像素的變化檢測基準數據集(Goyette等)RADD?- 室內 - 室外數據集中的重新識別:43人,4臺攝像機,6920張圖像(Abir Das等人)SYNTHIA?- 大型(約五十萬)虛擬世界圖像,用于訓練自主車輛。(計算機視覺中心的ADAS集團)Shinpuhkan 2014?- 一個人重新識別數據集,包含由16臺攝像機捕獲的24人的22,000張圖像。(Yasutomo Kawanishi等)斯坦福結構化集團發現數據集?- 發現圖像中的人群(W. Choi等人)寺廟顏色128 - 顏色跟蹤基準?- 編碼用于視覺跟蹤的顏色信息(P.Liang,E.Blasch,H.Lin)瞬態生物特征指甲數據集V01(Igor Barros Barbosa)中佛羅里達大學 - 人群數據集(Saad Ali)中佛羅里達大學 - 人群流分段數據集(Saad Ali)VIPeR:觀點不變行人識別?- 在不同照明條件下從任意視角拍攝的632個行人圖像對。(格雷,布倫南,陶)視覺對象跟蹤挑戰數據集?- VOT數據集是在單目標短期視覺對象跟蹤挑戰中使用的完全注釋的視覺對象跟蹤數據集的集合(VOT委員會)WIDER屬性數據集?- WIDER屬性是一個大規模的人類屬性數據集,其中13789個圖像屬于30個場景類別,每個57524個人體邊界框分別用14個二進制屬性注釋(Li,Yining和Huang,Chen,Loy,Chen Change和唐,小ou)
遙感
 
巴西Cerrado-Savanna場景數據集?- 由巴西Cerrado-Savanna植被分類的RapidEye傳感器拍攝的IR-RG場景的組成。(K.Nogueira,JA dos Santos,T.Fornazari,TS Freire,LP Morellato,R.da S. Torres)巴西咖啡場景數據集?- 由SPOT傳感器用于鑒定巴西山區咖啡作物的IR-RG場景的組成(OAB Penatti,K.Nogueira,JA dos Santos。)從IKONOS(1米)和QuickBird(60厘米)(阿里Ozgun Ok和Caglar Senaras)獲取的建筑物檢測基準?-14圖像CBERS-2B,Landsat 5 TM,Geoeye,Ikonos-2 MS和ALOS-PALSAR?- 使用光學圖像的陸地覆蓋分類(D。Osaku等人)Furnas和Tiete?- 沉積物產量分類(Pisani等)ISPRS 2D語義標簽?- 在波茨坦(德國波茨坦)市(Franz Rottensteiner,Gunho Sohn,Markus Gerke,Jan D. Wegner)準備了距離為5cm的高度模型和真正的正像,ISPRS 3D語義標注?- 九級機載激光掃描數據(Franz Rottensteiner,Gunho Sohn,Markus Gerke,Jan D. Wegner)內陸空中圖像標簽數據集?- 美國和奧地利城市的9000平方公里的彩色航空影像。(Emmanuel Maggiori,Yuliya Tarabalka,Guillaume Charpiat,Pierre Alliez)Lampert的譜圖分析?- 來自時間序列數據的被動聲納譜圖,這些譜圖是從水下海洋記錄中從螺旋槳和發動機機械輻射的聲能的記錄產生的。(托馬斯·蘭珀特)Linkoping Thermal InfraRed數據集?- LTIR數據集是用于評估短期單對象(STSO)跟蹤的熱紅外數據集(Linkoping大學)MUUFL Gulfport高光譜和LiDAR數據集?- 在密西西比州南密西根海灣大學校園內共同登記的航空高光譜和激光雷達數據,其中包含幾個子像素目標。(P.Gader,A.Zare,R.Light,J.Aitken,G.Touell)蘇黎世夏季數據集旨在用于城市場景的非常高分辨率衛星圖像的語義分割,具有不完整的地面實況(Michele Volpi和Vitto Ferrari。)蘇黎世城市微型飛行器數據集?- 蘇黎世2公里的時間同步空中高分辨率圖像,以及相關的其他數據(Majdik,Till,Scaramuzza
場景分割或分類
 
巴塞羅那?- 15,150張圖片,巴塞羅那的城市景觀(Tighe和Lazebnik)CMU可視化本地化數據集?- 使用裝備有IMU,GPS,INS,激光雷達和相機的Navlab 11?收集的數據集(Hernan Badino,Daniel Huber和Takeo Kanade)COLD(舒適的本地化數據庫) - 本地化(Ullah,Pronobis,Caputo,Luo和Jensfelt)DAVIS:視頻對象分割數據集?- 密集注釋的VIdeo分割(F. Perazzi,J.Pont-Tuset,B. McWilliams,L.VanGol,M.Gross和A.Sorkine-Hornung)EDUB-Seg?- 用于事件分割的Egocentric數據集(Mariella Dimiccoli,MarcBola?os,Estefania Talavera,Maedeh Aghaei,Stavri G. Nikolov和Petia Radeva。)十五個場景分類十五個自然場景類別的數據集(Fei-Fei Li和Aude Oliva)幾何背景 - 場景解釋圖像(Derek Hoiem)移動機器人本地化的室內地點識別數據集?- 該數據集包含由兩個不同機器人(virtualMe和先鋒)構建的17個不同的地方(Raghavender Sahdev,John K. Tsotsos)。室內場景識別?- 67室內類別,15620圖像(Quattoni和Torralba)野外的本質圖像(IIW)?- 野外的內在圖像是一個大型的公共數據集,用于評估室內場景的內在圖像分解(Sean Bell,Kavita Bala,Noah Snavely)LM + SUN?- 45,676幅圖像,主要是城市或人類相關場景(Tighe和Lazebnik)可視和紅外光譜中的海事影像?- VAIS包含從碼頭獲得的船舶的同時獲取的未注冊的熱和可見圖像(Zhang,MM,Choi,J.,Daniilidis,K.,Wolf,MT&Kanan)上下文中的材料(MINC)?- 上下文數據庫中的材料(MINC)建立在OpenSurfaces上,但包括數百萬個材料標簽的點注釋。(Sean Bell,Paul Upchurch,Noah Snavely,Kavita Bala)麻省理工學院內在圖像?- 20件物品(羅杰格羅斯,米卡·約翰遜,愛德華·阿德爾森和威廉·弗里曼)NYU V2混合曼哈頓框架數據集?- 我們提供曼哈頓框架(MMF)分割和MF旋轉的混合物在全面的NYU深度數據集V2由Silberman等人。(Straub,Julian和Rosman,Guy和Freifeld,Oren和Leonard,John J.和Fisher III,John W.)OpenSurfaces?- OpenSurfaces由數以萬計的內部消費者照片分割的曲面示例組成,并用材質參數,紋理信息和上下文信息進行注釋。(Kavita Bala等人)場景2場景識別數據庫?-365場景類別和800萬圖像(周,Khosla,Lapedriza,Torralba和Oliva)場景識別數據庫?- 205個場景類別和250萬個圖像(Zhou,Lapedriza,Xiao,Torralba和Oliva)RGB-NIR場景數據集?- 在RGB和近紅外(NIR)(Brown和Susstrunk)中捕獲的9個類別中的477個圖像SUN 2012?- 16,873場景分類完全注釋場景圖像(Xiao等)SUN 397?- 397場景分類場景類別(Xiao等)SUN RGB-D:RGB-D場景了解基準套件?- 10,000 RGB-D圖像,146,617 2D多邊形和58,657 3D邊框(Song,Lichtenberg和Xiao)SYNTHIA?- 大型(約五十萬)虛擬世界圖像,用于訓練自主車輛。(計算機視覺中心的ADAS集團)篩選流程(也稱為LabelMe Outdoor,LMO)?- 2688幅圖像,主要是戶外自然和城市(Tighe和Lazebnik)斯坦福背景數據集?- 包含至少一個前景物體的戶外場景的715幅圖像(Gould等人)表面檢測?- 通過顏色空間融合和時間分析的實時可行表面檢測 - 評估數據集(Breckon,Toby P.,Katramados,Ioannis)ViDRILO?- ViDRILO是一個數據集,其中包含5個帶有注釋的RGB-D圖像序列,該圖像采用移動機器人在兩個辦公樓內,具有挑戰性的照明條件(Miguel Cazorla,J。Martinez-Gomez,M. Cazorla,I. Garcia-Varea和V莫雷爾)
細分(一般)
 
:陰影檢測/紋理分割計算機視覺數據集?- 基于視頻的陰影檢測/抑制序列,具有實例(Newey,C.,Jones,O.,&Dee,HM)Aberystwyth葉評估數據集?- 用手標記植物圖像,用手標記一段時間的葉級分割,以及植物犧牲的生物數據。(Bell,Jonathan; Dee,Hannah M.)Alpert等人 分段評估數據庫(Sharon Alpert,Meirav Galun,Ronen Basri,Achi Brandt)BMC(背景模型挑戰)?- 用于比較背景減法算法的數據集,實際和合成視頻(Antoine)伯克利分割數據集和基準測試(David Martin和Charless Fowlkes)傳播服裝的CTU顏色和深度圖像數據?- 具有注釋角落的散布服裝的圖像(Wagner,L.,Krejov D.,Smutn V.(捷克技術大學在布拉格))CTU服裝折疊照片數據集?- 衣服折疊各個階段的色彩和深度圖像(Sushkov R.,Melkumov I.,Smutn y V.(捷克技術大學在布拉格))DeformIt 2.0?- 圖像數據增強工具:從單個圖像分割對(Brian Booth和Ghassan Hamarneh)模擬具有地面真實分割的新穎圖像GrabCut圖像數據庫(C.Rother,V.Kolmogorov,A.Blake,M.Brown)野外的本質圖像(IIW)?- 野外的內在圖像是一個大型的公共數據集,用于評估室內場景的內在圖像分解(Sean Bell,Kavita Bala,Noah Snavely)LabelMe圖像數據庫和在線注釋工具(Bryan Russell,Antonio Torralba,Kevin Murphy,William Freeman)上下文中的材料(MINC)?- 上下文數據庫中的材料(MINC)建立在OpenSurfaces上,但包括數百萬個材料標簽的點注釋。(Sean Bell,Paul Upchurch,Noah Snavely,Kavita Bala)OpenSurfaces?- OpenSurfaces由數以萬計的內部消費者照片分割的曲面示例組成,并用材質參數,紋理信息和上下文信息進行注釋。(Kavita Bala等人)PetroSurf3D?- 26高分辨率(亞毫米精度)巖石藝術的3D掃描與巖畫的像素標記進行分割(Poier,Seidl,Zeppelzauer,Reinbacher,Schaich,Bellandi,Marretta,Bischof)SYNTHIA?- 大型(約五十萬)虛擬世界圖像,用于訓練自主車輛。(計算機視覺中心的ADAS集團)石溪大學陰影數據集(SBU-Shadow5k)?- 來自各種場景和照片類型的大型影像檢測數據集,以及人體注釋(Tomas FY Vicente,Le Hou,Chen-Ping Yu,Minh Hoai,Dimitris Samaras)
同時本地化和映射
 
姿態估計,視覺測??距和SLAM的基于事件的數據數據還包括來自運動捕捉系統的強度圖像,慣性測量和地面實況。(ETH)RAWSEEDS SLAM基準數據集(Rawseeds Project)TUM RGB-D基準?- 用于評估RGB-D視覺測距和SLAM算法的數據集和基準(BCrgen Sturm,Nikolas Engelhard,Felix Endres,Wolfram Burgard和Daniel Cremers)視覺測量/ SLAM評估?- 測距基準由22個立體聲序列組成(Andreas Geiger和Philip Lenz和Raquel Urtasun)
監視和跟蹤
 
ATOMIC GROUP ACTIONS數據集?- (Ricky J. Sethi等)AVSS07:基于高級視頻和信號的監控2007數據集(Andrea Cavallaro)活動建模和異常檢測數據集?- 數據集包含45分鐘視頻,帶有注釋異常(Jagan Varadarajan和Jean-Marc Odobez)背景減法?- 關于背景減法的數據集列表(Thierry BOUWMANS)CMUSRD:監控研究數據集?- 用于室內監控場景的多攝像機視頻(K.Hattori,H.Hattori等人)DukeMTMC:杜克多目標多攝像機跟蹤數據集?- 8個攝像頭,85分鐘,2米幀,2000人視頻(Ergys Ristani,Francesco Solera,Roger S. Zou,Rita Cucchiara,Carlo Tomasi)ETISEO視頻監控下載數據集(INRIA獵戶座等)HDA +多攝像機監控數據集?- 分布在研究所3層樓的1??8個異??質攝像機網絡(不同分辨率和幀速率)的視頻,具有13個完全標記的序列,85個人和64028個包圍的人。(D.Figueira,M.Taiana,A.Nambiar,J.Nascimento和A.Bernardino)人類點擊數據?- 跟蹤目標20K人的點擊(包括點擊錯誤)(Zhu和Porikli)即時數據集?- 此數據集專為估計個人關系而設計。(Xiao Chu et al。)MAHNOB數據庫 - 包括笑聲數據庫,HCI標簽數據庫,MHI模擬數據庫(M.Pantic等)MVHAUS-PI?- 一種多視角人類交互識別數據集(Saeid et al。)多光譜可見NIR視頻序列?- 注釋多光譜視頻,可見+ NIR(LE2I,布爾戈尼大學)Openvisor - 視頻監控在線存儲庫(摩德納和雷焦艾米利亞大學)停車場數據集?- 停車場數據集是一個汽車數據集,專注于停車場情況下汽車的中度和重度遮擋(B。李,TF吳和SC Zhu)色情數據庫?- 色情數據庫是一個色情檢測數據庫,包含從色情網站和Youtube中提取的近80個小時的400個色情和400個非色情視頻。(Avila,Thome,Cord,Valle,de Araujo)普林斯頓跟蹤基準?- 100個RGBD跟蹤數據集(Song and Xiao)瑪麗瑪麗多相機分布式交通場景數據集(QMDTS)?- QMDTS是從城市監控環境中收集的,用于研究分布式場景中的監控行為(徐旭教授,邵剛教授和Timothy Hospedales博士)SALSA:協同社會場景分析?- 多模式群體行為分析的新型數據集(Xavier Alameda-Pineda等)SBMnet(場景背景建模.NET)?- 用于測試背景估計算法的數據集(Pierre-Marc Jodoin,Lucia Maddalena和Alfredo Petrosino)SCOUTER?- 視頻監控場地實況(轉移觀點,不同設置/照明條件,主題變化較大)。30個視頻和約36,000個手動標記的幀。(Catalin Mitrea)SJTU-BEST一個監視指定的數據集平臺,具有逼真的,使用相機的攝像頭,多樣化的監控圖像和視頻(上海交通大學)SPEVI:監督績效評估計劃(倫敦瑪麗皇后大學)Shinpuhkan 2014?- 一個人重新識別數據集,包含由16臺攝像機捕獲的24人的22,000張圖像。(Yasutomo Kawanishi等)在極其混亂的場景中進行跟蹤 - 這個單個對象跟蹤數據集具有28個高度混亂的序列,每幀注釋(Jingjing Xiao,Linbo Qiao,Rustam Stolkin,Ale Leonardis)UCSD異常檢測數據集?- 一個穩定的攝像機,安裝在海拔高度,俯瞰行人天橋,行人異?;蚍切腥诉\動。UCSD軌跡聚類和分析數據集?- (Morris and Trivedi)USC信息科學研究所的ATOMIC PAIR ACTIONS數據集?- (Ricky J. Sethi等)Udine基于軌跡的異常事件檢測數據集?- 具有異常值的合成軌跡數據集(Udine人工視覺和實時系統實驗室)視覺跟蹤器基準?- 100個跟蹤跟蹤序列,具有可視化跟蹤基準評估的地面實況,包括跟蹤多個跟蹤器的跟蹤結果(Wu,Lim,Yang)WIDER屬性數據集?- WIDER屬性是一個大規模的人類屬性數據集,其中13789個圖像屬于30個場景類別,每個57524個人體邊界框分別用14個二進制屬性注釋(Li,Yining和Huang,Chen,Loy,Chen Change和唐,小ou)
紋理
 
Brodatz紋理,規范化Brodatz紋理,彩色Brodatz紋理,Multiband Brodatz紋理?154新圖像加上112個具有各種變換的原始圖像(A. Safia,D. He)顏色紋理圖像按類別(textures.forrest.cz)哥倫比亞 - 烏特勒支反射和紋理數據庫(哥倫比亞特區和烏得勒支大學)DynTex:動態紋理數據庫(Renaud Piteri,Mark Huiskes和Sandor Fazekas)野外的本質圖像(IIW)?- 野外的內在圖像是一個大型的公共數據集,用于評估室內場景的內在圖像分解(Sean Bell,Kavita Bala,Noah Snavely)KTH TIPS& TIPS2紋理?- 姿態/照明/刻度變化(Eric Hayman)上下文中的材料(MINC)?- 上下文數據庫中的材料(MINC)建立在OpenSurfaces上,但包括數百萬個材料標簽的點注釋。(Sean Bell,Paul Upchurch,Noah Snavely,Kavita Bala)OpenSurfaces?- OpenSurfaces由數以萬計的內部消費者照片分割的曲面示例組成,并用材質參數,紋理信息和上下文信息進行注釋。(Kavita Bala等人)奧盧紋理數據庫(奧盧大學)牛津可描述的紋理數據集?- 5640個圖像(M.Cimpoi,S. Maji,I.Kokkinos,S.Mhhamed,A.Vedaldi)布拉格紋理分割數據生成器和基準測試(Mikes,Haindl)薩爾斯堡紋理圖像數據庫(STex)?- 奧地利薩爾斯堡附近捕獲的大量476色紋理圖像。(羅蘭·克維特和彼得·梅爾瓦爾德)紋理數據庫紋理數據庫具有25個紋理類,每個40個樣本(Svetlana Lazebnik,Cordelia Schmid和Jean Ponce)表面和材料的烏普薩拉紋理數據集?- 織物,谷物等視覺紋理(MIT Media Lab)
城市數據集
 
巴塞羅那?- 15,150張圖片,巴塞羅那的城市景觀(Tighe和Lazebnik)CMP門面數據庫?- 包括606個修正的外墻圖像,具有12個建筑類別的地方(Radim Tylecek)LM + SUN?- 45,676幅圖像,主要是城市或人類相關場景(Tighe和Lazebnik)麻省理工學院CBCL StreetScenes挑戰框架:(Stan Bileschi)瑪麗瑪麗多相機分布式交通場景數據集(QMDTS)?- QMDTS是從城市監控環境中收集的,用于研究分布式場景中的監控行為(徐旭教授,邵剛教授和Timothy Hospedales博士)強大的全球翻譯與1DSfM數據數據描述每個數據集的運動問題的全局結構(凱爾威爾遜和挪亞Snavely)篩選流程(也稱為LabelMe Outdoor,LMO)?- 2688幅圖像,主要是戶外自然和城市(Tighe和Lazebnik)解卷積網絡的街景變化檢測?- 具有結構,照明,天氣和季節變化的街景圖像對齊圖像對的數據庫(Pablo F. Alcantarilla,Simon Stent,德國Ros,Roberto Arroyo和Riccardo Gherardi)悉尼房屋?- 具有準確3D房屋形狀,門面對象標簽,密點對應和注釋工具箱的街景房屋圖像(Hang Chu,Shenlong Wang,Raquel Urtasun,Sanja Fidler)交通標志數據集?- 記錄從瑞典高速公路和城市道路(Fredrik Larsson)350公里以上的序列
其他收藏
 
4D光場數據集?- 24個具有9x9x512x512x3輸入圖像的合成場景,深度和視差地面實況,攝像機參數和評估面具。(Katrin Honauer,Ole Johannsen,Daniel Kondermann,Bastian Goldluecke)AMADI_LontarSet?- 巴厘棕櫚葉手稿圖像二進制數據集,查詢字典查找和孤立字符識別巴厘劇本。(AMADI項目等)注釋的Web耳朵數據集(AWE數據集)?- 所有圖像都是通過從已知人員的互聯網上的圖像中刪除耳朵獲得的(Ziga Emersic,Vitomir Struc和Peter Peer)生物特征評估與測試?- 識別技術的評估,包括生物識別(歐洲計算電子基礎設施)CALVIN研究組數據集?- 眼睛跟蹤對象檢測,imagenet邊界框,同步活動,stickman和身體姿勢,youtube對象,臉,馬,玩具,視覺屬性,形狀類(CALVIN ggroup)CANTATA視頻和圖像數據庫索引站點(Multitel)香港中文大學數據集?- 面部素描,面部對齊,圖像搜索,公眾廣場觀察,閉塞,中心站,麻省理工學院單人和多人相機軌跡,人物重新識別(多媒體實驗室)計算機視覺測試圖像數據庫(Carnegie Mellon Univ)首頁列表計算機視覺實驗室OCR DataBase(CVL OCR DB)?- CVL OCR DB是一個公共注釋的圖像數據集,在自然場景中有120個二進制注釋的文本圖像。(Andrej Ikica和Peter Peer)ETHZ各種,包括ETH 3D頭部姿勢,BIWI視聽數據,ETHZ形狀類,BIWI步行者,行人,建筑物,4D MRI,個人事件,肝臟超聲,食物101(ETH蘇黎世,計算機視覺實驗室)一般100數據集?- General-100數據集包含100個bmp格式的圖像(無壓縮),非常適合超分辨率訓練(Dong,Chao和Loy,Chen Change和Tang,Xiaoou)HKU-IS?-4447圖像與像素標記的基礎,用于突出物體檢測(Guanbin Li,Yizhou Yu)高分辨率3D模型?- 它包括這些數據集的高分辨率渲染。(休伯特等)I3 - Yahoo Flickr Creative Commons 100M?- 此數據集包含照片和視頻列表。(B.Thomee,DAShamma,G.Friedland等人)IDIAP數據集集合?- 26個不同的數據集 - 多模式,攻擊,生物特征,草書人物,話語,眼睛凝視,海報,瑪雅法典,MOBIO,面部欺騙,游戲,手指靜脈,YouTube個性特質(IDIAP團隊)Kinect v2數據集?- 用于評估kinect2深度解碼(Felix等)中的展開的數據集拉瓦爾HDR天空數據庫?- 該數據庫包含800個半球形,全天空的HDR照片,可用于戶外照明分析。(Jean-Francois Lalonde等)Leibe的人物/車輛/物體數據庫(Bastian Leibe)蓮山圖像數據庫收集與地面真相(Sealeen Ren,Benjamin Yao,Michael Yang)麻省理工學院收入基準數據集?- 收集(指向23個數據集)(Bylinskii,Judd,Borji,Itti,Durand,Oliva,Torralba}Michael Firman的RGBD數據集列表Msspoof:2D多光譜臉部欺騙?- 使用紙張進行NIR和VIS相機(Idiap研究所)的實時數據主體和欺騙性數據對象的演示攻擊(欺騙)數據集,多視覺立體聲評估?- 每個數據集通過激光掃描過程獲得的“地面真相”3D模型進行注冊(Steve Seitz等)牛津雜項,包括巴菲,鮮花,電視角色,建筑物等(牛津視覺幾何集團)PEIPA圖像數據庫摘要(試點歐洲圖像處理歸檔)PalmVein欺騙?- 用紙(Idiap研究機構)執行的來自欺騙性數據主題(對應于VERA Palmvein)的示例的演示攻擊(欺騙)數據集RSBA數據集?- 用于評估滾動快門束調整的順序(Per-Erik等)重播攻擊:2D臉部欺騙?- 使用來自移動設備到筆記本電腦的紙張,照片和視頻執行的真實數據主體和欺騙性數據主題的演示攻擊(欺騙)數據集(Idiap研究所)重播手機:2D臉部欺騙?- 使用來自移動設備的紙張,照片和視頻執行的實時數據主體和欺騙性數據主題的演示攻擊(欺騙)數據集(Idiap研究所)合成序列發生器?- 合成序列發生器(G. Hamarneh)事件相機數據集?- 這是世界上第一個采用基于事件的高速機器人相機數據集合(E.Mueggler,H. Rebecq,G. Gallego,T. Delbruck,D.Scaramuzza)從貓的角度看世界 - 從自由行為的貓頭上?錄制的視頻(Belinda Y.Betsch,Wolfgang Einh?user)USC注釋計算機視覺參考書目數據庫出版摘要(Keith Price)USC-SIPI圖像數據庫:紋理,空中,收藏(例如Lena)(USC信號和圖像處理研究所)伯爾尼大學伯克利數據庫,在線文檔,字符串編輯和圖形匹配(伯恩大學,計算機視覺和人工智能)VERA Fingervein欺騙?- 使用紙(Idiap研究所)執行的來自欺騙性數據主題(對應于VERA Fingervein)的樣本的演示攻擊(欺騙)數據集VERA Fingervein?- 帶有數據主體的Fingervein數據集,用開放的fingervein傳感器記錄(Idiap研究所)VERA PalmVein:PalmVein?- Palmvein數據集,其中記錄有開放式掌紋傳感器(Idiap研究所)的數據主體航空圖像中的車輛檢測?- VEDAI是航空影像中車輛檢測的數據集,作為在無約束環境中對自動目標識別算法進行基準測試的工具。(Sebastien Razakarivony和Frederic Jurie)視頻堆疊數據集?- 用于在手機上釋放視頻堆疊的數據集(Erik Ringaby等)手腕攝像機視頻數據集?- 從腕上攝像頭和頭戴式攝像機拍攝的日常生活視頻活動(Katsunori Ohnishi,Atsushi Kanehira,Asako Kanezaki,Tatsuya Harada)Yummly-10k數據集?- 目標是了解人類的感知,在這種情況下,食物味道相似。(SE(3)康乃爾科技計算機視覺集團)
雜
 
3D網格水印基準數據集(Guillaume Lavoue)4D光場數據集?- 24個具有9x9x512x512x3輸入圖像的合成場景,深度和視差地面實況,攝像機參數和評估面具。(Katrin Honauer,Ole Johannsen,Daniel Kondermann,Bastian Goldluecke)用于實際低光圖像降噪的數據集?- 它包含由低光照相機噪聲和低噪聲對應物損壞的像素和強度對齊的圖像對。(J.Anaya,A.Barbu)AMADI_LontarSet?- 巴厘棕櫚葉手稿圖像二進制數據集,查詢字典查找和孤立字符識別巴厘劇本。(AMADI項目等)活動外觀模型數據集(Mikkel B. Stegmann)飛機跟蹤(Ajmal Mian)注釋的Web耳朵數據集(AWE數據集)?- 所有圖像都是通過從已知人員的互聯網上的圖像中刪除耳朵獲得的(Ziga Emersic,Vitomir Struc和Peter Peer)CITIUS視頻數據庫?- 具有眼睛跟蹤數據的72個視頻數據庫=用于評估動態顯眼視覺模型(Xose)CVSSP 3D數據存儲庫?- 數據集旨在評估一般的多視圖重建算法。(Armin Mustafa,Hansung Kim,Jean-Yves Guillemaut和Adrian Hilton)加利福尼亞州 - ND?- 從個人照片集的701張照片,包括許多具有挑戰性的現實生活中不相同的近似重復(Vassilios Vonikakis)基于劍橋運動的分割和識別數據集(Brostow,Shotton,Fauqueur,Cipolla)反折射相機校準圖像(Yalin Bastanlar)Chars74K數據集 - 74個英語和卡納達角色(Teo de Campos - t.decampos@surrey.ac.uk)硬幣圖像數據集?- 硬幣圖像數據集是60類羅馬共和國硬幣的數據集(Sebastian Zambanini,Klaus Vondrovec)哥倫比亞相機響應功能:數據庫(DoRF)和模型(EMOR)(MD Grossberg和SK Nayar)哥倫比亞數據庫的污染物模式和散射參數(Jinwei Gu,Ravi Ramamoorthi,Peter Belhumeur,Shree Nayar)犯罪現場鞋印象數據庫?- 犯罪現場和參考foorware印象圖像(Adam Kortylewski)D-HAZY?- 用于評估定量診斷算法的數據(Cosmin Ancuti et al。)DR(眼睛)VE?- 駕駛員注意力數據集(摩德納大學和雷焦艾米利亞大學)DTU控制運動和照明圖像數據集(135K圖像)(Henrik Aanaes)視覺眼動數據庫(DOVES)?- 從29個人類觀察者收集到的一組眼動,因為它們觀察到101個自然校準圖像。(van der Linde,I.,Rajashekar,U.,Bovik,AC等)DeformIt 2.0?- 圖像數據增強工具:從單個圖像分割對(Brian Booth和Ghassan Hamarneh)模擬具有地面真實分割的新穎圖像密集的戶外通信地面實況數據集,用于光流和局部關鍵點評估(Christoph Strecha)EISATS:.enpeda ..圖像序列分析測試站點(奧克蘭大學多媒體成像組)無特征對象跟蹤?- 此數據集包含幾個具有有限紋理的視頻序列,用于視覺跟蹤,包括手動注釋的每幀姿勢(Lebeda,Hadfield,Matas,Bowden)FlickrLogos-32?- 8240圖像的32個產品標識(Stefan Romberg)一般100數據集?- General-100數據集包含100個bmp格式的圖像(無壓縮),非常適合超分辨率訓練(Dong,Chao和Loy,Chen Change和Tang,Xiaoou)Geometry2view?- 此數據集包含用于2視圖幾何計算的圖像對,包括手動注釋點坐標(Lebeda,Matas,Chum)漢諾威區域檢測器評估數據集?- 從1.5到800萬像素(Kai Cordes)的多個圖像分辨率中的特征檢測器評估序列Hillclimb和CubicGlobe數據集?- 一個集會汽車的視頻,分為幾個獨立的鏡頭(用于視覺跟蹤和建模)。(Lebeda,Hadfield,Bowden)I3 - Yahoo Flickr Creative Commons 100M?- 此數據集包含照片和視頻列表。(B.Thomee,DAShamma,G.Friedland等人)IISc - 孤立對象之間的相似性(IISc-DIO)?- 數據集在269個人類受試者上使用具有多樣化對象的視覺搜索任務進行的26,675次感知異常測量(RT Pramod&SP Arun,IISc)INRIA特征檢測器評估序列(Krystian Mikolajczyk)INRIA的PERCEPTION數據庫中的圖像和視頻采集了幾臺同步和校準的相機(INRIA Rhone-Alpes)圖像/視頻質量評估數據庫摘要(Stefan Winkler)用于立體聲,光學流和視覺測距的KITTI數據集(Geiger,Lenz,Urtasun)LFW-10數據集,用于學習相對屬性?- 具有10個屬性的實例級注釋的10,000對面部圖像的數據集(CVIT,IIIT Hyderabad。)來自地面LiDAR掃描的大規模3D點云數據(Andreas Nuechter)光場材料數據集?- 使用Lytro ILLUM攝像機拍攝的12種物質類別的1.2k注釋圖像(王廷俊,朱俊仁,Ebi Hiroaki,Manmohan Chandraker,Alexei Efros,Ravi Ramamoorthi)Linkoping滾動快門整流數據集(Per-Erik Forssen和Erik Ringaby)LIRIS-ACCEDE數據集?- 具有沿著情感維度(Technicolor)注釋的大內容多樣性的視頻摘錄集合MARIS波托菲諾數據集?- 水下立體圖像的數據集,描繪圓柱形管道物體并收集以測試物體檢測和姿態估計算法。(帕爾馬大學RIMLab(機器人與智能機器實驗室))MPI Sintel流量數據集來自開源3D動畫短片Sintel的光流評估數據集。它已被擴展為立體聲和差距,深度和相機運動,以及細分。(馬克斯·普朗克·圖賓根)MPI-Sintel光流評估數據集(Michael Black)MSR-VTT?- 視頻到200K +視頻剪輯/句子對的文本數據庫米德爾伯勒大學立體視覺研究數據集(丹尼爾·沙爾斯坦和理查德·西策斯基)2D橢圓形圖案的建模?- 他的數據集包含標準和家庭數據集中的4,526個2D形狀(Costas Panagiotakis和Antonis Argyros)Multi-FoV?- 逼真逼真的視頻序列,可以將相機的視場(FoV)對各種視覺任務的影響進行基準測試。(Zhang,Rebecq,Forster,Scaramuzza)多視覺立體聲評估?- 每個數據集通過激光掃描過程獲得的“地面真相”3D模型進行注冊(Steve Seitz等)具有激光基礎的多視點立體圖像(ESAT-PSI / VISICS,FGAN-FOM,EPFL / IC / ISIM / CVLab)NCI癌癥圖像存檔?- 前列腺圖像(國家癌癥研究所)NIST 3D興趣點檢測(Helin Dutagaci,Afzal Godil)NRCS自然資源/農業形象數據庫(USDA自然資源保護局)對象去除?- 使用合成光流的密集立體視覺場景映射的廣義動態對象去除 - 評估數據集(Hamilton,OK,Breckon,Toby P.)閉塞檢測測試數據(Andrew Stein)OSIE - 對象和語義圖像和眼睛跟蹤?- 700圖像,5551分割對象,眼睛跟蹤數據(徐,江,王,Kankanhalli,趙)OTIS:打開湍流圖像集?- 通過湍流氣氛進行長距離成像的幾個序列(靜態或動態)(Jerome Gilles,Nicholas B. Ferrante)PHOS(照明不變數據集)?- 在不同照明條件下拍攝的15個場景* 15張圖像(Vassilios Vonikakis)PRINTART:著名繪畫作品的藝術形象,包括細節注釋。ECCV發布了使用此數據庫進行自動注釋和檢索任務的基準。(Nuno Miguel Pinho da Silva)Pics’n’Trails - 連續存檔的GPS和數碼照片的數據集(Gamhewage Chaminda de Silva)RAWSEEDS SLAM基準數據集(Rawseeds Project)ROMA(ROAD MArkings):用于道路標記提取算法評估的圖像數據庫(Jean-Philippe Tarel,et al)機器人3D掃描存儲庫?- 來自機器人實驗的3D點云(Osnabruck和Jacobs大學)滾動快門整流數據集?- 從手持裝置整理卷簾快門視頻(Per-Erik等)SALICON?- 上下文眼睛跟蹤數據集中的顯著性c。80個圖像類中有1000個具有眼睛跟蹤數據的圖像(Jiang,Huang,Duan,Zhao)SIDIRE:用于照明穩健性評估的合成圖像數據集 - SIDIRE是一個免費提供的圖像數據集,提供綜合生成的圖像,可以調查照明變化對物體外觀的影響(Sebastian Zambanini)Scripps浮游生物相機系統?- 數千張圖像。50類浮游生物和其他小型海洋物體(Jaffe等人)石溪大學實境雜波數據集(SBU-RwC90)?- 人類排名不同等級的圖像(陳平平,Dimitris Samaras,Gregory Zelinsky)解卷積網絡的街景變化檢測?- 具有結構,照明,天氣和季節變化的街景圖像對齊圖像對的數據庫(Pablo F. Alcantarilla,Simon Stent,德國Ros,Roberto Arroyo和Riccardo Gherardi)悉尼房屋?- 具有準確3D房屋形狀,門面對象標簽,密點對應和注釋工具箱的街景房屋圖像(Hang Chu,Shenlong Wang,Raquel Urtasun,Sanja Fidler)Technicolor有趣的數據集?- 電影摘錄和關鍵幀的集合,以及基于分類成有趣和非有趣的樣本(Technicolor)的相應的地面實況文件。Technicolor Hannah數據集?- 從“Hannah和她的姐妹”電影153,525幀,為幾種類型的音頻和視覺信息(Technicolor)注釋,Technicolor HR-EEG4EMO數據集?- 在觀看中性和情感視頻(Technicolor)期間收集的40個受試者的腦電圖和其他生理記錄Technicolor VSD暴力場景數據集?- 基于提取電影中暴力事件的地面實況文件的集合(Technicolor)TGIF?- 來自Tumblr和120K自然語言描述的動畫GIF(Li,Song,Cao,Tetreault,Goldberg,Jaimes,Luo)TMAGIC數據集?- 視覺跟蹤的幾個視頻序列,包含強大的飛機外旋轉(Lebeda,Hadfield,Bowden)TUM RGB-D基準?- 用于評估RGB-D視覺測距和SLAM算法的數據集和基準(BCrgen Sturm,Nikolas Engelhard,Felix Endres,Wolfram Burgard和Daniel Cremers)沖突升級決議(CONFER)數據庫?- 來自電視政治辯論的自然主義互動的120個視聽劇集(?142分鐘),在實際沖突強度方面逐幀加注。(Christos Georgakis,Yannis Panagakis,Stefanos Zafeiriou,Maja Pantic)開放視頻項目(Gary Marchionini,Barbara M. Wildemuth,Gary Geisler,Yaxiao Song)圖盧茲消失點數據集?- 用于消失點估計的曼哈頓場景數據集,還為每個圖像提供了相機方向的IMU數據(Vincent Angladon和Simone Gasparini)UCL地面真相光流數據集(Oisin Mac Aodha)熱那亞大學差異和光流評估數據集(Manuela Chessa)神經網絡系統的驗證與驗證(Francesco Vivarelli)非常長的基線干涉圖像重建數據集(MIT CSAIL)虛擬KITTI?- 從五個不同的虛擬世界生成的?40個高分辨率視頻(17,008幀),用于:對象檢測和多對象跟蹤,場景級和實例級語義分割,光流和深度估計(Gaidon,Wang, Cabon,Vig)視覺對象跟蹤挑戰?- 這個挑戰每年作為ICCV / ECCV研討會舉行,每年都有一個新的數據集和更新的評估套件(Kristan等人)世界衛生組織 - 浮游生物?- 350萬個顯微鏡海洋浮游生物的圖像(奧爾森,索西克)WILD:天氣和虛擬數據庫(S. Narasimhan,C. Wang。S. Nayar,D. Stolyarov,K. Garg,Y. Schechner,H. Peri)YACCLAB數據集?- YACCLAB數據集包括合成和實際二進制圖像(Grana,Costantino; Bolelli,Federico; Baraldi,Lorenzo; Vezzani,Roberto)YtLongTrack?- 此數據集包含兩個視頻序列,具有質量低,極限長度和完全遮擋等挑戰,包括手動注釋的每幀姿勢(Lebeda,Hadfield,Matas,Bowden)
致謝:非常感謝所有貢獻者對數據庫的建議。
                            總結
                            
                                以上是生活随笔為你收集整理的各种数据集链接的全部內容,希望文章能夠幫你解決所遇到的問題。
                            
                            
                                如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。