Yolov5系列AI常见数据集(1)车辆,行人,自动驾驶,人脸,烟雾
下述所有數據可在下方二維碼公眾號回復: 數據大禮包 獲得!!!
Fashion-MNIST圖像數據集(200.4MB)
每個訓練和測試樣本都按照以下類別進行了標注:
| 0 | T-shirt/top(T恤) |
| 1 | Trouser(褲子) |
| 2 | Pullover(套衫) |
| 3 | Dress(裙子) |
| 4 | Coat(外套) |
| 5 | Sandal(涼鞋) |
| 6 | Shirt(汗衫) |
| 7 | Sneaker(運動鞋) |
| 8 | Bag(包) |
| 9 | Ankle boot(踝靴) |
CIFAR100數據集(161.3MB)
車輛數據集(車輛識別與分類)(62.5MB)
垃圾分類數據集
該數據集是圖片數據,分為訓練集85%(Train)和測試集15%(Test)。其中O代表Organic(有機垃圾),R代表Recycle(可回收)。
另一個垃圾分類數據集(40.9MB)
CIFAR10數據集(148MB)
GTSRB-德國交通標志識別圖像數據(253.3MB)
手勢識別數據庫(1.1GB)
提出了手勢識別數據庫,該數據庫由Leap Motion傳感器獲取的一組近紅外圖像組成。
數據說明
該數據庫由10個不同的手勢(如上所示)組成,這些手勢由10個不同的對象(5位男性和5位女性)執行。
情緒的面部表情(170MB+)
它是一個包含9名BPD(邊緣型人格障礙)患者的數據庫。
并非所有患者都接受了12次治療采訪。
所有患者都是女性。
治療干預的持續時間因訪談而異。
數據說明
我們根據Paul Ekman和David Matsumoto的理論分析了7種情緒(Happy,Sad,Angry,Surprised,Scared,Disgusted,Contempt)的面部表情。
從每位患者的每次治療訪談的視頻記錄中分析這些表達,每0.04秒分析一次,即每秒進行25次測量。
并非所有患者都能覆蓋所有12個訪談,但會議的年表按照對治療的幫助順序出現。
因此,我們希望看到的是這些患者的適應力或情緒調節。
中性對Contemp的情緒在0到1的強度中被評估。
情緒效價從0到1被評估為正面情緒,0到-1是負面情緒。喚醒評估從0到1。
槍支目標檢測(2.4MB)
一共有333張圖像,對于每張圖像,都標注了其中槍支的所在位置。圖像不是單一尺寸的,它們有不同的長寬大小。值得注意的是,一張圖像里面可能有不止一把槍支!
數據來源
數據收集基于來自flickr,google圖像和yandex圖像的抓取數據。
人臉圖像數據(294.1MB)
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-4k5GGey7-1603543383804)(https://cdn.kesci.com/upload/image/pzgl9tukkd.png)]
RMFD口罩遮擋人臉數據集(610.3MB)
中國交警手勢數據集(1.8GB)
數據已劃分為訓練集和測試集,每個文件夾包含多個視頻和csv文件;
視頻里展示了中國交警的各種手勢動作,同一序號名稱的csv文件則對應了每幀視頻交警的動作標簽
場景分類數據集(105.9MB)
87種寶石圖片數據(50.9MB)
驗證碼數據集(13.5MB)
硬幣圖像數據集(326.7MB)
LabelMe圖像語義分割數據集(102.6MB)
數據集包含945張圖片,圖片已經注釋了天空,建筑物,道路,人行道,植被,窗戶,門和汽車等的標簽信息,用于語義圖像分割任務。
車牌識別數據集(62.8MB)
Biwi頭姿勢數據庫(449.7MB)
數據集包含945張圖片,圖片已經注釋了天空,建筑物,道路,人行道,植被,窗戶,門和汽車等的標簽信息,用于語義圖像分割任務。
動物
Butterfly-200細粒度圖像分類數據集(828MB)
數據集包含25,279張蝴蝶🦋圖像,涵蓋200個物種,116屬,23個亞科和5個科的四個不同級別,用于細粒度圖像分類研究
寵物圖像數據集(783.5MB)
狗狗種類圖像數據集(919.5MB)
黑猩猩圖片數據集(604.4MB)
植物:
水稻葉子疾病圖片集(36.7MB)
水稻葉子的三種疾病,即Bacterial leaf blight, Brown spot, and Leaf smut。
植物幼苗圖片數據集
花卉識別數據集(224.9MB)
花卉圖像分類
可食用野外植物數據集
葉片計數圖像數據集(882.3MB)
氣象:
颶風損害的衛星圖像數據集(63MB)
從衛星圖像理解云層數據集(42MB)
字符識別:
TibetanMNIST藏文手寫數字數據集(53.2MB)
MNIST手寫識別數據集(9.5MB)
Chars74K字符識別數據集(188.3MB)
信用卡卡面圖像及標注數據(42.9MB)
卡片是信用卡的重要載體,我們希望能夠通過拍照卡片來識別卡片上的信息。
本次競賽希望參賽者獨立設計模型,在拍照的卡面上識別卡面信息, 具體包括如下幾點:
手寫數學表達式識別(29MB)
CROHME,一個在線手寫數學表達識別競賽。本數據集提供了來自CROHME 2011、2012和2013競賽的訓練和測試數據
圖片與單詞匹配數據集(31.1MB)
密集不規則文本行數據集(353MB)
視覺文字識別數據集
HASY手寫符號圖片數據集(127.2MB)
麻將圖片數據集(7.5MB)
醫療:
犬球蟲病寄生蟲圖片集(18.1MB)
包含犬球蟲病寄生蟲的近350張圖片,識別他們!
頭部CT圖像數據(24.4MB)
該數據集包含100個正常頭部CT切片和100個頭部其他出血的CT切片
肺部CT圖像數據(529.0MB)
LUNA和2017年Kaggle數據科學碗等競賽涉及處理并試圖找到肺部CT圖像中的病變。
為了很好地發現這些圖像中的疾病,首先要很好地找到肺部是很重要的。
該數據集是具有手動分割的肺的2D和3D圖像的集合。
心血管疾病預測(2.7MB)
深圳醫院胸片檢查掩膜圖片數據集(19.8MB)
該數據集包含人工分割的肺部圖像掩膜,在我們最近的論文中使用該肺部圖像掩膜來描述肺分割技術,結合無損和有損數據增強功能,使我們能夠在如此小的數據集(<1000張圖像)上獲得統計上可靠的預測。
肺部CT圖像數據(529MB)
結核病圖像數據集(456.8MB)
該數據集全部與結核有關,取自痰液樣本。
它包含928個痰液圖像以及3734個細菌的邊界框。XML文件包含圖像的邊界框詳細信息。參見示例圖片:
行人識別:
行人檢測數據集ETHZ(146MB)
行人重識別數據集Market-1501(145.7MB)
該數據集包括了1501個行人,751個行人用于訓練,有750個人用于測試,共有3368個圖像。 測試集中有19732張圖像,訓練集中有12936張圖像。
行人重識別數據集RAiD(140.1MB)
行人重識別數據集prid_2011(1015.3MB)
汽車后視攝像頭視角行人數據集(799.7MB)
數據集包含15個拍攝時段,每個拍攝時段在不同的日子以不同的場景進行。每個會話包含多個剪輯,持續時間從幾秒鐘到幾分鐘不等。數據集總共包含250個剪輯,總時長為76分鐘,并帶有超過20萬個帶注釋的行人邊界框。
兩種類型的session。分階段進行的場景主要包括行人以可控的方式在攝像機前的不同位置和方向行走,跨越后方警報或制動汽車功能的不同用例。在其余的時段中,車輛在公共道路或停車場中行駛,并捕獲了偶然的行人。不同的位置包括:室內停車場,室外鋪砌/沙地停車場,城市道路和私人車道。我們在不同的天氣和光照條件下拍攝白天和黑夜的場景。有
——語音大類——
Mozilla語音數據集-中文(358.2MB)
2000個英語讀數字的錄音(8.9MB)
上述所有數據可在下方二維碼公眾號回復: 數據大禮包獲得!!!
所有的數據,在下面二維碼掃碼關注就能免費領取~
一 [NLP] 50萬閑聊語料
公眾號回復:閑聊
二 密集人群檢測
公眾號回復:密集人群檢測
三疲勞駕駛數據集
公眾號回復:pilao
四 文本生成與文本分類數據集
公眾號回復:文本生成
五 實體命名識別
公眾號回復:實體命名識別
六 人臉識別
公眾號回復:人臉識別
七 車牌數據集
公眾號回復:車牌
八 自動駕駛數據集
公眾號回復:自動駕駛
九 異常行為數據集
公眾號回復:異常行為
十 人臉關鍵點檢測
公眾號回復:人臉關鍵點檢測
十一 高空車輛數據集
公眾號回復:高空車輛
十二 安全帽+頭盔+算法
公眾號回復:頭盔
十三 吸煙手勢
公眾號回復:吸煙手勢
十四 香煙數據+算法
公眾號回復:香煙
十五 10萬煙霧數火災數據
公眾號回復:煙霧
十六 十萬口罩數據集
公眾號回復:口罩
十七 車道線數據
公眾號回復:車道線
十八 車輛識別數據+模型
公眾號回復:車輛識別
十九 車輛檢測數據集
公眾號回復:車輛檢測
二十 無人機檢測
公眾號回復:無人機
二十一 X光安檢
公眾號回復:安檢
二十二 【語音識別】嬰兒啼哭
公眾號回復:嬰兒啼哭
二十三 老鼠檢測
公眾號回復:老鼠檢測
二十四 工業缺陷檢測
包含:紡織布缺陷檢測;
? 金屬鋼板缺陷檢測;
? 混凝土缺陷檢測;
? PCB板缺陷檢測;
? 太陽能板缺陷檢測;
等等
公眾號回復:工業缺陷檢測
二十五 交通卡口 車輛計數
公眾號回復:車輛計數
二十六 電動車
公眾號回復:電動車
二十七 醫療ct
公眾號回復醫療ct
二十八 YOLOv3 口罩檢測
公眾號回復:v3口罩
二十九 漂流物檢測
公眾號回復:漂流物
三十 昆蟲檢測
公眾號回復:昆蟲
**三十一 點贊關注轉發~
總結
以上是生活随笔為你收集整理的Yolov5系列AI常见数据集(1)车辆,行人,自动驾驶,人脸,烟雾的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python 大数据分析 淘宝商品销量的
- 下一篇: Python操作excel(.xlsx)