图像数据集转载
使用的數據集
THCHS30是Dong Wang, Xuewei Zhang, Zhiyong Zhang這幾位大神發布的開放語音數據集,可用于開發中文語音識別系統。
為了感謝這幾位大神,我是跪在電腦前寫的本帖代碼。
下載中文語音數據集(5G+):
?
| 1 2 3 4 5 6 7 | $?wget?http://data.cslt.org/thchs30/zip/wav.tgz $?wget?http://data.cslt.org/thchs30/zip/doc.tgz $?wget?http://data.cslt.org/thchs30/zip/lm.tgz # 解壓 $?tar?xvf?wav.tgz $?tar?xvf?doc.tgz $?tar?xvf?lm.tgz |
在開始之前,先好好檢視一下數據集。
訓練
?
金融
美國勞工部統計局官方發布數據
滬深股票除權除息、配股增發全量數據,截止 2016.12.31
上證主板日線數據,截止 2017.05.05,原始價、前復權價、后復權價,1260支股票
深證主板日線數據,截止 2017.05.05,原始價、前復權價、后復權價,466支股票
深證中小板日線數據,截止 2017.05.05,原始價、前復權價、后復權價,852支股票
深證創業板日線數據,截止 2017.05.05,原始價、前復權價、后復權價,636支股票
上證A股日線數據,1999.12.09 至 2016.06.08,前復權,1095支股票
深證A股日線數據,1999.12.09 至 2016.06.08,前復權,1766支股票
深證創業板日線數據,1999.12.09 至 2016.06.08,前復權,510支股票
MT4平臺外匯交易歷史數據
Forex平臺外匯交易歷史數據幾組外匯交易逐筆(Ticks)數據
美國股票新聞數據【Kaggle數據】
美國醫療保險市場數據【Kaggle數據】
美國金融客戶投訴數據【Kaggle數據】
Lending Club 網貸違約數據【Kaggle數據】
信用卡欺詐數據【Kaggle 數據】
美國股票數據XBRL【Kaggle數據】
紐約股票交易所數據【Kaggle數據】
貸款違約預測競賽數據【Kaggle競賽】
Zillow 網站房地產價值預測競賽數據【Kaggle競賽】
Sberbank 俄羅斯房地產價值預測競賽數據【Kaggle競賽】
Homesite 保險定價競賽數據【Kaggle競賽】
Winton 股票回報率預測競賽數據【Kaggle競賽】
交通
2013年紐約出租車行駛數據
2013年芝加哥出租車行駛數據
Udacity自動駕駛數據
紐約 Uber 接客數據 【Kaggle數據】
英國車禍數據(2005-2015)【Kaagle數據】
芝加哥汽車超速數據【Kaggle數據】
KITTI 自動駕駛任務數據【數據太大僅有部分】
Cityscapes 場景標注數據【數據太大僅有部分】
德國交通標志識別數據
交通信號識別數據
芝加哥Divvy共享自行車騎行數據(2013年至今)
美國查塔努加市共享單車騎行數據
Capital 共享單車騎行數據
Bay Area 共享單車騎行數據
Nice Ride 共享單車騎行數據
花旗銀行共享單車騎行數據
運用衛星數據跟蹤亞馬遜熱帶雨林中的人類軌跡競賽【Kaggle競賽】
紐約出租車管理委員會官方的乘車數據(2009年-2016年)
商業
Airbnb 開放的民宿信息和住客評論數據
Amazon 食品評論數據【Kaggle數據】
Amazon 無鎖手機評論數據【Kaggle數據】
美國視頻游戲銷售和評價數據【Kaggle數據】
Kaggle 各項競賽情況數據【Kaggle數據】
Bosch 生產流水線降低次品率競賽數據【Kaggle競賽】
預測公寓租金競賽數據
廣告點擊預測競賽數據
餐廳營業收入預測建模競賽
銀行產品推薦競賽數據
網站用戶推薦點擊預測競賽數據
在線廣告實時競價數據【Kaggle數據】
購物車商品關聯競賽數據【Kaggle競賽】
Airbnb 新用戶的民宿預定預測競賽數據【Kaggle競賽】
推薦系統
Netflix 電影評價數據
MovieLens 20m 電影推薦數據集
WikiLens
Jester
HetRec2011
Book Crossing
Large Movie Review
Retailrocket 商品評論和推薦數據
醫療健康
人識別物體時大腦核磁共振影像數據
人理解單詞時大腦核磁共振影像數據
心臟病心房圖像及標注數據
細胞病理識別
FIRE 視網膜眼底病變圖像數據
食物營養成分數據 【Kaggle數據】
EGG 大腦電波形狀數據【Kaggle數據】
某人基因序列數據【Kaggle數據】
癌癥CT影像數據【Kaggle數據】
軟組織肉瘤CT圖像數據【Kaggle數據】
美國國家健康與服務部-國家癌癥研究所發起的癌癥數據倉庫介紹【僅有介紹】
Data Science Bowl 2017 肺癌識別競賽數據【數據太大僅有介紹】
TCGA-LUAD 肺癌CT圖像數據
RIDER Lung CT 肺癌CT影像
TCGA-COAD癌癥CT影像數據
TCIA-TCGA-OV 癌癥CT影像數據
TCIA RIDER NEURO 癌癥MRI影像數據
QIN Beast 乳腺癌MRI影像數據
圖像數據
綜合圖像
Visual Genome 圖像數據
Visual7w 圖像數據
COCO 圖像數據
SUFR 圖像數據
ILSVRC 2014 訓練數據(ImageNet的一部分)
PASCAL Visual Object Classes 2012 圖像數據
PASCAL Visual Object Classes 2011 圖像數據
PASCAL Visual Object Classes 2010 圖像數據
80 Million Tiny Image 圖像數據【數據太大僅有介紹】
ImageNet【數據太大僅有介紹】
Google Open Images【數據太大僅有介紹】
場景圖像
Street Scences 圖像數據
Places2 場景圖像數據
UCF Google Street View 圖像數據
SUN 場景圖像數據
The Celebrity in Places 圖像數據
Web標簽圖像
HARRISON 社交標簽圖像
NUS-WIDE 標簽圖像
Visual Synset 標簽圖像
Animals With Attributes 標簽圖像
人形輪廓圖像
MPII Human Shape人體輪廓數據
Biwi Kinect Head Pose 頭部姿勢數據
上半身人像數據
INRIA Person 數據集
視覺文字識別圖像
Street View House Number 門牌號圖像數據
MNIST 手寫數字識別圖像數據
3D MNIST 數字識別圖像數據【Kaggle數據】
MediaTeam Document 文檔影印和內容數據
Text Recognition 文字圖像數據
NIST Handprinted Forms and Characters 手寫英文字符數據
NIST Structured Forms Reference Set of Binary Images(SFRS) 圖像數據
NIST Structured Forms Reference Set of Binary Images(SFRS) II 圖像數據
特定一類事物圖像
著名的貓圖像標注數據
Caltech-UCSDBirds200 鳥類圖像數據
Stanford Car 汽車圖像數據
Cars 汽車圖像數據
MIT Cars 汽車圖像數據
Stanford Cars 汽車圖像數據
Food-101 美食圖像數據
17_Category_Flower圖像數據
102_Category_Flower圖像數據
UCI Folio Leaf 圖像數據
Labeled Fishesin the Wild 魚類圖像
美國 Yelp 點評網站酒店照片
CMU-OxfordSculpture 塑像雕像圖像
Oxford-IIIT Pet 寵物圖像數據
NatureConservancy Fisheries Monitoring 過度捕撈監控圖像數據【Kaggle數據】
材質紋理圖像
CURET 紋理材質圖像數據
ETHZ Synthesizability 紋理圖像數據
KTH-TIPS 紋理材質圖像數據
Describable Textures 紋理圖像數據
物體分類圖像
COIL-20 圖像數據
COIL-100 圖像數據
Caltech-101 圖像數據
Caltech-256 圖像數據
CIFAR-10 圖像數據
CIFAR-100 圖像數據
STL-10 圖像數據
LabelMe_12_50k圖像數據
NORB v1.0 圖像數據
NEC Toy Animal 圖像數據
iCubWorld 圖像分類數據
Multi-class 圖像分類數據
GRAZ 圖像分類數據
人臉圖像
IMDB-WIKI 500k+ 人臉圖像、年齡性別數據
Labeled Faces in the Wild 人臉數據
Extended Yale Face Database B 人臉數據
Bao Face 人臉數據
DC-IGN 論文人臉數據
300 Face in Wild 圖像數據
BioID Face 人臉數據
CMU Frontal Face Images
FDDB_Face Detection Data Set and BenchmarkNIST Mugshot Identification Database
Faces in the Wild 人臉數據
CelebA 名人人臉圖像數據
VGG Face 人臉圖像數據
Caltech 10k Web Faces 人臉圖像數據
姿勢動作圖像
HMDB_a large human motion database
Human Actions and Scenes Dataset
Buffy Stickmen V3 人體輪廓識別圖像數據
Human Pose Evaluator 人體輪廓識別圖像數據
Buffy pose 人類姿勢圖像數據
VGG Human Pose Estimation 姿勢圖像標注數據
指紋識別
NIST FIGS 指紋識別數據
NIST Supplemental Fingerprint Card Data (SFCD) 指紋識別數據
NIST Plain and Rolled Images from Paired Fingerprint Cardsin 500 pixels per inch 指紋識別數據
NIST Plain and Rolled Images from Paired Fingerprint Cards1000 pixels per inch 指紋識別數據
其它圖像數據
Visual Question Answering V1.0 圖像數據
Visual Question Answering V2.0 圖像數據
視頻數據
綜合視頻
DAVIS_Densely Annotated Video Segmentation 數據
YouTube-8M 視頻數據集【數據太大僅有介紹】
YouTube 網站視頻備份【數據太大僅有介紹】
人類動作視頻
Microsoft Research Action 人類動作視頻數據
UCF50 Action Recognition 動作識別數據
UCF101 Action Recognition 動作識別數據
UT-Interaction 人類動作視頻數據
UCF iPhone 運動中傳感器數據
UCF YouTube 人類動作視頻數據
UCF Sport 人類動作視頻數據
UCF-ARG 人類動作視頻數據
HMDB 人類動作視頻
HOLLYWOOD2 人類行為動作視頻數據
Recognition of human actions 動作視頻數據
Motion Capture 動作捕捉視頻數據
SBU Kinect Interaction 肢體動作視頻數據
?
目標檢測視頻
UCSD Pedestrian 行人視頻數據
Caltech Pedestrian 行人視頻數據
ETH 行人視頻數據
INRIA 行人視頻數據
TudBrussels 行人視頻數據
Daimler 行人視頻數據
ALOV++ 物體追蹤視頻數據
密集人群視頻
Crowd Counting 高密度人群圖像
Crowd Segmentation 高密度人群視頻數據
Tracking in High Density Crowds 高密度人群視頻
其它視頻
Fire Detection 視頻數據
音頻數據
綜合音頻
Google Audioset 音頻數據【數據太大僅有介紹】
語音識別
Sinhala TTS 英語語音識別
TIMIT 美式英語語音識別數據
LibriSpeech ASR corpus 語音數據
Room Impulse Response and Noise 語音數據
ALFFA 非洲語音數據
THUYG-20 維吾爾語語音數據
AMI Corpus 語音識別
自然語言處理
RCV1英語新聞數據
20news 英語新聞數據
First Quora Release Question Pairs 問答數據
JRC Names各國語言專有實體名稱
Multi-Domain Sentiment V2.0
LETOR 信息檢索數據
Yale Youtube Vedio Text斯坦福問答數據【Kaggle數據】
美國假新聞數據【Kaggle數據】
NIPS會議文章信息數據(1987-2016)【Kaggle數據】
2016年美國總統選舉辯論數據【Kaggle數據】
WikiLinks 跨文檔指代語料
European Parliament Proceedings Parallel Corpus 機器翻譯數據
WikiText 英語語義詞庫數據
WMT 2011 News Crawl 機器翻譯數據
Stanford Sentiment Treebank 詞匯數據
英語語言模型單詞預測競賽數據
社會數據
希拉里郵件門泄露郵件
波士頓Airbnb 公開數據【Kaggle數據】
世界各國經濟發展數據【Kaagle數據】
世界大學排名芝加哥犯罪數據(2001-2017)【Kaagle數據】
世界范圍顯著地震數據(1965-2016)【Kaagle數據】
美國嬰兒姓名數據【Kaagle數據】
全世界鯊魚襲擊人類數據【Kaagle數據】
1908年以來空難數據【Kaagle數據】
2016年美國總統大選數據【Kaagle數據】
2013年美國社區統計數據【Kaagle數據】
2014年美國社區統計數據【Kaagle數據】
2015年美國社區統計數據【Kaagle數據】
歐洲足球運動員賽事表現數據【Kaagle數據】
美國環境污染數據【Kaagle數據】
美國H1-B簽證申請數據【Kaggle數據】
IMDB五千部電影數據【Kaggle數據】
2015年航班延誤和取消數據【Kaggle數據】
兇殺案報告數據【Kaggle數據】
人力資源分析數據【Kaggle數據】
美國費城犯罪數據【Kaggle數據】
安然公司郵件數據【Kaggle數據】
歷史棒球數據【Kaggle數據】
美聯航 Twitter 用戶評論數據【Kaggle數據】
波士頓 Airbnb 公開數據【Kaggle數據】
芝加哥市2001年以來犯罪記錄數據
美國查塔努加市犯罪記錄數據(2003年至今)
芝加哥街邊咖啡廳季節中的人行道咖啡廳許可數據
芝加哥餐館衛生檢查結果數據
幾個人類運動位置路線GPS數據集(騎行、跑步等)
處理后的科研和競賽數據
NIPS 2003 屬性選擇競賽數據
臺灣大學林智仁教授處理為 LibSVM 格式的分類建模數據
Large-scale 分類建模數據
幾個UCI 中 large-scale 分類建模數據
Social ComputingData Repository 社交網絡數據
貓和狗分類識別競賽數據【Kaggle競賽】
DSTL 衛星圖像識別競賽數據【Kaggle競賽】
根據手機應用軟件使用行為預測用戶性別年齡競賽數據【Kaggle競賽】
人臉關鍵點標定競賽數據【Kaggle競賽】
Kaggle競賽數據合輯(部分競賽數據)
總結
- 上一篇: Python小白的数学建模课-B2. 新
- 下一篇: pcl从一个点云里面导出下标