一文多图搞懂KITTI检测数据集下载使用(附网盘链接)
文章目錄
- 前言
- 1 下載
- 2 說明
- 2.1 devkit_object
- 2.2 data_object_calib
- 2.3 data_object_label_2
- 2.4 data_object_image_2
- 2.5 data_object_velodyne
- 3 使用
- 相關傳送門
前言
KITTI 是自動駕駛領域最著名的數據集,本文不做科普,只講干貨!!!話不多說,進入正題,看完本文,你將得到網盤下載地址,數據集使用說明,足夠你復現別人的工作,進而開展自己的工作!
1 下載
如下圖,大家根據自己工作的需要,自行選擇要下載的內容,別急,馬上送上網盤鏈接
本文的最大福利來啦,以上數據集的網盤鏈接分享給大家,拿走不謝,好心人點個贊即可。
鏈接:https://pan.baidu.com/s/1oc1hzIEer3MNeV6gHR2OTA
提取碼:qifd
2 說明
本節給大家解讀一下我們下載的數據。
2.1 devkit_object
目錄結構如下
devkit_object ├── cpp ├── mapping ├── matlab └── readme.txt這是 KITTI 官方提供的開發套件以及使用說明,本文將取其精華,去其糟粕。
2.2 data_object_calib
目錄結構如下
data_object_calib ├── testing │ └── calib └── training└── calib這些文件夾分別存放著訓練集以及測試集每個樣本的標定數據,其中測試集7518個,訓練集7481個。
每個樣本的標定文件如下圖所示,此處坐標系轉換理論詳見【點云處理】坐標系轉換。
官方的 readme 也給出了說明:
To project a point from Velodyne coordinates into the left color image,
you can use this formula: x = P2 * R0_rect * Tr_velo_to_cam * y
For the right color image: x = P3 * R0_rect * Tr_velo_to_cam * y
顯然,從雷達坐標系轉到 2 號相機坐標系用到了 R(3x3的旋轉矩陣) 以及 T(3x1的平移矩陣)。
2.3 data_object_label_2
目錄結構如下
data_object_label_2 ├── training└── label_2這是標注文件,是的,你沒看錯,只有訓練集的標注,沒有測試集的,原因你懂的。
下圖是某樣本的標注文件,這里具體含義官方也給了說明:
注意:這里的 DontCare 標簽代表沒有標注的目標,原因可能是距離太遠已經超出激光雷達的檢測范圍了,沒有意義。此外,在 2D 與 3D Detection Benchmark 中只針對 Car,Pedestrain, Cyclist 這三類。
2.4 data_object_image_2
目錄結構如下
data_object_image_2 |── testing │ └── image_2 └── training └── image_2這是 RGB 數據,分為測試集與訓練集。
2.5 data_object_velodyne
這是激光雷達點云數據,點云數據被保存為二進制文件,每個點包含 3 個坐標和反射率信息,即 (x,y,z,r)。
3 使用
這必須依據你的工作需要,合理安排數據組織形式,這里提供一個 3D 檢測工作 F-PointNet 的數據組織形式。
data/kitti ├── testing │ ├── calib │ ├── image_2 │ └── velodyne └── training├── calib├── image_2├── label_2└── velodyne相關傳送門
計算機視覺工程師的萬里長征路(附完整學習資料)
陌生人,祝你數據集玩得愉快,效果都是 SOTA,點個贊再走唄。
總結
以上是生活随笔為你收集整理的一文多图搞懂KITTI检测数据集下载使用(附网盘链接)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 麻省理工科技评论:AI预言的七宗罪(上)
- 下一篇: 官宣!麻省理工学院官方线上课程之机器学习