「Self-driving: KITTI」KITTI数据集简介
背景
KITTI數據集建立前,前人的實驗在米德爾伯里等既定基準上排名靠前的方法在從實驗室轉移到現實世界時表現低于平均水平。 除了向社區提供具現實世界數據以減少實驗偏差,KITTI在補充現有基準的情況下,形成了一個新穎且具有挑戰性的計算機視覺基準。
KITTI數據集涵蓋的任務包括:立體視覺、光流、視覺里程計量、3D目標檢測和3D跟蹤。使用的傳感器包括:兩個高分辨率彩色相機和灰度視頻相機、激光雷達、GPS系統。KITTI在中型城市卡爾斯魯厄、農村地區和高速公路上行駛中收集。 每張圖像最多可以看到 15 輛汽車和 30 名行人。
除了提供原始格式的所有數據,KITTI還為每個任務提供了基準。 對于每個基準還提供了一個評估指標和評估網站。
KITTI數據集任務分類
- 立體
- 光流
- 場景流
- 深度
- 里程計量
- 目標檢測
- 跟蹤
- 道路
- 語義
傳感器配置細節
- GPS/IMU: OXTS RT 3003
- Lidar: Velodyne HDL-64E
- 灰度相機(1.4 Megapixels): Point Grey Flea 2 (FL2-14S3M-C)
- 彩色相機(1.4 Megapixels): Point Grey Flea 2 (FL2-14S3C-C)
- 各式鏡頭(4-8 mm): Edmund Optics NT59-917
其中,激光雷達的頻率為10幀/秒,每次循環大約捕捉100k個點,水平像素為64,點云數據格式是在激光雷達坐標系下的(x, y, z, ρ)分別表示點在激光雷達坐標下的坐標(x, y, z)和點的反射強度,;相機安裝在與地平面大致水平,使用libdc’s 格式、模式7對相機圖像剪裁成1382x512,由于修正的原因使得圖像略小;相機快門時間最快2ms,且使用激光雷達觸發相機拍攝,因此相機頻率與激光雷達頻率持平。
整個傳感器的部署和各傳感器坐標系朝向如下圖:
3D目標檢測
可用數據
整個3D目標檢測基準包括7481張訓練圖像和7518張測試圖像,以及其各自對應的點云數據。這些圖像中一共包含了80256個已標注的目標對象。在評估方面,數據集計算的是準確度-召回率的曲線,此外,為了對各個方法進行排名,還計算了平均準確率。
可供下載的數據包括:
評估細節
其中,對3D目標檢測性能評估,使用的是PASCAL用于2D目標檢測的標準
遠距離目標檢測結果根據bbox在圖像上的高度進行過濾;只要目標出現在圖像中并被標注,那么目標在dont car區域不會被標注為假正例。評估方法并不關心圖像上沒有出現而被忽略掉的檢測結果,因為這些檢測結果可能提高假正例的數量。
對于汽車的3D檢測,要求重疊率超過70%,而對于行人和自行車騎手則指要求bbox重疊超過50%。根據程度劃分為三類:
- 簡單類:bbox最小高度為40像素,最大重疊范圍:完全可見,最大截斷比例為15%
- 中等類:bbox最小高度為25像素,最大重疊范圍:部分可見,最大截斷比例為30%
- 困難類:bbox最小高度為25像素,最大重疊范圍:不容察覺,最大截斷比例為50%
檢測類別
- 汽車
- 行人
- 自行車手
總結
以上是生活随笔為你收集整理的「Self-driving: KITTI」KITTI数据集简介的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 双向高压油流可能导致全开的高压手动球阀开
- 下一篇: 海信5G中央空调如何解决新居装修除甲醛问