當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

阿波罗数据集怎么下载_从2D images 到3D估计：现有最大规模数据集 ApolloCar3D

發布時間：2024/10/12 编程问答 29 豆豆

生活随笔收集整理的這篇文章主要介紹了阿波罗数据集怎么下载_从2D images 到3D估计：现有最大规模数据集 ApolloCar3D 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

任務：給定2D圖像，給出檢測車輛的3D屬性(距離，旋轉，外形)

貢獻分為3方面：

1)20× larger than PASCAL3D+ and KITTI，5, 277 images， 60K instances

2)實現了2個baseline的算法，基本步驟分為兩部：1. 用預訓練的Mask R-CNN分割car；2.回歸其3D的pose與形狀(根據使用或者不使用語義關鍵點分為兩套方案)

3)提出了同時考慮3D的pose和shape的metric

現有的具有3D instances的datasets對比:

注意作者在構建數據集的3D keypoint的groundtruth的時候，采用了一些優化輔助，對于足夠利用關鍵點回歸出的車僅使用PnP loss，但對于遮擋較大的車(關鍵點不足以得到準確的回歸)新增loss以校準，該loss的定義原則就是和附近估計比較準確的車輛的一些位姿量盡可能接近，如roll角度分量(假設靠近的車地面起伏很小)。后續還需要人工最終修正調整確認。

該數據集使用了非常豐富的關鍵點(多達66個)，如圖所示：

但個人感覺似乎從實用的角度來講，可能不太需要那么多的關鍵點；同時對于任意異形車，關鍵點基本都是失效的，所以過多的關鍵點略微顯得有那么些吃力不討好。

整體兩套baseline的方案基于3D-RCNN以及DeepMANTA，主要創新有：

1) 全像素回歸pose和shape

2) 引入self-attention機制

3)之前提到的利用附近車輛輔助被遮擋車輛的估計

在評價metric中，作者將threshold擴展為shape，translation，rotation三者的聯合判定，注意shape部分是將3D投影回2D進行IoU計算的：

并取多種閾值進行組合進行指標評估：

最后給出2個baseline可視化的對比：

下面坐等dataset release~

update------------------------------------20190319

向作者問到了數據集的位置，動起手來~：

總結

以上是生活随笔為你收集整理的阿波罗数据集怎么下载_从2D images 到3D估计：现有最大规模数据集 ApolloCar3D的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

阿波罗数据集怎么下载_从2D images 到3D估计：现有最大规模数据集 ApolloCar3D

總結