AVOD-理解系列(二)
AVOD理解
4:RPN->Fusion
RPN:
從RPN得到的輸出top_anchors,ground_plane,class_label等作為AVOD檢測部分網絡的輸入.將top_anchors投影到BEV面,得到其的坐標(x1,z1,x2,z2),再交換坐標為(z1,x1,z2,x2);讀取圖像上的2D框的信息.根據原始的feature map選擇mask確定輸入
ROI_pooling:
根據初始的feature map以及RPN后的top_anchors信息,進行crop_and_resize,生成7*7的bev_rois,img_rois
Fusion
融合網絡被與后面的全連接網絡放到了一起.
5:Fusion->fully connection
Layers:
根據config文件,設置layers,輸入bev_rois, img_rois, input_weights(bev_mask,img_mask),class,top_anchors.
Fully connection
代碼全連接部分.
Output:
Classification:預測的分類,背景/車
**Offsets:**10個回歸值,3D-boxes的底面的四個坐標(不涉及高度)以及代表高度的兩個h.一個是地面與地平面的距離,一個是頂面與地平線的距離.
**Angle_vector:**2,用于計算方向的兩個值
6:NMS
Prediction:
Prediction_box_4c:是top_anchors在一些變換,(anchors->box3d([N,7]->box4c[N,10]->box4c+offset[N,10]
->box3d[N,7]),為了進行NMS,[N,7]->[N,6],在投影到bev平面上,找出預測分類的最大的得分作為gt,以0.01作為閾值,最大輸出100個結果.最后根據NMS選擇相應的篩選后的top_anchors,top_classification
7:Loss
總的loss是rpn + avod部分,訓練時一起訓練.
代碼的大致流程結束,整理一下再把代碼額一些解析放上來.
總結
以上是生活随笔為你收集整理的AVOD-理解系列(二)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Infopath入门到精通系列-1 In
- 下一篇: Java-集合练习题(1)