CVPR2019 | 目标检测新文:Generalized Intersection over Union
鏈接 | https://mp.weixin.qq.com/s/6QsyYtEVjavoLfU_lQF1pw
作者 | ywsun
原文| https://zhuanlan.zhihu.com/p/57863810
如有興趣可以**點擊加入極市CV專業微信群**,獲取更多高質量干貨
論文鏈接
https://arxiv.org/abs/1902.09630
1.Motivation
包圍框回歸是2D/3D 視覺任務中一個最基礎的模塊,不管是目標檢測,目標跟蹤,還是實例分割,都依賴于對bounding box進行回歸,以獲得準確的定位效果。目前基于深度學習的方法想獲得更好的檢測性能,要么是用更好的backbone,要么是設計更好的策略提取更好的feature,然而卻忽視了bounding box regression中L1、L2 loss這個可以提升的點。
IoU是目標檢測中一個重要的概念,在anchor-based的方法中,他的作用不僅用來確定正樣本和負樣本,還可以用來評價輸出框(predict box)和ground-truth的距離,或者說predict box的準確性。IoU有一個好的特性就是對尺度不敏感(scale invariant)。
在regression任務中,判斷predict box和gt的距離最直接的指標就是IoU,但所采用的loss卻不適合,如圖所示,在loss相同的情況下,regression的效果卻大不相同,也就是說loss沒有體現出regression的效果,而IoU卻可以根據不同的情況得到不同的數值,能最直接反應回歸效果。
2.Method
因此本文提出用IoU這個直接的指標來指導回歸任務的學習。與其用一個代理的損失函數來監督學習,不如直接用指標本身來的好。此時損失函數為:
但直接用IoU作為損失函數會出現兩個問題:
如果兩個框沒有相交,根據定義,IoU=0,不能反映兩者的距離大小(重合度)。同時因為loss=0,沒有梯度回傳,無法進行學習訓練。
IoU無法精確的反映兩者的重合度大小。如下圖所示,三種情況IoU都相等,但看得出來他們的重合度是不一樣的,左邊的圖回歸的效果最好,右邊的最差。
針對IoU上述兩個缺點,本文提出一個新的指標generalized IoU(GIoU):
GIoU的定義很簡單,就是先計算兩個框的最小閉包區域面積,再計算IoU,再計算閉包區域中不屬于兩個框的區域占閉包區域的比重,最后用IoU減去這個比重得到GIoU。GIoU有如下4個特點:
-
與IoU相似,GIoU也是一種距離度量,作為損失函數的話,
,滿足損失函數的基本要求 -
GIoU對scale不敏感
-
GIoU是IoU的下界,在兩個框無線重合的情況下,IoU=GIoU
-
IoU取值[0,1],但GIoU有對稱區間,取值范圍[-1,1]。在兩者重合的時候取最大值1,在兩者無交集且無限遠的時候取最小值-1,因此GIoU是一個非常好的距離度量指標。
-
與IoU只關注重疊區域不同,GIoU不僅關注重疊區域,還關注其他的非重合區域,能更好的反映兩者的重合度。
其實GIoU不僅定義簡單,在2D目標檢測中計算方式也很簡單,計算重合區域和IoU一樣,計算最小閉包區域只需要得到兩者max和min坐標,坐標圍城的矩形就是最小閉包區域。
GIoU和IoU作為loss的算法如下所示: 
步驟:
-
分別計算gt和predict box的面積
-
計算intersection的面積
-
計算最小閉包區域面積
-
計算IoU和GIoU
-
根據公式得到loss
3.Experiments
GIoU loss可以替換掉大多數目標檢測算法中bounding box regression,本文選取了Faster R-CNN、Mask R-CNN和YOLO v3 三個方法驗證GIoU loss的效果。實驗在Pascal VOC和MS COCO數據集上進行。
實驗效果如下:
可以看出YOLOv3在COCO上有明顯漲點,但在其他模型下漲點并不明顯,作者也指出了faster rcnn和mask rcnn效果不明顯的原因是anchor很密,GIoU發揮作用的情況并不多。
總體來說,文章的motivation比較好,指出用L1、L2作為regression損失函數的缺點,以及用直接指標IoU作為損失函數的缺陷性,提出新的metric來代替L1、L2損失函數,從而提升regression效果,想法簡單粗暴,但work的場景有很大局限性。
**相關文章**
https://blog.csdn.net/Extremevision/article/details/86681531 https://blog.csdn.net/Extremevision/article/details/87937468 與50位技術專家面對面20年技術見證,附贈技術全景圖
總結
以上是生活随笔為你收集整理的CVPR2019 | 目标检测新文:Generalized Intersection over Union的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CVPR2019 大会信息即时跟进(附C
- 下一篇: [CVPR2019]:专门为卷积神经网络