maskrcnn用于目标检测_用于目标检测的池化渐进网络(Pooling Pyramid Network)
用于目標(biāo)檢測的池化漸進網(wǎng)絡(luò)(Pooling Pyramid Network)
題目:
Pooling Pyramid Network for Object Detection
作者:
Pengchong Jin, Vivek Rathod, Xiangxin Zhu
來源:
Machine Learning (cs.LG)
Submitted on 9 Jul 2018
文檔鏈接:
arXiv:1807.03284
代碼鏈接:
https://github.com/UKPLab/elmo-bilstm-cnn-crf
摘要
我們想分享一個簡單微調(diào)的單鏡頭多盒探測器(SSD),它能有效地減少模型尺寸,同時保持相同的性能。我們在所有的尺度上共享盒測器,并使用最大池替換尺度之間的卷積。與普通的SSD相比,它有兩個優(yōu)點:(1)它避免了跨尺度的分?jǐn)?shù)錯誤校準(zhǔn);(2)共享預(yù)測器可以看到所有級別的訓(xùn)練數(shù)據(jù)。由于我們將預(yù)測器的數(shù)量減少到一個,并對它們之間的所有卷積進行了修剪,因此模型的大小要小得多。我們的經(jīng)驗表明,相比,普通的SSD,這些變化并沒有損害模型的性能。
英文原文
We'd like to share a simple tweak of Single Shot Multibox Detector (SSD) family of detectors, which is effective in reducing model size while maintaining the same quality. We share box predictors across all scales, and replace convolution between scales with max pooling. This has two advantages over vanilla SSD: (1) it avoids score miscalibration across scales; (2) the shared predictor sees the training data over all scales. Since we reduce the number of predictors to one, and trim all convolutions between them, model size is significantly smaller. We empirically show that these changes do not hurt model quality compared to vanilla SSD.
要點
Pooling Pyramid Network (PPN)
該模型是一種單級卷積目標(biāo)檢測器,與傳統(tǒng)的SSD非常相似,只是做了一些簡單的改變。該預(yù)測頭被設(shè)計成重量輕,運行速度快,同時保持與普通SSD相當(dāng)?shù)臋z測精度。網(wǎng)絡(luò)體系結(jié)構(gòu)如圖1所示。
圖1所示。池金字塔網(wǎng)絡(luò)(PPN)與普通SSD的體系結(jié)構(gòu)比較。左:香草SSD,右:PPN。注意,PPN中的變化是突出顯示的:(1)使用max pool構(gòu)建特征金字塔,(2)使用共享卷積預(yù)測器進行框分類和回歸。
Shared Box Predictor
普通的SSD對不同尺度的特征圖使用獨立的框預(yù)測器。一個問題是對不同尺度的預(yù)測分?jǐn)?shù)的錯誤校準(zhǔn)。由于每個框預(yù)測器只使用分配給它的groundtruth框的一部分進行獨立訓(xùn)練,因此不同的框預(yù)測器在訓(xùn)練期間可以看到非常不同數(shù)量的正例和負例。這種隱式的數(shù)據(jù)不平衡導(dǎo)致了來自不同預(yù)測器的分?jǐn)?shù)落在非常不同的范圍內(nèi)的問題,這使得它們無法比擬,并且在后續(xù)基于分?jǐn)?shù)的后處理步驟(如非最大抑制)中難以使用。我們設(shè)計了一個跨越不同尺度特征圖的共享框預(yù)測器。因此,即使groundtruth box量表存在不平衡,box預(yù)測器也能看到所有的訓(xùn)練數(shù)據(jù)。這減少了錯誤校準(zhǔn)和不穩(wěn)定預(yù)測分?jǐn)?shù)的影響。有人可能會說,為每個量表設(shè)置單獨的box預(yù)測器可以增加總?cè)萘?#xff0c;并允許每個預(yù)測器專注于其特定的量表。然而,我們認為這可能沒有必要,因為對象大多是尺度不變的。
Max Pooling Pyramid
我們的目標(biāo)是建立一個多尺度的特征金字塔結(jié)構(gòu),從中我們可以使用共享框預(yù)測器進行預(yù)測。我們通過收縮基本特性通過骨干網(wǎng)多次使用一系列最大池操作來實現(xiàn)。
表1。實驗對比結(jié)果:COCO檢測:MobileNet SSD vs . MobileNet PPN
總結(jié)
以上是生活随笔為你收集整理的maskrcnn用于目标检测_用于目标检测的池化渐进网络(Pooling Pyramid Network)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: go mongodb排序查询_【赵强老师
- 下一篇: android byte[] 转stri