小目标检测的增强算法
小目標(biāo)檢測(cè)的增強(qiáng)算法
Augmentation for small object detection
摘要
近年來,目標(biāo)檢測(cè)取得了令人矚目的進(jìn)展。盡管有了這些改進(jìn),但在檢測(cè)小目標(biāo)和大目標(biāo)之間的性能仍有很大的差距。本文在一個(gè)具有挑戰(zhàn)性的數(shù)據(jù)集上分析了當(dāng)前最先進(jìn)的模型Mask RCNN,MS COCO。結(jié)果表明,小真實(shí)目標(biāo)與預(yù)測(cè)錨之間的重疊度遠(yuǎn)低于期望的IoU閾值。本文推測(cè)這是由于兩個(gè)因素造成的:(1)只有少數(shù)圖像包含小對(duì)象,并且(2)即使在包含它們的每個(gè)圖像中,小對(duì)象也不足以出現(xiàn)。因此,本文建議用小對(duì)象對(duì)這些圖像進(jìn)行過采樣,并通過多次復(fù)制粘貼小對(duì)象來增強(qiáng)每個(gè)圖像。它允許本文在大物體和小物體上權(quán)衡探測(cè)器的質(zhì)量。本文評(píng)估了不同的粘貼增強(qiáng)策略,最終,本文在實(shí)例分割和小目標(biāo)檢測(cè)方面分別比MS-COCO上的現(xiàn)有方法提高了9.7%和7.1%。
1. Introduction
本文關(guān)注的是最先進(jìn)的物體探測(cè)器Mask R-CNN[18],一個(gè)具有挑戰(zhàn)性的數(shù)據(jù)集,COCO女士。本文注意到這個(gè)數(shù)據(jù)集關(guān)于小對(duì)象的兩個(gè)屬性。首先,本文觀察到數(shù)據(jù)集中包含小對(duì)象的圖像相對(duì)較少,這可能會(huì)使任何檢測(cè)模型偏向于更集中于中大型對(duì)象。其次,小物體覆蓋的區(qū)域要小得多,這意味著小物體的位置缺乏多樣性。本文推測(cè),這使得當(dāng)小目標(biāo)出現(xiàn)在圖像中不易被探測(cè)的部分時(shí),目標(biāo)檢測(cè)模型很難在測(cè)試時(shí)間內(nèi)推廣到小目標(biāo)。本文通過對(duì)包含小物體的圖像進(jìn)行過采樣來解決第一個(gè)問題。第二個(gè)問題通過在包含小對(duì)象的每個(gè)圖像中多次復(fù)制粘貼小對(duì)象來解決。粘貼每個(gè)對(duì)象時(shí),本文確保粘貼的對(duì)象不會(huì)與任何現(xiàn)有對(duì)象重疊。這增加了小對(duì)象位置的多樣性,同時(shí)確保這些對(duì)象出現(xiàn)在正確的上下文中,如圖3所示。每幅圖像中小物體數(shù)量的增加進(jìn)一步解決了少量正匹配錨的問題,本文在第3節(jié)中對(duì)其進(jìn)行了定量分析。與目前最新的基于MS-COCO的Mask-R-CNN方法相比,本文在實(shí)例分割和小目標(biāo)檢測(cè)方面分別取得了9.7%和7.1%的相對(duì)改進(jìn)。
 2. Related Work
實(shí)例分割實(shí)例分割超出了對(duì)象檢測(cè)的范圍,需要預(yù)測(cè)每個(gè)對(duì)象的準(zhǔn)確掩碼。多任務(wù)網(wǎng)絡(luò)級(jí)聯(lián)(MNC)[9]構(gòu)建一個(gè)預(yù)測(cè)和屏蔽的級(jí)聯(lián)。全卷積實(shí)例感知語義分割(FCIS)[23]是一個(gè)全卷積模型,它計(jì)算每個(gè)感興趣區(qū)域共享的位置敏感得分圖。[14] ,這也是一種完全卷積的方法,學(xué)習(xí)像素嵌入。Mask R-CNN[18]擴(kuò)展了FPN模型的一個(gè)分支,用于預(yù)測(cè)掩模,并引入了新的不同裁剪操作,用于對(duì)象檢測(cè)和實(shí)例分割。
可以通過提高輸入圖像分辨率[7,26]或?qū)⒏叻直媛侍卣髋c低分辨率圖像的高維特征融合來處理檢測(cè)小目標(biāo)的小目標(biāo)[36,2,5,27]。然而,這種使用更高分辨率的方法增加了計(jì)算開銷,并且沒有解決大小對(duì)象之間的不平衡。[22]取而代之的是,使用世代對(duì)抗網(wǎng)絡(luò)(GAN)在復(fù)雜網(wǎng)絡(luò)中構(gòu)建特征,在交通標(biāo)志和行人檢測(cè)的背景下,這些特征在小物體和大物體之間是不可區(qū)分的。[12] 使用基于區(qū)域建議網(wǎng)絡(luò)中不同分辨率層的不同錨定比例。[13] 根據(jù)錨定大小的正確分?jǐn)?shù)移動(dòng)圖像特征以覆蓋它們之間的間隙。[6,33,8,19]裁剪小對(duì)象建議時(shí)添加上下文。
 
3. Identifying issues with detecting small objects
在這一部分中,本文首先概述了MS-COCO數(shù)據(jù)集和在本文的實(shí)驗(yàn)中使用的目標(biāo)檢測(cè)模型。然后討論了MS-COCO數(shù)據(jù)集的問題和訓(xùn)練中使用的錨匹配過程,這有助于小目標(biāo)檢測(cè)的困難。
 
4. Result and Analysis
 
5.Conclusion
本文研究了小目標(biāo)檢測(cè)問題。本文發(fā)現(xiàn),小目標(biāo)平均精度差的原因之一是訓(xùn)練數(shù)據(jù)中缺少小目標(biāo)的表示。這尤其適用于現(xiàn)有的最先進(jìn)的物體探測(cè)器,它要求有足夠的物體供預(yù)測(cè)的錨在訓(xùn)練期間匹配。為了克服這個(gè)問題,本文提出了兩種擴(kuò)充原始MS-COCO數(shù)據(jù)庫的策略。首先,本文展示了在訓(xùn)練過程中,通過對(duì)包含小對(duì)象的圖像進(jìn)行過采樣,可以很容易地提高對(duì)小對(duì)象的性能。其次,提出了一種基于復(fù)制粘貼小對(duì)象的增強(qiáng)算法。實(shí)驗(yàn)證明,與Mask R-CNN在MS-COCO上獲得的最新技術(shù)相比,實(shí)例分割和小目標(biāo)檢測(cè)分別提高了9.7%和7.1%。正如實(shí)驗(yàn)所證實(shí)的,所提出的一套增強(qiáng)方法可以在預(yù)測(cè)大小物體的質(zhì)量之間進(jìn)行權(quán)衡。
總結(jié)
以上是生活随笔為你收集整理的小目标检测的增强算法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
                            
                        - 上一篇: arm,asic,dsp,fpga,mc
 - 下一篇: 多视觉任务的全能: HRNet