M2Det 网络解读
1. 總述
M2Det 是AAAI 2019年的文章,出自北大之手,one-stage網絡,官方給出的其在COCO上的AP達到了44.2。
網絡架構是基于FPN的思想進行設計的,很有腦洞的一點是作者在 FPN 的基礎上提出了 MLFPN(?Multi-Level Feature Pyramid Network?)。所謂 MLFPN,可以將其理解為將原本?FPN 框架中不同深度的層替換成一個小的 FPN 模塊,即FPN套FPN。同時,作者還引入了 SE block,對不同深度的特征賦予了權重。這是 M2Det 的兩個創新點。
2.網絡結構
backbone直接選用了VGG-16和Resnet-101。MLFPN模塊接在backbone之后,detection out 用了SSD的方式。
MLFPN由三個模塊組成,即特征融合模塊(FFM),細化U形模塊(TUM)和按比例縮放特征聚合模塊(SFAM)。
TUM模塊就是FPN的結構,每個TUM模塊輸出不同尺度的feature maps。MLFPN中包含多個TUM模塊級聯的結構。
FFM包含兩個子模塊:FFMv1子模塊負責將backbone中不同深度和尺寸的feature maps進行融合,得到一個統一尺度的Base feature。FFMv2子模塊負責將前一個TUM模塊的輸出和Base feature進行融合,送入下一個TUM模塊。
SFAM模塊負責將不同TUM模塊的輸出按尺度拼接,并經過一個SE block,最后輸出特征金字塔。
在實際的網絡中,使用了6種尺度和8個深度:6種尺度表示最后輸出的特征金字塔為6個尺度,即TUM模塊的輸出也是6個尺度;8個深度表示MLFPN種總共級聯了8個TUM模塊,提取了深度為8的FPN feature maps。
?
?
?
?
總結
以上是生活随笔為你收集整理的M2Det 网络解读的全部內容,希望文章能夠幫你解決所遇到的問題。