M2Det的学习过程
不全,待補充
主要框架:
分析解釋這個框圖:
M2Det主要是有三部分組成,主干網絡、MLFPN(muli-level 的FPN、以及預測層。
其中主干網絡是用兩個尺度進行特征提取。將這兩個尺度的特征合并輸入到MLFPN中
MLFPN則由三部分組成,FFM、TUM、SFAM。
FFM
FFMv1是對主干網中提取出來的內容進行合并,得到base feature。
FFMv2是用來整合TUM中最后一層的特征和basefeature整合在一塊送入下一個TUM中。
在base feature的基礎上做TUM,這里解釋啥是TUM?
TUM
編碼器是一系列的步長為2,卷積核為3*3的Conv,解碼器將這些output作為生成feature map的參考。在解碼器分支上采樣和element-wise后,添加1x1卷積層,以增強學習能力,并保持特征的平滑性
每個TUM結構中的所有輸出都形成當前level的多尺度特性。從整體上看,堆疊的TUMs輸出形成多層次的多尺度特征,而前面的TUM主要提供淺層特征,中間的TUM提供中層特征,后面的TUM提供深層特征。
看M2Det的圖,感覺TUM是把feature map變小了之后又變大了,但是論文里面的解釋我只看到:把feature map進行多次卷積然后得到了多個scale 的feature map,沒看出來有放大的過程。不明白是怎么回事……
SFAM
把在TUM中得到的多種特征按照不同的scale進行contact,得到尺度豐富的feature map,完了你就可以去做分類和檢測了。
但細節上是把SFAM分成兩部分了,第一部分是把相同的尺度進行連接。第二部分做了智能處理,用channel-wise模塊,鼓勵特性將注意力集中較為重要的通道上。使用SENet模型。
?
總結
以上是生活随笔為你收集整理的M2Det的学习过程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 从神话诗歌到奇幻科学的人类探索史·《月亮
- 下一篇: Win10华硕atk驱动怎么安装_win