MASK -RCNN
MASK R-CNN
-
https://www.bilibili.com/video/BV1bW411w7ZF?from=search&seid=13728655997839278518
-
運行速度還是比較慢的,只能做的5FPS,不能做到實時
-
processON 很好的畫圖工具
-
圖像的輸入 padding 成1024 ——輸入成resNet101
-
得到C1——C5特征層次
-
C5 -> 256通道,通過一個 1 X 1的卷積核(調整channel的維度),所以我們得到了P5,P5 乘以 2(反卷積,轉置卷積,upsample),加起來得到P4,得到P3,最后得到P2。P5是feature是抽象層次比較高的,P2是比較細力度的。但是有的物體肯能很大,所以我們對P5進行 MAX POOLing,得到P6,P6是僅僅只用于RPN網絡(抽象維度特別高 7 X 7,14 X14 ,最后在進行一個 3X 3 的上采樣層,消除上采樣的混疊效應 。喂入RPN,RPN是同一個網絡(shared with ),得到了五個結果。連接在一起,得到一個output,得到三個東西,loss,class,bbox,得到了十幾個。篩選幾十萬個anchor之后,我們使用proposallayer(選擇),再選290個anchor【class 為0的,沒有物體的框框都丟掉】,得到最后的rpn_rois(精確的一個框框),得到金字塔ROI,根據公示進行計算。如果框比較大,那么就P5抽取ROI對應的,如果框比較小,那么可能選擇P2。P2——P5是之前出現過的,最后得到的feature MOI,再放入header層次,(計算位置,以及MASK層次,做instance segmentation ),最后得到了輪廓。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-nKO952Ty-1624544305159)(C:\Users\jiang000\AppData\Roaming\Typora\typora-user-images\image-20210624213430204.png)]
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-ajpb9Qkl-1624544305165)(C:\Users\jiang000\AppData\Roaming\Typora\typora-user-images\image-20210624214510353.png)]
總結
以上是生活随笔為你收集整理的MASK -RCNN的全部內容,希望文章能夠幫你解決所遇到的問題。