白话详细解读(六)----- BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation
生活随笔
收集整理的這篇文章主要介紹了
白话详细解读(六)----- BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
一、論文簡介
論文鏈接:https://openaccess.thecvf.com/content_ECCV_2018/html/Changqian_Yu_BiSeNet_Bilateral_Segmentation_ECCV_2018_paper.html
到目前為止,已被引用了將近500次,說明這篇文章還是非常有看點的,那我們今天就盤它了!
二、創(chuàng)新點及解決的問題
- 1.論文提出了一種能夠保留豐富空間信息的Spatial path。現(xiàn)有的方法無非是用空洞卷積擴大感受野來獲得足夠的空間信息,或者是使用空間金字塔池化、空洞金字塔池化來獲取足夠大的感受野來獲得空間信息或者是通過使用大的卷積核。感受野和空間信息對于獲得高準確率是非常重要的,然而,這些方法是很難同時滿足兩個要求的(速度與準確率兼顧)。特別是,在實時語義分割的情況下,現(xiàn)有的現(xiàn)代方法利用小輸入圖像或輕量級基模型來加速。較小的輸入圖像丟失了原始圖像的大部分空間信息,而輕量級模型通過通道剪枝破壞了空間信息。為了解決這個矛與盾的問題,論文提出了一種速度快、且能夠保留空間信息的spatial path。
- 2.論文提出了一種能夠提供足夠感受野的Context path。在語義分割領(lǐng)域,感受野是非常重要的概念,現(xiàn)代的方法大都是利用空洞金字塔池化、金字塔池化來增大感受野,但是這種方法會大大耗費內(nèi)存和需要大量的計算成本,這會導致低速率。考慮到獲得較大的感受野和較高的計算效率,我們提出了context path。
三、網(wǎng)絡(luò)結(jié)構(gòu)
- 核心思想
- 1.論文提出了一條小步幅的空間信息路徑(Spatial path)來保留空間信息以獲取高像素的特征。
- 2.論文提出了一條上下文信息路徑(Context path)來提供足夠的感受野。
- 3.論文提出了一種特征融合模塊(Feature Fusion Module),以高效的結(jié)合不同來自Spatial path和Context path的特征。
四、實驗超參數(shù)
| Momentum | 0.9 |
| Initial Learning rate | 2.5e?2 |
| learning rate strategy | Poly |
詳細請看原文,這里只簡單的例舉幾個常見的超參數(shù)。
五、實驗
(1)Cityscapes數(shù)據(jù)集
- 1.Ablation for spatial path
- 2.Accuracy and parameter analysis of our baseline model
- 3.Speed comparison of our method against other state-of-the-art methods.
- 4.Accuracy and speed comparison of our method against other state-of-the-art methods on Cityscapes test dataset.
- 5.Accuracy comparison of our method against other state-of-the-art methods on Cityscapes test dataset.
- 6.Accuracy result on CamVid test dataset.
- 7.Accuracy result on COCO-Stuff validation dataset.
總結(jié)
以上是生活随笔為你收集整理的白话详细解读(六)----- BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 需求评审流程该如何高效的走下去
- 下一篇: 2021公益数字化研究报告