DeepLab v2的摘要部分(翻译加理解)
1.原文翻譯
In this work we address the task of semantic image segmentation with Deep Learning and make three main contributions that are experimentally shown to have substantial practical merit.
在這個工作當中,我們聚焦深度學習當中圖片語義分割問題,并做出了被實驗說明有很多實質性成效的三個主要貢獻。
First, we highlight convolution with upsampled filters(上采樣過濾器), or ‘atrous convolution’, as a powerful tool in dense prediction tasks.
首先,我們顯著提升了卷積作為上采樣濾波器的存在,或者將這個描述為空洞卷積。是一個在稠密預測任務當中有力的工具。
Atrous convolution allows us to explicitly control the resolution at which feature responses are computed within Deep Convolutional Neural Networks.
空洞卷積使得我們可以在特征被深度卷積神經網絡的計算過程中,明確地控制分辨率。
It also allows us to effectively enlarge the field of view of filters to incorporate larger context without increasing the number of parameters or the amount of computation.
同樣地,空洞卷積也可以是我們可以有效地提升過濾器的感受野,來在不增加參數和計算量的前提下擴大contesxt(我理解這里應該是考慮更大的范圍)
Second, we propose atrous spatial pyramid pooling (ASPP) to robustly(魯棒性) segment objects at multiple scales.*
第二點,我們建議使用ASPP,在多尺度輸入的情況下,強化領域對象的魯棒性
ASPP probes an incoming convolutional feature layer with filters at multiple sampling rates and effective fields-of-views,
ASPP探索一種帶有多抽樣率卷積特征層的濾波器,同時伴隨著有效地感受野。
thus capturing objects(目標) as well as image context at multiple scales(多尺度).
這里注意object不應該理解為對象,應當理解為目標。
因此在多尺度上獲得了識別目標和圖片上下文。
Third, we improve the localization of object boundaries by combining methods from DCNNs and probabilistic graphical
models. The commonly deployed combination of max-pooling and downsampling in DCNNs achieves invariance but has a toll on
localization accuracy. We overcome this by combining the responses at the final DCNN layer with a fully connected Conditional Random Field (CRF), which is shown both qualitatively and quantitatively to improve localization performance. Our proposed
“DeepLab” system sets the new state-of-art at the PASCAL VOC-2012 semantic image segmentation task, reaching 79.7% mIOU in
the test set, and advances the results on three other datasets: PASCAL-Context, PASCAL-Person-Part, and Cityscapes. All of our code
is made publicly available online.
2.理解部分
1.強調具有上采樣濾波器的空洞卷積在密集預測任務中是很有用的工具。空洞卷經濟可以準確控制深度神經網絡當中的特征相應,同時可以在不增加參數和計算量的前提下提升感受野。
有點難理解,大約就是說密集任務中,這個挺有效果的,有效果的原因可以理解成,這個東西不用引入新的參數不用增加計算量就可以獲得更好的感受野。
2.提出了atrous spatial pyramid pooling (ASPP) 網絡,增強了在多尺度下多類別分割時的魯棒性,使用不同的采樣比例與感受野提取輸入特征,能在多個尺度上捕獲目標與上下文信息。
大約我們是可以將這個理解成使用空洞卷積獲得不同的尺度信息來共同輸入
3.通過圖模型(a fully connected Conditional Random Field ,CFR(DenseCRF))來精確確定分割的邊界。
這個東西就是在模型的最后使用了一個傳統的概率圖模型,來有效處理語義分割的邊界
總結
以上是生活随笔為你收集整理的DeepLab v2的摘要部分(翻译加理解)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 什么是空洞卷积?
- 下一篇: DeepLab v2