【边缘检测】RCN:Object Contour and Edge Detection with RefineContourNet
文章目錄
- 一、背景
- 二、動(dòng)機(jī)
- 三、方法
- 四、效果
一、背景
邊緣檢測(cè)/輪廓檢測(cè)是從圖片的背景中分離出目標(biāo)的輪廓和邊緣。
現(xiàn)有的基于CNN的方法:HED/CEDN/COB等,基本都是使用較深的網(wǎng)絡(luò)結(jié)構(gòu),并利用其從imagenet預(yù)訓(xùn)練得來的高層分類信息
問題:雖然現(xiàn)有的方法使用了預(yù)訓(xùn)練的分類網(wǎng)絡(luò)作為backbone,但這些backbone肯定有一些沒有被開發(fā)出來的能力,因?yàn)樗鼈償y帶了很多高層抽象特征。
二、動(dòng)機(jī)
三、方法
1、語義信息層面
對(duì)于邊緣檢測(cè),傳統(tǒng)的邊緣檢測(cè)方法可以檢測(cè)出圖像中的很多邊緣,所以難點(diǎn)會(huì)在于如何區(qū)分出對(duì)任務(wù)有用的邊緣和無用的邊緣,此時(shí)就需要上下文語義信息了(semantic context)。
本文采用了PASCAL VOC 的20類目標(biāo)的邊界來作為語義上下文信息
出發(fā)點(diǎn):如果上下文信息明確且細(xì)節(jié)信息也可得到,那么最重要的事情就是高層信息的抽象能力,就可以從上下文信息中抽出邊緣。
落腳點(diǎn):基于上述出發(fā)點(diǎn),本文致力于使用現(xiàn)有分類網(wǎng)絡(luò)自身的能力來提升對(duì)輪廓檢測(cè)的效果
實(shí)現(xiàn)方法:對(duì)網(wǎng)絡(luò)結(jié)構(gòu)、backbone、訓(xùn)練方式、數(shù)據(jù)集都做了探究
2、refine 結(jié)構(gòu)
① 首先從最深的特征圖出發(fā),將其與上一層的特征圖融合,直到到達(dá)最淺層(multi-resolution fusion)
② 訓(xùn)練過程實(shí)現(xiàn)兩個(gè)目標(biāo),這兩個(gè)目標(biāo)都可以通過數(shù)據(jù)增強(qiáng)來加強(qiáng)實(shí)現(xiàn):
- 有效利用pretrained 網(wǎng)絡(luò)的特征抽象能力
- 將該抽象能力和pixel-wise的檢測(cè)有效結(jié)合
3、邊緣檢測(cè)和圖像分割的不同
邊緣檢測(cè)和圖像分割網(wǎng)絡(luò)最大的不同在于目標(biāo)函數(shù),邊緣檢測(cè)是一個(gè)二分類問題,本文使用邏輯回歸作為 loss function:
- h∈[0,1]h\in[0,1]h∈[0,1],是預(yù)測(cè)結(jié)果
- y∈{0,1}y\in\{0,1\}y∈{0,1},是二值label
- β=10\beta=10β=10,平衡因子,平衡邊緣和非邊緣特征
4、網(wǎng)絡(luò)結(jié)構(gòu)
- RCU:residual convolutional unit,有殘差卷積層,可以豐富網(wǎng)絡(luò)參數(shù),同時(shí)可以調(diào)節(jié)/修正 MRF 的輸入。
- MRF:multi-resolution fusion,使用卷積和上采樣調(diào)節(jié)特征圖通道和大小,以便不同分辨率的特征圖融合
- CRP:chained residual pooling,使用鏈?zhǔn)降木矸e和pooling,相比只使用 max-pooling 來說,可以更好的聚合更多的context信息。
- 在最后一個(gè) refinement,作者使用原始圖作為輸入,經(jīng)過了3個(gè)RCU,提升了部分效果。
四、效果
總結(jié)
以上是生活随笔為你收集整理的【边缘检测】RCN:Object Contour and Edge Detection with RefineContourNet的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【边缘检测】BDCN:Bi-Direct
- 下一篇: 女神异闻录5打工杂志在哪