CNN结构:SPP-Net为CNNs添加空间尺度卷积-神经元层
??????? 前幾個CNN檢測的框架要求網(wǎng)絡(luò)的圖像輸入為固定長寬,而SPP-Net在CNN結(jié)構(gòu)中添加了一個實現(xiàn)圖像金字塔功能的卷積層SPP層,用于在網(wǎng)絡(luò)中實現(xiàn)多尺度卷積,由此對應(yīng)多尺度輸入,以此應(yīng)對圖像的縮放變換和仿射變換。
??????? 原文鏈接:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
??????? 原文鏈接: http://zhangliliang.com/2014/09/13/paper-note-sppnet/
??????? 作者主頁:http://research.microsoft.com/en-us/um/people/kahe/eccv14sppnet/index.html
一、文章的主要思想
? ? ?? 考慮到傳統(tǒng)的CNN構(gòu)架的輸入圖像的尺寸都是固定的(例如:256*256),這種人工改變輸入圖像的尺寸破壞了輸入圖像的尺度和長寬比例。作者認為卷積層的輸入的尺寸可以是任意,全連接層的輸入是固定不變。針對這個問題,作者提出了spatial pyramid pooling(SPP-net)結(jié)構(gòu),在目標檢測方面,比R-CNN快30-170倍。
? ? ? ? ? ??
二、spatial pyramid pooling(SPP-net)的優(yōu)勢
? ? ? ? 1、針對不同尺寸的輸入可以得到相同維度的輸出,而siding window pooling 做不到;
? ? ? ? 2、SPP使用multi-level?spatial bins,?而siding window pooling采用的單一的窗口,multi-level對目標變形非常魯棒;
? ? ? ? 3、由于輸入尺寸的可變性,SPP可以提取不同尺度的特征。
?????????? 這樣就可以省去對輸入圖像進行標準化的麻煩,可以節(jié)省大量人力。
三、Deep Networks with Spatial Pyramid Pooling
??? ? 特征提取的過程其實很簡單,就是將SPP放在卷積層的最后一層,pooling層以前,將相當于用SPP代替最后一層pooling。假設(shè)最后一層卷積層有256個maps,每個maps的尺寸為a*a,n*n個bins。那么采用窗口win=ceil(a/n)和步長str=floor(a/n)的max-pooling。最后將所有的特征級聯(lián)起來作為全連接層的輸入。這樣就保證了無論輸入圖像的尺寸,輸入全連接層的輸入都有同樣的大小。示意圖如下:
??
? ?
? ? ??
? ? ? ? ? ? ?
四、實驗結(jié)果
? ? ? ???? 從這個結(jié)果來看,確實有不少的提升。在ILSVRC比賽獲得了第二名?
五、論文總結(jié)
? ? ?本論文的思想主要還是基于SPM的思想,將CNN和SPM進行了結(jié)合,值得借鑒。并且提到了再訓練模型的時候,采用不同的尺寸輸入交替訓練,這種思想還是首次提到。
???? 增加一層神經(jīng)元消畸變和尺度變換.
總結(jié)
以上是生活随笔為你收集整理的CNN结构:SPP-Net为CNNs添加空间尺度卷积-神经元层的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AD9定义PCB板大小的3中方法(转)
- 下一篇: DNN结构演进History—CNN(