深度学习和目标检测系列教程 5-300:早期的目标检测RCNN架构
@Author:Runsen
最早期的目標(biāo)檢測(cè)基于RCNN的算法,下面介紹RCNN的架構(gòu)
RCNN架構(gòu)
R-CNN 的目標(biāo)是獲取圖像,并正確識(shí)別圖片中的主要對(duì)象(通過邊界框)的位置。
- 輸入:圖像;
- 輸出:圖像中每個(gè)對(duì)象的邊界框和標(biāo)簽。
R-CNN檢測(cè)系統(tǒng)由三個(gè)模塊組成。
- 第一個(gè)生成與類別無關(guān)的區(qū)域候選框。這些候選框識(shí)別圖像中存在的候選檢測(cè)集。
- 第二個(gè)模塊是一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò),從每個(gè)區(qū)域提取一個(gè)特征向量。
- 第三個(gè)模塊是一組特定于類的分類器,即線性 SVM。
R-CNN 也做了我們可能直覺上做的事情——在圖像中提出一堆框,看看它們中是否有任何一個(gè)對(duì)應(yīng)于一個(gè)對(duì)象。R-CNN 使用稱為Selective Search的過程創(chuàng)建這些邊界框或區(qū)域提議 。
在高層次上,選擇性搜索(如下圖 所示)通過不同大小的窗口查看圖像,并針對(duì)每種大小嘗試按紋理、顏色或強(qiáng)度對(duì)相鄰像素進(jìn)行分組以識(shí)別對(duì)象。
候選框一經(jīng)創(chuàng)建,R-CNN 就將該區(qū)域封閉為標(biāo)準(zhǔn)正方形大小,并將其傳遞給 AlexNet 的修改版本。在 CNN 的最后一層,R-CNN 添加了一個(gè)支持向量機(jī) (SVM),可以對(duì)這是否是一個(gè)對(duì)象以及如果是什么對(duì)象進(jìn)行分類。這是上圖中的第 4 步。
- AlexNet是卷積神經(jīng)網(wǎng)絡(luò) (CNN) 架構(gòu)的名稱,由 Alex Krizhevsky 與 Ilya Sutskever 和 Geoffrey Hinton 合作設(shè)計(jì)
改進(jìn)邊界框
在盒子中創(chuàng)建物體后,我們可以收緊盒子以使物體適合其真實(shí)尺寸。這是R-CNN的最后一步。R-CNN 對(duì)區(qū)域提議運(yùn)行簡(jiǎn)單的線性回歸以生成邊界框坐標(biāo)以獲得最終結(jié)果。這個(gè)回歸模型的輸入和輸出是:
- 輸入:與對(duì)象對(duì)應(yīng)的圖像子區(qū)域。
- 輸出:子區(qū)域中對(duì)象的新邊界框坐標(biāo)。
所以,總而言之,R-CNN 是以下步驟:
- 為邊界框生成一組區(qū)域候選框。
- 通過預(yù)訓(xùn)練的 AlexNet 和 SVM 運(yùn)行邊界框中的圖像,以查看框中的圖像是什么對(duì)象。
- 一旦對(duì)象被分類,通過線性回歸模型運(yùn)行框以輸出更緊密的框坐標(biāo)。
RCNN訓(xùn)練網(wǎng)絡(luò)所需的時(shí)間非常長(zhǎng),因?yàn)榫W(wǎng)絡(luò)必須對(duì)每張圖像 2000 個(gè)區(qū)域提議進(jìn)行分類。它無法實(shí)時(shí)實(shí)現(xiàn),因?yàn)槊總€(gè)測(cè)試圖像需要大約 47 秒。特定的搜索算法是固定算法。因此,在那個(gè)階段沒有發(fā)生任何學(xué)習(xí)。這會(huì)導(dǎo)致產(chǎn)生不良區(qū)域的建議。
下面是RCNN架構(gòu)實(shí)現(xiàn)的具體代碼:
- Tensorflow : https://github.com/rbgirshick/rcnn
- Keras : https://github.com/broadinstitute/keras-rcnn
Result
R-CNN 提供了最先進(jìn)的結(jié)果。以前的系統(tǒng)是復(fù)雜的集成,將多個(gè)低級(jí)圖像特征與來自對(duì)象檢測(cè)器和場(chǎng)景分類器的高級(jí)上下文相結(jié)合。R-CNN 提出了一種簡(jiǎn)單且可擴(kuò)展的對(duì)象檢測(cè)算法,與之前在 ILSVRC2013 上的最佳結(jié)果相比,相對(duì)提高了 30%。
R-CNN 通過兩個(gè)見解實(shí)現(xiàn)了這一性能。
- 首先是將大容量卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于自下而上的區(qū)域建議以定位和分割對(duì)象。
- 第二種是在訓(xùn)練數(shù)據(jù)標(biāo)簽稀缺時(shí)訓(xùn)練大型 CNN。
R-CNN 結(jié)果表明,在監(jiān)督下預(yù)訓(xùn)練網(wǎng)絡(luò)非常有用。
總結(jié)
以上是生活随笔為你收集整理的深度学习和目标检测系列教程 5-300:早期的目标检测RCNN架构的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 武警副指导员办案吗
- 下一篇: 大陆电话在澳门打马来西亚能打通吗