论文阅读笔记03-fast-rcnn
fast-rcnn主要有如下改變:
1.引入ROI-pooling層
2.并行進(jìn)行classification和bonnd box regression
下面詳細(xì)介紹
1.引入ROI-pooling層
R-CNN 在網(wǎng)絡(luò)前半部分提取特征時(shí),對(duì)每個(gè)候選區(qū)域都進(jìn)行了特征提取,導(dǎo)致大量重復(fù)計(jì)算,速度極低。
在fast-rcnn中提出roi-pooling層,有效解決這一問(wèn)題。
roi_pool層將每個(gè)候選區(qū)域均勻分成M×N塊,對(duì)每塊進(jìn)行max pooling。將特征圖上大小不一的候選區(qū)域轉(zhuǎn)變?yōu)榇笮〗y(tǒng)一的數(shù)據(jù),送入下一層。
注意:特征提取網(wǎng)絡(luò)的參數(shù)訓(xùn)練過(guò)程類似于RCNN網(wǎng)絡(luò)中的過(guò)程,即將網(wǎng)絡(luò)尾端加上1000類的分類層,用image-net數(shù)據(jù)集訓(xùn)練,然后凍結(jié)網(wǎng)絡(luò)前半部分參數(shù)作為特征提取網(wǎng)絡(luò)的參數(shù)。
2.并行進(jìn)行classification和bonnd box regression
特征提取網(wǎng)絡(luò)得到的feature-map送入兩個(gè)并行的網(wǎng)絡(luò)進(jìn)行classification和bonnd box regression。
cls_score層用于分類,輸出K+1維數(shù)組p,表示屬于K類和背景的概率。
bbox_prdict層用于調(diào)整候選區(qū)域位置,輸出4*K維數(shù)組t,表示分別屬于K類時(shí),應(yīng)該平移縮放的參數(shù)。
轉(zhuǎn)載于:https://www.cnblogs.com/yeran/p/10887241.html
總結(jié)
以上是生活随笔為你收集整理的论文阅读笔记03-fast-rcnn的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Excel-数据分列的多种方法实现
- 下一篇: 这世界没有意义