【计算机视觉】目标检测之ECCV2016
本文轉(zhuǎn)載自:
http://www.cnblogs.com/lillylin/p/6207292.html
SSD論文閱讀(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)
目錄
作者及相關(guān)鏈接文章的選擇原因方法概括方法細(xì)節(jié)相關(guān)背景補(bǔ)充實(shí)驗(yàn)結(jié)果與相關(guān)文章的對比總結(jié)
作者
intro: ECCV 2016 Oralarxiv:http://arxiv.org/abs/1512.02325paper:http://www.cs.unc.edu/~wliu/papers/ssd.pdfslides:http://www.cs.unc.edu/%7Ewliu/papers/ssd_eccv2016_slide.pdfgithub:https://github.com/weiliu89/caffe/tree/ssdvideo:http://weibo.com/p/2304447a2326da963254c963c97fb05dd3a973github(MXNet):https://github.com/zhreshold/mxnet-ssdgithub:https://github.com/zhreshold/mxnet-ssd.cppgithub(Keras):https://github.com/rykov8/ssd_keras
文章的選擇原因
性能好,single stage
方法概括
文章的方法介紹
SSD主要用來解決目標(biāo)檢測的問題(定位+分類),即輸入一張待測圖像,輸出多個(gè)box的位置信息和類別信息測試時(shí),輸入一張圖像到SSD中,網(wǎng)絡(luò)輸出一個(gè)下圖最右邊的tensor(多維矩陣),對該矩陣進(jìn)行非極大值抑制(NMS)就能得到每個(gè)目標(biāo)的位置和label信息
Figure2的最右圖的1th-20th Channel表示類別,每一個(gè)Channel上的map對應(yīng)原圖,last 4 channel的每一個(gè)map分別對應(yīng)x,y,w,h的偏移量。最后4個(gè)通道可以確定一個(gè)box的位置信息,前20個(gè)通道確定類別信息。
方法的pipeline和關(guān)鍵點(diǎn)
方法細(xì)節(jié)
模型結(jié)構(gòu)
多尺度特征圖
用來預(yù)測的卷積濾波器
defaul box
groundTruth的標(biāo)定,損失函數(shù)
default box和尺度的選擇
SSD的訓(xùn)練——Hard negative mining
SSD的訓(xùn)練——數(shù)據(jù)擴(kuò)增
相關(guān)背景補(bǔ)充
Atrous算法(hole算法)
FPS/SPF, Jaccard overlap
二類分類/檢測常用的評價(jià)標(biāo)準(zhǔn)(recall, precision, f-measure, accuracy, error, PR曲線和ROC曲線,AP,AUC)
ImageNet多類分類的評價(jià)標(biāo)準(zhǔn)
ImageNet單目標(biāo)檢測的評價(jià)標(biāo)準(zhǔn)
ImageNet(多)目標(biāo)檢測的評價(jià)標(biāo)準(zhǔn)
實(shí)驗(yàn)結(jié)果
PASCAL VOC2007 test detection結(jié)果
使用數(shù)據(jù)擴(kuò)增、多尺度default box、atrous算法的對比效果
SSD512在某類Ianimals)上的檢測性能可視化
SSD對于目標(biāo)大小的敏感性實(shí)驗(yàn)
SSD使用的feature map的個(gè)數(shù)對結(jié)果的影響
示例結(jié)果
時(shí)間和速度
與相關(guān)文章的對比
原始R-CNN方法的變形
Faster R-CNN和SSD對比
YOLO和SSD對比
總結(jié)
文章貢獻(xiàn)
SSD, asingle-shot detectorfor multiple categories (faster than YOLO, accurate as Faster R-CNN)The
core of SSDispredicting category scores and box offsetsfor a fixed set ofdefault
bounding boxesusingsmall convolutional filtersapplied tomultiple
feature mapsfrom different layersExperimental evidence:high
accuracy, high speed, simple end-to-end training (single shot)
SSD對于其他方法的改進(jìn)的關(guān)鍵點(diǎn)
Using asmall convolutional filter to predictobject categories and offsets in bounding box locationsUsingseparate predictors (filters)for different aspect ratio detectionsUsingmultiple layers for prediction at different scales(apply these
filters to multiple feature maps to perform detection at multiple stages)
總結(jié)
以上是生活随笔為你收集整理的【计算机视觉】目标检测之ECCV2016的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 为什么要学python-为什么要学 Py
- 下一篇: 抖音云控_抖音云控/快手云控:引领5G电