Ubuntu 16.04下Caffe-SSD的应用(六)——PASCAL VOC2007数据集介绍
前言
1.PASCAL VOC為圖像識(shí)別與分類提供了一整套標(biāo)準(zhǔn)化的圖像數(shù)據(jù)集,VOC數(shù)據(jù)集是衡量圖像分類識(shí)別能力的基準(zhǔn),好多深度學(xué)習(xí)的框架在識(shí)別這塊都以此數(shù)據(jù)集作為演示樣例。PASCAL VOC數(shù)據(jù)集的下載鏈接。
2.我們想要用Caffe-SSD訓(xùn)練自己想要識(shí)別數(shù)據(jù)模型,也是要制作自己的VOC數(shù)據(jù)集,那么最好的辦法是看官方的數(shù)據(jù)的結(jié)構(gòu)與它們之間的關(guān)聯(lián),才好制作自己的數(shù)據(jù)集。
3.我這是以VOC2007為例子,大概介紹VOC數(shù)據(jù)集的結(jié)構(gòu)與各個(gè)文件的功能。
VOC2007數(shù)據(jù)集的目錄結(jié)構(gòu)
當(dāng)把下載好之后的VOC2007解壓出來(lái),可以看到里面五個(gè)目錄。
1.Annotations目錄
(1)目錄下存放的是 xml 文件,每個(gè)xml文件對(duì)應(yīng) JPEGImage 里面的一張圖片,這個(gè)xml文件是用標(biāo)注工具對(duì) JPEGImage 里的圖像進(jìn)行標(biāo)注得到的。
(2)xml文件是一種用于標(biāo)記電子文件使其具有結(jié)構(gòu)性的標(biāo)記語(yǔ)言,打開一個(gè)文件可以看到對(duì)應(yīng)的圖像的一些信息和標(biāo)注工具標(biāo)注出要訓(xùn)練的的物體的相關(guān)信息。文件打開內(nèi)容如下:
這個(gè)文件對(duì)應(yīng)的圖像是這張
2.ImageSets目錄是存放記錄各個(gè)數(shù)據(jù)正負(fù)樣本的 txt 文件,ImageSets有三個(gè)目錄。
(1)Layout目錄有四個(gè)txt文件。
這個(gè)在我們制作自己的數(shù)據(jù)時(shí)用不上,所以就不去做深入了解,但看文件名也大概能明白是用來(lái)放訓(xùn)練,測(cè)試,驗(yàn)證,交叉驗(yàn)證相關(guān)的圖數(shù)據(jù)。
(2)Main目錄
XXX_train中存放的是訓(xùn)練使用的數(shù)據(jù),每一個(gè)類別的train數(shù)據(jù)都有5717個(gè)。
XXX_val中存放的是驗(yàn)證結(jié)果使用的數(shù)據(jù),每一個(gè)類別的val數(shù)據(jù)都有5823個(gè)。
XXX_trainval將上面兩個(gè)進(jìn)行了合并,每一個(gè)類別有11540個(gè)。
需要保證的是train和val兩者沒(méi)有交集,也就是訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)不能有重復(fù),在選取訓(xùn)練數(shù)據(jù)的時(shí)候 ,也應(yīng)該是隨機(jī)產(chǎn)生的。
打開其中的一個(gè)txt文件可以看到如下的內(nèi)容:
可以看到前面的表示圖像的名稱不帶擴(kuò)展名,后面如果是1代表正樣本,如果是-1代表負(fù)樣本。
(3)Segmentation目錄下的四個(gè)txt文件,放著從圖像里分割出分類對(duì)的相關(guān)信息,test放著測(cè)試數(shù)據(jù)的圖像名,val中存放的是驗(yàn)證結(jié)果使用的數(shù)據(jù),train中存放的是訓(xùn)練使用的數(shù)據(jù),trainval是將val與train進(jìn)行了合并。
3.JPEGImages目錄放置數(shù)據(jù)的原始圖片,圖片的文件名用統(tǒng)一以一種格式以遞增式進(jìn)行命名。
4.SegmentationClass目錄是放置分割好的類的數(shù)據(jù)。
5.SegmentationObject目錄放置著分割好的對(duì)象的數(shù)據(jù)。
結(jié)語(yǔ)
1.以上是關(guān)于VOC2007的目錄結(jié)構(gòu)與放置的內(nèi)容的相關(guān)介紹,是為了更好的去制作我們自己的數(shù)據(jù)做準(zhǔn)備。但我們自己制作自己的SSD訓(xùn)練集時(shí),不像官方格式這么繁多,能訓(xùn)練出結(jié)果就行。
2.這是我對(duì)于PASCAL VOC數(shù)據(jù)集的理解,有理解不到的地方或者想要做相關(guān)可以加這個(gè)群(487350510)互相學(xué)習(xí)。
總結(jié)
以上是生活随笔為你收集整理的Ubuntu 16.04下Caffe-SSD的应用(六)——PASCAL VOC2007数据集介绍的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Ubuntu 16.04下Caffe-S
- 下一篇: Ubuntu 16.04下Caffe-S