语义分割的时候,发的牢骚
問題:opencv讀取灰度圖調用shape屬性,顯示通道數是3
- 我想跑起來 嗚嗚嗚嗚
1:VOC數據集
1:IPEGImages
- 原始圖片,RGB圖片,大小不一致
2:Segmentation
- 分割之后的圖片,得到的是灰度圖(深度是8位)
3:ImageSet
- ImageSet 中含有train.txt,value.txt,test.txt
4:VOC_COLORMAP
- 標簽
https://github.com/ShusenTang/Dive-into-DL-PyTorch/blob/master/docs/chapter09_computer-vision/9.9_semantic-segmentation-and-dataset.md
2:Train.py
1:aux_branch
- 是否使用輔助分支
2:下采樣的倍數
- 16
- 8的話,顯存占用量特別大
3:Epoch
-
初始化
-
凍結層
-
0
-
50
-
50
-
100
-
找一個pspnet網絡
-
開始的RGB顏色的標注
-
MIOU的計算
mask獲取對應的區域
3:pspNet網絡的采集
-
怎么將灰度圖轉化為 RGB圖像
-
MIOU的計算問題
1:pspNet
- 不失幀的resize
- 主干提取網絡resNet50 進行初步特征提取
- pspNet,不同大小的池化層進行平均池化
- 我們使用了 1 X 1, 2 X 2, 3 X 3, 6 X 6的區域進行操作 進行加強特征提取
2 問題
- 【PyTorch系列】找不到d2lzh_pytorch包,No module named ‘d2lzh_pytorch’
- https://blog.csdn.net/lilileon/article/details/114435102
3:問題
AttributeError: 'NDArray' object has no attribute 'convert'-
colormap.convert(RGB)
- Image.fromarray(arr, 'RGB')
4:NDaRRAY 和 Nparray
{[128, 0, 64], [128, 64, 0], [128, 0, 192], [0, 128, 64], [0, 192, 128], [192, 224, 224], [0, 0, 192], [128, 128, 192], [0, 128, 192], [0, 0, 64], [128, 128, 64], [0, 64, 0], [0, 128, 0], [128, 128, 128], [0, 0, 0], [0, 128, 128], [128, 0, 128], [128, 0, 0], [128, 128, 0], [0, 0, 128], [0, 192, 0], [0, 64, 128]} 0:白色[128, 0, 64] [128, 64, 0], [128, 0, 192], [0, 128, 64], [0, 192, 128], [192, 224, 224], [0, 0, 192], [128, 128, 192], [0, 128, 192], [0, 0, 64], [128, 128, 64], [0, 64, 0], [0, 128, 0] , [128, 128, 128] 14:黑色[0, 0, 0], [0, 128, 128], [128, 0, 128] , [128, 0, 0], 18:貓頭鷹[128, 128, 0], [0, 0, 128], [0, 192, 0], [0, 64, 128]}[0, 0, 0] 背景
-
0 是 白色 [128, 0, 64]
-
18 是鳥
-
實在不行,采用非深度學習的方法,全部設置為背景???
-
是不是我讀取的時候讀錯了???8位的應該怎么讀取
5:讀取txt中的所有目錄
- 讀取 RGB的所有圖像
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-KKys6WnY-1622361549148)(CV%E4%BD%9C%E4%B8%9A%E7%AC%94%E8%AE%B0.assets/image-20210529181221769.png)]
-
我要死了~~~~~ ~~~~
-
應該寫不完了,我死了~·
-
弄一個全是黑的的圖片吧,這個怎么弄的
-
測試集上是 0.8732
標簽
-
VOC 2012中的ground truth label 是以RGB偽彩色圖像的形式保存的
-
完結,撒花~~~
7:為什么一訓練就變花了啊????
上天啊~~~— 讓我過一過吧,我真的只想得到一個 0.02 的結果
- 可以嗎???
8:kaggle 下載代碼后運行的結果文件
- commit之后,就會重新執行,得到最后的結果輸出
9:TMD
顏色又搞反了
我真是個 廢物
- 我覺得很扯,怎么顏色又不對····我是真的迷,迷了···
kaggle下載代碼運行后的結果文件_筆記小屋-CSDN博客
一次跑三分鐘,50輪就是一百五十分鐘,差不多三個小時
-
為什么我越訓練越低啊????為什么我第一次最高???搞笑吧???
-
當epoch = 0 的時候
- MIOU = 0.83
-
epoch = 1 的時候
- 先執行的是test文件
- MIOU 74.06
-
epoch = 4 的時候
- MIOU 79.89
-
epoch = 4 2 的時候
- mIoU: 82.82; mPA: 89.19
-
epoch = 56 的時候
- ===> mIoU: 82.63; mPA: 89.25
-
epoch = 70 的時候
- Mean IoU: 0.8263
-
很服,很迷,你是不想讓我訓練嗎??、
-
哭
代碼地址
CV3Predict:https://www.kaggle.com/kksspsls/cv3predict
CV3MIOUTEST:https://www.kaggle.com/kksspsls/cv3mioutest
CV3trainModel:https://www.kaggle.com/kksspsls/cv3trainmodel
總結
以上是生活随笔為你收集整理的语义分割的时候,发的牢骚的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 语义分割 小总结
- 下一篇: VOC 灰度图 索引图