Computer Vision Tasks
Computer Vision Tasks:
圖像分類、目標(biāo)檢測、語義分割、實例分割;
只有目標(biāo)檢測和實例分割是實現(xiàn)了實例級別的識別的,就是把每一個單獨的物體拎出來識別的;目標(biāo)檢測是畫框框,而實例分割是摳圖。
?實例識別:就是把圖片中的每一個物體都單獨進(jìn)行識別出來;
目標(biāo)檢測:是輸入圖像,輸出每一個物體;(就是多個類別的多個框)
圖像分割:
(1)Semantic Segmentation語義分割:我對每一個像素分類,我不管這個像素是屬于哪幾個物體的,只管他是屬于什么類別的;(并不區(qū)分不同物體的像素)(把同一個目標(biāo)的物體扣到一起,并不區(qū)分每一個物體,而實例分割需要區(qū)分每一個物體)
(2)Instance Segmentation實例分割:把同一個類別的不同實例給他區(qū)分出來;(需要區(qū)分同一類別不同物體的像素)
在無人駕駛中還有全景分割:要把它看到的所有像素都做實例分割;
?下面幾張圖比較有說服力:
?
?計算機(jī)視覺還有其他的解決問題:
除了圖像檢測、定位、目標(biāo)檢測、語義分割、實例分割之外還有關(guān)鍵點檢測;
綜述:里邊把目標(biāo)檢測里邊的代表性的模型、發(fā)展過程,還有著名的一些數(shù)據(jù)集都寫出來了;都
?
?目標(biāo)檢測分為兩個流派:
(1)單階段模型:不提取候選框,我直接把全圖喂到模型里邊,喂到算法里邊,算法能夠直接輸出出來目標(biāo)檢測的結(jié)果,一步到位他是一個統(tǒng)一的端到端的系統(tǒng),所以是單階段;
(2)兩階段模型:先從圖像中提取若干候選框,再逐一的對這些候選框進(jìn)行分類、甄別以及調(diào)整他們的坐標(biāo),最后得出結(jié)果,(就是先提取候選框,再逐一的進(jìn)行甄別,這是兩個階段,所以稱作兩階段模型)
兩階段一般是比較準(zhǔn)確的,因為他要篩選出很多個候選框,比較準(zhǔn)確但是比較耗時;而單階段呢雖然比較快一步到位,但是準(zhǔn)確率不是很高;但是現(xiàn)在YOLO發(fā)展到V5在速度和準(zhǔn)確度(小目標(biāo)識別)都已經(jīng)很好了;
?
總結(jié)
以上是生活随笔為你收集整理的Computer Vision Tasks的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PyTorch框架:(6)图像识别实战常
- 下一篇: 使用pycharm将自己项目代码上传gi