yolo算法的优缺点分析_yolo算法介绍
yolo算法介紹
(2020-06-06 16:49:28)
把Yolo模型搞清楚后不得不再次為人類的智慧感慨,一個(gè)巧妙的模型。
要想理解Yolo我們先要搞清楚Yolo到底要解決一個(gè)什么問題,解決這個(gè)問題必須做哪些事情。
Yolo屬于多目標(biāo)檢測,因此需要解決兩個(gè)問題:
1)從一張圖片中可以識別出多個(gè)不同種類的物體
2)并且用一個(gè)框?qū)⒚總€(gè)物體分割出來,既要得到物體的尺寸。
直觀來看這兩個(gè)問題,那一個(gè)是分類問題,另一個(gè)是回歸問題。分類問題就是說能夠從圖片中識別出不同物體種類,回歸問題是可以通過非線性擬合計(jì)算出物體的尺寸坐標(biāo)。
把握住解決問題的實(shí)質(zhì)就可以明確樣本訓(xùn)練如何設(shè)計(jì)了,分類問題就是常規(guī)的圖像識別,而回歸問題就需要我們提前畫好一個(gè)框?qū)⒈蛔R別物體恰到好處的框起來,這個(gè)框的尺寸就是就可以當(dāng)做目標(biāo)值。這樣就建立了輸入和輸出的關(guān)系:輸入是圖像,輸出是種類和尺寸。
要對圖片中一個(gè)物體進(jìn)行分類,首先要解決如何從圖片中發(fā)現(xiàn)這個(gè)物體,最直觀的方法就是用不同尺寸的方框進(jìn)行掃描,這個(gè)方框可以被稱為window,和要得到的物體尺寸是兩回事。這就是RNN的方法,但這種方法計(jì)算量大,因此出現(xiàn)了Yolo,其核心思想就體現(xiàn)在如何從一張圖像準(zhǔn)確獲取目標(biāo)的方法上。基本思路就是先對圖像進(jìn)行劃分,劃分成圍棋格子那樣,之后以每個(gè)網(wǎng)格為核心進(jìn)行目標(biāo)檢測。注意這里的格子仍然是window的概念不是物體尺寸,具體過程是這樣的,訓(xùn)練對每個(gè)網(wǎng)格進(jìn)行的,這個(gè)網(wǎng)格是否能代表某一個(gè)物體及物體尺寸在訓(xùn)練集都是可以得到的。預(yù)測同樣也是以每個(gè)網(wǎng)格進(jìn)行的。
這樣就帶來一個(gè)問題,如果多個(gè)網(wǎng)格都說自己識別到了某一個(gè)物體該如何處理,這里使用了基于IOU的非極大值抑制算法,就是找到一個(gè)最合理的框,以得分最高的為基準(zhǔn),想同類并且IOU大于0.5的就說明是同一個(gè)物體,想同類IOU小于0.5說明雖然是統(tǒng)一物體但可能出現(xiàn)在了照片不同位置。
后來又發(fā)現(xiàn)一個(gè)問題,同一個(gè)格子檢測出兩個(gè)物體怎么辦,這是就提出了Anchor
box的概念,既一個(gè)格子之前的輸出就是一個(gè)物體種類的信息,那現(xiàn)在不是了,可能是2個(gè)或3個(gè)。這時(shí)就帶來了新問題,這么多事先畫好的預(yù)選框,各種目標(biāo)都可能重合,怎么合理分配呢。這是就引入了聚類和金字塔的技術(shù)結(jié)合的方法:
1)聚類就是把不同預(yù)選框按照尺寸進(jìn)行自動歸類
2)Yolo從模型上建立金字塔模式,將不同預(yù)選框按照尺寸分配給不同的特征層。
這樣就實(shí)現(xiàn)了大尺寸在深層識別,小尺寸在淺層識別,還實(shí)現(xiàn)了語義上下文分析功能,最終得到了完美的多目標(biāo)檢測算法。
分享:
喜歡
0
贈金筆
加載中,請稍候......
評論加載中,請稍候...
發(fā)評論
登錄名: 密碼: 找回密碼 注冊記住登錄狀態(tài)
昵???稱:
評論并轉(zhuǎn)載此博文
發(fā)評論
以上網(wǎng)友發(fā)言只代表其個(gè)人觀點(diǎn),不代表新浪網(wǎng)的觀點(diǎn)或立場。
總結(jié)
以上是生活随笔為你收集整理的yolo算法的优缺点分析_yolo算法介绍的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
                            
                        - 上一篇: 对话阿里巴巴副总裁贾扬清:追求大模型,并
 - 下一篇: typora公式zuo对齐_Markdo