yolo v3制作自己的数据_小白也能弄懂的目标检测之YOLO系列 第一期
生活随笔
收集整理的這篇文章主要介紹了
yolo v3制作自己的数据_小白也能弄懂的目标检测之YOLO系列 第一期
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
大家好,上期分享了電腦端幾個(gè)免費(fèi)無廣告且實(shí)用的錄屏軟件,這期想給大家來講解YOLO這個(gè)算法,從零基礎(chǔ)學(xué)起,并最終學(xué)會(huì)YOLOV3的Pytorch實(shí)現(xiàn),并學(xué)會(huì)自己制作數(shù)據(jù)集進(jìn)行模型訓(xùn)練,然后用自己訓(xùn)練好的模型進(jìn)行預(yù)測。話不多說,先上我用VisDrone數(shù)據(jù)集進(jìn)行訓(xùn)練的效果圖:在正式制作數(shù)據(jù)集進(jìn)行模型訓(xùn)練之前,還是向大家介紹一下YOLO的來源以及其作用效果,我想你們也并不只是想單純按步驟跑起來這么簡單吧,換了一下樣子,到時(shí)候又不會(huì)了,所以重要的是自己能夠理解這其中的原理,讓我們一起來學(xué)習(xí)了解一下吧。
前言
當(dāng)我們談起計(jì)算機(jī)視覺時(shí),首先想到的就是圖像分類,沒錯(cuò),圖像分類是計(jì)算機(jī)視覺最基本的任務(wù)之一,但是在圖像分類的基礎(chǔ)上,還有更復(fù)雜和有意思的任務(wù),如目標(biāo)檢測,物體定位,圖像分割等,見圖1所示。其中目標(biāo)檢測是一件比較實(shí)際的且具有挑戰(zhàn)性的計(jì)算機(jī)視覺任務(wù),其可以看成圖像分類與定位的結(jié)合,給定一張圖片,目標(biāo)檢測系統(tǒng)要能夠識(shí)別出圖片的目標(biāo)并給出其位置,由于圖片中目標(biāo)數(shù)是不定的,且要給出目標(biāo)的精確位置,目標(biāo)檢測相比分類任務(wù)更復(fù)雜。目標(biāo)檢測的一個(gè)實(shí)際應(yīng)用場景就是無人駕駛,如果能夠在無人車上裝載一個(gè)有效的目標(biāo)檢測系統(tǒng),那么無人車將和人一樣有了眼睛,可以快速地檢測出前面的行人與車輛,從而作出實(shí)時(shí)決策。總結(jié):目標(biāo)檢測是識(shí)別圖片或者視頻中所出現(xiàn)所有的目標(biāo)和其位置,要解決的問題是:目標(biāo)分類和目標(biāo)定位。目前比較流行的目標(biāo)檢測算法可以分為兩類:第一類是基于侯選區(qū)域Region Proposal的R-CNN系算法(R-CNN,Fast R-CNN, Faster R-CNN),它們是two-stage的,需要先使用啟發(fā)式方法(selective search)或者CNN網(wǎng)絡(luò)(RPN)產(chǎn)生候選區(qū)域Region Proposal,然后再在Region Proposal上做分類與回歸。通俗的意思就是:網(wǎng)絡(luò)會(huì)根據(jù)候選區(qū)域生成位置和類別。第二類是像Yolo,SSD這類one-stage算法,其僅僅使用一個(gè)CNN網(wǎng)絡(luò)直接預(yù)測不同目標(biāo)的類別與位置,直接從圖片生成位置和類別。從圖中的FPS和mAP我們可以看出:第一類方法是準(zhǔn)確度高一些,但是速度慢,但是第二類算法是速度快,但是準(zhǔn)確性要低一些。這里FPS是用來評估目標(biāo)檢測的速度,即每秒內(nèi)可以處理的圖片數(shù)量或者處理一張圖片所需時(shí)間來評估檢測速度,時(shí)間越短,速度越快。mAP是物體檢測器準(zhǔn)確率的度量方法,通俗來說就是目標(biāo)檢測準(zhǔn)確度。提醒:FPS和mAP是目標(biāo)檢測算法的兩個(gè)重要評估指標(biāo)。這里大家可能不太懂具體是什么意思,不要擔(dān)心,后期在我的卷積系列單元里面會(huì)出有關(guān)于這些,幫助大家更好的理解。YOLO進(jìn)化史
這里主要介紹YOLO算法,首先了解一下YOLO的進(jìn)化史,其全稱是You Only Look Once: Unified, Real-Time Object Detection,You Only Look Once說的是只需要一次CNN運(yùn)算,Unified指的是這是一個(gè)統(tǒng)一的框架,提供end-to-end的預(yù)測,而Real-Time體現(xiàn)是Yolo算法速度快。通俗的意思就是神經(jīng)網(wǎng)絡(luò)只需要看一次圖片,就可以預(yù)測圖片中所有的物體邊框。從圖中我們可以看到,YOLO已經(jīng)發(fā)展到第五代了,而v4和v5是最近提出來的,所以其中包含的技術(shù)是非常多的,對于新手來說理解起來肯定又很大的難度,故在此我想和大加分享一下有關(guān)于YOLO系列的知識(shí),以便大家能夠更好的理解,這里我會(huì)從YOLOV1開始進(jìn)行講解,我想只有深入理解,才能更好的使用,所以如果你感興趣的話,就繼續(xù)追我下面的文章吧。參考:https://blog.csdn.net/qq_34510308/article/details/106653190https://zhuanlan.zhihu.com/p/32525231https://segmentfault.com/a/1190000022632577·END·微信號(hào):碼農(nóng)的后花園長按識(shí)別關(guān)注哦總結(jié)
以上是生活随笔為你收集整理的yolo v3制作自己的数据_小白也能弄懂的目标检测之YOLO系列 第一期的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python 底层实现_用Python从
- 下一篇: python程序员年薪百万_想要成为年薪