What?你还搞不懂什么是物体检测?
全世界只有3.14 %?的人關注了
爆炸吧知識
計算機視覺在上一個世紀60年代脫胎于人工智能與認知神經科學,并旨在通過設計算法來讓計算機自動理解圖像的內容。
于是為了“解決”這類機器視覺的問題,麻省理工在1966年正式將這個問題作為一個夏季項目,然而事實驗證,要解決這個問題可能還需要更長時間。
轉眼間,距離麻省理工最初提出這個項目已過去50多年,一般的圖像理解任務仍舊是不能得到完美解決。
不過也已取得顯著進展,并且隨著機器視覺算法商業化的成功,機器視覺產品已經開始擁有廣泛的用戶,包括圖像分割(例如微軟office中去除圖片背景的功能)、圖像檢索、人臉檢測對焦和Kinect的人體運動捕捉等。
物體檢測是計算機視覺與模式識別領域的核心問題,一直以來受到學術界與工業界的廣泛關注。當前物體檢測最大的難點是如何對場景中多種尺度的物體進行有效表征,進而進行更為高效、更為準確、更為魯棒的物體檢測。
物體檢測對于人眼來說并不困難,我們可以通過對圖片中不同顏色、紋理、邊緣模塊的感知很容易定位出目標物體,但對于計算機來說,面對的是RGB像素矩陣,很難從圖像中直接得到狗和貓這樣的抽象概念并定位其位置,再加上物體姿態、光照和復雜背景混雜在一起,使得物體檢測更加困難。
于是人們在不斷探索的過程中,涌現出用以解決各類問題的算法、框架,例如決策樹、Fast R-CNN、Mask R-CNN等,今天小天將主要講講Mask R-CNN。
Mask R-CNN是一個實例分割(Instance segmentation)算法,由何凱明等人在2017年發表的論文中提出,可以用來做“目標檢測”、“目標實例分割”、“目標關鍵點檢測”。
Mask R-CNN是一個非常靈活的框架,可以通過增加不同的分支來完成不同的任務,例如可以用來完成目標分類、目標檢測、語義分割、實例分割、人體姿勢識別等多種任務!
Mask R-CNN算法建立在Faster R-CNN架構的基礎之上,我們可以將Mask R-CNN架構可視化如下圖所示:
相較于Faster-rcnn,Mask R-CNN擁有更高速、高準確率(高的分類準確率、高的檢測準確率、高的實例分割準確率等)、簡單直觀、易于使用的特性。即便如此,Faster-rcnn與Mask R-CNN這兩個算法都是對應領域中的經典之作。
Mask R-CNN比Faster-rcnn復雜,但是最終仍然可以達到5fps的速度,這和原始的Faster-rcnn的速度相當。
此外,由于發現了ROI Pooling中所存在的像素偏差問題,提出了對應的ROIAlign策略,加上FCN精準的像素MASK,使得其可以獲得高準確率。
縱觀整個Mask R-CNN,它的算法的思路很簡單,就是在原始Faster-rcnn算法的基礎上面增加了FCN來產生對應的MASK分支。即Faster-rcnn + FCN,更細致的是 RPN + ROIAlign + Fast-rcnn + FCN。
那么問題來了,到底如何借助Mask R-CNN來進行進行物體檢測呢?
為了讓大家對Mask R-CNN在物體檢測領域的應用有全面的了解,爆炸吧知識攜手唐老師推出《深度學習-物體檢測實戰》。
長按識別二維碼
即可查看課程
內容包含:物體檢測框架Mask R-CNN項目配置,Mask R-CNN網絡框架源碼詳解、基于Mask R-CNN訓練自己的數據集與任務、遷移學習與Resnet網絡架構、物體檢測Faster R-CNN系列。
限時直降70元,卻有滿滿干貨!不止是學習建議,更注重學以致用:
多維度教學模式:錄播+學習群,不受時間/地域限制,大家可輕松安排時間學習;
項目實戰:以真實賽題為訓練目標,學習就是比賽,這樣才能學以致用;
全程代碼:課上講解的訓練代碼都會分享給大家,使學生做到及時的活學活用。
關于主講老師
適用對象與課程特色
適用對象:
◆?人工智能愛好者、Python愛好者、機器學習愛好者、深度學習愛好者
課程特色:
學習平臺——騰訊課堂
上課形式——錄播
課程資料——配有專屬實戰案例
課程收益——了解物體檢測Faster R-CNN與Mask R-CNN,快速入門物體檢測
注意事項
①課程有疑問或成功報名均請聯系助教?
小七微信:zwjlee001
大魚QQ:210187565
來吧,點擊下方“閱讀原文”,跟隨著老師的腳步,提升自我!
總結
以上是生活随笔為你收集整理的What?你还搞不懂什么是物体检测?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 越来越多的人不刷朋友圈竟然是因为....
- 下一篇: 让TA们告诉你,疫情当下如何更彪悍的成长