计算机视觉入门培训
計算機視覺入門培訓
- 引入
- 計算機視覺的基本概念
- 計算機視覺五大技術
- 計算機視覺主要應用領域
- 計算機視覺落地場景
一、引入
二、計算機視覺的基本概念
What?
計算機視覺的概念
計算機視覺是使用計算機及相關設備對生物視覺的一種模擬,它的主要任務就是通過對采集的圖片或視頻進行處理以獲得相應場景的三維信息。即:
? 對圖像中的客觀對象構建明確而有意義的描述
? 從一個或多個數字圖像中計算三維世界的特性
? 基于感知圖像做出對客觀對象和場景有用的決策
計算機視覺的最終目標
使計算機像人那樣,通過視覺觀察和理解世界,具有自主適應環境的能力
計算機視覺與機器視覺的異同
機器視覺的研究對象主要是指工業領域的視覺研究,例如自主機器人的視覺,用于檢測和測量的視覺。
機器視覺是配備有感測視覺儀器的檢測機器,其中光學檢測儀器占有比重非常高,可用于檢測出各種產品的缺陷,或者用與判斷并選擇出物體等。主要大量應用于工廠自動化檢測及機器人產業等。側重的是視覺感官上去做人做不到的工作,測量定位這些,與光源鏡頭自動化控制相關
計算機視覺的研究對象主要是映射到單幅或多幅圖像上的三維場景,例如三維場景的重建。計算機視覺的研究很大程度上針對圖像的內容。
計算機視覺是指用攝影機和計算機代替人眼對目標進行識別、跟蹤和測量等機器視覺,并進一步做圖像處理,用計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像。側重的是利用計算機分析得到的圖像,往往是對圖像里面信息的一個分析處理。
三、計算機視覺五大技術
圖像分類常規流程
- 輸入:輸入是由N個圖像組成的訓練集,共有K個類別,每個圖像都被標記為其中一個類別。
- 學習:使用該訓練集訓練一個分類器,來學習每個類別的外部特征。
- 評價:預測一組新圖像的類標簽,評估分類器的性能,我們用分類器預測的類別標簽與其真實的類別標簽進行比較。
圖像分類常用算法 - K近鄰(KNN)
- 支持向量機(SVM)
- BP神經網絡
- 卷積神經網絡(CNN)
- 遷移學習
AlexNet網絡架構將CNN用到了更深更寬的網絡中,在每個隱藏層內使用ReLU代替了Sigmoid,激活函數為線性的,要比邏輯單元的訓練速度更快、性能更好,解決了sigmoid在訓練較深的網絡中出現的梯度消失問題,相比于以前的LeNet其分類的精度更高;AlexNet使用Dropout隨機失活,隨機忽略一些神經元,以避免過擬合;在以前的CNN中普遍使用平均池化層,AlexNet全部使用最大池化層,避免了平均池化層的模糊化的效果,并且步長比池化的核的尺寸小,這樣池化層的輸出之間有重疊,提升了特征的豐富性;提出了局部響應歸一化LRN,對局部神經元創建了競爭的機制,使得其中響應小的值變得更大,并抑制反饋較小的;使用了gpu加速神經網絡的訓練;使用數據增強的方法緩解過擬合現象。
區域卷積神經網絡(R-CNN)
R-CNN首先對圖像選取若干提議區域(例如錨框也是一種選取方法)并標注它們的類別和邊界框(如偏移量);然后用卷積神經網絡對每個提議區域做前向計算抽取特征;最后我們用每個提議區域的特征預測類別和邊界框。其算法原理如下:
? 在R-CNN中使用選擇性搜索算法掃描輸入圖像,尋找其中的可能對象,從而生成約2000個區域建議;
? 在這些區域建議上運行一個卷積神網絡;
? 將每個卷積神經網絡的輸出傳給支持向量機(SVM),使用一個線性回歸收緊對象的邊界框。
選擇性搜索算法(selective search)
? 按一定的規則生成區域集R;
? 計算區域集R里每個相鄰區域的相似度S={s1,s2,…};
? 找出相似度最高的兩個區域,將其合并為新集,添加進R;
? 從S中移除所有與2中有關的子集
? 計算新集與所有子集的相似度
? 跳至2,直至S為空
實質上,我們這是將對象檢測轉換為一個圖像分類問題。由于用于SVM、b-box回歸的特征需要存儲到磁盤中,將占用大量的磁盤空間,且提取這些特征也會耗費好多時間,所以這種方法訓練速度慢,需大量的磁盤空間,推理速度也很慢。
Fast R-CNN
R-CNN的升級版本Fast R-CNN,通過使用了2次增強,大大提了檢測速度。其改進如下:
? 在建議區域之前進行特征提取,因此在整幅圖像上只能運行一次卷積神經網絡;
? 用一個 softmax 層代替支持向量機,對用于預測的神經網絡進行擴展,而不是創建一個新的模型;
Fast R-CNN 的運行速度要比R-CNN快很多,因為在一幅圖像上它只能訓練一個CNN,其中選擇性搜索算法生成區域建議仍然要花費大量時間。一旦我們有了區域建議,就直接將它們送入Fast R-CNN。并且我們還添加了一個池化層、一些全連接層、一個softmax分類層以及一個邊界框回歸器,使得Faster R-CNN成為對象檢測性能最好的方法之一。
四、計算機視覺主要應用領域
五、計算機視覺落地場景
總結
- 上一篇: 文献管理软件
- 下一篇: 程序员必备网页前端设计网站