计算机视觉的发展历史
“看”是人類與生俱來的能力。剛出生的嬰兒只需要幾天的時間就能學會模仿父母的表情,人們能從復雜結構的圖片中找到關注重點、在昏暗的環境下認出熟人。隨著人工智能的發展,機器視覺技術也試圖在這項能力上匹敵甚至超越人類,那么你對計算機視覺的發展歷史了解么?知道它是如何應用于圖像檢測、缺陷檢測等領域的么?
發展歷史過程
1966年,人工智能學家Minsky在給學生布置的作業中,要求學生通過編寫一個程序讓計算機告訴我們它通過攝像頭看到了什么,這也被認為是計算機視覺最早的任務描述。
七八十年代,隨著現代電子計算機的出現,計算機視覺技術也初步萌芽。人們開始嘗試讓計算機回答出它看到了什么東西,于是首先想到的是從人類看東西的方法中獲得借鑒。
借鑒之一是當時人們普遍認為,人類能看到并理解事物,是因為人類通過兩只眼睛可以立體地觀察事物。因此要想讓計算機理解它所看到的圖像,必須先將事物的三維結構從二維的圖像中恢復出來,這就是所謂的“三維重構”的方法。
借鑒之二是人們認為人之所以能識別出一個蘋果,是因為人們已經知道了蘋果的先驗知識,比如蘋果是紅色的、圓的、表面光滑的,如果給機器也建立一個這樣的知識庫,讓機器將看到的圖像與庫里的儲備知識進行匹配,是否可以讓機器識別乃至理解它所看到的東西呢,這是所謂的“先驗知識庫”的方法。
這一階段的應用主要是一些光學字符識別、工件識別、顯微/航空圖片的識別等等,
九十年代,計算機視覺技術取得了更大的發展,也開始廣泛應用于工業領域。一方面原因是CPU、DSP等圖像處理硬件技術有了飛速進步;另一方面是人們也開始嘗試不同的算法,包括統計方法和局部特征描述符的引入。
進入21世紀,得益于互聯網興起和數碼相機出現帶來的海量數據,加之機器學習方法的廣泛應用,計算機視覺發展迅速。以往許多基于規則的處理方式,都被機器學習所替代,自動從海量數據中總結歸納物體的特征,然后進行識別和判斷。
這一階段涌現出了非常多的應用,包括典型的相機人臉檢測、安防人臉識別、車牌識別等等。
2010年以后,借助于深度學習的力量,計算機視覺技術得到了爆發增長和產業化。通過深度神經網絡,各類視覺相關任務的識別精度都得到了大幅提升。
在全球最權威的計算機視覺競賽ILSVR(ImageNet Large Scale VisualRecognition Competition)上,千類物體識別Top-5錯誤率在2010年和2011年時分別為28.2%和25.8%,從2012年引入深度學習之后,后續4年分別為16.4%、11.7%、6.7%、3.7%,出現了顯著突破。
計算機視覺技術的應用場景也快速擴展,除了在比較成熟的安防領域應用外,也有應用在金融領域的人臉識別身份驗證、電商領域的商品拍照搜索、醫療領域的智能影像診斷、機器人/無人車上作為視覺輸入系統等,包括許多有意思的場景:照片自動分類(圖像識別+分類)、圖像描述生成(圖像識別+理解)等等。
計算機視覺中的三個概念
計算機視覺:指對圖像進行數據采集后提取出圖像的特征,一般處理的圖像的數據量很大,偏軟件層
機器視覺:處理的圖像一般不大,采集圖像數據后僅進行較低數據流的計算,偏硬件層,多用于工業機器人、工業檢測等
圖像處理:對圖像數據進行轉換變形,方式包括降噪、、傅利葉變換、小波分析等,圖像處理技術的主要內容包括圖像壓縮,增強和復原,匹配、描述和識別3個部分。
計算機視覺是指利用計算機來模擬人的視覺,是人工智能中的“看”。從技術流程上來說,分為目標檢測、目標識別、行為識別三個部分。根據識別的目標種類可以分為圖像識別、物體識別、人臉識別、文字識別等。在智能機器人領域,計算機視覺可以對靜態圖片或動態視頻中的物體進行特征提取、識別和分析,從而為后續的動作和行為提供關鍵的信息。
近年來,基于計算機視覺的智能視頻監控和身份識別等市場逐漸成熟擴大,機器視覺的技術和應用趨于成熟,廣泛應用于制造、 安檢、圖像檢索、醫療影像分析、人機交互等領域。
總結
以上是生活随笔為你收集整理的计算机视觉的发展历史的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OpenCV计算机视觉编程攻略之提取图片
- 下一篇: 新京报:“AI换脸”被滥用 科技莫成“黑