计算机视觉概述
關于計算機視覺的介紹性文章,包括計算機視覺的定義,和人類視覺的區別以及涉及到的學科等等。
1. 什么是計算機視覺
計算機視覺既是工程領域,也是科學領域中的一個富有挑戰性重要研究領域。計算機視覺是一門綜合性的學科,它已經吸引了來自各個學科的研究者參加到對它的研究之中。其中包括計算機科學和工程、信號處理、物理學、應用數學和統計學,神經生理學和認知科學等。
視覺是各個應用領域,如制造業、檢驗、文檔分析、醫療診斷,和軍事等領域中各種智能/自主系統中不可分割的一部分。由于它的重要性,一些先進國家,例如美國把對計算機視覺的研究列為對經濟和科學有廣泛影響的科學和工程中的重大基本問題,即所謂的重大挑戰(grandchallenge)。"計算機視覺的挑戰是要為計算機和機器人開發具有與人類水平相當的視覺能力。機器視覺需要圖象信號,紋理和顏色建模,幾何處理和推理,以及物體建模。一個有能力的視覺系統應該把所有這些處理都緊密地集成在一起。"[Neg91]作為一門學科,計算機視覺開始于60年代初,但在計算機視覺的基本研究中的許多重要進展是在80年代取得的?,F在計算機視覺已成為一門不同于人工智能、圖象處理、模式識別等相關領域的成熟學科。計算機視覺與人類視覺密切相關,對人類視覺有一個正確的認識將對計算機視覺的研究非常有益。為此我們將先介紹人類視覺。
1.1 人類視覺
感覺是人的大腦與周圍世界聯系的窗口,它的任務是識別周圍的物體,并告訴這些物體之間的關系。我們的思維活動是以我們對客觀世界與環境的認識為基礎的,而感覺則是外界是客觀世界與我們對環境的認識之間的橋梁,使我們的思維與周圍世界建立某種對應關系。視覺則是人最重要的感覺,它是人的主要感覺來源,人類認識外界信息的80%來自視覺。人有多種感覺,但對人的智力產生影響的主要是視覺和聽覺。味覺和嗅覺是豐富多樣的,但很少有人去思考它們。在視覺和聽覺中形狀、色彩、運動、聲音等就很容易被結合成各種明確和高度復雜、多樣的空間和時間的組織結構。所以這兩種感覺就成了理智活動得以行使和發揮作用的非常合適的媒介和環境。但人聽到的聲音要想具有意義還需要聯系其它的感性材料。而視覺則不同,它是一種高度清晰的媒介,它提供關于外界世界中各種物體和事件的豐富信息。因此它是思維的一種最基本的工具。
視覺對正常人來說是生而有之,毫不費力的能力。但實際上視覺系統所完成的功能卻十分復雜的。有人認為視覺本身就包含了思維的一切基本因素。設想你要在一個會場中尋找一位朋友,呈現在你眼前的是由參加會議的人、桌、椅、主席臺等組成的復雜景物。眼睛得到這些信息以后先要對景物的各部分進行分類,然后從中選出與朋友的外表有關的特征作出判斷,那么在人的眼睛視網膜上映照的景物成象是否就能直接提供判斷時所需要的有關特征呢?不是的,這里需要大腦的思考。例如,雖然人在不同距離處觀察同一物體時在眼睛中成象的大小是不同的。但人們在觀察某人以便估計他的身高時卻不會因為他在近處而感到他高些,也不會因他在遠處而感到他矮些。這是由于大腦根據被觀察物體的距離和與周圍物體的比較,并依靠有關的知識對輸入的圖象信息進行處理,解釋的結果。如果你是在一個燈光暗淡的劇院中尋找朋友,這個問題就變得更為困難。
你剛走進劇院時開始會感到一片漆黑看不清東西,過了幾分鐘你的眼睛變得習慣于在黑暗中觀察。事實上你的視覺系統在此期間中對微光變得更敏感了。但這時許多本來可用的信息喪失了,物體可能難以與背景相區分,許多細節難以分辨。即使這樣人也總能認出朋友??傊?#xff0c;視覺是一個復雜的感知和思維的過程,視覺器官-眼睛接受外界的刺激信息,而大腦對這些信息通過復雜的機理進行處理和解釋,使這些刺激具有明確的物理意義。
從以上分析我們還可以看到敏感(Sansation)、感覺(Perception)、認知(Cognition)這三個概念之間的聯系和差別。敏感是把外界的各種刺激轉換成人體神經系統能夠接受的生物電信號。它所完成的是信號的轉換,并不涉及對信號的理解。例如,人眼是視覺的敏感器官,它使光信號通過視網膜轉換電信號。與攝象機的光電傳感器相似,視網膜的感光細胞對光信號在平面上進行采樣,產生點陣形式的電信號,所不同的僅是攝象機的空間采樣是均勻的,而視網膜的采樣是不均勻的,在中央凹附近采樣分辨率高,而在周圍的分辨率低。而感覺的任務是把敏感器官的各種輸入轉換和處理成為對外部世界的理解。例如,對視覺來說就是能說出周圍世界中有什么東西和這些東西之間的空間關系。這些都是關于周圍世界的概念。從輸入的點陣形式的信號到形式對客觀世界的各種概念其中要經過復雜的信息處理和推理。而認知是以人們對周圍客觀世界的概念為基礎的。如果沒有感覺這個人與外部世界的橋梁或窗口,人的思維活動就換去基本的依據。
1.2 計算機視覺
人類正在進入信息時代,計算機將越來越廣泛地進入幾乎所有領域。一方面是更多未經計算機專業訓練的人也需要應用計算機,而另一方面是計算機的功能越來越強,使用方法越來越復雜。這就使人在進行交談和通訊時的靈活性與目前在使用計算機時所要求的嚴格和死板之間產生了尖銳的矛盾。人可通過視覺和聽覺,語言與外界交換信息,并且可用不同的方式表示相同的含義,而目前的計算機卻要求嚴格按照各種程序語言來編寫程序,只有這樣計算機才能運行。為使更多的人能使用復雜的計算機,必須改變過去的那種讓人來適應計算機,來死記硬背計算機的使用規則的情況。而是反過來讓計算機來適應人的習慣和要求,以人所習慣的方式與人進行信息交換,也就是讓計算機具有視覺、聽覺和說話等能力。這時計算機必須具有邏輯推理和決策的能力。具有上述能力的計算機就是智能計算機。
智能計算機不但使計算機更便于為人們所使用,同時如果用這樣的計算機來控制各種自動化裝置特別是智能機器人,就可以使這些自動化系統和智能機器人具有適應環境,和自主作出決策的能力。這就可以在各種場合取代人的繁重工作,或代替人到各種危險和惡劣環境中完成任務。
計算機視覺就是用各種成象系統代替視覺器官作為輸入敏感手段,由計算機來代替大腦完成處理和解釋。計算機視覺的最終研究目標就是使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應環境的能力。要經過長期的努力才能達到的目標。因此,在實現最終目標以前,人們努力的中期目標是建立一種視覺系統,這個系統能依據視覺敏感和反饋的某種程度的智能完成一定的任務。例如,計算機視覺的一個重要應用領域就是自主車輛的視覺導航,目前還沒有條件實現象人那樣能識別和理解任何環境,完成自主導航的系統。因此,目前人們努力的研究目標是實現在高速公路上具有道路跟蹤能力,可避免與前方車輛碰撞的視覺輔助駕駛系統。這里要指出的一點是在計算機視覺系統中計算機起代替人腦的作用,但并不意味著計算機必須按人類視覺的方法完成視覺信息的處理。計算機視覺可以而且應該根據計算機系統的特點來進行視覺信息的處理。但是,人類視系統是迄今為止,人們所知道的功能最強大和完善的視覺系統。如在以下的章節中會看到的那樣,對人類視覺處理機制的研究將給計算機視覺的研究提供啟發和指導。因此,用計算機信息處理的方法研究人類視覺的機理,建立人類視覺的計算理論,也是一個非常重要和信人感興趣的研究領域。這方面的研究被稱為計算視覺(ComputationalVision)。計算視覺可被認為是計算機視覺中的一個研究領域。
有不少學科的研究目標與計算機視覺相近或與此有關。這些學科中包括圖象處理、模式識別或圖象識別、景物分析、圖象理解等。由于歷史發展或領域本身的特點這些學科互有差別,但又有某種程度的相互重迭。為了清晰起見,我們把這些與計算機視覺有關的學科研究目標和方法的角度加以歸納。
圖象處理技術把輸入圖象轉換成具有所希望特性的另一幅圖象。例如,可通過處理使輸出圖象有較高的信-噪比,或通過增強處理突出圖象的細節,以便于操作員的檢驗。在計算機視覺研究中經常利用圖象處理技術進行預處理和特征抽取。
模式識別技術根據從圖象抽取的統計特性或結構信息,把圖象分成予定的類別。例如,文字識別或指紋識別。在計算機視覺中模式識別技術經常用于對圖象中的某些部分,例如分割區域的識別和分類。
給定一幅圖象,圖象理解程序不僅描述圖象本身,而且描述和解釋圖象所代表的景物,以便對圖象代表的內容作出決定。在人工智能視覺研究的初期經常使用景物分析這個術語,以強調二維圖象與三維景物之間的區別。圖象理解除了需要復雜的圖象處理以外還需要具有關于景物成象的物理規律的知識以及與景物內容有關的知識。
在建立計算機視覺系統時需要用到上述學科中的有關技術,但計算機視覺研究的內容要比這些學科更為廣泛。計算機視覺的研究與人類視覺的研究密切相關(見1.3.5中的論述)。為實現建立與人的視覺系統相類似的通用計算機視覺系統的目標需要建立人類視覺的計算機理論。
本文轉自:http://www.chinaai.org/ip/image-processing/computer-vision.html總結
- 上一篇: 利用vcftools比较两个vcf文件
- 下一篇: Direct3D中的绘制(3)