图像检测技术的研究现状
圖像檢測技術的研究現狀
技術檢測
圖像處理知識庫 · 2016-01-08 19:59
圖像檢測技術的研究現狀
所謂圖像檢測,就是通過圖像對感興趣的特征區域(檢測目標)進行提取的過程,其中圖像是承載檢測目標的載體,檢測目標需要事先進行特征提取、歸納,最終通過相應算法分離出來。
圖像檢測方法可分為單幀圖像檢測和多幀圖像檢測。單幀圖像檢測主要是利用圖像的灰度信息對目標進行分割,主要包括基于灰度閾值的目標檢測方法和基于邊緣信息的目標檢測方法。
多幀圖像檢測通過序列圖像的變化特征實現對目標的提取,主要用于運動目標的檢測,大體包括:基于像素分析的方法、特征檢測的方法和基于變換的方法。本文主要對單幀圖像的檢測方法進行詳述。
1、基于灰度閾值的目標檢測基于灰度閾值的目標檢測是根據目標灰度與背景灰度的不同,通過選取合適的閾值將圖像二值化,使得目標從背景中分離出來的過程。顯然,閾值的選取是目標檢測的關鍵,同樣也是目標檢測的難點,如何能得到合適的灰度閾值,最大程度的將目標提取出來,并消除背景的干擾,這一直是研究的熱點。根據閾值選取數量的不同,基于灰度閾值的目標檢測方法又可分為單閾值目標檢測和多閾值目標檢測。
單閾值目標檢測適合于噪聲少、照度均勻、目標和背景灰度值相差較明顯的情況。最常用的方法有直方圖分析法、迭代分割法。直方圖分析法是多種空間域處理技術的基礎,在目標相比背景比較突出的情況下,直方圖會有明顯的雙峰現象,兩峰之間的谷點即為最佳閾值,這種閾值選取方法又稱為峰谷法。峰谷法主要在理想情況下對閾值進行選取,現實中采集圖像的直方圖經常會有峰值懸殊極大或寬平谷底的情況,一般需要通過分析直方圖的凹形來確定一個較理想的全局閾值迭代分割法的實現過程是:首先對初始圖像的最大灰度值和最小灰度值取平均,得到初始閾值T0;其次根據閾值T0將圖像分為前景與背景,分別求得前景灰度平均值Vq和背景灰度平均值Vb,并對兩者取平均得到T1;通過T1再次將圖像分為前景與背景,通過對前景灰度平均值和背景灰度平均值取平均得到T2;如此往復,當|Tk+1-Tk|<ε時(ε為一無窮小常數),我們認為Tk為最終閾值。迭代分割方法得到的閾值處在與前景和背景區域的重心成反比的位置,因此從路徑規劃的角度可看做一種最優閾值。此外,單閾值分割方法中還有最大類間方差法,最大熵分割法,貝葉斯分割法。其中,最大類間方差法通過尋找一個閾值,使分割后目標和背景之間的方差最大,僅適用于目標和背景所占比例相差不大的情況。最大熵分割法通過在規定的分布集合中尋找熵值最大者作為真實分布的一種判斷,一般情況下由于推測分布與實際分布差距較大,錯分率較大。貝葉斯分割法要求精確估算目標和背景先驗概率,由于實際中采集圖像存在大量噪聲,處理效果會與預想差距較大。
多閾值分割方法是將圖像分為多個具有不同區域特征的分塊,在這些分塊中分別采用不同的閾值對圖像進行分割的方法。相比單閾值分割,它能夠兼顧圖像各處的情況,在有突發噪聲、照度不均、各處對比度不同時對圖像進行有效分割,特別是在目標和背景的灰度有梯度變化時效果最為明顯。
2、基于邊緣信息的目標檢測圖像的邊緣包含了用于識別的有用信息,是圖像分割所依賴的重要特征。邊緣信息包含的往往是圖像中最重要的信息,通常情況下邊緣附近灰度值會發生劇烈變化,基于邊緣信息的目標檢測就是根據這一特征對目標的邊緣進行檢測,進而實現目標的定位。邊緣檢測最為通用的方法是檢測亮度的不連續性,這樣的不連續主要通過求一階導數和二階導數得到檢測,若找到亮度的一階導數在幅值上比指定的閾值大或二階導數有零交叉的位置,可將其識別為邊緣。基于邊緣信息的目標檢測方法大體包括:梯度算子檢測、最優算子檢測、多尺度信號處理方法、自適應平滑濾波法以及利用其它數學工具的邊緣檢測方法。
梯度算子檢測是最基本的邊緣檢測方法,主要通過計算模板系數與所包圍區域內灰度級的乘積之和,并與設定閾值T比較實現。一般情況下,設定的模板系數總和為零,在灰度不變的區域,模板響應也為零,而在灰度變化的區域,模板響應不為零,梯度算子就是依據這一特點對圖像進行檢測的。梯度算子主要包括Roberts算子、Sobel算子、Prewitt算子、Laplacian算子等。Roberts算子是數字圖像中最簡單的算子,經常用于圖像檢測的硬件實現中,不足之處是功能有限(如不能檢測?45倍數的邊緣)。Sobel算子和Prewitt算子是在實踐中計算數字梯度時最常用的,基于Prewitt算子的圖像檢測相比Sobel算子在計算上要簡單一些,但基于Sobel算子的圖像檢測在噪聲抑制特性方面略勝一籌。Laplacian算子一般不以其原始形式用于邊緣檢測,主要原因是:作為一個二階導數,它對噪聲具有無法接受的敏感性,幅值產生雙邊緣且不能檢測邊緣方向,這些均是圖像檢測過程中不希望有的結果。
最優算子檢測是在傳統算子的基礎上發展起來的邊緣檢測方法,主要有LOG(Laplacian of a Gaussian)算子、Canny算子以及基于曲面擬合的邊緣檢測算法。
LOG算子為高斯型的Laplacian算子,它將高斯型平滑函數與Laplacian算子相結合, 首先對圖像進行平滑處理,然后使用Laplacian算子產生雙邊緣圖像,最后通過找到兩個邊緣之間的零交叉定位邊緣。其中,圖像的平滑處理不僅減小了噪聲的影響,還抵消了由Laplacian算子的二階導數引起的逐漸增加的噪聲影響,為Laplacian算子在邊緣檢測中發揮作用提供了有力的條件支持。采用LOG算子進行圖像檢測的優點是抗干擾能力強,邊界定位精度高,連續性好,且能提取出對比度弱的邊界;不足之處是當邊界寬度小于算子寬度時,零交叉處的斜坡發生融合,小于2?2σ(σ為標準差)的區域邊界細節會丟失。
Canny算子的基本思想是把邊緣檢測問題轉換為檢測單位函數的極大值問題,它根據邊緣檢測對好的信噪比與定位性能、邊緣響應唯一性的要求,采用最優化數值方法,得到了對應給定邊緣類型的最佳邊緣檢測模板。基于曲面擬合的邊緣檢測算法的基本思想是用一個平滑曲面與待測點周圍某鄰域內像素的灰度值進行擬合,在此基礎上計算曲面的一階或二階導數。最早采用曲面擬合對圖像進行邊緣檢測的是Prewitt,他首先采用最小二乘法用n階多項式對原始圖像擬合,然后用梯度算子在擬合曲面上進行邊緣檢測,取得了較理想的效果。Haralick在一個規則對稱領域構造了正交多項式,對圖像每一像素鄰域灰度變化作曲面擬合,再用二階方向導數的零交叉檢測階躍邊緣,算法精度有較大提高,但由于正交多項式基構造過程復雜,靈活性差,不易表達復雜邊界形狀,應用受到了限制。
多尺度圖像檢測方法是在尺度空間濾波理論的基礎上發展起來的,它不僅可以辨識出信號中的重要特征,而且能以不同細節程度對信號進行重構,在高級視覺處理中有廣泛的應用。多尺度圖像檢測方法主要包括邊緣聚焦和小波變換。邊緣聚焦的基本思想是用一個很強的平滑在低分辨率下檢測出重要邊緣,再減弱平滑強度進行跟蹤聚焦以確定其準確位置。它的特點是:可不使用閾值,所需計算量與最粗分辨率尺度上的計算量相同,很好的將定位的高精度與良好的噪聲抑制結合起來。小波變換具有本質的多尺度特性,它能把圖像信號分解成不同尺度上的多個分量,對圖像進行多分辨率分析;利用小波變換進行多尺度邊緣檢測,能提高定位目標的準確度,取得良好的檢測效果。20世紀80年代,在多分辨率理論中,小波首次作為分析基礎出現。接著Mallat首次將小波變換用于信號奇異點的檢測,奠定了小波在信號檢測方面應用的基礎[18]。在小波變換基礎上發展起來的最新理論有1999年Donoho等人提出的curvelet變換,相比以往的小波變換在圖像增強與去噪方面有了很大的提高。至今小波變換仍是學術界討論的熱點,在圖像處理中也發揮著越來越重要的作用。
自適應平滑濾波是一種變尺度邊緣檢測方法,它的基本思想是用一個隨像素點的梯度變化的平均模板與待平滑的信號進行迭代卷積。其中,模板函數以k為尺度變化參數,該參數控制了迭代過程中所要保留的突變點幅度,保證了在不同尺度下邊緣檢測的正確性。自適應平滑濾波方法通過自適應迭代平滑提高了圖像的信噪比;在邊緣檢測之前對圖像進行平滑濾波迭代運算,提高了邊緣定位精度;相比其它邊緣檢測方法,在圖像檢測過程中具有很強的自適應能力。
除上述方法之外,許多學者一直致力于將各種數學思想引入圖像的邊緣檢測中。20世紀80年代,Pal和King將模糊集理論與邊緣檢測相結合,提出了圖像邊緣檢測模糊算法,該算法可對圖像中的背景和目標進行有效的分離,成功應用在了模式識別與醫療圖像處理領域。近年來,基于神經網絡的邊緣提取方法已成為一個重要的研究熱點,其中基于BP網絡的邊緣檢測方法已在許多領域得到應用。數學形態學引入圖像處理,解決了噪聲抑制、特征提取等問題。遺傳算法作為一種優化算法也成功運用在邊緣檢測中。
總結
以上是生活随笔為你收集整理的图像检测技术的研究现状的全部內容,希望文章能夠幫你解決所遇到的問題。