数字空间中的二值形态学
數字空間中的二值形態學
Binary Morphology in Digital Space
Herry
Herry
?
?
?
?
摘要:數學形態學作為圖象處理與分析的基本理論和方法在視覺檢測、生物醫學圖象分析、機器人視覺、圖象壓縮編碼、紋理分析等諸多領域,都取得了非常成功的應用,創造了巨大的經濟效益。同時,從近年來大量涌現的研究期刊和會議論文可以看到,數學形態學已經發展成為圖象處理的一個主要研究領域。本文作為數字圖象處理課程的結業報告,以介紹數學形態學的沿革、基本運算、形態學在數字空間中的畸變和灰值形態學為主,同時結合作者所掌握的知識,闡述了自己的一些認識和看法。最后,筆者就圖象處理中的一般方法,談了一些務虛的想法。
關鍵字:形態學;數字空間;圖象處理
?
?
Abstract:Mathematical morphology has developed greatly in both research field and application field. Applications of morphology in vision detection, biological and medical image analysis, robot vision, image compressing coding, pattern analysis, etc. all have gained surprising success. On the other hand, there appear more and more research journals and conference papers, proving that mathematical morphology has been becoming a main research field of image processing. This paper is a course completing report of Digital Image Processing, whose emphasis is on the introduction of the history of mathematical morphology, fundamental operations, aberrance of morphology in digital space, and grayscale morphology. Meanwhile, I state my understanding and opinion along with them. At the end, there is my thinking about the general methods in image processing without any supporting resources.
Key words:Morphology;Digital space;Image processing
?
?
一、?????? 數學形態學的沿革
數學形態學誕生于1964年。當時法國巴黎礦業學院的J.Serra在G.Matheron
的指導下從事博士論文的研究工作,內容是對法國洛林地區的鐵礦核作定量巖相分析,從而預測起開采特性。Serra用計算礦核切片的多形態圖的方法取代了剛體力學方法。他意識到方差、弦長分布、周長測量及顆粒計數等都是某個獨特概念的特殊情況。Serra將其稱為擊中擊不中變換(Hit-Miss Transform)。
? ??與此同時,在一個更為理論的層面上,Matheron承擔了多孔介質滲透性與其幾何(或紋理)之間關系的研究工作。第一次引入了形態學開的表達式,并在此基礎上利用凸結構元素建立了顆粒分析方法。
??? 60年代的工作從理論和實踐兩個方面初步奠定了數學形態學的基礎,產生了擊中擊不中變換,開運算,閉運算和布爾模型的理論描述,以及第一個紋理分析器原型。
??? 70年代是數學形態學的充實和發展期。擊中擊不中變換很快得到了一連串成功的應用。而在理論方面,以Matheron的工作為主要標志:拓撲學基礎,隨機集,遞增映射,凸性分析,隨機集的若干模型等。
? ??80年代是數學形態學的成熟和對外開放期。數學形態學走向了世界,尤其是美國;在格論基礎上建立了數學形態學的數學框架;隨機處理方法得到進一步的更新。所有這些都標志著數學形態學即將進入一個快速發展期。
??? 80年代的另一個特點,是在格論數學框架上建立了形態學方法的基礎。各種各樣的實際應用問題,迫使人們回到基礎理論方面尋找解決問題的出路和方法。數學形態學最初的算子是面向集合的,要將它們拓寬到其他領域,如對(網格)圖的、數值函數的形態學處理,在這種情況下,平移或旋轉會影響到處理過程,甚至使處理過程無效。一些概念,如連通性、測地等需要新的符號來描述。為了使形態學的基本理論具有更廣泛的適用性,更統一的形式和便于新算法的研究,數學形態學基本定理的核心最終被簡化到備格結構。
??? 90年代至今,是數學形態學的持續發展、擴展期,取得了一系列重大應用和理論成果。
??? 縱觀數學形態學的發展史,不難發現,其沿革歷程和其他學科大同小異,都是呈螺旋式發展的形式。后期的應用和發展,總是促使人們回到起始點,回到理論層面,對其根基進行不斷的填充。圖1.1是數學形態學發展的一個簡化模型。它幾乎和其他學科的發展模型一致。
零星思想 |
零星思想 |
零星思想 |
第一次系統概括 |
理論填充 |
應用發展 |
由此可見,一個新理論的誕生和成熟,是經過長期的,反復的錘煉而來的。
?
?
二、?????? 數學形態學的基本運算
形態學的運算具有高度的統一性。擊中擊不中變換在數學形態學中起著核心作用。它的基本思想至少來源于(或拓廣到)五個方面:第一,這種變換擴展了對隨機函數空間定律的表達方式;第二,這種變換曾用來對格式塔心理學的一些思想作數學上的形式化描述;第三,這種變換來源于(或完成于)實驗及紋理分析;第四,擊中擊不中變換為腐蝕和膨脹兩個重要的形態學運算奠定了邏輯上的前期條件;第五,擊中擊不中變換簡潔的表達方式可以在所有已應用于實踐中的數學形態學算法中可窺見一斑。
??? 圖2.1說明了這種統一性。
HMT |
腐蝕(膨脹) |
細化 |
開(閉) |
同倫骨架 |
特殊細化 |
各向同性腐蝕 |
各向異性腐蝕 |
隨機集 |
SKIZ |
?
?
三、?????? 數字空間中的畸變
3.1數字空間的概念和性質
3.1.1數字空間的概念
??? 在圖象處理中用到的數字空間有兩種,一種是正方形網格空間,記為Q2;另一種是正六邊形網格空間,記為H2。它們都是歐氏空間R2的子集。在歐氏空間中通常使用的坐標系下,命u1(k) = (0, k),u2(k) = (k, 0),v1(k) = (0, k),v2(k) = (k/2, root(3)k/2),其中k為一個正實數,那么Q2和H2可定義為:
Q2 = {x1u1(k) + x2u2(k) | x1, x2均為整數}
H2 = {x1v1(k) + x2v2(k) | x1, x2均為整數}
因此,Q2和H2實際上是在不同坐標系統下的具有整數坐標的點(稱為格點)的集合。K稱為網格空間的密度,它刻畫了網格點的密度。
3.1.2數字空間中的拓撲二義性
??? 首先引入以下定義:
??? 1、對于Q2中的點x,它的四鄰域定義為點集N4(x) = {x, x + u1, x + u2, x – u1, x – u2},而N8(x) = {x, x + u1, x + u1 + u2, x + u2, x + u2 – u1, x – u1, x – u1 – u2, x – u2, x + u1 – u2}稱為x的八鄰域。N4(x) – {x}中的點稱為x的直接鄰接點,而N8(x) – N4(x) – {x}中的點稱為x的間接鄰接點。
??? 2、對H2中的點x,它的六鄰域定義為點集N6(x) = {x, x + v1, x + v2, x – v1, x – v1 + v2, x – v2, x + v1 – v2}。N6(x) – {x}中的點稱為x的鄰接點。
??? 3、如果一個Q2中的點列x0,x1,……,xn滿足xk∈N4(xk-1)(k = 1, 2, ……,n),則稱為一條由x0到xn的四連通路徑。如果它們滿足xk∈N8(xk-1)(k = 1, 2, ……,n),則稱為一條由x0到xn的八連通路徑。
??? 4、如果一個H2中的點列x0,x1,……,xn滿足xk∈N6(xk-1)(k = 1, 2, ……,n),則稱為一條由x0到xn的四連通路徑。
??? 5、給定Q2中一個集合X,對x,y∈X,如果存在一條X中的由x到y的八連通路徑,則稱為x,y在X中是八連通的。如果存在一條X中的由x到y的四連通路徑,則稱為x,y在X中四連通。
??? 6、給定H2中一個集合X,對x,y∈X,若存在一條X中的x到y的連通路徑,則稱為x,y在X中是連通的。
??? 7、對數字空間(Q2或H2)中的一個集合X和一個有意義的連通定義,如果X中的任意兩點均在X中是連通的,則X是一個連通集合。
??? 在連續空間R2中,一條簡單的封閉曲線L的內部A和外部B均是簡單的連通集合,且它們彼此不連通,或者說由A中任意一點x到B中任意一點y的連通路徑必然與所給封閉曲線L相交。這就是R2中的Jordan定理。如圖3.1所示。
B |
y |
A |
x |
??? 現在考察圖3.2中的正方形網格空間。
假如我們使用八連通定義,則細十字點集形成一條簡單封閉曲線L,其內點集A由粗十字和方塊組成,外部點集B由圓圈組成。顯然A、B是彼此八連通的,我們可以構造出從A到B的八連通路徑且使之與L不相交(圖中虛線所示)。因此八連通定義不滿足Jordan定理。如果我們使用四連通定義,圖中細十字和粗十字形成一條簡單四連通封閉曲線L,其內部A由方塊組成,外部B由圓圈組成。顯然A不是一個四連通集合,因此仍然不滿足Jordan定理。這就是正方形網格空間中一個經典的拓撲奇異現象。
??? 解決這一問題的最常用方法是對前景和背景使用不同的連通性定義。例如若對曲線使用四連通定義,那么曲線的補集就使用八連通定義。這就是拓撲的二義性。
??? 對于六邊形網格空間H2,只有一種連通性定義,而且這一連通性定義下,Jordan定理成立。因此H2中不存在拓撲奇異性,也就沒有拓撲二義性。正是由于這個原因,近年來六邊形網格較受推崇。不過六邊形網格采樣技術比較復雜,而且從形態學角度看,它的幾何也不如正方形網格空間豐富,因此應用仍然不廣泛。
3.1.3數字空間中的幾何意義
??? 數字空間中的幾何概念可以由連續空間中的對應概念的網格空間采樣得到。這是最自然,最穩妥的方法,而由連續空間中的定義直接類推通常是危險的。
??? 例如,連續空間中集合A以λ為相似因子的相似集合λA定義為{λa| a∈A}。但對數字空間來說,這個定義不能使用。原因有兩個:1、λa(a∈Z2)可能不是一個網格點;2、這樣的λA會遺失很多點而導致與A完全不同的結構。
??? 正確的定義應該是:A*是A對應的連續集合(A*∩Z2 = A),則A以λ為相似因子的相似集合為λA* ∩Z2。
3.1.4數字凸集和連續凸集的區別
??? 數字凸集雖然與連續凸集有很多相似的性質,但同時在一些相當重要的特征上也有明顯的不同。例如,連續凸集一定是連通集合,但數字凸集未必是連通的。如圖3.3所示。
3.2數字空間中的畸變
3.2.1數字圖象處理的預期目標及其現實情況
??? 在圖象處理的實際環境中,數字空間是一切處理和操作的載體。而進行這些數字空間中的處理的目的則是為了分析和理解連續空間中的客觀世界。換句話說,是為了實現連續空間中一個期望的,理想的,假定的處理和操作。因此,一個自然的要求就是所完成的數字空間中的運算與所期望的連續空間中的運算應該有良好的對應關系。假定一個連續空間的集合運算£*,其相應的數字空間中的集合運算為£,那么在理想情況下,它們應滿足下述關系:
£*(X) ∩ Z2 = £(X ∩ Z2)
采樣過程通常會有信息損失,因而實際中上式常常無法滿足。不過在采樣密度適當高的條件下,采樣所損失的信息可以很少。因而應力爭使上式近似得以滿足。
??? 這里的近似性至少有兩個方面的含義:1、等式兩邊的集合在某種意義上是相近的;2、這兩個集合具有同樣的幾何和拓撲結構。
??? 簡單地將連續空間中的運算類推移植到數字空間中,不一定滿足這種近似性。一個經典的例子就是圖象的骨架抽取算法。在連續空間中圖象的骨架變換在很弱的條件下就能給出連通的骨架,而將這一變換類推到數字空間中后,所求得的骨架通常是不連通的。
3.2.2形態學運算畸變示例
??? 圖3.4展示一個八連通凸集膨脹運算的畸變。(a):數字空間中的畸變;(b):(a)中凸集對應的連續凸集的膨脹運算結果。
3.2.3數字空間中的幾何貧乏性
??? 數字空間是離散的點集,與連續空間相比,它的結構簡單得多,稀疏得多,這就以為著數字空間中的幾何對象在幾何性質、形狀結構等諸多方面都將被制約,靈活性要小的多。在經典的圖象處理方法中,由于它們通常不顯式地關聯圖象的幾何性質,因此這一制約所引起的問題顯得不那么突出。對于形態學方法來講,它更關注于數字空間的幾何特點,同時對數字空間內在的幾何制約要敏感的多。
??? 數字空間中的幾何貧乏性表現之一是集合的大小和形狀不能連續變化。數字空間中的一個圓盤事實上是一個有限邊數的多邊形,它遠沒有連續圓盤那么平滑。當它的半徑縮小時,只能按定長遞減。另一個表現是,小尺寸的連續集合的采樣過程會產生巨大的相對變形,從而可能破壞一切幾何特征。如圖3.5所示。
??????????????
3.3結論
??? 數字空間中形態學運算的畸變是一個相當本質的問題,即使在圖象和結構元素均有良好性質(即連通性)時,它仍有可能發生。因此,畸變發生的條件和畸變類型的研究和分析就顯得十分重要。我們必須對這些問題給出一個令人滿意的答案,從而尋求出避免或修正畸變的有效方法,以證實在數字空間中形態學方法的可用性,并保證數字空間形態學運算應用的可靠性和合理性。
?
?
四、?????? 灰值形態學簡介
在這里,作者并不想對灰值形態學的理論和方法做過多的闡述,只是對灰值
形態學的運算形式和分析數學中的卷積定理做一個簡單的對比。
??? 首先做如下定義:
??? f代表一個圖象;g代表一個結構函數;U(f)代表函數f的陰影集;G(U)代表陰影集U的表面函數;⊙代表一個灰值形態學運算,?代表二值形態學運算。那么,灰值形態學運算的一般形式為:
f⊙g = G[U(f)?U(g)]
這個形式和分析數學中的卷積定理有著驚人的相似:
??? 定義:£(f)代表函數f的傅立葉變換,£~(f)代表函數f的傅立葉逆變換;⊙代表卷積運算,則卷積定理的一般形式為:
f⊙h = £~[£(f)£(h)]
??? 這兩個一般形式中,有著某種對應性(如表4.1所示):
灰值形態學運算 | 卷積 |
陰影集(U) | 傅立葉變換(£) |
表面函數(G) | 傅立葉逆變換(£~) |
二值形態學運算(?) | 頻率域乘法 |
表4.1灰值形態學運算和卷積定理之間的對應關系
這種對應性和高度一致性突出了它們的一個共同性質:它們都將某一個域的運算,變換為另外一個域的運算。這種變換具有一個重要性質,即可逆性。從而可以使得在某一個域中不可能完成的任務,或很難完成的任務,在另外一個域中得以順利完成。
??? 筆者認為,把握以上這種對應性和一致性,對于深入理解變換存在的目的和意義具有很大的幫助。
?
?
五、?????? 圖象處理中的一般方法
本節所要闡述的內容是筆者一些務虛的想法。表5.1列出了筆者至今所接觸
到的圖象處理所使用的一般方法,數學背景,以及它們對圖象本質的認識:
一般方法 | 形態學 | 分析方法 | 統計方法 |
數學背景 | 集合論 | 分析數學 | 概率數學 |
對圖象的認識 | 點集 | 波 | 點集 |
表5.1圖象處理中的一般方法
??? 這太巧合了!人們對圖象的認識,和人們對光的認識具有驚人的相似性。人們對于光的認識可以統一到波粒二相性上來,那么對于圖象的認識是否也可以統一起來呢?這是很多專家學者所反對的觀點。自始至終圖象處理都是一個面向問題的學科,在可以預見的將來都無法找到一種超級理論,來包羅圖象處理中的所有理論。
??? 筆者對于統一論有一定的偏執和愛好,但并不對圖象處理統一論的觀點有半點樂觀。世界上有些巧合確實蘊涵著統一論的玄機,但有些巧合,最終也只是巧合而已。
??? 然而筆者認為,一個統一的理論,并意味著一定有一個包羅一切的超級定理來支撐。它有可能是某種認識上的統一。就圖象而言,是否有一種理論來指導我們在什么樣的場合使用什么的本質來解釋圖象——正如人們在宏觀上利用光的波動性,在微觀上利用光的粒子性一樣。筆者深信,這種認識上的統一論是存在的。
?
?
致謝
??? 非常感謝劉怡光老師半年來對我的教誨和指導。本文得以完成得益于參閱了互聯網上的大量信息,在此對那些無私奉獻的網友表示誠摯的謝意。
?
?
參考文獻
[1]崔屹。《圖象處理與分析——數學形態學方法及應用》。北京:科學出版社,2000
[2]龔煒,石青云,程民德。《數字空間中的數學形態學——理論及應用》。北京:
科學出版社,1997
[3]J.Serra. Introduction to mathematical morphology, CVGIP, Vol.35, 283—305, 1986
[4]Henk Heijmans. Mathematical Morphology and Image Processing, ERCIM
News No.37 - April 1999
總結
以上是生活随笔為你收集整理的数字空间中的二值形态学的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机网络体系结构 - 网络安全
- 下一篇: 12.1 草根的追求——《逆袭大学》连载