《Visual C++数字图像模式识别技术详解(第2版)》一3.4 形状特征
3.4 形狀特征
物體的形狀特征也是物體的一個重要模式特征,本節將介紹對物體形狀的描述及其計算方法。
3.4.1 多邊形描述
一個圖像區域邊界可以用多邊形來近似表示。對于一個閉合的曲線,當多邊形的邊數與邊界中頂點數相等時,邊界中的每對點都定義了多邊形中的一個邊,在這種情況下,以上近似是精確的。在實際應用場合中,多邊形近似的目的就是要用邊數最少的多邊形來近似地描繪出圖像邊界的形狀。但要實現上述近似并非是一件簡單的事情。例如,用簡單的迭代搜索算法來實現上述方法時,計算量是相當大的。然而,在圖像邊界描述要求不是很高時,采用一些具有中等復雜度的多邊形近似技術進行圖像邊界描述還是很適用的。
有兩種方法被應用于多邊形近似,一種是合并方法;另一種是分裂方法。
1.合并方法的計算步驟
[1] 計算物體邊界點;
[2] 沿著邊界合并邊界上的點,直到所有合并點的線性擬合(基于最小平方誤差)的誤差超過一個預先設定的閾值;
[3] 記錄下該擬合直線的參數,誤差置為零;
[4] 重復以上步驟。當這一過程結束時,相鄰線段間的交點就構成了多邊形的頂點,而整個邊界點也被這些線段擬合。
但是,這一方法找到的頂點并不一定對應于邊界的變形點(如邊界的拐角等)。例如,如果我們跟蹤了一條很長的直線,接著它拐了一個彎,那么,在誤差超過給定的閾值前,很多位于拐角以后的點都被吸收了。為此,在合并過程結束后,需要結合分裂法進一步分析。
2.分裂方法的計算步驟
[1] 任取合并得到的一段邊界;
[2] 計算被該段邊界合并的邊界點到該段邊界的垂直距離;
[3] 如果有邊界點到邊界的距離超過一個預定的閾值,則以該點為中間頂點將邊界分成兩部分。
分裂法對于找出邊界中比較顯著的轉折點來說是相當有效的。
對于一個閉合的邊界,上述方法計算的起始點通常選擇為邊界上相距最遠的兩點。
3.4.2 曲線描述
在圖像分析中,可用邊界點擬合的曲線來描述物體的邊界特征。曲線擬合是數值分析中重要的內容,通常使用最小均方誤差準則來找出一定參數形式下的最佳擬合函數。具體選擇什么參數形式與問題有關,通常采用多項式的形式特別是二次多項式的形式,而對于更為一般的情況也可采用樣條函數形式。
對于有些邊界可用一條曲線來描述,而有些邊界卻不能用一條曲線完成擬合,因此邊界分段擬合是解決這個問題較常用的方法之一。
3.4.3 標記
標記(Signature)是邊界的一維函數表達方式,它與邊界的曲線擬合有所不同,其基本思想是把一個二維的邊界用一個較容易的一維函數形式來描述。產生標記的方法很多,最簡單的是先對給定的區域求出重心,然后把邊界點與重心的距離作為角度的函數就得到一種標記。不管標記是怎么生成的,其主要的思想就是要把區域的表示退化成一個一維的函數,它比二維邊界容易描述。如果對二維邊界的形狀感興趣,通過這種方法就可把二維形狀描述的問題轉化為對一維波形進行分析的問題。
上面所述方法產生的標記不受區域平移的影響,但與區域的尺度變換和旋轉(可等價為角度測量的起點變化)有關。尺度變換造成的影響是標記的幅度值發生變化,這個問題可用把最大幅度值歸一化到單位值來解決。解決旋轉影響可有多種方法,常用的一種方法是選離重心最遠的點作為標記起點;另一種方法是求出邊界主軸,以主軸上離重心最遠的點作為標記起點。后一種方法考慮了邊界上所有的點,所以計算量較大但也比較可靠。
從更廣泛的意義上說,標記可由廣義的投影產生。這里的投影可以是水平的、垂直的、對角線的、放射的和旋轉的等。但需要注意的是投影不是一種能保持信息的變換,將二維平面上的區域邊界變換為一維的曲線有可能丟失一些信息。標記方法較適用于對一些已知的特定物體圖像的標記和識別。
3.4.4 矩形度
矩形度體現物體對其外接矩形的充滿程度,反映一個物體矩形度的一個參數是矩形擬合因子。
(3-21)其中,S0是該物體的面積,而SMER是其最小外接矩形的曲積。R反映了一個物體對其的充滿程度。對于矩形物體R取得最大值1,對于圓形物體R取值為,對于纖細、彎曲的物體R取值變小。矩形擬合因子的值為0~1。
另一個與形狀有關的特征是長寬比:
它是最小外接矩形的寬與長的比值。這個特征可以把較纖細的物體與方形或圓形物體區分開。
3.4.5 圓形度
圓形度是用來表示物體圓形程度的指標,有多種圓形度指標,最常用的圓形度指標之一如下:
它是周長的平方與面積的比。這個特征對于圓形形狀取最小值。物體形狀越細長,其取值越大。
一個相關的圓形度指標是邊界能量。假定一個物體的周長為P。在物體邊界上任一點都有一個瞬時曲率半徑,它是在該點與邊界相切的圓的半徑。設在點存在以下函數:
則函數是P周期函數。可以用下式計算單位邊界長度的平均能量:
(3-25)在面積相同的條件下,圓具有最小邊界能量,即:
(3-26)這里R是該圓的半徑。
第三個圓形度指標利用了從邊界上的點到物體內部某點的平均距離。這個距離如下:
式中,di是從具有N個點的物體中的第i個點到與其最近的邊界點的距離。由此有相應的形狀指標,其為:
(3-28)3.4.6 不變矩
在前述中介紹過距的概念,當時是從圖像幅值特征分布角度來介紹的。但是當圖像為二值圖像時,可用矩來描述圖像中一些區域的形狀特征,則區域R的(i, j)階如下:
式中參加運算的點(x, y)都是區域R的內點或邊界點。因此,區域的M00即是區域的像素點數。
由于用上式描述區域的形狀對區域的平移、旋轉、尺度變換不具有不變性,因此需要對該矩進行變化處理。首先將坐標點移到區域的形心,重新計算區域的中心矩,即:
其中,為區域R的形心,由下式求得:
(3-31)中心矩雖然對區域平移具有不變性,但對旋轉和尺度變化依然敏感,可通過對進行歸一化得到尺度的不變性。歸一化中心矩定義如下:
(3-32)由上式可求出一組歸一化的中心矩,同時將中心歸一化進行組合,可獲得如下7個不變的矩組合:
當區域進行平移、旋轉、尺度變換時,這些不變矩是不變的。不變矩具備了良好的形狀特征,已經用于印刷體字符的識別、飛機形狀區分、景物匹配和染色體分析中。但它們并不能確保在任意情況下都具有這些不變性質,這是由于圖像量化對矩不變性特征計算還是有影響的。通常離散幾何變換(包括旋轉和比例變換(尺度))不是一一對應的,因為圖像經過采樣和量化后導致了圖像灰度層次和離散化圖像邊緣的不精確。只有當區域大小和采樣間隔的比趨于無窮大時,才能消除量化對矩不變性特征計算的影響。合理設置采樣間隔可使計算誤差減小。
3.4.7 偏心率
偏心率E也叫伸長度。它在一定程度上描述了區域的緊湊性。偏心率E有多種計算公式,其中一種常用的簡單方法是區域主軸(長軸)長度(A)與輔軸(短軸)長度(B)的比值。另一種方法是計算慣性主軸比,它基于邊界線上的點或整個區域來計算質量。根據中心矩計算任意點集偏心率的近似計算公式如下:
總結
以上是生活随笔為你收集整理的《Visual C++数字图像模式识别技术详解(第2版)》一3.4 形状特征的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux下confstr与uname函
- 下一篇: 云供应商安全评估:小心落入陷阱