图像特征理论综述
前言:
???? ?? 關于集合:在計算機科學領域,離散數學是非常重要的學科,在圖像處理領域,這種重要性更加直觀。
?
一:特征可靠性的來源:
1. 數據離散化:???????
? ?? ?? 系統觀測理論:物理世界存在某一實體,若對其進行描述和解析,需要觀測系統及系統所提供的接口。作為圖像分析系統的接口,實現的功能是完成實體的圖像化,即是實體的可視化。
??????? 實體與人的視覺交互是其研究價值的根本,可視化是必須的;若實體不能具體可視化,即只可稱之為數據,則可排斥出圖像研究領域,即實體完整描述必須完成可視化。
? ? ??? 離散圖像——圖像可視化的實現:所有完成圖像數據可視化的介質都只能完成圖像數據離散的描述:古老的CRT為陰極射線激發熒光粉生成光斑點,畫面本質上是離散的,CRT以推出大多數應用領域,可以暫且不談;等離子為等離子激發稀有氣體發射紫外線,紫外線激發熒光粉發出可見光,以粉為點;LED以液晶分子的陣列轉換改變透視特性來顯示色彩,圖像描述為像素;OLED為有機自發光,以自發光有機分子作為原子像素。
? ?? ?? 圖像準確性:圖像的介質轉換以離散數據的方式進行,和圖像真實定義(形狀特性等)產生偏差,在信息接收到額過程中,再次從離散數據歸結為圖像數據,這個過程就是 擬合。對于擬合過程來說,擬合數據越多,擬合越精確,因此圖像數據描述定義和顯示設備 都進行著像素大戰。
?
????? 可擬合性的基礎:圖像像素排列的硬規則。
??????(1):圖像的硬性規則描述
???????????????? 矢量圖像:嚴格的說,矢量圖像僅僅是一種圖像數據描述,其可視化是其定義無法實現的。即矢量圖像只給出了定義和方法級別的描述,而未給出其實現的描述。
???????????????? 點陣圖像:圖像的點陣排列規則是圖像像素可擬合性的基礎。
?????????????????????? 兩種常用方式:正方形點陣和 六邊形 蜂窩狀點陣
???????????????? 蜂窩狀點陣:優點是在描述線的相交時是無歧義的;確定是描述垂直時時有歧義的;
???????????????? 正方形點陣:雖然在描述線的相交時出現問題,但其對垂直的描述是 無歧義的,因此對正交可以很好的描述,與歐式空間坐標系更能相符合,為描述方式的主流。
????? (2):正交離散坐標系
?????????? 正交離散坐標系為歐式離散坐標系,其可描述性為歐式離散空間,即多維整數空間,所有圖像的描述最后必定歸結為多維整數空間的描述。
?????
2. 圖像特征描述???
?
?(1):特征的直線特性:y=ax+b的參數描述,可以把直線的點集數據規約到二維,兩條直線的距離 和相似度 表示為 兩個方程的 距離和相似度。
???????????????????? S1:( f1: y=a1x+b1 )???? S2: (f2: y=a2x+b2 )
???????????????????? Dis(S1,S2) ——>Dis(f1,f2)——>Dis( (a1,b1), ? (a2,b2)? )??
?????????? 直線來源:點集的直線擬合。
?????????? 擬合準確性:擬合的方差和偏差等數值描述。
?????????? 特征準確性:集合到集合的距離表示為函數和函數的距離,如何保證這個映射的同態性。
?
(2):特征的曲線特性:y=a1x^n+ a2x^(n-1)......+ (aN-1) x + aN的參數描述,可以把直線的點集數據規約到N維,兩條曲線的距離 和相似度 表示為 兩個方程的 距離和相似度。??????????
????????? 參考數值計算的相關知識...............
?
(3):二維圖像特征描述:參考局部圖像特征描述概述??????
?????? ? ? 圖像在數學中的專業術語為二維張量,即可以嵌入二維歐式空間,表示為二維張量空間中的一個坐標。而圖像特征典型為可以嵌入一維歐式空間中的N維向量,理解為對應了N維向量空間中的一個坐標。
?????????? 圖像的特征提取過程,即是把二維圖像從二維張量空間降維到一維向量空間,轉化到N維向量空間,每個圖像映射到N維向量空間的一個點上。這就帶來了特征提取的本本質要求:壓縮的近鄰特性,即是在張量空間近似的圖像其壓縮映射到向量空間仍然保持近鄰。
?????????? 這就表明了特征提取過程的數學描述:一個從二維張量空間到N維向量空間的hash映射,而且必定是壓縮近鄰hash的。
?????????? 這就隱含了特征提取的一般原則: 尺度不變性/相似性,旋轉不變性/相似性,明暗不變性/相似性等要求。但也明確顯示了一個特征提取的一般缺點:近鄰hash映射的壓縮損失。
?????????? 比如HOG特征提取的一般過程,對每個圖片(假如64*40)塊劃分Cell和patch,在每一個cell里面計算梯度直方圖,收集到一個1008維的特征向量里。依據特征提取的原理,相似圖片的特征也必須相近。在計算HOG每個Cell直方圖時,使用了梯度,這就保證了光線不變性和少量的旋轉不變性。
?????????? 至于如何分類,那是模型的問題了,后面是適應某個問題的特定模型,比如SVM、RFs、logistics回歸等。模型把N維向量再次壓縮到0維空愛的離散個點上,完成分類識別。
?????????? CNN走的更遠,直接拋棄了圖像信息從二維空間到向量空間的轉換,這就直接舍棄了特征提取過程。直接使用Pooling和conv把圖像從二維空間逐層變換,從N*N的圖像,逐層壓縮到二維空間的1*1的最終表示層,從二維空間直接跨越到0維。這就融合性地完成了傳統方法特征提取和模型分類的整個過程。
?
3.三維圖像特征
???????? 三維圖像在三維空間內進行表示,增加的緯度信息給圖像特征提取開拓了空間,并降低了約束。對于可獲得精確Z軸信息的三維圖像,其特征縮放不變性即尺度 便不需要再考慮;其增加的Z軸信息,也使圖像離散描述擴展到三維空間,特征提取面向于三維整數集合。
????????
???????? 圖像三維特征綜述:基于三維形狀的三維圖像檢索
?
4.后記
???????? 使用CNN對三維圖像進行模式識別,是否該使用三維遞進的網絡結構呢?
?
總結
- 上一篇: 干花好评语80字
- 下一篇: 关于突破自我的励志句子189个