MPEG-7 视觉描述符
FROM:?http://blog.csdn.net/leixiaohua1020/article/details/16859347
本文節選自《基于MPEG-7與內容的圖像檢索技術的研究》。
MPEG-7 標準中視覺描述工具包括基本結構和描述符。本文主要介紹各描述符。
(1)顏色描述符
MPEG-7 主要定義了七種顏色描述符:顏色空間、主顏色、顏色的量化、顏色直
方圖、顏色布局、GOF/GOP 顏色、顏色結構、對顏色的特征和結構進行描述。他們之間的關系如圖 2.2 所示。
①顏色空間,該描述符主要用于其它基于顏色的描述。當前描述所支持的顏色空間有:RGB、YCbCr、HSV、HMMD、關于 RGB 的線性變換矩陣、單色。
②顏色量化,該描述符定義了顏色空間的均勻量化。量化產生的維(bin)的數目是可配置的,這樣使得各種應用具有更大的靈活性。要使這個描述符在 MPEG-7 背景下有應用意義,例如表示主顏色值的含義,必須結合其它顏色描述符。
③主顏色,該描述符最適用于表示局部(對象或圖像區域)特征,幾種顏色就足以表達我們感興趣區域的顏色信息。當然,它也可以用于整個圖像,例如旗幟圖像或彩色商標圖像。顏色量化用于提取每個區域/圖像的少數代表顏色,并相應的計算出區域中的每種量化顏色所占的百分比。同時還定義了整個描述符的空間相關性,用于相似性檢索。
④顏色布局,該描述符以一種緊湊的形式,有效的表達了顏色的空間分布。這種緊湊性以很小的計算代價,帶來高速的瀏覽和檢索。它提供圖像與圖像的匹配和超高速的片斷與片斷的匹配,這些匹配要求大量相似性計算的重復。由于該描述符表達了顏色特征的布局信息,因此它可以提供相當友好的用戶接口,例如使用其它顏色描述符中均不支持的手繪草圖查詢。
⑤可伸縮顏色,該描述符是 HSV 顏色空間的顏色直方圖(用 Haar 變換編碼)。根據維的數目和比特表示的精度,它的二進制表示在一定數據速率范圍內是可伸縮的。這個描述符主要用于圖像與圖像的匹配和基于顏色特征的檢索,檢索的精度隨著描述中使用的比特數目的增加而增加。
⑥顏色結構,該描述符是一個顏色特征描述符,它既包括顏色內容信息(類似于顏色直方圖),又包括內容的結構信息。它的主要功能是圖像與圖像的匹配,主要用于靜態圖像檢索,在這里一幅圖像可能由一個單一矩形或者任意形狀、可能是非連通的區域組成。提取的方法是:通過考慮一個 8×8 像素的結構化元素中的所有顏色,將顏色結構信息加入該描述符中,而不是單獨考慮每個像素。
⑦幀組/圖組顏色,該描述符將用于靜態圖像的可伸縮顏色描述符擴展到對視頻片段或靜態圖像集合的顏色描述。在 Haar 變換之前,用附加的兩個比特定義如何計算顏色直方圖,是均值、中值還是相交。
(2)紋理描述符
MPEG-7 推薦了三種紋理描述符,同質紋理描述符(HomogenousTexture Descriptors)、紋理瀏覽描述符(Texture Browsing Descriptors)和邊緣直方圖描述符(Edge HistogramDescriptors)。
①同質紋理描述符
同質紋理作為一個重要的視覺基本特征,主要用于大量相似圖案的搜索和瀏覽。一幅圖像可看作由同質紋理以馬賽克形式拼接而成的,所以與這些區域關聯的紋理特征可以作為索引來檢索圖像。例如,用戶瀏覽一個航空圖像數據庫,可能想識別圖像集合中停車場。當從遠處觀察時,汽車規則(以相等間隔)停放的停車場就是一個極好的同質紋理圖案的例子。同樣的,從空中或是衛星拍攝的農田和植被也是同質紋理的示例。同質紋理描述符使用 62 個數字(每一個都量化為 8bits)提供了紋理信息的量化表示。這62 個數字的計算方法是:將圖像用一組帶有方向和尺度參數的 Gabor 濾波器進行濾波,一共是六個方向和五個尺度。一共得到 30 個濾波結果,每一個濾波結果頻率域的一階矩和二階矩就是兩個描述數字。
②紋理瀏覽描述符
描述紋理的感知特性,例如規則性、方向性和粗糙性。計算方法和同質紋理描述符類似,首先使用一組帶有方向和尺度參數的 Gobor 濾波器進行濾波,然后通過分析濾波結果,找到紋理主要的方向。接著分析濾波后的圖像沿著這兩個(第二個主方向是可選的)主方向投影,來確定紋理的規則性和稀疏性。最多只需要 12 比特。同質紋理描述符和瀏覽描述符提供了表示相似紋理區域(Homogeneous Texture Regions)的多尺度方法。
③邊緣直方圖描述符
描述了 5 種邊緣(4 種方向邊緣和一種無方向邊緣)的空間分布統計。因為對于圖像感知,邊緣扮演了一個重要角色,所以它可以用于相似語義的圖像檢索。因此它的主要目標在于圖像與圖像的匹配(通過示例或草圖),特別是邊緣分布不規則的自然圖像。如果邊緣直方圖描述符與其它描述符如顏色直方圖相結合,將可以顯著提高圖像檢索的性能。
(3)形狀描述符
MPEG-7 定義了三種形狀描述符:基于區域的形狀(RegionShape)、基于輪廓的形狀(Contour Shape)和三維形狀(Shape 3D)。
①基于區域的形狀
一個對象的形狀可能只包括一個單一區域,也有可能包括多個區域,同時在對象中還可能有一些孔(見圖 2.3)?;趨^域的形狀描述符充分利用了一個幀內組成形狀的所有像素,它可以描述任何形狀,不但可以描述有一個單一連通區域的簡單形狀(如圖(a)和圖(b)),而且可以描述有對象中一些孔或幾個不向連區域組成的復雜形狀(如圖(c)、圖(d)和圖(e))。基于區域的形狀描述符不僅能夠有效描述不同目標形狀,而且對于沿對象邊界的較小變形具有一定的健壯性。
②基于輪廓的形狀
基于輪廓的形狀描述符提取了目標和區域基于輪廓獲得的形狀,一般采用曲率空間表示形狀信息,這種形狀描述符反映了人的感知特性,又稱為曲率尺度空間(Curvature Scale-space,CSS)表示,它由輪廓的曲率尺度空間表達式構成,該表達式具有如下重要特征(如圖 2.4 所示):
較好的提取了形狀特有特征,并能用于相似性檢索;
反映了人類視覺系統的感知性,具有良好的概括性;
對于不是很明顯的運動、形狀的部風重疊、投影變換均具有健壯性;
表達式簡潔。
③三維形狀
考慮到多媒體技術、虛擬世界和增強現實技術的持續發展,三維內容也成為當今多媒體信息系統的普遍特征。大多數情況下,三維信息是用多邊形網格來表示的。MPEG-4的 SNHC 組研究這個問題并開發了有效的三維網格模型編碼技術。在 MPEG-7 標準的框架中,要求對三維信息實現智能的基于內容的提取,用以查找、檢索和瀏覽三維模型庫。三維形狀特征描述符對三維網格模型進行本質的形狀描述,它善于挖掘三維表面的局部特征。
?
原文地址:http://www.cnki.net/KCMS/detail/detail.aspx?QueryID=4&CurRec=2&recid=&filename=2008145927.nh&dbname=CMFD0911&dbcode=CMFD&pr=&urlid=&yx=&uid=WEEvREcwSlJHSldSdnQ1V1l1YzRFR1o1VWlJc3EwQmJhdExWR3NMbFdRSW9oczZOUnNyMkwxczBMdDJxc2JZPQ==&v=MTIwNTJGeXJsVnIzS1YxMjdGcks4RzlqT3FKRWJQSVI4ZVgxTHV4WVM3RGgxVDNxVHJXTTFGckNVUkxtZVp1UnU=
總結
以上是生活随笔為你收集整理的MPEG-7 视觉描述符的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CEDD(Color and Edge
- 下一篇: 图像检索:几类基于内容的图像分类技术