颜色特征
轉(zhuǎn)自:http://hi.baidu.com/intelliencecore/blog/item/fe7d0945b2b6c62ecffca386.html
?
顏色特征是在圖像檢索中應(yīng)用最為廣泛的視覺(jué)特征,主要原因在于顏色往往和圖像中所包含的物體或場(chǎng)景十分相關(guān)。此外,與其他的視覺(jué)特征相比,顏色特征對(duì)圖像本身的尺寸、方向、視角的依賴(lài)性較小,從而具有較高的魯棒性。
面向圖像檢索的顏色特征的表達(dá)涉及到若干問(wèn)題。首先,我們需要選擇合適的顏色空間來(lái)描述顏色特征;其次,我們要采用一定的量化方法將顏色特征表達(dá)為向量的形式;最后,還要定義一種相似度(距離)標(biāo)準(zhǔn)用來(lái)衡量圖像之間在顏色上的相似性。在本節(jié)中,我們將主要討論前兩個(gè)問(wèn)題,并介紹顏色直方圖、顏色矩、顏色集、顏色聚合向量以及顏色相關(guān)圖等顏色特征的表示方法。
1?顏色直方圖
顏色直方圖是在許多圖像檢索系統(tǒng)中被廣泛采用的顏色特征。它所描述的是不同色彩在整幅圖像中所占的比例,而并不關(guān)心每種色彩所處的空間位置,即無(wú)法描述圖像中的對(duì)象或物體。顏色直方圖特別適于描述那些難以進(jìn)行自動(dòng)分割的圖像。
當(dāng)然,顏色直方圖可以是基于不同的顏色空間和坐標(biāo)系。最常用的顏色空間是RGB顏色空間,原因在于大部分的數(shù)字圖像都是用這種顏色空間表達(dá)的。然而,RGB空間結(jié)構(gòu)并不符合人們對(duì)顏色相似性的主觀判斷。因此,有人提出了基于HSV空間、Luv空間和Lab空間的顏色直方圖,因?yàn)樗鼈兏咏谌藗儗?duì)顏色的主觀認(rèn)識(shí)。其中HSV空間是直方圖最常用的顏色空間。它的三個(gè)分量分別代表色彩(Hue)、飽和度(Saturation)和值(Value)。
計(jì)算顏色直方圖需要將顏色空間劃分成若干個(gè)小的顏色區(qū)間,每個(gè)小區(qū)間成為直方圖的一個(gè)bin。這個(gè)過(guò)程稱(chēng)為顏色量化(color quantization)。然后,通過(guò)計(jì)算顏色落在每個(gè)小區(qū)間內(nèi)的像素?cái)?shù)量可以得到顏色直方圖。顏色量化有許多方法,例如向量量化、聚類(lèi)方法或者神經(jīng)網(wǎng)絡(luò)方法。最為常用的做法是將顏色空間的各個(gè)分量(維度)均勻地進(jìn)行劃分。相比之下,聚類(lèi)算法則會(huì)考慮到圖像顏色特征在整個(gè)空間中的分布情況,從而避免出現(xiàn)某些bin中的像素?cái)?shù)量非常稀疏的情況,使量化更為有效。另外,如果圖像是RGB格式而直方圖是HSV空間中的,我們可以預(yù)先建立從量化的RGB空間到量化的HSV空間之間的查找表(look-up table),從而加快直方圖的計(jì)算過(guò)程。
上述的顏色量化方法會(huì)產(chǎn)生一定的問(wèn)題。設(shè)想兩幅圖像的顏色直方圖幾乎相同,只是互相錯(cuò)開(kāi)了一個(gè)bin,這時(shí)如果我們采用L1距離或者歐拉距離(見(jiàn)3.1.1節(jié))計(jì)算兩者的相似度,會(huì)得到很小的相似度值。為了克服這個(gè)缺陷,需要考慮到相似但不相同的顏色之間的相似度。一種方法是采用二次式距離[4](見(jiàn)3.1.3節(jié))。另一種方法是對(duì)顏色直方圖事先進(jìn)行平滑過(guò)濾,即每個(gè)bin中的像素對(duì)于相鄰的幾個(gè)bin也有貢獻(xiàn)。這樣,相似但不相同顏色之間的相似度對(duì)直方圖的相似度也有所貢獻(xiàn)。
選擇合適的顏色小區(qū)間(即直方圖的bin)數(shù)目和顏色量化方法與具體應(yīng)用的性能和效率要求有關(guān)。一般來(lái)說(shuō),顏色小區(qū)間的數(shù)目越多,直方圖對(duì)顏色的分辨能力就越強(qiáng)。然而,bin的數(shù)目很大的顏色直方圖不但會(huì)增加計(jì)算負(fù)擔(dān),也不利于在大型圖像庫(kù)中建立索引。而且對(duì)于某些應(yīng)用來(lái)說(shuō),使用非常精細(xì)的顏色空間劃分方法不一定能夠提高檢索效果,特別是對(duì)于不能容忍對(duì)相關(guān)圖像錯(cuò)漏的那些應(yīng)用。另一種有效減少直方圖bin的數(shù)目的辦法是只選用那些數(shù)值最大(即像素?cái)?shù)目最多)的bin來(lái)構(gòu)造圖像特征,因?yàn)檫@些表示主要顏色的bin能夠表達(dá)圖像中大部分像素的顏色。實(shí)驗(yàn)證明這種方法并不會(huì)降低顏色直方圖的檢索效果。事實(shí)上,由于忽略了那些數(shù)值較小的bin,顏色直方圖對(duì)噪聲的敏感程度降低了,有時(shí)會(huì)使檢索效果更好。兩種采用主要顏色構(gòu)造直方圖的方法可以在文獻(xiàn)[5,6]中找到。
2?顏色矩
另一種非常簡(jiǎn)單而有效的顏色特征使由Stricker?和Orengo所提出的顏色矩(color moments)?[7]。這種方法的數(shù)學(xué)基礎(chǔ)在于圖像中任何的顏色分布均可以用它的矩來(lái)表示。此外,由于顏色分布信息主要集中在低階矩中,因此僅采用顏色的一階矩(mean)、二階矩(variance)和三階矩(skewness)就足以表達(dá)圖像的顏色分布。與顏色直方圖相比,該方法的另一個(gè)好處在于無(wú)需對(duì)特征進(jìn)行向量化。因此,圖像的顏色矩一共只需要9個(gè)分量(3個(gè)顏色分量,每個(gè)分量上3個(gè)低階矩),與其他的顏色特征相比是非常簡(jiǎn)潔的。在實(shí)際應(yīng)用中為避免低次矩較弱的分辨能力,顏色矩常和其它特征結(jié)合使用,而且一般在使用其它特征前起到過(guò)濾縮小范圍(narrow down)的作用。
3?顏色集
為支持大規(guī)模圖像庫(kù)中的快速查找,Smith和Chang提出了用顏色集(color sets)作為對(duì)顏色直方圖的一種近似[8]。他們首先將RGB顏色空間轉(zhuǎn)化成視覺(jué)均衡的顏色空間(如HSV空間),并將顏色空間量化成若干個(gè)bin。然后,他們用色彩自動(dòng)分割技術(shù)將圖像分為若干區(qū)域,每個(gè)區(qū)域用量化顏色空間的某個(gè)顏色分量來(lái)索引,從而將圖像表達(dá)一個(gè)二進(jìn)制的顏色索引集。在圖像匹配中,比較不同圖像顏色集之間的距離和色彩區(qū)域的空間關(guān)系(包括區(qū)域的分離、包含、交等,每種對(duì)應(yīng)于不同得評(píng)分)。因?yàn)轭伾磉_(dá)為二進(jìn)制的特征向量,可以構(gòu)造二分查找樹(shù)來(lái)加快檢索速度,這對(duì)于大規(guī)模的圖像集合十分有利。
4?顏色聚合向量
針對(duì)顏色直方圖和顏色矩?zé)o法表達(dá)圖像色彩的空間位置的缺點(diǎn),Pass[9]提出了圖像的顏色聚合向量(color coherence vector)。它是顏色直方圖的一種演變,其核心思想是將屬于直方圖每一個(gè)bin的像素進(jìn)行分為兩部分:如果該bin內(nèi)的某些像素所占據(jù)的連續(xù)區(qū)域的面積大于給定的閾值,則該區(qū)域內(nèi)的像素作為聚合像素,否則作為非聚合像素。假設(shè)αi與βi分別代表直方圖的第i個(gè)bin中聚合像素和非聚合像素的數(shù)量,圖像的顏色聚合向量可以表達(dá)為<(α1,?β1), (α2,?β2),?…, (αN,?βN)>。而<α1 +?β1,?α2 +?β2,?…,?αN +βN >?就是該圖像的顏色直方圖。由于包含了顏色分布的空間信息,顏色聚合向量相比顏色直方圖可以達(dá)到更好的檢索效果。
5?顏色相關(guān)圖
顏色相關(guān)圖(color correlogram)是圖像顏色分布的另一種表達(dá)方式[16]。這種特征不但刻畫(huà)了某一種顏色的像素?cái)?shù)量占整個(gè)圖像的比例,還反映了不同顏色對(duì)之間的空間相關(guān)性。實(shí)驗(yàn)表明,顏色相關(guān)圖比顏色直方圖和顏色聚合向量具有更高的檢索效率,特別是查詢(xún)空間關(guān)系一致的圖像。
如果考慮到任何顏色之間的相關(guān)性,顏色相關(guān)圖會(huì)變得非常復(fù)雜和龐大(空間復(fù)雜度為O(N2d))。一種簡(jiǎn)化的變種是顏色自動(dòng)相關(guān)圖(color auto-correlogram),它僅僅考察具有相同顏色的像素間的空間關(guān)系,因此空間復(fù)雜度降到O(Nd)。
總結(jié)
- 上一篇: 颜色,形状,纹理特征
- 下一篇: 图像纹理识别与检索