LBP特征原理及代码实现
一、LBP特征的背景介紹
LBP指局部二值模式,英文全稱:Local Binary Pattern,是一種用來描述圖像局部特征的算子,LBP特征具有灰度不變性和旋轉不變性等顯著優(yōu)點。它是由T. Ojala, M.Pietik?inen, 和 D. Harwood [1][2]在1994年提出,由于LBP特征計算簡單、效果較好,因此LBP特征在計算機視覺的許多領域都得到了廣泛的應用,LBP特征比較出名的應用是用在人臉識別和目標檢測中,在計算機視覺開源庫Opencv中有使用LBP特征進行人臉識別的接口,也有用LBP特征訓練目標檢測分類器的方法,Opencv實現(xiàn)了LBP特征的計算,但沒有提供一個單獨的計算LBP特征的接口。
二、LBP特征的原理
1、原始LBP特征描述及計算方法
原始的LBP算子定義在像素3*3的鄰域內,以鄰域中心像素為閾值,相鄰的8個像素的灰度值與鄰域中心的像素值進行比較,若周圍像素大于中心像素值,則該像素點的位置被標記為1,否則為0。這樣,3*3鄰域內的8個點經過比較可產生8位二進制數(shù),將這8位二進制數(shù)依次排列形成一個二進制數(shù)字,這個二進制數(shù)字就是中心像素的LBP值,LBP值共有28種可能,因此LBP值有256種。中心像素的LBP值反映了該像素周圍區(qū)域的紋理信息。?
備注:計算LBP特征的圖像必須是灰度圖,如果是彩色圖,需要先轉換成灰度圖。?
上述過程用圖像表示為:?
?
?
將上述過程用公式表示為:?
(xc,yc)為中心像素的坐標,p為鄰域的第p個像素,ip為鄰域像素的灰度值,ic為中心像素的灰度值,s(x)為符號函數(shù)
原始LBP特征計算代碼(Opencv下):
//原始LBP特征計算 template <typename _tp> void getOriginLBPFeature(InputArray _src,OutputArray _dst) {Mat src = _src.getMat();_dst.create(src.rows-2,src.cols-2,CV_8UC1);Mat dst = _dst.getMat();dst.setTo(0);for(int i=1;i<src.rows-1;i++){for(int j=1;j<src.cols-1;j++){_tp center = src.at<_tp>(i,j);unsigned char lbpCode = 0;lbpCode |= (src.at<_tp>(i-1,j-1) > center) << 7;lbpCode |= (src.at<_tp>(i-1,j ) > center) << 6;lbpCode |= (src.at<_tp>(i-1,j+1) > center) << 5;lbpCode |= (src.at<_tp>(i ,j+1) > center) << 4;lbpCode |= (src.at<_tp>(i+1,j+1) > center) << 3;lbpCode |= (src.at<_tp>(i+1,j ) > center) << 2;lbpCode |= (src.at<_tp>(i+1,j-1) > center) << 1;lbpCode |= (src.at<_tp>(i ,j-1) > center) << 0;dst.at<uchar>(i-1,j-1) = lbpCode;}} }- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
測試結果:?
2、LBP特征的改進版本
在原始的LBP特征提出以后,研究人員對LBP特征進行了很多的改進,因此產生了許多LBP的改進版本。
2.1 圓形LBP特征(Circular LBP or Extended LBP)
? ? ? ?由于原始LBP特征使用的是固定鄰域內的灰度值,因此當圖像的尺度發(fā)生變化時,LBP特征的編碼將會發(fā)生錯誤,LBP特征將不能正確的反映像素點周圍的紋理信息,因此研究人員對其進行了改進[3]。基本的 LBP 算子的最大缺陷在于它只覆蓋了一個固定半徑范圍內的小區(qū)域,這顯然不能滿足不同尺寸和頻率紋理的需要。為了適應不同尺度的紋理特征,并達到灰度和旋轉不變性的要求,Ojala 等對 LBP 算子進行了改進,將 3×3 鄰域擴展到任意鄰域,并用圓形鄰域代替了正方形鄰域,改進后的 LBP 算子允許在半徑為 R 的圓形鄰域內有任意多個像素點。從而得到了諸如半徑為R的圓形區(qū)域內含有P個采樣點的LBP算子:?
?
這種LBP特征叫做Extended LBP,也叫Circular LBP。使用可變半徑的圓對近鄰像素進行編碼,可以得到如下的近鄰:?
?
對于給定中心點(xc,yc),其鄰域像素位置為(xp,yp),p∈P,其采樣點(xp,yp)用如下公式計算:
?
R是采樣半徑,p是第p個采樣點,P是采樣數(shù)目。由于計算的值可能不是整數(shù),即計算出來的點不在圖像上,我們使用計算出來的點的插值點。目的的插值方法有很多,Opencv使用的是雙線性插值,雙線性插值的公式如下:?
?
通過LBP特征的定義可以看出,LBP特征對光照變化是魯棒的,其效果如下圖所示:?
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
測試結果:?
radius = 3,neighbors = 8?
?
第三幅圖像為radius = 3,neighbors = 8,第四幅圖像為radius = 1,neighbors = 8,從實驗結果可以看出,半徑越小,圖像紋理越精細?
第三幅圖像為radius = 3,neighbors = 8,第四幅圖像為radius = 3,neighbors = 4,從實驗結果可以看出,鄰域數(shù)目越小,圖像亮度越低,合理,因此4位的灰度值很小?
由于我代碼的問題,不能使neighbors >8,可改進?
2.2 旋轉不變LBP特征
? ? ? ?從上面可以看出,上面的LBP特征具有灰度不變性,但還不具備旋轉不變性,因此研究人員又在上面的基礎上進行了擴展,提出了具有旋轉不變性的LBP特征。?
首先不斷的旋轉圓形鄰域內的LBP特征,根據(jù)選擇得到一系列的LBP特征值,從這些LBP特征值選擇LBP特征值最小的作為中心像素點的LBP特征。具體做法如下圖所示:?
?
如圖,通過對得到的LBP特征進行旋轉,得到一系列的LBP特征值,最終將特征值最小的一個特征模式作為中心像素點的LBP特征。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
測試結果:?
radius = 3,neighbors = 8,最后一幅是旋轉不變LBP特征?
2.3 Uniform Pattern LBP特征
? ? ? ?Uniform Pattern,也被稱為等價模式或均勻模式,由于一個LBP特征有多種不同的二進制形式,對于半徑為R的圓形區(qū)域內含有P個采樣點的LBP算子將會產生2P種模式。很顯然,隨著鄰域集內采樣點數(shù)的增加,二進制模式的種類是以指數(shù)形式增加的。例如:5×5鄰域內20個采樣點,有220=1,048,576種二進制模式。這么多的二進制模式不利于紋理的提取、分類、識別及存取。例如,將LBP算子用于紋理分類或人臉識別時,常采用LBP模式的統(tǒng)計直方圖來表達圖像的信息,而較多的模式種類將使得數(shù)據(jù)量過大,且直方圖過于稀疏。因此,需要對原始的LBP模式進行降維,使得數(shù)據(jù)量減少的情況下能最好的表示圖像的信息。?
????為了解決二進制模式過多的問題,提高統(tǒng)計性,Ojala提出了采用一種“等價模式”(Uniform Pattern)來對LBP算子的模式種類進行降維。Ojala等認為,在實際圖像中,絕大多數(shù)LBP模式最多只包含兩次從1到0或從0到1的跳變。因此,Ojala將“等價模式”定義為:當某個LBP所對應的循環(huán)二進制數(shù)從0到1或從1到0最多有兩次跳變時,該LBP所對應的二進制就稱為一個等價模式類。如00000000(0次跳變),00000111(只含一次從0到1的跳變),10001111(先由1跳到0,再由0跳到1,共兩次跳變)都是等價模式類。除等價模式類以外的模式都歸為另一類,稱為混合模式類,例如10010111(共四次跳變)。通過這樣的改進,二進制模式的種類大大減少,而不會丟失任何信息。模式數(shù)量由原來的2P種減少為 P ( P-1)+2種,其中P表示鄰域集內的采樣點數(shù)。對于3×3鄰域內8個采樣點來說,二進制模式由原始的256種減少為58種,即:它把值分為59類,58個uniform pattern為一類,其它的所有值為第59類。這樣直方圖從原來的256維變成59維。這使得特征向量的維數(shù)更少,并且可以減少高頻噪聲帶來的影響。?
????具體實現(xiàn):采樣點數(shù)目為8個,即LBP特征值有28種,共256個值,正好對應灰度圖像的0-255,因此原始的LBP特征圖像是一幅正常的灰度圖像,而等價模式LBP特征,根據(jù)0-1跳變次數(shù),將這256個LBP特征值分為了59類,從跳變次數(shù)上劃分:跳變0次—2個,跳變1次—0個,跳變2次—56個,跳變3次—0個,跳變4次—140個,跳變5次—0個,跳變6次—56個,跳變7次—0個,跳變8次—2個。共9種跳變情況,將這256個值進行分配,跳變小于2次的為等價模式類,共58個,他們對應的值按照從小到大分別編碼為1—58,即它們在LBP特征圖像中的灰度值為1—58,而除了等價模式類之外的混合模式類被編碼為0,即它們在LBP特征中的灰度值為0,因此等價模式LBP特征圖像整體偏暗。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
測試結果:?
radius = 3,neighbors = 8,最后一幅是等價模式LBP特征?
2.4 MB-LBP特征
MB-LBP特征,全稱為Multiscale Block LBP,來源于論文[9],中科院的人發(fā)明的,在Traincascade級聯(lián)目標訓練檢測中的LBP特征使用的就是MB-LBP。?
MB-LBP的原理:?
?
將圖像分成一個個小塊(Block),每個小塊再分為一個個的小區(qū)域(類似于HOG中的cell),小區(qū)域內的灰度平均值作為當前小區(qū)域的灰度值,與周圍小區(qū)域灰度進行比較形成LBP特征,生成的特征稱為MB-LBP,Block大小為3*3,則小區(qū)域的大小為1,就是原始的LBP特征,上圖的Block大小為9*9,小區(qū)域的大小為3*3。?
不同Block提取的MB-LBP特征如圖所示:?
?
計算MB-LBP代碼:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
效果圖:?
Block=3,即原始的LBP特征?
?
Block=9?
?
Block=15?
?
????到此為止,還沒有結束,作者對得到LBP特征又進行了均值模式編碼,通過對得到的特征圖求直方圖,得到了LBP特征值0-255之間(0-255即直方圖中的bin)的特征數(shù)量,通過對bin中的數(shù)值進行排序,通過權衡,將排序在前63位的特征值看作是等價模式類,其他的為混合模式類,總共64類,作者在論文中稱之為SEMB-LBP(Statistically Effective MB-LBP )。類似于等價模式LBP,等價模式的LBP的等價模式類為58種,混合模式類1種,共59種。二者除了等價模式類的數(shù)量不同之外,主要區(qū)別在于:對等價模式類的定義不同,等價模式LBP是根據(jù)0-1的跳變次數(shù)定義的,而SEMB-LBP是通過對直方圖排序得到的。當然下一步要做的就是將SEMB-LBP變?yōu)長BPH進行使用。?
計算SEMB-LBP的代碼
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
測試結果:?
第二幅為對MB-LBP進行編碼得到的SEMB-LBP圖像?
?
總結:MB-LBP有點類似于先將圖像進行平滑處理,然后再求LBP特征。而SEMB-LBP是在MB-LBP進行編碼后的圖像。類似于等價模式LBP,先求LBP特征,再用等價模式進行編碼。當Scale=3時,MB-LBP和SEMB-LBP就是LBP和等價模式LBP。想具體了解需要去看論文,當然要自己實現(xiàn)才會理解的更透徹。
三、LBPH——圖像的LBP特征向量
????LBPH,Local Binary Patterns Histograms,即LBP特征的統(tǒng)計直方圖,LBPH將LBP特征與圖像的空間信息結合在一起。這種表示方法由Ahonen等人在論文[3]中提出,他們將LBP特征圖像分成m個局部塊,并提取每個局部塊的直方圖,然后將這些直方圖依次連接在一起形成LBP特征的統(tǒng)計直方圖,即LBPH。?
一幅圖像具體的計算LBPH的過程(以Opencv中的人臉識別為例):?
1. 計算圖像的LBP特征圖像,在上面已經講過了。?
2. 將LBP特征圖像進行分塊,Opencv中默認將LBP特征圖像分成8行8列64塊區(qū)域?
3. 計算每塊區(qū)域特征圖像的直方圖cell_LBPH,將直方圖進行歸一化,直方圖大小為1*numPatterns?
4. 將上面計算的每塊區(qū)域特征圖像的直方圖按分塊的空間順序依次排列成一行,形成LBP特征向量,大小為1*(numPatterns*64)?
5. 用機器學習的方法對LBP特征向量進行訓練,用來檢測和識別目標?
舉例說明LBPH的維度:?
采樣點為8個,如果用的是原始的LBP或Extended LBP特征,其LBP特征值的模式為256種,則一幅圖像的LBP特征向量維度為:64*256=16384維,?
而如果使用的UniformPatternLBP特征,其LBP值的模式為59種,其特征向量維度為:64*59=3776維,可以看出,使用等價模式特征,其特征向量的維度大大減少,?
這意味著使用機器學習方法進行學習的時間將大大減少,而性能上沒有受到很大影響。?
Opencv的人臉識別使用的是Extended LBP
計算LBPH的代碼如下:
//計算LBP特征圖像的直方圖LBPH Mat getLBPH(InputArray _src,int numPatterns,int grid_x,int grid_y,bool normed) {Mat src = _src.getMat();int width = src.cols / grid_x;int height = src.rows / grid_y;//定義LBPH的行和列,grid_x*grid_y表示將圖像分割成這么些塊,numPatterns表示LBP值的模式種類Mat result = Mat::zeros(grid_x * grid_y,numPatterns,CV_32FC1);if(src.empty()){return result.reshape(1,1);}int resultRowIndex = 0;//對圖像進行分割,分割成grid_x*grid_y塊,grid_x,grid_y默認為8for(int i=0;i<grid_x;i++){for(int j=0;j<grid_y;j++){//圖像分塊Mat src_cell = Mat(src,Range(i*height,(i+1)*height),Range(j*width,(j+1)*width));//計算直方圖Mat hist_cell = getLocalRegionLBPH(src_cell,0,(numPattern-1),true);//將直方圖放到result中Mat rowResult = result.row(resultRowIndex);hist_cell.reshape(1,1).convertTo(rowResult,CV_32FC1);resultRowIndex++;}}return result.reshape(1,1); } //計算一個LBP特征圖像塊的直方圖 Mat getLocalRegionLBPH(const Mat& src,int minValue,int maxValue,bool normed) {//定義存儲直方圖的矩陣Mat result;//計算得到直方圖bin的數(shù)目,直方圖數(shù)組的大小int histSize = maxValue - minValue + 1;//定義直方圖每一維的bin的變化范圍float range[] = { static_cast<float>(minValue),static_cast<float>(maxValue + 1) };//定義直方圖所有bin的變化范圍const float* ranges = { range };//計算直方圖,src是要計算直方圖的圖像,1是要計算直方圖的圖像數(shù)目,0是計算直方圖所用的圖像的通道序號,從0索引//Mat()是要用的掩模,result為輸出的直方圖,1為輸出的直方圖的維度,histSize直方圖在每一維的變化范圍//ranges,所有直方圖的變化范圍(起點和終點)calcHist(&src,1,0,Mat(),result,1,&histSize,&ranges,true,false);//歸一化if(normed){result /= (int)src.total();}//結果表示成只有1行的矩陣return result.reshape(1,1); }- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
總結:上面的LBP特征都是較經典的LBP特征,除此之外,LBP特征還有大量的變種,如TLBP(中心像素與周圍所有像素比較,而不是根據(jù)采樣點的數(shù)目),DLBP(編碼標準四個方向的灰度變化,每個方向上用2比特編碼),MLBP(將中心像素值替換成采樣點像素的平均值),MB-LBP(上面有介紹),VLBP(沒太看懂),RGB-LBP(RGB圖像分別計算LBP,然后連接在一起)等,具體的需要自己去研究,可參考維基百科
四、LBP特征的匹配與使用
1、LBP特征用在目標檢測中
人臉檢測比較出名的是Haar+Adaboost方法,其實目前的Opencv也支持LBP+Adaboost和HOG+Adaboost方法進行目標檢測,從目前我的使用效果來看,LBP+Adaboost方法用在目標檢測中的效果比Haar特征、HOG特征都要好(HOG特征用的不多,主要是Haar和LBP),而且LBP特征的訓練速度比Haar和HOG都要快很多。在LBP+Adaboost中,LBP特征主要是用作輸入的訓練數(shù)據(jù)(特征),使用的LBP特征應該是DLBP(維基百科上說的,待考證,沒太看明白Cascade中LBP特征的計算方式),具體用法需要看源碼。Opencv的TrainCascade中使用的LBP特征是MB-LBP。?
老外的對Opencv級聯(lián)檢測中使用的LBP的解釋(非常好,自己讀,就不翻譯了),在看這個之前最好是運行過TrainCascade來訓練目標檢測的分類器,并使用過LBP特征訓練,調節(jié)過參數(shù)[8]:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
2、 LBP用在人臉識別中
LBP在人臉識別中比較出名,從源碼上來看,人臉識別中LBPH的使用主要是用來進行直方圖的比較,通過直方圖的比較來判斷目標的類別。在Opencv的基于LBP的人臉識別的實現(xiàn)中使用的LBP特征是Extendes LBP,即圓形LBP特征。參考的論文為文獻[10]。?
LBPH訓練主要是提取輸入的圖像的LBPH保存,當進行識別時,遍歷保存的LBPH,找到輸入圖像與訓練圖像方差最小的LBPH,將其對應的類別作為識別的類別輸出。?
用LBPH進行訓練和識別的代碼。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
測試結果:?
參考資料
[1] T. Ojala, M. Pietik?inen, and D. Harwood (1994), “Performance evaluation of texture measures with classification based on Kullback discrimination of distributions”, Proceedings of the 12th IAPR International Conference on Pattern Recognition (ICPR 1994), vol. 1, pp. 582 - 585.?
[2] T. Ojala, M. Pietik?inen, and D. Harwood (1996), “A Comparative Study of Texture Measures with Classification Based on Feature Distributions”, Pattern Recognition, vol. 29, pp. 51-59.?
[3] Ahonen, T., Hadid, A., and Pietikainen, M. Face Recognition with Local Binary Patterns. Computer Vision- ECCV 2004 (2004), 469–481.?
[4]?http://blog.csdn.net/xidianzhimeng/article/details/19634573?
[5] opencv參考手冊,Opencv源碼?
[6]?http://blog.csdn.net/zouxy09/article/details/7929531?
[7]?http://blog.csdn.net/songzitea/article/details/17686135?
[8]?http://stackoverflow.com/questions/20085833/face-detection-algorithms-with-minimal-training-time/20086402#20086402?
[9] Shengcai Liao, Xiangxin Zhu, Zhen Lei, Lun Zhang and Stan Z. Li. Learning Multi-scale Block Local Binary Patterns for Face Recognition. International Conference on Biometrics (ICB), 2007, pp. 828-837.?
[10] Ahonen T, Hadid A. and Pietik?inen M. “Face description with local binary patterns: Application to face recognition.” IEEE Transactions on Pattern Analysis and Machine Intelligence, 28(12):2037-2041.
總結
以上是生活随笔為你收集整理的LBP特征原理及代码实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Python】使用Python调用Fr
- 下一篇: Fragstats官方教程 [汉译版]