摘 要: 針對MB_LBP算法對人臉特征提取維數(shù)較高,使用PCA方法會造成圖像原始空間結(jié)構(gòu)破壞和維數(shù)變得過大等問題,提出一種基于多塊LBP(Multi-scale Block Local Binary Patterns, MB_LBP),結(jié)合改進的Fast PCA算法進行人臉特征提取的方案。首先用MB_LBP算法提取人臉圖像的特征,接著用本文所改進Fast PCA方法加速計算矩陣S非零本征值所對應(yīng)的本征向量,對人臉特征進行降維,最后在ORL人臉庫進行驗證。實驗表明,該方法對后期人臉特征提取效果優(yōu)于改進前的效果,很大程度上降低了提取時間,效果明顯。
關(guān)鍵詞: MB_LBP算法;改進Fast PCA;人臉特征;維災(zāi)
0 引言
特征提取在人臉識別中應(yīng)用十分廣泛,如何更好地將圖像的特征提取應(yīng)用于人臉識別是當(dāng)前模式識別和人工智能領(lǐng)域的一個研究熱點,它涉及到計算機視覺、圖像處理、生理學(xué)等多個學(xué)科的知識背景。這種技術(shù)具有廣泛的應(yīng)用前景,如身份識別、視頻監(jiān)控、國家安全、信息安全等領(lǐng)域。
人臉特征提取和分析是人臉識別中的重要過程。局部二進制模式(Local Binary Patterns,LBP)[1-2]的方法自從被Ahonen等人引入人臉識別后一直受到廣泛關(guān)注,它是最早作為一種有效紋理描述算子提出的,尤其對圖像局部紋理特征的卓越描述能力而獲得廣泛的應(yīng)用。前述的LBP可以很精細地描述圖像的局部紋理信息,然而,也正是由于這種特征的局部化特點,使其易受噪聲的影響而不夠健壯,缺乏對圖像整體信息的粗粒度把握,因此MB_LBP代替LBP來提取圖像的特征。盡管MB_LBP算法可以很好地對圖像特征進行提取,但是此算法在提取圖像紋理特征時維數(shù)過高,對后期人臉識別計算量有所影響,會造成計算過程的復(fù)雜化。因此,在圖像特征提取時需要對其降維。PCA在特征降維中是一個經(jīng)典的重要方法。在參考文獻[3]中所涉及的LBP和PCA結(jié)合的特征提取算法,從一定程度上提高了識別率,但是PCA原理是將圖像展開成高維的行向量和列向量,然后通過訓(xùn)練樣本來計算樣本協(xié)方差矩陣,并由協(xié)方差矩陣組成的投影矩陣把原始訓(xùn)練樣本中的高維向量投影成低維矩陣。但是這樣會造成圖像原始空間結(jié)構(gòu)破壞和維數(shù)變得過大。因此,本文提出改進Fast PCA可加速計算矩陣S非零本征值所對應(yīng)的本征向量,降低提取時間。將其與MB_LBP算法結(jié)合,在ORL人臉庫上進行實驗,效果有一定的優(yōu)越性。
1 MB_LBP算法
局部二進制模式(LBP)[4]是最早作為有效的紋理描述算子提出的,由于最初的LBP算法的映射過程相對簡單,僅僅提取到所給范圍內(nèi)特征信息,對于類內(nèi)的圖像識別具有一定的效果,但對于類間圖像的識別效果很難令人滿意。LBP算法只提取圖像特征,并沒有實現(xiàn)先驗信息的運用。LBP算法是直接在灰度圖像上實現(xiàn)特征提取,通過比較中心像素和鄰域像素之間的灰度值來實現(xiàn)二值化。一般采用固定大?。ㄈ?×3)的矩形方塊,對應(yīng)窗口的局部紋理的分布則可以假設(shè)是局部區(qū)域內(nèi)像素的聯(lián)合分布密度,以圖像的某個像素為中心點gc,對周圍的8個像素點g0,g1,…,g7的紋理T的分布定義如下:
T~(g0-gc,…,g7-gc)(1)
然后令中心點gc的灰度值作為參考,對鄰域8個像素點進行二值化處理,方法為:
T≈t(s(g0-gc),…,s(g7-gc))(2)
圖1給出一個基本LBP算子,圖中的3×3區(qū)域中心點以其灰度值88作為閾值對其8鄰域進行二值化,并且從左上點開始按照順時針方向?qū)⒍祷Y(jié)果組成一個二進制數(shù)10001011,即十進制139,作為中心的響應(yīng)。在整個逐行掃描過程結(jié)束后,會得到一個LBP響應(yīng)圖像,稱為LBP統(tǒng)計直方圖,也稱為LBP特征。
由于LBP的映射過程太簡單,并且易受噪聲干擾,穩(wěn)定性不強,所以利用MB_LBP[5-6]算法。該算法是在LBP算法的基礎(chǔ)上提出來的,把LBP算法中一個中心像素的應(yīng)用開展到含有眾多像素的矩形區(qū)域,把該矩形區(qū)域的灰度平均值作為其閾值。用MBs_LBP表示像素塊大小為S×S的LBP算法。圖2為MB_LBP算法特征的圖像表示。
MB_LBP算法公式:
式中,gc表示圖像某個像素的中心點,gi表示周圍8個像素點。
由圖3可以看出,隨著像素塊大小S的增加,響應(yīng)圖像中紋理增粗,并趨于穩(wěn)定,說明較大的像素塊有利于圖像中的粗粒度信息的把握。
2 Fast PCA算法
前面已講過單方面用MB_LBP算法提取的人臉特征維數(shù)較高,如果直接計算,計算量會很大,復(fù)雜度也很大。為了提高這一特性,本文將改進后的Fast PCA運用到特征提取過程中,提高識別效果。
特征提取過程包括了兩個方面[7]:訓(xùn)練和識別。在訓(xùn)練過程中,系統(tǒng)需要識別到樣品數(shù)據(jù),并將這些樣品創(chuàng)建成一個特征矩陣,把圖像空間里的樣本轉(zhuǎn)換成特征空間里的點。把這些圖像樣本作為灰度圖像,并通過保持列向量的連續(xù)性,將樣本圖像從二維矩陣轉(zhuǎn)變成N2×1列向量一維矩陣。最后把這n幅圖像的列向量排列成維數(shù)為N2×n的圖像組X。
令m為矩陣X中數(shù)據(jù)向量的均值向量,定義如下:
通過X矩陣的所有列向量減去均值向量m,將數(shù)據(jù)矩陣的列向量視為中心,經(jīng)過以上操作,從而得到協(xié)方差矩陣ST。定義為:
對其進行特征值分解,如下:
公式中V是與特征值?撰相關(guān)的特征向量組,根據(jù)從高到低對應(yīng)的特征值設(shè)定特征矩陣的順序。其中特征向量的矩陣就是特征空間V,數(shù)據(jù)矩陣X被投影到特征空間,從而獲取由n列組成的P:
P=VTX(7)
在識別階段,正如上面說的,圖像S將被轉(zhuǎn)換成一維向量并形成J,然后都在映射到特征空間獲得Z。
Z=XTJ(8)
其中有個歐式距離d,它是Z和P中所有的投射樣品的距離。d用L2來計算,L2是圖像A和B的規(guī)范的歐氏距離:
最后把投射測試圖像與每個投影訓(xùn)練圖像作比較,發(fā)現(xiàn)訓(xùn)練圖像更加接近被用來識別的訓(xùn)練圖像的測試圖像。
3 一種Fast PCA改進方法
3.1 預(yù)處理
本文針對Fast PCA[8-9]提出的改進方法是在訓(xùn)練和識別階段中同時加進預(yù)處理這一過程。對于此方法,通過直方圖均值化過程進行結(jié)果比較,從而通過增加局部比較來調(diào)整圖像。這一過程對輸入圖像的灰度值進行了再分配,從而輸出圖像擁有了統(tǒng)一的灰度值分布。并且通過式(10),降低圖像灰度值變化和光不對稱效果的影響,將圖像進行歸一化:
式中:std和m分別表示標(biāo)準差和輸入圖像灰度值的均值,ustd和um分別表示所期望的標(biāo)準差和均值。
3.2 改進后算法流程
這一改進算法包括下面幾個步驟:
第一步:運用直方圖均值化和歸一化過程,對數(shù)據(jù)組訓(xùn)練圖像進行預(yù)處理。
第二步:運用第2節(jié)中所提的MB_LBP進行特征提取,并在特征矩陣中存儲期望的值。
第三步:在特征矩陣中,根據(jù)不同特征的分類將其訓(xùn)練圖像放到不同子集中,然后把這些值存儲到特征向量的一個列向量中。
第四步:輸入測試圖像。
第五步:像上面第二步和第三步一樣,將測試圖像進行特征提取和分類。
第六步:在同一組的訓(xùn)練圖像作為測試圖像裝載到圖像組中。
第七步:在已有的圖像組中,運用Fast PCA去識別這些測試圖。
4 實驗及結(jié)果分析
本次實驗是在ORL人臉庫中進行的,旨在將MB_LBP與改進后的Fast PCA結(jié)合的方式在人臉特征提取方面的性能與其他傳統(tǒng)方式進行比較。該試驗方法是在MATLAB上選取30個不同人的灰度圖像完成的。原始圖像如圖4,30個訓(xùn)練樣本圖像如圖5。
使用MB_LBP對如圖5的灰度圖像進行處理,用于對其提取特征,MB_LBP對于特征提取比以往的方法更加健壯,且對整體把握度更好,并且它的計算量不是很大。本文提出的針對于人臉識別的算法,在時間和維數(shù)上都有很好的效果。一張人臉包含了很多特征信息,例如眼睛、鼻子和嘴等,而且每個特征都有相應(yīng)的一些值和權(quán)重。本次實驗中選用鼻子和嘴處紋理信息,在本次改進算法中,在訓(xùn)練樣本數(shù)據(jù)中,根據(jù)這些特征的權(quán)重對人臉進行預(yù)分類,每個人臉將與一個特征子集相匹配[10]。
最后的比較結(jié)果如圖6和圖7所示。計算量在實際人臉識別應(yīng)用中是相當(dāng)重要的因素。從圖6可以看出,原來的Fast PCA的計算量比改進后的要大得多,時間隨著訓(xùn)練集中的圖像數(shù)的增加比改進后的快得多,這里的時間是指消耗在訓(xùn)練數(shù)據(jù)和識別上的總時間。在圖7中也可以看出,改進后算法的特征空間的維數(shù)很低,變化趨于穩(wěn)定,而改進前的維數(shù)隨著訓(xùn)練圖像數(shù)的增加越來越大。
為了說明Proposed Fast PCA的優(yōu)越型,本文做了Fast PCA特征的人臉識別與Proposed Fast PCA特征的人臉識別比較試驗。結(jié)果如表1所示。
由表1可以看出,在ORL人臉庫上進行實驗,本文所提改進算法識別率最高,但由于實驗方法是MB_LBP算法與Proposed Fast PCA算法的結(jié)合,識別時間有些變長,但是可以發(fā)現(xiàn),運用本文算法可以避免維數(shù)災(zāi)難性增長的發(fā)生,人臉識別率明顯提高。后期隨著實驗平臺的提升,所提算法的人臉識別時間會有所減少,可見,本文算法具有一定的實用價值。
5 總結(jié)
通過實驗結(jié)果可以看出本文算法在計算量和特征空間維數(shù)方面有很好的效果。所改進的方法比較簡單,更重要的是對于特征提取進行了降維,識別率提升效果明顯。此方法更好地避免了維數(shù)災(zāi)難,更有利于后面的人臉識別的進行。在以后的工作中將對算法進行進一步改進,以達到更好效果。
參考文獻
[1] 李良,高娜.基于LBP層次特征的表情識別算法[J].河南理工學(xué)報,2013,32(6):732-735.
[2] 歐陽琰,桑農(nóng).基于面部動作組合特征的表情識別[J].中國體視學(xué)與圖像分析,2011,16(1):38-43.
[3] LI W M, LI Y F, WU Y. A mode based method for overall well focused catadioptric image acquisition with multi-focal images[C]. proc of ICCAIP, 2009:648-653.
[4] 郭艷榮,蔣建國,郭世杰,等.基于LBP文理特征的隨機游走圖像分割[J].電路與系統(tǒng)學(xué)報,2013,18(1):357-364.
[5] 盧桂馥,林忠,金忠,等.基于最大差值的二維邊界Fisher的人臉識別[J].計算機科學(xué),2010,37(5):251-253.
[6] FANG Y C, LUO J, LOU C S. Fusion of multi-driectional rotation invariant unform LBP features for face recognition[C]. Proceedings of the 3rd International Conference on Intelligent Information Technology Application, NJ, USA, 2009:332-335.
[7] SAJID I, AHMED M M, TAJ I. Design and implementation of a face recognition system using Fast PCA[J]. IEEE Translation on Computer Society, 2008,16(8):126-130.
[8] TUCK M, PENTLAND A. Eigenfaces for Recognition[J].Cognitive Neuroscience, 1999,3(1):71-86.
[9] 褚玉,李妮妮,劉軍清,等.基于均值濾波分頻的直方圖均衡方法[J].中山大學(xué)學(xué)報:自然科學(xué)版,2013,52(4):71-75,85.
[10] 張錚,王艷平,薛桂香.數(shù)字圖像處理與機器視覺[M].北京:人民郵電出版社,2010.