頊聰,陶永鵬
?。ù筮B外國(guó)語大學(xué) 軟件學(xué)院, 遼寧 大連 116044)
摘要:局部二值模式(LBP)算法是人臉識(shí)別領(lǐng)域中的經(jīng)典算法,能夠捕捉局部的細(xì)節(jié)特征,但其魯棒性和識(shí)別率易受外部環(huán)境變化的影響。文章深入研究了LBP算法,從LBP算子、直方圖特征提取對(duì)傳統(tǒng)LBP算法進(jìn)行改進(jìn),并結(jié)合LIOP編碼方法,進(jìn)一步提出了增強(qiáng)局部量化模式(ELQP)的人臉識(shí)別算法。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的LBP算法具有更高的識(shí)別率和較強(qiáng)的魯棒性。
關(guān)鍵詞:LBP 算子;圖像融合;人臉識(shí)別;特征提取
中圖分類號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:ADOI: 10.19358/j.issn.16747720.2016.23.005
引用格式:頊聰,陶永鵬. 基于改進(jìn)的LBP人臉識(shí)別算法的研究[J].微型機(jī)與應(yīng)用,2016,35(23):18-20,27.
0引言
人臉識(shí)別,特指利用分析比較人臉視覺特征信息進(jìn)行身份鑒別的計(jì)算機(jī)技術(shù)。研究人臉識(shí)別重點(diǎn)在于對(duì)核心算法的研究,通過算法的改進(jìn)使識(shí)別結(jié)果具有實(shí)用化的識(shí)別率和識(shí)別速度。當(dāng)前人臉識(shí)別領(lǐng)域中,主要有以下核心算法研究[1]:(1)通過積分方式進(jìn)行歐式距離表示,形成的基于幾何特征的算法,例如MIT的Brunelli和Poggio科研團(tuán)隊(duì)。(2)利用模板匹配算法進(jìn)行人臉特征提?。ㄈ缑济⒀劬喞奶卣魈崛。?,例如Harvard大學(xué)SmithKettlewell眼睛研究中心。然而目前面臨的主要問題是外界環(huán)境的不斷變化對(duì)人臉識(shí)別產(chǎn)生了巨大影響,加大了識(shí)別的難度。如何提出新算法或改進(jìn)原有的算法進(jìn)行有效的人臉特征提取是目前人臉識(shí)別技術(shù)研究的重點(diǎn)。
早期的研究提出了Eigenface方法[2],主要是利用主成分分析(PCA)進(jìn)行人臉特征提取,形成特征臉,因?yàn)槌醪教崛〉拿枋鋈四樛庠谧兓奶卣髂樉S度較高,所以要進(jìn)行降維處理。在此基礎(chǔ)上進(jìn)一步提出了Fisherface[3]方法,先應(yīng)用PCA對(duì)特征向量進(jìn)行降維,然后使用線性判別分析(LDA)使特征的類內(nèi)差異減小并增大類間差異。但是這些基于全局特征的方法對(duì)于表情、光照、遮擋這些變化十分敏感,于是基于局部特征的人臉?biāo)惴ㄖ饾u成為新的研究熱點(diǎn)。
1LBP的算法的改進(jìn)
1.1LBP理論
局部二值模式(LBP)算法是一種典型的基于局部特征的識(shí)別算法[4]。LBP局部二值模式是一種基于灰度值比較的局部紋理結(jié)構(gòu)表示方法,與灰度特征相比表示能力更強(qiáng)。它對(duì)于邊緣、角點(diǎn)和平滑變化的圖像區(qū)域都能良好地表示出來。對(duì)于任意圖像I來說,LBP通過比較中心像素點(diǎn)和鄰域像素點(diǎn)的值來對(duì)圖像進(jìn)行重編碼,其定義如下:
其中φ(x)為閾值化函數(shù),只有當(dāng)x的值大于等于0時(shí)函數(shù)值為1,否則函數(shù)值為0;n代表LBP編碼總的鄰域點(diǎn)數(shù);k表示第k個(gè)鄰域點(diǎn);c代表中心像素點(diǎn)。
LBP算法計(jì)算方法簡(jiǎn)單,不涉及到復(fù)雜的運(yùn)算,但是本身存在兩個(gè)缺陷:
第一,隨著LBP的鄰域點(diǎn)數(shù)量增加,LBP的主模數(shù)量會(huì)成指數(shù)形式增加。
第二,LBP編碼雖然有一定的灰度不變性和旋轉(zhuǎn)不變性,但是對(duì)姿態(tài)變化和光照變化等外界環(huán)境依然不夠魯棒。
1.2LBP算子的改進(jìn)
對(duì)于LBP算法的改進(jìn),目的是克服原有算法的不足,提高在復(fù)雜外界環(huán)境下人臉的識(shí)別率。
由于基于局部特征提取框架主要分為三個(gè)部分,因此主要的改進(jìn)方向有:圖像濾波、模式采樣、模式編碼三個(gè)。
1.2.1圖像濾波上的改進(jìn)
在不同的光照環(huán)境下得到的人臉圖像存在顯著的差異,為了消除這種差異需要對(duì)圖片進(jìn)行預(yù)處理。具體來說就是對(duì)于圖像I使用濾波核w進(jìn)行濾波處理,得到圖像f(I),然后對(duì)f(I)進(jìn)行LBP編碼。增強(qiáng)圖像細(xì)節(jié)。
1.2.2模式采樣的改進(jìn)
LBP方法只使用了鄰域點(diǎn)與中心像素點(diǎn)的大小關(guān)系,沒有利用上鄰域點(diǎn)之間的大小關(guān)系,而且對(duì)于鄰域點(diǎn)之間的權(quán)重是相等的。因此如何利用鄰域點(diǎn)之間的大小關(guān)系進(jìn)行編碼是重點(diǎn)解決的關(guān)鍵技術(shù)問題??紤]到局部序數(shù)模式算法可以對(duì)鄰域點(diǎn)按照一定的關(guān)系排序,因此本文采用該算法去改善模式的編碼。
1.2.3模式編碼上的改進(jìn)
LBP編碼的主模數(shù)與鄰域點(diǎn)數(shù)之間存在指數(shù)關(guān)系,然而為了增強(qiáng)判別能力不得不使用較大的鄰域點(diǎn)數(shù)。因此如何降低主模數(shù)量是重點(diǎn)解決的關(guān)鍵技術(shù)問題。針對(duì)這個(gè)問題HUSSAIN S U提出了LQP,通過使用離線K均值距離建立一個(gè)碼本,并將二進(jìn)制序列分成K個(gè)子類來編碼主模。
1.3直方圖特征提取
改進(jìn)LBP算子后,需要進(jìn)一步進(jìn)行直方圖下的特征提取。如圖1所示。
?。?)直方圖特征度量
基于圖像分塊的直方圖特征提取是一種局部建模方法,計(jì)算得到空間直方圖對(duì)于表情、飾物、光照、姿態(tài)等的變化不敏感。為了對(duì)直方圖特征進(jìn)行相似度比較,因此需要使用一定的度量標(biāo)準(zhǔn)。對(duì)于圖片的直方圖特征表示來說,傳統(tǒng)的歐氏距離度量不再適用于直方圖相似度的計(jì)算,直方圖相交距離[5]可以有效表示其直方圖特征的類似狀況,因此本文加以采用,并給出直方圖相交距離的數(shù)學(xué)定義:
?。?)直方圖權(quán)重度量方法
人臉不同的部位對(duì)于身份的辨別具有不同的重要性。不同的直方圖特征對(duì)應(yīng)的判別能力也不同,因此需要對(duì)不同的直方圖塊賦予不同的權(quán)重。整體的直方圖特征就是由每一個(gè)區(qū)域的直方圖連接起來的。為了體現(xiàn)不同直方圖塊在整體人臉的不同部位的重要性,需要進(jìn)行權(quán)重的分配。而目前關(guān)于權(quán)重的設(shè)置并沒有一個(gè)很好的方案,人工指定的方法過于復(fù)雜,對(duì)于各個(gè)區(qū)域權(quán)重的取值過于隨意,取值全靠經(jīng)驗(yàn)。因此針對(duì)不同的直方圖特征對(duì)應(yīng)的判別能力的不同,本文改寫了上面直方圖相交的公式,加入了權(quán)重后其直方圖相交距離為:就是第i塊直方圖對(duì)應(yīng)的權(quán)重值。
?。?)直方圖特征的降維方法
直方圖特征維數(shù)過高不利于后續(xù)的識(shí)別和實(shí)際應(yīng)用中實(shí)時(shí)計(jì)算的要求,因此有必要對(duì)直方圖特征進(jìn)行降維處理。本文利用特征降維法PCA[6],算法步驟為:①計(jì)算散布矩陣S;②計(jì)算散布矩陣S的本征值和本征向量;③按本征值的大小,從大到小對(duì)其對(duì)應(yīng)的本征向量進(jìn)行排序;④選擇其中最大的d個(gè)本征值對(duì)應(yīng)的本征向量,并將其作為投影向量,構(gòu)成D×d投影矩陣W。
測(cè)試結(jié)果如圖2所示。
圖2(a)是原始人臉圖像,圖2(b)是采用分塊的 LBP圖像的空間增強(qiáng)直方圖算法進(jìn)行特征提取的人臉圖像,圖2(c)是經(jīng)過 PCA 降維的特征圖像。可以看出經(jīng)過 PCA 降維的人臉的局部細(xì)節(jié)特征依然保留,但數(shù)據(jù)量降低,說明經(jīng) PCA 降維的特征提取取得了良好的效果。通過降維后人臉圖像特征矩陣識(shí)別將轉(zhuǎn)化為樣本分類的求解問題,本文則通過構(gòu)建最小支持向量機(jī)來進(jìn)行分類。
2增強(qiáng)局部量化模式(ELQP)人臉識(shí)別算法
2.1概述
因LBP的鄰域編碼能力比較弱化,依然影響最終人臉的識(shí)別,所以本文在改進(jìn)LBP算法的基礎(chǔ)上進(jìn)行更進(jìn)一步的研究,提出增強(qiáng)局部量化模式(ELQP)的人臉識(shí)別算法。
LIOP[7]是用鄰域序數(shù)關(guān)系代替LBP的鄰域編碼,具有更強(qiáng)的判別能力,LQP是一種通過查表的方式對(duì)特征向量進(jìn)行編碼的方法,可以在不增加計(jì)算復(fù)雜度的情況下對(duì)更大的鄰域進(jìn)行采樣編碼。因此結(jié)合LIOP和LQP的優(yōu)點(diǎn)提出了ELQP算法進(jìn)行人臉識(shí)別。
2.2LIOP主模數(shù)指數(shù)級(jí)增加的解決
LIOP也會(huì)遇到隨著鄰域點(diǎn)數(shù)的增加,主模數(shù)呈指數(shù)級(jí)增加的問題。應(yīng)用局部量化模式可以在一定程度上解決這個(gè)問題。局部量化模式通過預(yù)先建立的查找表來對(duì)特征向量進(jìn)行量化編碼,設(shè)計(jì)分為訓(xùn)練和編碼兩個(gè)階段。訓(xùn)練階段提取所有圖像的鄰域特征向量,應(yīng)用K均值聚類算法得到一個(gè)碼本。編碼階段使用查表法將特征向量編碼成碼本中對(duì)應(yīng)的碼字,從而獲得LQP編碼圖。
2.3融合LIOP和LQP的特征提取方法
增強(qiáng)局部量化模式是融合LIOP與LQP的特征提取方法。如何進(jìn)行融合是問題處理的關(guān)鍵。本文設(shè)計(jì)的ELQP編碼選用16個(gè)鄰域點(diǎn)構(gòu)成的鄰域向量計(jì)算離線碼本。為了降低計(jì)算量,此處將圖像分成6×6的子塊,分別為每一個(gè)子塊計(jì)算一個(gè)碼本。鄰域點(diǎn)的定義如圖3所示。
2.4似度量與降維方法
所有圖像提取特征向量后都需要比較圖像之間的相似度??紤]到識(shí)別過程的計(jì)算效率,針對(duì)直方圖特征一般使用直方圖相交度量來計(jì)算相似度。如何定義兩個(gè)直方圖的特征向量并計(jì)算直方圖相交距離是重點(diǎn)解決的關(guān)鍵問題。同時(shí)利用Fisher[8]進(jìn)行特征向量的權(quán)重的分配。對(duì)于降維處理本算法采用了WPCA[9]降維。
3實(shí)驗(yàn)參數(shù)與結(jié)果
實(shí)驗(yàn)中的所有算法使用直方圖相交度量的結(jié)果如表1所示。表2給出了各算法的特征提取時(shí)間和維數(shù)。
從表1的實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),本文方法的識(shí)別率在遮擋、表情、年齡、背景和距離5個(gè)測(cè)試集上的結(jié)果優(yōu)于與之對(duì)比的PCA、LBP、Fisherface算法。
表2的結(jié)果表明本文算法ELQP在高維度下提取時(shí)間用時(shí)很少,效率高于PCA及Fisherface算法。這說明了本文算法的實(shí)用性較強(qiáng)。
4結(jié)論
人臉識(shí)別是一個(gè)具有巨大挑戰(zhàn)力的課題,雖然近十幾年來得到了非常大的關(guān)注,也取得了很多的研究成果,但是仍然沒有在本質(zhì)上有很大的突破。本文通過分析局部二值模式(LBP)算法在人臉識(shí)別中的問題,針對(duì)LBP算子在圖像濾波、模式采樣、模式編碼三個(gè)方面進(jìn)行了改進(jìn),以提高在多變環(huán)境下LBP算法的人臉識(shí)別率。在改進(jìn)的局部二值模式(LBP)算法基礎(chǔ)上,本文針對(duì)LBP編碼時(shí)鄰域特征向量的關(guān)系進(jìn)行深入研究,結(jié)合LIOP和LQP算法的優(yōu)點(diǎn),提出了增強(qiáng)局部量化模式(ELQP)算法。并通過實(shí)驗(yàn)進(jìn)行了驗(yàn)證,證明了本算法的優(yōu)越性。
參考文獻(xiàn)
?。?] 山世光.人臉識(shí)別中若干關(guān)鍵問題的研究[D]. 北京:中國(guó)科學(xué)院計(jì)算技術(shù)研究所,2004.
[2] 張寶昌.人臉特征提取和非線性識(shí)別方法的研究[D].哈爾濱:哈爾濱工業(yè)大學(xué), 2006.
?。?] ZHAO W, CHELLAPPA R, PHILLIPS P J, et al.Face recognition: a literature survey[J].ACM computing surveys (CSUR), 2003, 35(4): 399-458.
[4] 雷震.人臉識(shí)別關(guān)鍵問題和算法研究[D]. 北京:中國(guó)科學(xué)院計(jì)算技術(shù)研所,2010.
?。?] HARMAON L D, KHAN M K, LASCH R, et al. Machine identification of human faces[J]. Pattern Recognition, 1981, 13(2): 97-110.
?。?] CHELLAPPA R, WILSON C L, SIROHEY S. Human and machine recognition of faces: a survey[J]. Proceedings of the IEEE, 1995, 83(5): 705-741.
[7] PENTLAND A, MOGHADDAM B, STARNER T. Viewbased and modular eigenspaces for face recognition[C].Computer Vision and Pattern Recognition, 1994. Proceedings CVPR'94., 1994 IEEE Computer Society Conference on. IEEE, 1994: 84-91.
?。?] BELHUMEUR P N, HESPANHA J P, KRIEGMAN D J. Eigenfaces vs. fisherfaces: recognition using class specific linear projection[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 1997, 19(7): 711-720.
[9] 謝術(shù)富.人臉識(shí)別中的局部表示方法研究[D].北京:中國(guó)科學(xué)院計(jì)算技術(shù)研究所,2010.