文獻標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.2016.09.033
中文引用格式: 首照宇,楊曉帆,李萌芽. 基于局部特征與核低秩表示的人臉識別算法[J].電子技術(shù)應(yīng)用,2016,42(9):126-128,132.
英文引用格式: Shou Zhaoyu,Yang Xiaofan,Li Mengya. Face recognition based on local feature and kernel low-rank representation[J].Application of Electronic Technique,2016,42(9):126-128,132.
0 引言
人臉識別一直是近年來計算機視覺領(lǐng)域中的重要研究方向,被用于門禁、生物入侵、安防等實際應(yīng)用環(huán)境中。然而,人臉識別仍然是一個具有挑戰(zhàn)的問題,例如遮擋、偽裝、光照變化等噪聲對人臉圖片的影響會導(dǎo)致后續(xù)識別效果下降。從幾十年前至今,眾多學(xué)者在人臉識別技術(shù)的發(fā)展中對這些問題進行了研究,提出了許多針對這些問題的富有建設(shè)性的算法。
原始的局部二值模式(Local Binary Patterns,LBP)算法是由OJALA T等人提出的用于紋理分類的方法[1],它是一個由局部像素比較獲得的二進制序列。AHONEN T等人將LBP用于人臉識別領(lǐng)域并將其改進為對光照變化具有魯棒性的方法[2]。在文獻[3]中,LBP通常用來處理人臉識別中的光照問題。實驗表明,經(jīng)過LBP處理后的圖片比原始圖片在識別時具有更強的魯棒性。近年來,Liu Guangcan等人提出了低秩表示的算法[4](Low-Rank Representation,LRR),該算法可以對子空間進行分類。LRR的目的是尋找一個字典中所有向量表示一個基于候選線性組合的最低秩表示?;诰植刻卣鲗μ幚砣四槇D片時的魯棒性和低秩表示分類的框架,結(jié)合近年來被廣泛用于克服提取特征和分類時線性方法的極限的核方法,本文提出了一種基于局部特征與核低秩表示的人臉識別算法。
1 相關(guān)知識
1.1 低秩表示
Liu Guangcan等人[4]提出了對子空間結(jié)構(gòu)進行分析的低秩表示算法(LRR),該方法也可以用于對線性子空間的數(shù)據(jù)進行無監(jiān)督分類。如果給定一個適當(dāng)?shù)淖值洌琇RR可以學(xué)習(xí)到所有觀測向量通過字典原子的所有可能線性組合表示中的最低秩表示[5]。秩最小化的問題可以通過下式求解:
其中X是一個測試數(shù)據(jù)矩陣,X的每一列是都一個測試對象。A是一個字典,Z是字典A對X的一個低秩表示。式(1)中求秩最小的問題可以通過求核范數(shù)來代替,則式(1)可改寫為:
當(dāng)數(shù)據(jù)有噪聲干擾時,LRR的優(yōu)化模型定義如下:
其中A·Z是低秩部分,E是與X相關(guān)的誤差(或噪聲)部分,||E||2,1是適應(yīng)于不同遮擋模型的誤差項,適用于小的高斯噪聲,||E||1適用于隨機遮擋,>0是低秩和誤差兩部分的平衡因子。已經(jīng)有許多學(xué)者提出了低秩恢復(fù)問題的解法,例如迭代閾值法[6]、加速近端梯度法[7]、增廣拉格朗日法[8](Augmented Lagrange Multiplier,ALM)。其中ALM方法有著更快的速度和更高的準(zhǔn)確度,本文采用ALM方法來處理低秩問題。
1.2 核函數(shù)
核函數(shù)是一項眾所周知的應(yīng)用于機器學(xué)習(xí)中的技術(shù),如SVM、KPCA、KFDA算法[9]中都應(yīng)用了核函數(shù)。通過核函數(shù)可以將原始的特征空間通過非線性映射轉(zhuǎn)換到一個高維的核特征空間,并且在高維空間將問題轉(zhuǎn)換為線性問題解決[10]。例如多項式核k(x,y)=(〈x+y〉+c)d和高斯核k(x,y)=exp(-γ||x-y||2)都是常見的核函數(shù),其中d和γ是核函數(shù)的參數(shù)。
2 基于局部特征與核低秩表示的人臉識別算法(LKLRR)
2.1 局部特征提取
LBP是用于描述局部紋理算子,通過比較圍繞像素的計算值的特征表征的二進制序列,然后將該序列轉(zhuǎn)化為十進制數(shù)來表示該點的特征[1]。過多的二進制模式會給計算帶來不便,OJALA T采用了一種新的“等價模式”來解決這一問題,同時該算法也提高了LBP的統(tǒng)計特性并對LBP算子的模式種類進行降維。OJALA T的“等價模式”表示如下:當(dāng)從0→1或從1→0相應(yīng)的循環(huán)LBP二進制數(shù)跳兩次時,對應(yīng)二進制模式LBP被稱為等價類模式,另一種類型便為混合模式。改進后的二進制模式類型降低的同時也不會使任何信息丟失。這使得特征向量的維數(shù)更少,并能消弱高頻噪聲的滋擾。
2.2 基于局部特征與核低秩表示
假設(shè)一個經(jīng)過LBP特征提取后的樣本通過一個非線性映射從原始的特征空間Rm映射到高維特征空間分別表示由所有訓(xùn)練樣本和測試樣本所組成的矩陣通過非線性映射?漬轉(zhuǎn)換到高維特征空間,其中就是上述高維空間F。通過式(4)可以將測試樣本圖片在核特征空間F中通過訓(xùn)練樣本圖片線性表示。
因此,在核空間中的低秩表示問題可以通過式(5)來表示:
其中Z為訓(xùn)練樣本矩陣在高維核特征空間對測試樣本矩陣最低秩表示。其中和都未知,從而式(5)無法直接求解。將樣本特征空間F中進行降維處理,也就是樣本圖片從F空間映射到其低維子空間中,假設(shè)P∈RD×d是F中的變換矩陣,求解式(5)可通過式(6)來實現(xiàn):
其中映射矩陣P是與圖片相關(guān)的矩陣,通過應(yīng)用KPCA中的核降維方法,映射矩陣中的向量是空間F中與圖片線性相關(guān)的向量,表示如下式:
其中Pj為P∈[P1,P1,…,Pd]=RD×d中的第j個向量,是與第j個變換向量相關(guān)的偽變換向量。令是偽變換矩陣,則變換矩陣P可以通過下式表示:
將式(8)帶入式(6),則有:
其中核矩陣和由相應(yīng)的核函數(shù)計算得出。對于樣本α和β,則有其中k(:,:)表示一個核函數(shù)。令,則式(1)的約束表達式可以通過式(5)來代替,則優(yōu)化問題轉(zhuǎn)為下式:
考慮到噪聲對樣本的影響,將式(10)轉(zhuǎn)化為如下更加魯棒的優(yōu)化模型:
其中E表示高維空間中的相關(guān)誤差。>0表示兩部分的平衡因子。其中轉(zhuǎn)換矩陣通過應(yīng)用KPCA中降維獲得變換矩陣的方法計算得出,偽變換向量j可以通過求解特征值的方法計算:
將歸一化后的特征向量進行排序,選擇最大的前d個特征值j,j=1,2,3,…d所對應(yīng)的特征向量則可獲得偽轉(zhuǎn)換矩陣祝。將其代入優(yōu)化后的模型,則可通過求解低秩表示的問題來進行后續(xù)的分類判別。
具體的算法步驟如下:
(1)輸入:i類訓(xùn)練樣本矩陣A∈Rm×n,k個測試樣本矩陣B∈Rm×k;
?。?)分別對訓(xùn)練樣本和測試樣本進行LBP特征提取后進行核變換得到訓(xùn)練樣本的LBP核矩陣和測試樣本的LBP核矩陣;
?。?)將樣本通過映射函數(shù)進行處理,隨后獲得高維特征空間中的訓(xùn)練和測試樣本的特征矩陣;
?。?)通過特征值和特征向量的方法求解偽變換矩陣后對高維特征矩陣進行降維;
?。?)對降維后的測試和訓(xùn)練特征矩陣通過式(11)進行低秩表示獲得系數(shù)矩陣Z;
(6)通過下式計算每個樣本與每類樣本之間的殘差:
其中l(wèi)=1,2,…,k;j=1,2,…,i。
(7)輸出:
3 實驗結(jié)果及分析
本部分將本文提出的LKLRR與SRC、CRC和LRR等算法分別在AR、Extended YaleB、FERET等人臉庫進行了光照、表情及遮擋變化實驗對比。實驗表明,本文提出的基于局部特征與核低秩表示的人臉識別算法的識別率比其他幾種方法的識別率要高,而針對有遮擋和偽裝的人臉圖片提出的基于局部特征與核低秩表示的人臉識別算法的識別率也有更強的魯棒性和識別率。
3.1 Extended Yale B數(shù)據(jù)庫光照變化
Extended Yale B人臉庫由38個人的2 414幅正面人臉組成,其中每人大約有64幅圖像,來自64種實驗光照條件。圖1為該人臉庫中部分人臉圖片。本部分實驗隨機地選擇每人32幅圖片作為訓(xùn)練樣本集,其余的32幅人臉圖片作為測試樣本集。每幅圖片都調(diào)整為96×84。表1給出了不同方法在該人臉庫中的識別率。
由表1可以看出,圖片進行LBP特征提取后,通過低秩表示進行分類的方法對于人臉圖片的識別率增加,增加了核函數(shù)的低秩表示,表現(xiàn)出更加優(yōu)越的識別性能。
3.2 AR數(shù)據(jù)庫光照及表情變化
在AR人臉數(shù)據(jù)庫中選擇50名男性和50名女性構(gòu)成一個人臉數(shù)據(jù)庫,提取每人14幅人臉圖片,包括人臉圖像的表情和光照變化,其中7幅作為訓(xùn)練樣本,其余的作為測試集。圖像尺寸統(tǒng)一調(diào)整為83×60。表2顯示多種算法在該人臉庫上的比較。由表2可看出,本文的算法相比其他算法識別率明顯提高。
3.3 FERET數(shù)據(jù)庫姿態(tài)偏轉(zhuǎn)
FERET數(shù)據(jù)庫中包含了200個人,每人7幅總共1 400幅表情、光照以及不同尺度下的姿態(tài)變化人臉圖片。圖2為實驗中某個目標(biāo)的圖像,從左到右分別為標(biāo)準(zhǔn)、表情變化、光照變化、偏轉(zhuǎn)-25°、偏轉(zhuǎn)-15°、偏轉(zhuǎn)+15°、偏轉(zhuǎn)+25°的人臉圖像。采用前3幅人臉圖片作為訓(xùn)練集,其余4個偏轉(zhuǎn)角度不同的圖片分別作為4個測試集。所有的圖片均裁剪為80×80。表3為FERET數(shù)據(jù)庫中姿態(tài)偏轉(zhuǎn)尺度不同的情況下多種算法的識別率比較。表3可以明顯反映出提出的LKLRR算法相較于其他集中算法識別率有著顯著的優(yōu)勢,尤其是在測試集姿態(tài)偏轉(zhuǎn)尺度較大時(+25°和-25°)明顯提高。
3.4 偽裝實驗
本部分采用了AR人臉庫進行實驗,其中每人選取7幅人臉圖片進行訓(xùn)練,3幅墨鏡遮擋、3幅圍巾遮擋的人臉圖片進行測試,同樣將每幅圖片的大小調(diào)整為83×60,表4是各個方法分別對于墨鏡遮擋和圍巾遮擋的人臉識別率比較,從表中可以看出本文的方法對于偽裝的人臉圖像的識別率較其他方法有很大的提高。
4 總結(jié)
針對人臉圖片的遮擋、偽裝、光照及表情變化等問題,本文提出基于局部特征與核低秩表示的人臉識別算法。首先將樣本通過描述局部特征的LBP算子進行特征提取,加強了圖像的局部細節(jié)特征。隨后將特征轉(zhuǎn)換到高維的特征空間后進行核低秩表示來進行后續(xù)的分類識別。實驗表明,本文的LKLRR算法在處理遮擋、偽裝以及光照變化等問題時的魯棒性更強,識別率更高。
參考文獻
[1] OJALA T,HARWOOD I.A comparative study of texture measures with classification based on feature distributions[J].Pattern Recognition,1996,29(1):51-59.
[2] AHONEN T,HADID A,PIETIK?魧INEN M.Face recognition with local binary patterns[C].Lecture Notes in Computer Science,2004,3021:469-481.
[3] Yuan Xiaotong,Liu Xiaobai,Yan Shuicheng.Visual classification with multitask joint sparse representation[J].IEEETransactions on Image Processing A Publication of the IEEE Signal Processing Society,2010,21(10):3493-3500.
[4] Liu Guangcan,Lin Zhouchen,Yan Shuicheng,et al.Robustrecovery of subspace structures by low-rank representation[J].IEEE Transactions on Software Engineering,2012,35(1):171-184.
[5] ZHANG Y,JIANG Z,DAVIS L S.Learning Structured lowrank representations for image classification[C].Proceedings of the 2013 IEEE Conference on Computer Vision and Pattern Recognition.IEEE Computer Society,2013:676-683.
[6] DAUBECHIES I,DEFRISE M,MOL C D.An iterative thresholding algorithm for linear inverse problems with a sparsity constraint[J].Communications on Pure & Applied Mathematics,2003,57(11):1413-1457.
[7] BECK A,TEBOULLE M.A fast iterative shrinkage-thresh-olding algorithm for linear inverse problems[J].Siam Journal on Imaging Sciences,2009,2(1):183-202.
[8] BERTSEKAS D P.Constrained optimization and Lagrangemultiplier methods[M].Athena Scientific,1996.
[9] SMOLA A,M?譈LLER K.Nonlinear component analysis as a kernel eigenvalue problem[C].Neu.Img.2006:1299-1319.
[10] KANG C,LIAO S,XIANG S,et al.Kernel sparse representation with local patterns for face recognition[C].ImageProcessing(ICIP),2011 18th IEEE International Conferenceon.IEEE,2011:3009-3012.