李宇成,劉昆
?。ū狈焦I(yè)大學(xué) 電氣與控制工程學(xué)院, 北京 100144)
摘要:基于PCA 和SVM提出了一種新的人臉?lè)指?/a>法,將雙眼、額頭、鼻子、嘴等可以明顯表征人臉的六類(lèi)特征提取出來(lái),舍棄雙頰以及耳朵等特征量少的部位。融合上述人臉的特征識(shí)別結(jié)果,運(yùn)用支持向量機(jī)的方法進(jìn)行分類(lèi)識(shí)別,實(shí)驗(yàn)結(jié)果表明,文章所提出的PCA與SVM融合的新的人臉?lè)指罘椒苡行У貙?duì)人臉進(jìn)行分類(lèi),極大地提升識(shí)別率。
關(guān)鍵詞:人臉?lè)指睿?a class="innerlink" href="http://theprogrammingfactory.com/tags/人臉識(shí)別" title="人臉識(shí)別" target="_blank">人臉識(shí)別;主成分分析;支持向量機(jī)
0引言
如今生物學(xué)、機(jī)器學(xué)習(xí)等研究領(lǐng)域中都涉及到人臉識(shí)別,將人臉的生理特征與計(jì)算機(jī)相結(jié)合在人機(jī)交互場(chǎng)合有著重要的意義。
對(duì)人臉高效的識(shí)別分類(lèi)關(guān)鍵在于能否提取到精準(zhǔn)表征人臉的特征,特征的提取是指通過(guò)已有特征的組合(變換)建立一個(gè)新的特征子集。在眾多的組合方法當(dāng)中線性變換因其計(jì)算簡(jiǎn)單且便于分析的特點(diǎn)得到廣泛應(yīng)用,主成分分析(Principle Component Analysis, PCA)是其中常用的方法[1] 。
但是在特征提取過(guò)程中樣本圖片維數(shù)往往很高,難以對(duì)人臉圖片特征進(jìn)行高效的提取,比如圖像矩陣為112×92,那么協(xié)方差矩陣就是10 304× 10 304,這會(huì)導(dǎo)致程序運(yùn)行時(shí)間過(guò)長(zhǎng)。本文針對(duì)這個(gè)問(wèn)題提出了一種新的圖像矩陣分割方法,即將雙耳以及臉部剔除,最終人臉圖像分割成六部分,依次是額頭、左眼、右眼、鼻子、嘴、下巴,這六部分包含的人臉特征最為明顯,區(qū)別度最大。
以O(shè)RL 人臉庫(kù)為例:分割后的有效數(shù)據(jù)量只占原始人臉樣本數(shù)據(jù)的60%左右。但是這六部分矩陣組成的6 400個(gè)數(shù)據(jù)包含了很明顯的特征。因?yàn)槟繕?biāo)矩陣相對(duì)較小,所以整個(gè)識(shí)別過(guò)程的完成速度也比傳統(tǒng)PCA+SVM方法要快。
1相關(guān)算法
1.1PCA主成分分析
從人臉圖像中找出最能表征人臉的特征空間是主成分分析在人臉特征提取中的基本思想,這個(gè)過(guò)程中不能表征人臉的屬性會(huì)被剔除。也就是在一個(gè)高維特征空間中,利用一組系數(shù)對(duì)特征加權(quán),來(lái)重新表示一張人臉圖片[3],這個(gè)過(guò)程的數(shù)學(xué)描述如下:
如果訓(xùn)練集中有H張人臉樣本圖片,將人臉圖片訓(xùn)練樣本寫(xiě)成一個(gè)列向量[xH1,xH2,…,xHK],下標(biāo)K是人臉圖像的Pixel個(gè)數(shù)。首先需要獲得訓(xùn)練樣本中圖像的均值,公式 ψ=1H∑Hi=1π(xi)可以求得這個(gè)均值,然后通過(guò)Ω1=ai-ψ計(jì)算出某一樣本圖像與全部樣本均值的差,則人臉訓(xùn)練樣本集特征的協(xié)方差矩陣為:
式(1)中的矩陣X=[Ω1,Ω2,…,ΩH],將ζ進(jìn)行對(duì)角化運(yùn)算,可以將其轉(zhuǎn)化成代數(shù)特征空間。將式(1)矩陣ζ對(duì)角投影變換為:
ζψk=λkψk(k=1,2,…,H)(2)
下一步需要選擇基向量,基向量應(yīng)該從ψk中選擇最大值。獲得U′是包含較大特征值的H′個(gè)特征向量。完成上述計(jì)算過(guò)程后,需要將特征臉映射到它所對(duì)應(yīng)的特征子空間,通過(guò)式(3)實(shí)現(xiàn):
ρi=U′(xi-ψ)(i=1,2,…,H)(3)
計(jì)算后可發(fā)現(xiàn)ζ的維數(shù)很大,如果直接用其進(jìn)行特征值分解計(jì)算,計(jì)算的復(fù)雜度會(huì)非常高,因此這里巧妙地采用了空間的投影求得最終結(jié)果[4]。
1.2SVM人臉?lè)诸?lèi)
SVM(支持向量機(jī)) 在解決小樣本分類(lèi)上有很出色的表現(xiàn)[2]。
在輸入空間X中,令向量X為樣本特征集合,其中人臉樣本的有效特征xi擁有p類(lèi)屬性。假設(shè)任意人臉樣本特征xi,則設(shè)yi是對(duì)應(yīng)分類(lèi)輸出,yi標(biāo)記為1時(shí)說(shuō)明是計(jì)算后相似的人臉特征;yi標(biāo)記為-1時(shí)則表示不同的人臉樣本特征。
進(jìn)一步經(jīng)以下運(yùn)算獲得人臉特征最優(yōu)分界面,也就是對(duì)凸二次優(yōu)化問(wèn)題的求解:
min(θ)=θ22,其約束條件為:
yi(θ·xi)+b-1≥0,i=1,…,n(4)
令mi為拉氏乘子,便可以求出分類(lèi)判別函數(shù):
由式(4)、(5)可以求解出特征臉中的支持向量,該支持向量是與分界面平行的,而且與分界面的距離最短,支持向量可以唯一確定最優(yōu)分界面。
2基于人臉?lè)指畹腜CA和SVM人臉識(shí)別方法
2.1人臉?lè)指罘椒?/strong>
人臉?lè)指钏惴ǖ幕舅悸肥菑某叽鐬閙×n的矩陣I中分別取出FH(額頭)、RE(右眼)、LE(左眼)、NS(鼻子)、MU(嘴巴)、JW(下巴)共計(jì)6個(gè)特征圖像矩陣。以嘴部(MU)的矩陣為例來(lái)闡述一下這種新分割方法的數(shù)學(xué)依據(jù)以及特征提取方式[5]。如果樣本集人臉的圖片有H張,Ii(i=1,2,…,H)為全部樣本圖片,圖片尺寸為m×n,將MU變換為D=m1×n1維的列向量XMU。則全體的嘴巴樣本訓(xùn)練矩陣為AMU=[XMU1,XMU2,…,XMUM],嘴巴的協(xié)方差矩陣為:
式中,UMU是H張嘴巴圖片的期望向量。同理,可以得到SRE、SLE、SNS、SFH。對(duì)SMU求特征值和特征向量,先假設(shè)式中的λi是∑Hk=1(XMUk-UMU)(XMUk-UMU)T的r個(gè)不為零的特征值,那么vi就是它關(guān)于λi的一個(gè)特征向量,則矩陣的正交歸一特征向量μi為:
然后根據(jù)特征值所占的比重選擇最大的前p個(gè)特征向量:
取α=90%。同樣可以求解額頭、右眼、左眼、鼻子、下巴這幾個(gè)特征對(duì)應(yīng)的矩陣的特征值和特征向量。
2.2對(duì)分割后的特征使用PCA方法
定義最優(yōu)投影向量組P1,P2,…,Pd可取為SMU的d個(gè)最大特征值所對(duì)應(yīng)的標(biāo)準(zhǔn)正交特征向量。令PMU =[P1,P2,…,Pd],PMU稱(chēng)為最優(yōu)投影矩陣。對(duì)已知的嘴巴圖像樣本XMU,將XMU投影到矩陣PMU構(gòu)成的子空間上,即:
Yk=XTMU·Pk,k=1,2,…,d(6)
投影特征向量YMU稱(chēng)為嘴巴圖片樣本矩陣XMU的主成分。
按照同樣的思路可以解出額頭、右眼、左眼、鼻子、下巴這幾個(gè)部位對(duì)應(yīng)的主成分特征矩陣。
2.3將PCA降維特征通過(guò)SVM進(jìn)行分類(lèi)
設(shè)YFH、YRE、YLE、YNS、YMU、YJW為PCA抽取的第i個(gè)人臉的額頭、右眼、左眼、鼻子、嘴巴、下巴6個(gè)部分的特征向量,現(xiàn)在需要一個(gè)新的聯(lián)合特征向量i,這個(gè)特征向量由上面六個(gè)部分的特征向量融合得到,然后識(shí)別過(guò)程在(M+N)維的SVM特征空間里進(jìn)行。圖1給出了算法整體實(shí)現(xiàn)的流程圖。
3實(shí)驗(yàn)過(guò)程及結(jié)果分析
本實(shí)驗(yàn)所涉及的人臉圖片均來(lái)源于包含了40個(gè)人,即400 張320×280人臉圖像的ORL人臉數(shù)據(jù)庫(kù),圖2代表了某一個(gè)人的正臉以及他面部六部分分割后歸一化的圖片數(shù)據(jù)。
根據(jù)額、右眼、左眼、鼻子、嘴巴、下巴這幾部分,分別將六部分尺寸各異的模塊圖像矩陣與之一一對(duì)應(yīng)。如圖2所示,首先,將這6個(gè)模塊的特征矩陣用主成分分析(PCA)法提取出來(lái),然后,將提取出的特征矩陣用支持向量機(jī)(SVM)方法進(jìn)行分類(lèi)。用MATLAB實(shí)現(xiàn)的算法識(shí)別效果界面如圖3所示。
將各種算法的識(shí)別率性能進(jìn)行比較,如圖4所示,分別代表了以下3種分類(lèi)器的識(shí)別率情況:將PCA 用作特征抽取的人臉?lè)诸?lèi)器、基于新分割PCA (N_PCA)的分類(lèi)器和在新分割PCA 的方法中引入了SVM分類(lèi)器(N_PCA_SVM)。由圖4可以看出,無(wú)論是對(duì)于PCA 還是對(duì)于PCA+SVM方法來(lái)說(shuō),在加入新的人臉?lè)指罘椒ㄟM(jìn)行處理后,其識(shí)別率有了顯著的提高。
在ORL人臉數(shù)據(jù)庫(kù)的基礎(chǔ)上,進(jìn)行一次與識(shí)別效率有關(guān)的測(cè)試。因?yàn)槊繌埲四槇D片基于人臉?lè)指畹姆椒?,因此只用了約60%的數(shù)據(jù),該實(shí)驗(yàn)測(cè)試各種方法的運(yùn)行效率,3種人臉識(shí)別算法都執(zhí)行6次并計(jì)算平均執(zhí)行時(shí)間。實(shí)驗(yàn)結(jié)果如表1所示。
實(shí)驗(yàn)結(jié)果表明:使用新的人臉?lè)指罘椒ㄌ幚磉^(guò)的算法程序運(yùn)行總時(shí)間差別較小,而且不會(huì)因?yàn)榉诸?lèi)函數(shù)的不同而影響最終效率。新人臉?lè)指畹姆椒▋H使用了大約60%的人臉數(shù)據(jù),并且還被分成了六個(gè)部分,所以用的矩陣一般較小,處理速度也快。
4結(jié)束語(yǔ)
基于新分割的主成分分析和支持向量機(jī)分類(lèi)器(N_PCA_SVM),與其他分類(lèi)器相比有以下優(yōu)越性:能較好地解決視頻人臉跟蹤識(shí)別過(guò)程中高速特征提取問(wèn)題。因此對(duì)實(shí)時(shí)性要求較高的分類(lèi)場(chǎng)景具有很大的優(yōu)勢(shì)。
本文提出基于新分割PCA+SVM(N_PCA_SVM)方法,通過(guò)實(shí)驗(yàn)證明該方法實(shí)時(shí)識(shí)別速度快,并且識(shí)別率高,能用于實(shí)時(shí)視頻監(jiān)控人臉識(shí)別系統(tǒng)。
參考文獻(xiàn)
?。?] Zhu Yulian. Fuzzy withinclass matrix principal component analysis and its application to face recogntion[J]. Transactions of Nanjing University of Aeronautics & Astronautics,2008,25(2):141147.
?。?] 曾陽(yáng)艷,葉柏龍. 基于支持向量機(jī)的人臉識(shí)別系統(tǒng)的研究[J]. 計(jì)算機(jī)工程與應(yīng)用,2008,44(15):182184.
?。?] 王心醉,李巖,郭立紅,等.基于雙向 PCA 和 K 近鄰的人臉識(shí)別算法[J].解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2010, 11(6):623 627.
[4] 梁淑芬,張志偉,唐紅梅,等. 一種應(yīng)用于人臉識(shí)別的非線性降維方法[J]. 電路與系統(tǒng)學(xué)報(bào),2009, 14(4):4549.