摘要:2D人臉識別技術(shù)雖已成熟,但由于單一的2D圖像不能提供識別所需的完整信息,故其識別精度很難進一步提高。在人臉識別過程中,特征提取是影響識別效果的一個重要環(huán)節(jié),在分析了傳統(tǒng)的主成分分析法和由此改進的2D PCA方法的基礎(chǔ)上,提出了3D人臉識別方法。該方法將人臉圖像分為幾個部分分別進行特征提取,同時充分考慮每個部分所包含的特征信息量的多少,并在分類時賦予它們不同的權(quán)值。因此,將人臉用立體圖像來表示并進行識別是目前提高人臉識別精度的前沿課題。
關(guān)鍵詞:3D人臉識別;人臉建模;3D人臉形變模型;視頻圖像
人臉識別是基于生物特征識別技術(shù)的身份認證中最主要的方法之一,涉及計算機圖形學、計算機視覺、模式識別、機器學習、感知科學、人工智能、計算智能等技術(shù),3D人臉識別主要分為人臉檢測、人臉特征和人臉識別三個過程。為了提高人臉的識別精度,本文對3D人臉的自動識別系統(tǒng)及識別算法進行了研究,給出了3D人臉識別存在的問題。
1 3D人臉自動識別系統(tǒng)
普通的人臉識別一般分為圖1所示的三個過程。圖2所示是一個典型的3D人臉識別系統(tǒng)的組成框圖。其中,圖像獲取部分負責獲取來自于攝像機或是掃描儀等設(shè)備的圖像,通過程序?qū)⑵滢D(zhuǎn)換為可處理的數(shù)字圖像格式;檢測定位是通過對輸入的圖像進行處理分析,判斷圖像中是否有人臉,如果有人臉,則作出準確的定位;特征提取是在預(yù)處理后的人臉圖像中按照某種策略抽取出識別的特征。
人臉模型主要分為剛性模型和塑性模式,剛性模型可以滿足對人頭部跟蹤檢測的要求,主要用于表示人的頭部位置、姿態(tài)、方向等;塑性實體主要處理人臉識別、表情識別、唇語識別等問題,它涉及面部器官、肌肉和表皮的運動。
目前主要的三維建模工具有3DSMAX,MAYA,AUTOCAD等。
1.1 結(jié)合一般人臉模型的建模
由于人臉的復(fù)雜性和相似性,直接采用視覺重建算法進行3D人臉的重建,在精度和實用性上,相對于昂貴的硬件采集方法,都不能達到很好的效果。為了重建精度較高的人臉模型,下面引入了一般人臉3D模型。
一般人臉模型的主要思想是定義一個平均的人臉3D模型,其空間坐標點集為Sg={xgi,ygi,zgi},i=1,2,…,n,該空間坐標集表達了常見的人臉表面形狀的共同特性。該思想認為,不同人臉的3D結(jié)構(gòu)S。都可 以通過一般人臉模型Sg中每個空間點的位置變化來表達,即特定的人臉模型Sp=Sg+△S,(xpi,ypi,zpi}={xgi+△xi,yg+△yi,zgi+△zi}。形變量△S如何求取具有不同的方法,但核心思想是利用人臉模型提取表達五官特征(眼睛、鼻子、嘴、臉頰、眉毛)的輪廓點集Sf={xfj,yfj,zfj},j=1,2,…,m(其中m<
3D人臉形變模型的核心思想是利用有限數(shù)量的3D人臉模型的線性組合來表達任何一個3D人臉。在用3D人臉形變模型建模時,可將模型的形狀坐標集合記為s=[x1,y1,z1,…,xN,yN,zN]T,即包括N個頂點的x,y,z坐標;再將對應(yīng)一個人臉的紋理表示為一個紋理向量t=[R1,G1,B1,…,RN,GN,BN]T,即包括N個對應(yīng)頂點的RGB值(假設(shè)有效紋理的數(shù)據(jù)等于頂點數(shù))。
形變模型由M個人臉樣本數(shù)據(jù)構(gòu)成,這些數(shù)據(jù)分別表示為它的3D形狀和紋理兩部分,也可寫成M個樣本圖像的質(zhì)心坐標表達式,即:
使用PCA對3D人臉數(shù)據(jù)進行壓縮,再把基底變換到一個由對應(yīng)協(xié)方差距陣的特征值按降序排列對應(yīng)的特征向量si和ti形成的正交坐標系下,則有(α,β∈RM-1):
式中:是形狀協(xié)方差矩陣Cs的特征值。p(β)的計算與p(α)的計算類似。
最終定義的3DMM為[smodel(α),tmodel(β)],由兩個變量參數(shù)確定a=[a1,a2,…,aM]T,b=[b1,b2,…,bM]T。這樣,任意新的人臉都可以通過變化a,b來控制其形狀和紋理。
2 基于視頻圖像的識別算法
特征臉方法通常利用主分量分析進行降維和提取特征。該方法選擇與原數(shù)據(jù)協(xié)方差矩陣前幾個最大特征值對應(yīng)的特征向量構(gòu)成一個組基,以達到最佳表征原數(shù)據(jù)的目的。在人臉識別中,由一組特征臉基圖像張成一個特征臉子空間,任何一幅人臉圖像(減去平均人臉后)都可投影到該子空間,從而得到一個權(quán)值向量。圖3所示是一個主分量分析的應(yīng)用舉例。圖中最左邊的圖像為平均臉,其他為對應(yīng)7個最大特征值的特征向量。
但是,3D人臉識別是通過自動檢測人臉區(qū),從視頻中提取特征后才識別出人臉的身份。雖然視頻人臉識別是基于靜態(tài)圖像的人臉識別的直接擴展,但一般認為,視頻人臉識別算法需要同時用到空間和時間信息,它的時間連續(xù)性是視頻圖像的一個非常重要的特性,包括由此產(chǎn)生的人臉信息的不確定性。視頻人臉識別算法和基于靜態(tài)圖像的人臉識別算法的最大區(qū)別就是在人臉跟蹤和識別中利用時間信息。目前這類算法大致可分為兩類:
(1)跟蹤-然后-識別,這類方法首先檢測出人臉,然后跟蹤人臉特征隨時間的變化。只在跟蹤階段用到時間信息。識別還是采用基于靜態(tài)圖像的方法,而沒有用到時間信息。
(2)跟蹤-且-識別,這類方法中,人臉跟蹤和識別是同時進行的,在跟蹤階段和識別階段都要用到時間信息。
3 3D人臉識別存在的問題
近幾年才開始研究將三維方法用于人臉機器識別,目的是為了彌補二維方法的不足,或者是解決二維方法所無法根本解決的問題。
目前,三維人臉識別的處理方法和手段還是處于發(fā)現(xiàn)時期,其本身還不成熟,主要存在以下困難:
(1)海量存儲和計算的困難。由于三維識別過程中處理的數(shù)據(jù)容量和計算量十分巨大,對于一般計算機來說,它們的存儲和運算還比較困難;
(2)信息來源方面的困難。由于三維識別的完整信息難于獲取或者識別的信息往往不完整,同時,再加上圖像采集設(shè)備的差異和成像原理的不同,都可能造成識別算法本身不可糾正的錯誤;
(3)對人的生理認識的不足。由于計算機沒有人的經(jīng)驗和知識功能,而只有計算功能,同時由于對肌肉的運動理論和表情形成等問題,現(xiàn)在還不能提供給計算機足夠的專家支持;
(4)受環(huán)境和條件的約束。影響二維識別的不利因素在三維識別上同樣存在,如光線的強弱、方向、遮蓋、陰影、背景等;
(5)實現(xiàn)方式和手段的不足。傳統(tǒng)的識別方法不能滿足三維識別的要求,必須改進或采用新的方法。例如由于動態(tài)圖像的計算量太大,因此,適用于靜態(tài)圖像處理的神經(jīng)網(wǎng)絡(luò)就變得不適合了。
4 結(jié)語
3D人臉的研究始于計算機動畫和生物醫(yī)學成像。計算機動畫方面的方法是在計算機上生成三維的人臉來表達人的運動、姿態(tài)和表情。這種動畫的人臉可以在不同的環(huán)境下應(yīng)用和發(fā)展為虛擬現(xiàn)實,這在生物醫(yī)學方面可從生物圖層或切片來重構(gòu)人體器官組織,并將其用于病理分析。而三維人臉識別是極具挑戰(zhàn)性的課題,如在技術(shù)上有所突破,將具有很強的創(chuàng)新性和應(yīng)用價值。