《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 基于OMAP3530數(shù)字圖像處理的多人臉識(shí)別系統(tǒng)設(shè)計(jì)
基于OMAP3530數(shù)字圖像處理的多人臉識(shí)別系統(tǒng)設(shè)計(jì)
來源:微型機(jī)與應(yīng)用2013年第11期
李碩豪,張 軍
(國防科學(xué)技術(shù)大學(xué) 信息系統(tǒng)與管理學(xué)院,湖南 長沙 410073)
摘要: 為了完成在不采用傳感器條件下對公共場所人數(shù)的智能檢測,從實(shí)際應(yīng)用的角度出發(fā),運(yùn)用人臉圖像擬合及模糊條件下人臉匹配的算法,實(shí)現(xiàn)了在嵌入式Linux平臺(tái)下以O(shè)MAP3530芯片為核心的基于圖像處理的多人臉識(shí)別系統(tǒng)。該系統(tǒng)能夠得出公共場所實(shí)時(shí)人員的名單,并列出人員信息。以普通辦公室為例進(jìn)行實(shí)驗(yàn),得出準(zhǔn)確率可達(dá)80%。該系統(tǒng)充分利用了OMAP3530芯片強(qiáng)大的數(shù)據(jù)處理能力,具有性價(jià)比高、可維護(hù)性強(qiáng)、工作穩(wěn)定的特點(diǎn)。
Abstract:
Key words :

摘  要: 為了完成在不采用傳感器條件下對公共場所人數(shù)的智能檢測,從實(shí)際應(yīng)用的角度出發(fā),運(yùn)用人臉圖像擬合及模糊條件下人臉匹配的算法,實(shí)現(xiàn)了在嵌入式Linux平臺(tái)下以OMAP3530芯片為核心的基于圖像處理的多人臉識(shí)別系統(tǒng)。該系統(tǒng)能夠得出公共場所實(shí)時(shí)人員的名單,并列出人員信息。以普通辦公室為例進(jìn)行實(shí)驗(yàn),得出準(zhǔn)確率可達(dá)80%。該系統(tǒng)充分利用了OMAP3530芯片強(qiáng)大的數(shù)據(jù)處理能力,具有性價(jià)比高、可維護(hù)性強(qiáng)、工作穩(wěn)定的特點(diǎn)。
關(guān)鍵詞: Linux;OMAP3530;數(shù)字圖像處理;多人臉識(shí)別

 數(shù)字圖像處理技術(shù)就是利用計(jì)算機(jī)或者一些硬件設(shè)備(如MCU、DSP、PC等)對通過視頻采集電路采集到的圖像信息進(jìn)行一系列算法處理,得到所采集到圖像的一系列特征參數(shù)(如物體的幾何特征等),進(jìn)而滿足人們需求的技術(shù)。20世紀(jì)70年代初,由于得到大量的研究和應(yīng)用,數(shù)字圖像處理已具備了自己的技術(shù)特色,并形成了較完善的學(xué)科體系,從而成為一門獨(dú)立的新學(xué)科。目前,基于人臉識(shí)別的數(shù)字圖像處理在智能家居、安防監(jiān)控、搜救偵查等諸多方面得到良好的應(yīng)用[1-2],但仍存在一系列的問題,如現(xiàn)有系統(tǒng)多是采用單獨(dú)的計(jì)算機(jī)或者計(jì)算機(jī)組進(jìn)行操作,設(shè)備龐大,不易于操作,且大多只是對采集到的發(fā)生過的視頻片段或者圖像進(jìn)行操作,喪失人臉識(shí)別的實(shí)時(shí)性。本文從嵌入式應(yīng)用的角度出發(fā),以TI公司生產(chǎn)的包括ARM與DSP雙核的OMAP3530芯片為硬件核心,在Ubuntu上搭建基于Linux+DSP/BIOS雙操作系統(tǒng)開發(fā)環(huán)境,并用交叉編譯器來調(diào)試編譯ARM和DSP程序,設(shè)計(jì)了基于數(shù)字圖像處理的多人臉識(shí)別系統(tǒng)。
1 系統(tǒng)設(shè)計(jì)及主要算法
1.1 設(shè)計(jì)思路及系統(tǒng)結(jié)構(gòu)

 本系統(tǒng)主要是針對目前學(xué)校、公司等對人員的管理需求所設(shè)計(jì)研究的。如在教學(xué)方面,提高了點(diǎn)名效率,節(jié)省時(shí)間;在商業(yè)方面,解決了以往采用指紋識(shí)別的設(shè)備昂貴、操作不方便的問題。原理上采用形態(tài)學(xué)的圖像濾波、圖像清晰化和模糊條件下的人臉匹配等相關(guān)圖像視頻的處理技術(shù)以及基于OMAP3530芯片為核心的Linux嵌入式系統(tǒng)開發(fā)技術(shù),硬件上包括OMAP3530處理器、視頻采集接口、數(shù)/模轉(zhuǎn)換芯片、顯示屏幕、圖像獲取單元和電源等。系統(tǒng)的工作步驟如圖1所示。

 (1)系統(tǒng)初始化。由于系統(tǒng)采用的是以TI公司生產(chǎn)的OMAP3530芯片為核心的實(shí)驗(yàn)平臺(tái),在不同的環(huán)境下工作時(shí)要對系統(tǒng)進(jìn)行不同的初始化設(shè)置。例如在教室中,不僅需要設(shè)置攝像頭的安放位置,使得攝像頭能夠采集到整個(gè)工作場所的區(qū)域,還要預(yù)先得到場所人員的圖像數(shù)據(jù),并初始化人員圖像建立數(shù)據(jù)庫。
 (2)系統(tǒng)被開啟,系統(tǒng)將基于TVP5146進(jìn)行一系列的視頻采集工作。由于攝像頭采集的原始信號為模擬信號,因此首先要將其經(jīng)過A/D轉(zhuǎn)換器轉(zhuǎn)化為數(shù)字信號;然后OMAP3530處理器的ARM核通過基于TVP5146和V4L2(Video4Linux2)視頻捕獲應(yīng)用程序把從攝像頭采集到的視頻數(shù)據(jù)通過DSP/BIOS橋傳給DSP核進(jìn)行算法處理;最后DSP核把處理后的圖像傳給ARM核,并在屏幕上顯示。系統(tǒng)根據(jù)此原理完成視頻的采集過程。
?。?)處理采集到的圖像。因?yàn)樵谕粫r(shí)刻攝像頭不一定能夠采集到工作區(qū)域所有人員的信息,所以只處理一幀圖像不能準(zhǔn)確反映場所信息。為了解決此問題,系統(tǒng)對視頻流中的多幀圖像進(jìn)行處理。系統(tǒng)采集的幀數(shù)與公共場所的人數(shù)成正比,公共場所的人員越多則同一時(shí)刻采集到的人臉數(shù)目越小,所以需要的圖像幀數(shù)越多,反之越少。首先,系統(tǒng)對采集的圖像進(jìn)行亮度及去噪處理,得到平滑的圖像數(shù)據(jù);其次,將圖像中的人臉區(qū)域進(jìn)行分割,再將分割的人臉圖像大小標(biāo)準(zhǔn)化之后進(jìn)行清晰化處理;最后,系統(tǒng)將對標(biāo)準(zhǔn)化后的人臉圖像進(jìn)行人臉識(shí)別,得出并顯示未到人員名單。
 系統(tǒng)的實(shí)現(xiàn)主要由ARM核和DSP核完成。其主要功能包括:(1)ARM Cortex-A8核,此核主要完成系統(tǒng)任務(wù)管理功能,如采集前端視頻、控制系統(tǒng)的外設(shè)、通過DSPLink數(shù)據(jù)通信機(jī)制控制DSP完成一系列軟件算法并在LCD上實(shí)時(shí)顯示等功能;(2)TMS320C64+DSP核,此核主要完成圖像處理算法功能,如接收ARM端傳遞的數(shù)據(jù)、借助DSP/BIOS核完成一系列的算法,在本系統(tǒng)中執(zhí)行圖像標(biāo)準(zhǔn)化、圖像清晰化、人臉識(shí)別等算法。
1.2 基于OMAP3530嵌入式平臺(tái)的開發(fā)
1.2.1 Linux嵌入式系統(tǒng)的視頻、圖像采集設(shè)備開發(fā)

 本系統(tǒng)基于TVP5146視頻解碼芯片和V4L2設(shè)備進(jìn)行圖像采集算法的開發(fā)。在Linux環(huán)境下采用內(nèi)存映射的同步采集方式,這種方式在程序運(yùn)行過程中需要先分配一塊內(nèi)存空間作為視頻數(shù)據(jù)的緩沖區(qū)域,當(dāng)啟動(dòng)視頻采集后,視頻數(shù)據(jù)將不斷地送入該緩沖區(qū),而當(dāng)用戶需要數(shù)據(jù)時(shí)即從該緩沖區(qū)讀取。每獲得一幀新圖像數(shù)據(jù),采集程序便向應(yīng)用程序發(fā)送一個(gè)信號,上層程序通過相應(yīng)信號來實(shí)現(xiàn)圖像數(shù)據(jù)的實(shí)時(shí)處理。整個(gè)采集過程分為3個(gè)步驟:(1)利用函數(shù)open()打開設(shè)備文件,從而打開設(shè)備驅(qū)動(dòng)程序;(2)利用函數(shù)ioctl()設(shè)置視頻捕獲參數(shù),包括視頻格式、申請buffer等;(3)將內(nèi)核空間的視頻數(shù)據(jù)映射到相應(yīng)的用戶空間,開啟視頻捕獲;(4)關(guān)閉視頻流捕獲。ARM Cortex-A8核將攝像頭捕獲的數(shù)據(jù)通過DSP/BIOS橋傳給TMS320C64+核,按照式(1)對采集到的UYVY顏色空間的圖像數(shù)據(jù)進(jìn)行顏色空間轉(zhuǎn)換,在對圖像顏色空間轉(zhuǎn)換之后得到BMP格式圖像。此時(shí)再由TMS320C64+核進(jìn)行人臉識(shí)別等相關(guān)計(jì)算。
 
1.2.2 多線程開發(fā)
 從程序自身的角度考慮,多線程開發(fā)就是使目標(biāo)任務(wù)能夠盡可能快地完成,更有效地利用系統(tǒng)資源,提高應(yīng)用程序響應(yīng)[7],屬于嵌入式軟件開發(fā)中操作系統(tǒng)層的內(nèi)容。這對圖像處理的程序尤其有意義,當(dāng)一個(gè)操作耗時(shí)很長時(shí),整個(gè)系統(tǒng)都會(huì)等待這個(gè)操作,此時(shí)程序不會(huì)響應(yīng)其他算法的操作,而使用多線程技術(shù),將耗時(shí)長的操作(Time Consuming)置于一個(gè)新的線程,這樣可以提高系統(tǒng)運(yùn)算效率。
 在本系統(tǒng)中,由于相關(guān)視頻、圖像采集與圖像處理算法復(fù)雜度較高,而平臺(tái)的主頻為600 MHz,內(nèi)存為128 MB。綜合考慮,采用生產(chǎn)消費(fèi)算法完成多線程開發(fā)。在Linux嵌入式系統(tǒng)的調(diào)度下,系統(tǒng)的不同線程會(huì)運(yùn)行在不同的處理器上,因而一個(gè)復(fù)雜的程序被分為多個(gè)線程,使得ARM核控制的圖像采集與DSP核控制的圖像處理兩個(gè)線程之間相互獨(dú)立,并使其中一個(gè)線程阻塞或中斷不會(huì)影響其他線程的運(yùn)行,增加了系統(tǒng)的可維護(hù)性。
1.3 主要算法及設(shè)計(jì)
1.3.1 人臉圖像分割

 在系統(tǒng)的開發(fā)環(huán)境下,處理經(jīng)過預(yù)處理后的圖像。系統(tǒng)根據(jù)膚色識(shí)別模型將具有皮膚顏色的圖像進(jìn)行分割,并將分割下來的圖像與橢圓進(jìn)行擬合,從而使得到的人臉圖像為橢圓形,而系統(tǒng)根據(jù)橢圓長短軸與水平和垂直方向的夾角對橢圓進(jìn)行旋轉(zhuǎn)調(diào)整,最后得出較為理想的人臉圖像。標(biāo)準(zhǔn)化擬合得到的人臉圖像長短軸之比固定為1.5:1,采集出人臉圖像的效果如圖2所示。


1.3.2 人臉圖像清晰化
 系統(tǒng)運(yùn)用低分辨率的圖像進(jìn)行人臉的智能匹配,所以要采用圖像增強(qiáng)算法進(jìn)行清晰化研究,以提高采集到的標(biāo)準(zhǔn)化人臉圖像的亮度。李曉霞等提出了一種新的低照度彩色圖像增強(qiáng)算法[6],為了增強(qiáng)彩色圖像而不引起色彩失真,在HSV顏色空間中保持色相不變,提出了采用分段對數(shù)變換增強(qiáng)飽和度,結(jié)合在多尺度Retinex算法的基礎(chǔ)上,采用邊緣保持增強(qiáng)色調(diào)的低照度彩色圖像增強(qiáng)算法。通過對不同環(huán)境下的圖像或者分辨率比較低的圖像的增強(qiáng)處理,得到了比較清晰的圖像結(jié)果,提高了圖像的亮度、細(xì)節(jié)和對比度。實(shí)驗(yàn)結(jié)果表明,該算法能夠增強(qiáng)景物的可辨識(shí)度和人臉特征,提高圖像的辨識(shí)率。人臉清晰化前后的灰度圖像如圖3所示,可以看出圖3(b)圖像質(zhì)量明顯優(yōu)于圖3(a)。


1.3.3 人臉識(shí)別
 對清晰化后的人臉圖像進(jìn)行匹配。前人提出了很多人臉識(shí)別的算法,其中主成分分析法(PCA)一直受到人們的關(guān)注。參考文獻(xiàn)[8]在經(jīng)典PCA方法的基礎(chǔ)上,提出了一種改進(jìn)的PCA方法,該方法在預(yù)處理階段對每幅圖像進(jìn)行灰度的線性變換,通過增強(qiáng)圖像的對比度和亮度來減少光照變化帶來的影響,然后利用經(jīng)典PCA方法對圖像進(jìn)行處理。由于光照變化主要影響PCA方法的前3個(gè)最大的主分量,因此,在識(shí)別階段對這3個(gè)主分量進(jìn)行加權(quán)處理來進(jìn)一步減少光照的影響。
假設(shè)由M幅人臉圖像組成圖像集B,其主要步驟如下:
?。?)對清晰化的每幅圖像進(jìn)行零均值處理,處理后的圖像為x1,x2,…,xM。
?。?)對圖像x1,x2,…,xM作圖像灰度的線性變化。
 (3)利用經(jīng)典PCA方法計(jì)算特征子空間以及每張人臉在特征子空間中的投影系數(shù)。其中特征子空間由按特征值大小進(jìn)行降序排列的特征向量組成。
 (4)對人臉圖像進(jìn)行識(shí)別。
 本系統(tǒng)主要針對人臉區(qū)域進(jìn)行匹配,且整幅圖像中只包含人臉區(qū)域,所以人臉特征量的提取簡單,匹配率相對較高。
2 實(shí)例
 本系統(tǒng)的適用范圍較為廣泛,如教室、會(huì)議室、辦公室等均可應(yīng)用。由于分辨率的需要,面積大的環(huán)境對攝像頭的要求相對較高。此實(shí)例是系統(tǒng)在辦公室的應(yīng)用,系統(tǒng)通過對辦公室實(shí)時(shí)圖像的采集,得到了較為準(zhǔn)確的人員名單,驗(yàn)證了本系統(tǒng)的可行性及準(zhǔn)確性。
?。?)系統(tǒng)開始工作,采集辦公室內(nèi)的實(shí)時(shí)視頻。通過獲取的視頻,系統(tǒng)采集其中的幾幀圖像進(jìn)行處理。系統(tǒng)采集的圖像如圖4所示。由于內(nèi)存的限制且圖像的計(jì)算量較大,因此系統(tǒng)必須在獲取一定的視頻后釋放內(nèi)存,這就限定了獲取圖像的頻率不能太高。

 

 

 由圖5可以看出,系統(tǒng)根據(jù)采集的多幀圖像得出了最終人員的名單。第1幅公共場所的圖像并沒有采集到所有人員的人臉信息,所以不能檢測到所有的在位人員。當(dāng)采集到第2幅圖像時(shí),系統(tǒng)采集到了所有人員的人臉信息,并列出了在位人員信息。
由實(shí)驗(yàn)結(jié)果可知,系統(tǒng)準(zhǔn)確地獲得了此辦公室的人員信息,得出了未到和應(yīng)到的人員名單。而對于如教室等的大型公共場所,由于攝像頭清晰度的限制,必然使得系統(tǒng)存在一定的誤差,但由于系統(tǒng)所采集的是單純的沒有背景的人臉區(qū)域的圖像,因此在人臉的識(shí)別方面仍然具有很高的準(zhǔn)確性,使得整個(gè)系統(tǒng)的誤差相對較小。
 系統(tǒng)采用基于OMAP3530的嵌入式系統(tǒng)設(shè)計(jì),能夠?qū)崿F(xiàn)設(shè)備本地控制,可維護(hù)性及穩(wěn)定性比計(jì)算機(jī)控制都有所提高,體現(xiàn)出了系統(tǒng)智能化的特征。實(shí)際的應(yīng)用中,不僅可以運(yùn)用到文中提到的教室及其他辦公場所,而且可以在公安安防監(jiān)控系統(tǒng)中的罪犯搜索方面得到推廣,提高抓捕效率。本系統(tǒng)單純地對攝像頭采集到的數(shù)字圖像進(jìn)行處理,有著良好的可操作性和低成本的優(yōu)點(diǎn),便于推廣。
參考文獻(xiàn)
[1] 潘基明,張少兵.基于DSP視頻圖像采集處理系統(tǒng)設(shè)計(jì)[J].電子測試,2008(4):74-78.
[2] 王明艷,張海峰.基于TMSDM643的視頻監(jiān)控系統(tǒng)設(shè)計(jì)[J].微計(jì)算機(jī),2008(2):200-201.
[3] 彭啟倧,管慶.DSP集成開發(fā)環(huán)境——CCS及DSP/BIOS的原理與應(yīng)用[M].北京:北京電子工業(yè)出版社,2005.
[4] LEUVEN J, LEEUWEN M B, GROEN F C A. Real-time vehicle tracking in image sequence[C]. Proceedings of IEEE Conference on Instrumentation and Measurement Technology, 2001:2049-2053.
[5] KIM W, LEE C Y, LEE J J. Tracking moving object using snake′s jump based on image flow [J]. Mechanics, 2001(11):119-216.
[6] 李小霞,李鋮果,鄒建華,等.一種新的低照度彩色圖像增強(qiáng)算法[J].計(jì)算機(jī)應(yīng)用研究,2011(9):3554-3556.
[7] 李靜輝,題原,王艷春.基于DSP的圖像采集處理實(shí)驗(yàn)開發(fā)平臺(tái)的研究[J].計(jì)算機(jī)與網(wǎng)絡(luò),2008(2):213-214.
[8] 李榮健,韓其龍,楊鑫華.改進(jìn)的PCA人臉識(shí)別新算法[J].大連交通大學(xué)學(xué)報(bào),2008(4):48-51.
[9] 袁愛平,楊萬全.基于OMAP2的3G多媒體技術(shù)及應(yīng)用[J].現(xiàn)代電子技術(shù),2005(14):63-65.
[10] 時(shí)巖.基于OMAP軟件無線電平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)[J].電子技術(shù),2012(3):38-42.
[11] 何斌,馬天宇,王運(yùn)堅(jiān).數(shù)字圖像處理[M].北京:人民郵電出版社,2002.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。