摘 要: 為了在紅外遙控系統(tǒng)中實現(xiàn)手勢交互,設計了一種基于雙DSP結構的具有動態(tài)手勢視覺識別功能的紅外遙控系統(tǒng)。針對手勢識別圖像算法的復雜性,系統(tǒng)采用了一種流水線式的動態(tài)圖像處理模式并提出了一種基于雙端口RAM通信的雙DSP圖像處理硬件系統(tǒng)結構。結構前級負責實時采集圖像數(shù)據(jù)及手勢圖像預處理,后級結合以幀差法為核心的手勢識別算法負責動作識別處理,從而節(jié)省單DSP需要的等待時間,手勢圖像處理任務同步進行,加快動態(tài)圖像處理的速度。另外,雙DSP結構使得系統(tǒng)資源得到有效分配,復雜處理算法同步運行,再配合自學習紅外遙控模塊實現(xiàn)紅外遙控功能。實驗結果表明,系統(tǒng)一次手勢動作的最短識別時間為1.5 s,動作識別的準確率達到93.75%,具有良好的穩(wěn)定性和可操作性。
關鍵詞: 雙DSP結構;CMOS數(shù)字攝像頭;手勢識別;紅外遙控
隨著人機交互技術的發(fā)展,手勢識別交互的原理和應用已被國內外許多學者從不同的角度、不同的層次進行了研究[1-2]。近年來,傳統(tǒng)按鍵式的紅外遙控器已經成為現(xiàn)代家庭電子消費品中廣為人知的一種電子產品,而基于視覺的手勢識別交互技術與傳統(tǒng)紅外遙控技術的結合,逐漸成為人們研究手勢人機交互應用的新熱點[3]。手勢識別紅外遙控系統(tǒng)整合了新一代手勢人機交互技術,從而改變了傳統(tǒng)的按鍵模式,在某些紅外遙控的場合具有傳統(tǒng)遙控器所無可比擬的便捷和人性化的用戶體驗。手勢紅外遙控系統(tǒng)的結構大多都基于PC實現(xiàn),若要在專門系統(tǒng)獨立實現(xiàn),硬件系統(tǒng)一般都要根據(jù)具體要求進行特別的設計[4-5]。在充分考慮了算法實現(xiàn)的靈活性和實現(xiàn)結構的可行性之后[4,6-11],本文提出并設計了一種基于雙DSP結構的硬件處理平臺,快速實現(xiàn)手勢定位及特征提取,從而成功開發(fā)了一種簡便實用、容易操作及性價比高的動態(tài)手勢紅外遙控。
1 系統(tǒng)總體方案
系統(tǒng)基于雙DSP C2000系列芯片結構的硬件平臺,采用流水線處理結構,結合圖像幀差法實現(xiàn)手勢背景分離,通過圖像濾波、灰度直方圖等方法實現(xiàn)手勢定位及特征提取。雙DSP兩級流水線的圖像處理流程,保證了系統(tǒng)動態(tài)手勢圖像處理的流暢和實時性,再集成紅外控制模塊,實現(xiàn)了手勢識別技術和紅外遙控技術的結合,從而實現(xiàn)動態(tài)手勢紅外遙控。設計的動態(tài)手勢紅外遙控系統(tǒng)總體方案如圖1所示。系統(tǒng)主要由DSP1前級處理、DSP2后級處理、紅外控制模塊三大部分組成,其中DSP1和DSP2均為TI公司C2000系列芯片中的TMS320F2812信號處理芯片系統(tǒng),系統(tǒng)采用兩級流水線的系統(tǒng)處理方法,DSP1負責與圖像傳感器通信,實時采集圖像數(shù)據(jù),并對圖像進行初步的圖像濾波處理。DSP2主要負責實時圖像的后級處理,包括手勢背景分離、手勢特征提取、手勢動作識別、指令判斷以及與紅外控制模塊的通信。系統(tǒng)的紅外控制模塊具有收發(fā)一體功能,能夠自定義學習紅外指令以適應各種遙控對象。
手勢識別算法主要包括:手勢圖像預處理、手勢背景分離、特征提取和動作識別。系統(tǒng)基于幀差法實現(xiàn)手部圖像分割方法就是對視頻圖像序列中的相鄰的或一定時間間隔的兩幀進行逐個像素比較,來獲得前后兩幀圖像亮度差的絕對值。利用間隔短暫時間的兩幀圖像比較,可以得到兩張圖像運動方向的邊緣圍成的一小段白色區(qū)域。用這段白色區(qū)域代替手部位置。幀差法能夠消除大部分的背景,并且經過幀差法處理之后圖像中的噪聲類型單一,容易用特定的濾波算法消除[7,12]。對幀間差分法得到的圖像按選定的閾值進行二值化,得到目標圖像序列的二值化圖像序列Fk(x,y)。其中,
2.1 圖像采集模塊
為了實現(xiàn)手勢圖像的實時采集,本系統(tǒng)采用了一款以OV7620圖像傳感芯片為核心的型號為C3188的數(shù)字圖像傳感模組作為圖像采集攝像頭,同時為了與DSP1的工作速度匹配,圖像采集電路使用了型號為AL422B的FIFO緩沖存儲芯片。圖像數(shù)據(jù)采集電路示意圖如圖3所示。OV7620是Omni Vision公司生產的一款高集成度的高分辨率逐行/隔行掃描CMOS數(shù)字彩色/黑白視頻攝像芯片。芯片輸出視頻的同時提供了3根同步信號線,分別為場同步信號VSN,奇偶場同步信號FODD,行同步信號HREF和像素輸出時鐘PCLK。使用DSP的GPIO控制4根信號線,就可以完整讀取視頻圖像數(shù)據(jù)。
2.2 雙DSP硬件結構
為了使得最大工作頻率只有150 MHz的DSP F2812芯片能夠進行有效快速的圖像處理工作,結合實際考慮,本系統(tǒng)獨立設計了基于雙DSP F2812芯片的并行處理電路[10-11],系統(tǒng)電路示意圖如圖4所示。雙DSP芯片通過雙端口RAM CY7C028存儲芯片建立數(shù)據(jù)通道,從而實現(xiàn)將手勢識別圖像處理分離為流水線般的處理模式,使得雙DSP配合工作,前級DSP1進行圖像的采集與預處理,后級DSP2同時地進行手勢圖像特征提取及識別等工作。這樣可以大大提高單DSP的工作效率,從而可以勝任復雜的手勢識別的圖像處理工作。
3 軟件設計
系統(tǒng)軟件的編寫包括兩方面,一是DSP1端的控制程序,主要為圖像采集和圖像預處理;二是DSP2端的控制程序,主要為手勢分割、特征提取、動作識別、紅外控制程序。DSP芯片處理實現(xiàn)必要的圖像算法之外,還包括相應外部控制模塊的驅動控制程序。DSP1端的模塊控制程序部分主要包括OV7620攝像頭模塊的數(shù)據(jù)讀寫程序、RTL8019AS網(wǎng)絡芯片的控制程序。DSP2端的模塊控制程序部分為HXD019控制程序。根據(jù)各模塊的時序圖建立相應的時序算法即可實現(xiàn)對各模塊的控制。DSP端軟件流程簡圖如圖6所示。
4 測試實驗
利用自主設計的基于DSP C2000系列芯片搭建的雙DSP處理平臺,根據(jù)并行流水處理的思想,實現(xiàn)了基于機器視覺的動態(tài)手勢紅外遙控系統(tǒng)的研制,圖7為手勢分割及定位效果圖。
由表1可知,手與系統(tǒng)距離在2 m位置,系統(tǒng)的手勢識別率達到最高,高達88.75%以上。在距離小于2 m或大于2 m位置,手勢識別率都有所下降。通過實驗測試,可以得到本系統(tǒng)性能參數(shù),如表2所示。從表2可以看出,一次動作的最短識別時間為1 s,識別速度雖然相對較慢,但考慮到紅外遙控的應用實際,本系統(tǒng)仍然具有實用價值。
動態(tài)手勢交互實現(xiàn)需要多方面技術和算法的綜合,其優(yōu)化也是多方面的,包括手勢圖像采集、圖像預處理、手勢背景分離、特征提取和動作識別等。本系統(tǒng)使用雙DSP結構可達到資源合理分配和快速并行處理的目的,節(jié)省了單DSP需要等待的時間,加快了動態(tài)圖像處理的速度,從而實現(xiàn)了基于動態(tài)手勢交互的紅外遙控功能。測試結果表明,系統(tǒng)一次手勢動作的最短識別時間為1.5 s,動作識別的準確率達到93.75%,具有良好的穩(wěn)定性和可操作性,可應用于電視機遙控、空調遙控和燈光遙控等家用設備的控制系統(tǒng)中。該系統(tǒng)簡易實用,在滿足用戶手勢紅外遙控基本操作的同時,具有一定的趣味性和臨場感,給用戶帶來了新一代手勢交互的新體驗?;陔pDSP結構的處理平臺,采用流水線式的算法實現(xiàn)結構,能將復雜的算法任務進行逐步分解,同步處理,從而加快復雜任務的處理速度。在手勢識別應用方面,即使總體上系統(tǒng)仍有很大的改進和提升空間,但這是一次新嘗試。隨著手勢識別等復雜應用任務被廣泛關注,雙DSP結構的流水線處理思路可以為同行提供一個新的參考。
參考文獻
[1] WALDHERR S, ROMERO R, THRUN S. A gesture based interface for human-robot interaction[J]. Autonomous Robots, 2000,9(2):151-173.
[2] TRIESCH J, MALSBURG C. Robotic gesture recognition[C]. In Gesture Workshop,1997,233-244.
[3] STENGER B, WOODLEY T, CIPOLLA R. A Vision-Based Remote Control[M]. Computer Vision: Recognition, Registration and Reconstruction, Springer, 2010.
[4] Shi Lei, Wang Yangsheng, Li Jituo. A real time vision-based hand gestures recognition System[J]. Advances In Computation and Intelligence, 2010,6382:349-358.
[5] 曾翔,王賢秋.電視機手勢遙控系統(tǒng)設計[J].電視技術,2011,35(1):42-44.
[6] 趙永嘉,戴樹嶺.基于點分布模型的可變形手勢跟蹤方法[J].系統(tǒng)仿真學報,2009(S1):1-5.
[7] 任海兵,祝遠新,徐光祐,等.復雜背景下的手勢分割與識別[J].自動化學報,2002(2):256-261.
[8] VIBLIS M K, KYRIAKOPOULOS K J. Gesture recognition: the gesture segmentation problem[J]. Journal of Intelligent & Robotic Systems, 2000,28(1-2):151-158.
[9] IWAI Y, HATA T, YACHIDA M. Gesture recognition from image motion based on subspace method and hidden Markov model[C]. International conference on Intertlipent Robots and Systems,1997,2:960-966.
[10] 黎玉剛,張英敏,付強文.雙口RAM在組合導航系統(tǒng)中的應用[J].電子技術應用,2005(9):75-78.
[11] 李超,姜戎,羅傳勇,等.基于雙DSP的飛艇組合導航系統(tǒng)設計[J].計算機工程,2007(17):259-261.
[12] 劉俊梅,阮秋琦.一種復雜背景下的手勢分割新方法[J].北京電子科技學院學報,2006,14(2):23-27.