《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計(jì)應(yīng)用 > 基于ROI區(qū)域強(qiáng)分辨力HOG特征的視頻行人檢測(cè)
基于ROI區(qū)域強(qiáng)分辨力HOG特征的視頻行人檢測(cè)
來源:微型機(jī)與應(yīng)用2013年第7期
張 璐,陳淑榮
(上海海事大學(xué) 信息工程學(xué)院,上海 201306)
摘要: 針對(duì)傳統(tǒng)梯度方向直方圖(HOG)行人檢測(cè)系統(tǒng)中檢測(cè)窗掃描區(qū)域過大、HOG特征維度大而引起的檢測(cè)速度慢問題,提出了改進(jìn)的視頻行人檢測(cè)算法。通過運(yùn)動(dòng)信息提取感興趣(ROI)目標(biāo)區(qū)域,利用Fisher準(zhǔn)則和多尺度特性選取具有強(qiáng)分辨力的行人HOG特征從而降低特征維數(shù),結(jié)合支持向量機(jī)(SVM)檢測(cè)行人。實(shí)驗(yàn)結(jié)果表明,本文方法在保證視頻行人檢測(cè)的準(zhǔn)確率的同時(shí),有效地提高了行人檢測(cè)的速率。
Abstract:
Key words :

摘  要: 針對(duì)傳統(tǒng)梯度方向直方圖(HOG)行人檢測(cè)系統(tǒng)中檢測(cè)窗掃描區(qū)域過大、HOG特征維度大而引起的檢測(cè)速度慢問題,提出了改進(jìn)的視頻行人檢測(cè)算法。通過運(yùn)動(dòng)信息提取感興趣(ROI)目標(biāo)區(qū)域,利用Fisher準(zhǔn)則和多尺度特性選取具有強(qiáng)分辨力的行人HOG特征從而降低特征維數(shù),結(jié)合支持向量機(jī)(SVM)檢測(cè)行人。實(shí)驗(yàn)結(jié)果表明,本文方法在保證視頻行人檢測(cè)的準(zhǔn)確率的同時(shí),有效地提高了行人檢測(cè)的速率。
關(guān)鍵詞: 行人檢測(cè);感興趣區(qū)域;梯度方向直方圖;Fisher準(zhǔn)則

 行人檢測(cè)是計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域中的研究熱點(diǎn),在視頻監(jiān)控中有廣泛的應(yīng)用。目前,用于行人檢測(cè)的方法主要分為3類:(1)基于運(yùn)動(dòng)信息的方法[1-2],根據(jù)行人運(yùn)動(dòng)信息(如步態(tài))實(shí)現(xiàn)行人檢測(cè),實(shí)時(shí)性好但只限于運(yùn)動(dòng)行人;(2)基于先驗(yàn)知識(shí)建模的方法[3],利用已知先驗(yàn)知識(shí)構(gòu)建人體模板和待測(cè)目標(biāo)進(jìn)行匹配,但模板的初始參數(shù)難以獲?。唬?)基于特征統(tǒng)計(jì)分類的方法[4-9],根據(jù)訓(xùn)練數(shù)據(jù)獲取有效分類器對(duì)輸入檢測(cè)窗口進(jìn)行檢測(cè),實(shí)現(xiàn)簡(jiǎn)單且檢測(cè)效果較好,是目前靜態(tài)圖像行人檢測(cè)的主流方法,但對(duì)視頻行人檢測(cè)速度較慢。因此,如何保證視頻行人檢測(cè)的準(zhǔn)確率,并提高檢測(cè)速度是一個(gè)急需解決的問題。
1 本文行人檢測(cè)方法
 視頻錄像中行人的不同姿勢(shì)、復(fù)雜的背景變化對(duì)算法的檢測(cè)準(zhǔn)確率和檢測(cè)速度都提出了嚴(yán)格要求。本文提出利用視頻中的運(yùn)動(dòng)信息獲取ROI區(qū)域,結(jié)合Fisher準(zhǔn)則挑選強(qiáng)分辨力行人HOG特征,并結(jié)合SVM分類器檢測(cè)行人。其中,訓(xùn)練部分采用正負(fù)樣本庫提取強(qiáng)分辨力HOG行人特征,并通過SVM訓(xùn)練得到強(qiáng)分辨力HOG特征的行人分類器。檢測(cè)時(shí)利用幀間信息獲得ROI區(qū)域,通過多層次縮放ROI區(qū)域獲取所有檢測(cè)窗,并利用強(qiáng)分辨力行人HOG特征來表征檢測(cè)窗中行人,通過訓(xùn)練好的分類器實(shí)現(xiàn)對(duì)視頻中行人的檢測(cè)。該算法框架如圖1所示。
1.1 視頻圖像ROI目標(biāo)區(qū)域提取
 視頻幀圖像中存在大量的非人區(qū)域,全局掃描需要很多冗余計(jì)算。本文采用三幀差分法獲取運(yùn)動(dòng)目標(biāo)前景,進(jìn)行二值化處理、形態(tài)學(xué)處理和前景塊擴(kuò)展,獲取ROI目標(biāo)區(qū)域。具體實(shí)現(xiàn)步驟如下。

其中,u是0~1的一個(gè)值,w、h分別表示前景塊的寬、高。
(5)標(biāo)記擴(kuò)展后的行人目標(biāo)前景塊集合,構(gòu)建ROI區(qū)域以進(jìn)行后續(xù)的特征提取和檢測(cè)。ROI目標(biāo)區(qū)域提取如圖2所示。

1.2 強(qiáng)分辨力行人特征提取
1.2.1 多尺度HOG特征
 HOG特征是通過計(jì)算局部區(qū)域的梯度方向直方圖描述目標(biāo)形狀特征,對(duì)光照變化和小量的偏移不敏感。DALAL N提出的基本HOG是在64×128的檢測(cè)窗內(nèi)提取105個(gè)16×16等大小的Block特征塊,利用這些特征塊構(gòu)成描述符來訓(xùn)練和檢測(cè)行人。
 等大小的基本HOG特征塊對(duì)描述行人較大的部位(如頭部、身體等)的整體信息能力有限,因此本文構(gòu)建HOG特征時(shí)采用了多尺度[6]方法,對(duì)于64×128檢測(cè)窗,Block塊的大小選取依次從16×16到64×128,寬高比(w∶h)分別取1∶1、1∶2和2∶1,共獲得452個(gè)不同尺度的Block塊。
 在特征塊提取過程中,為避免特征塊交疊而引起的重復(fù)計(jì)算,引入“積分圖[6]”思想,每個(gè)像素點(diǎn)的特征由9維向量表示,即:

2 實(shí)驗(yàn)及結(jié)果分析
 本文實(shí)驗(yàn)在MATLAB2008a上實(shí)現(xiàn),計(jì)算機(jī)環(huán)境配置為3 GHz CPU和2 GB內(nèi)存。采用的數(shù)據(jù)來源于INRIA行人數(shù)據(jù)庫和PETS2006視頻庫。在提取強(qiáng)分辨力行人特征時(shí),分別將INRIA樣本庫中的1 000個(gè)正、負(fù)樣本用于訓(xùn)練和檢測(cè),并利用強(qiáng)分辨力HOG行人特征分類器對(duì)PETS2006視頻庫的視頻行人進(jìn)行檢測(cè)。實(shí)驗(yàn)采用libsvm工具包,選用線性SVM訓(xùn)練分類器。
 文中通過對(duì)單尺度基本HOG擴(kuò)展,得到Block數(shù)為452的多尺度HOG,并利用Fisher準(zhǔn)則分別對(duì)不同尺度HOG進(jìn)行降維處理,獲得不同維數(shù)的強(qiáng)分辨力特征,結(jié)合SVM分類器驗(yàn)證不同尺度、不同維度的特征檢測(cè)效果。實(shí)驗(yàn)結(jié)果如表1所示。

 實(shí)驗(yàn)表明,擴(kuò)展后的多尺度HOG特征,SVM分類準(zhǔn)確率顯著提高;相同特征維數(shù)下(表中只列出Block數(shù)為105、30、10的特征),多尺度特征比單尺度特征具有更高的檢測(cè)準(zhǔn)確率且降維幅度越大,多尺度特征優(yōu)勢(shì)越明顯。
 文中采用設(shè)定最低檢測(cè)率來提高檢測(cè)速率,利用SVM分類的效果來選擇最佳分辨力特征。如表1所示,在多尺度下,當(dāng)選取特征塊數(shù)為10時(shí),保證了行人檢測(cè)的準(zhǔn)確率,提取、檢測(cè)的速率比基本HOG都有所提高,檢測(cè)速率提高了9.7倍。本文取多尺度下Block數(shù)為10的特征集作為f′select,訓(xùn)練分類器進(jìn)行行人檢測(cè)和分類。
 實(shí)驗(yàn)通過ROI目標(biāo)區(qū)域提取,大大降低了檢測(cè)窗口數(shù)量,并與傳統(tǒng)HOG全局掃描算法、Adaboost[3,8]算法作比較。由于本文算法ROI目標(biāo)區(qū)域大小直接受行人數(shù)量、大小影響,實(shí)驗(yàn)選取統(tǒng)一的單行人視頻序列進(jìn)行測(cè)試,幀像素大小為720×480。實(shí)驗(yàn)結(jié)果如表2所示。

 參考文獻(xiàn)[3,8]提到的Adaboost算法是利用一系列弱分類器組合強(qiáng)分類器,根據(jù)每個(gè)樣本分類結(jié)果修改權(quán)值進(jìn)行下一層分類訓(xùn)練,訓(xùn)練分類器時(shí)依次對(duì)每個(gè)特征集單獨(dú)訓(xùn)練,耗費(fèi)時(shí)間很長(zhǎng)。本文算法采用Fisher準(zhǔn)則提取的強(qiáng)分辨力行人特征訓(xùn)練分類器,特征整體一次投影實(shí)現(xiàn)一次分類,具有優(yōu)勢(shì)。
實(shí)驗(yàn)證明,本文算法比全局掃描減少了檢測(cè)窗數(shù)量,顯著提高了檢測(cè)的速率;在保證準(zhǔn)確率的前提下改進(jìn)單尺度HOG,利用多尺度降維HOG進(jìn)一步提高行人的檢測(cè)速率。本文算法不僅大幅度提高了行人檢測(cè)的速率,而且保證了視頻行人檢測(cè)準(zhǔn)確率在90%以上。
 本文針對(duì)傳統(tǒng)HOG特征在行人檢測(cè)中存在高維度計(jì)算的問題,提出一種利用視頻運(yùn)動(dòng)信息和強(qiáng)分辨力行人HOG特征相結(jié)合的視頻行人檢測(cè)算法。利用INRIA行人庫和PETS2006視頻庫驗(yàn)證了算法的有效性。后續(xù)將針對(duì)夜間、雨天等復(fù)雜背景,進(jìn)一步驗(yàn)證和改進(jìn)算法。
參考文獻(xiàn)
[1] 劉鑫,劉輝,強(qiáng)振平,等.混合高斯模型和幀間差分相融合的自適應(yīng)背景模型[J].中國圖象圖形學(xué)報(bào),2008,4:729-734.
[2] 王成亮,周佳,黃晟.基于高斯混合模型與PCA_HOG的快速運(yùn)動(dòng)人體檢測(cè)[J].計(jì)算機(jī)應(yīng)用研究,2012,29(6):2156-2160.
[3] 周晨卉,王生進(jìn),丁曉青.基于局部特征級(jí)聯(lián)分類器和模板匹配的行人檢測(cè)[J].中國圖象圖形學(xué)報(bào),2010,15(5):824-829.
[4] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[C]. IEEE Computer Society Conference on Computer Vision and Pattern Recognition, CVPR2005, 2005,1:886-893.
[5] 孫昀,劉富強(qiáng),李志鵬.基于穩(wěn)定區(qū)域梯度直方圖的行人檢測(cè)方法[J].計(jì)算機(jī)輔助設(shè)計(jì)圖形學(xué)報(bào),2012,24(3):372-377.
[6] 黃茜,顧杰鋒,楊文亮.基于梯度向量直方圖的行人檢測(cè)[J].科學(xué)技術(shù)與工程,2009(13):3646-3651.
[7] 姚雪琴,李曉華,周激流.基于邊緣對(duì)稱行和HOG的行人檢測(cè)方法[J].人工智能及識(shí)別技術(shù),2012,38(5):179-182.
[8] 種衍文,匡湖林,李清泉.一種基于多特征和機(jī)器學(xué)習(xí)的分級(jí)行人檢測(cè)方法[J].自動(dòng)化學(xué)報(bào).2012,38(3):375-381.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。