文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.200363
中文引用格式: 劉欣,李衛(wèi)龍,張燦明. 基于邊窗濾波和擴(kuò)張卷積的礦井行人檢測(cè)[J].電子技術(shù)應(yīng)用,2020,46(10):42-46,50.
英文引用格式: Liu Xin,Li Weilong,Zhang Canming. Mine pedestrian detection based on side-window filter and dilated convolution[J]. Application of Electronic Technique,2020,46(10):42-46,50.
0 引言
數(shù)字化礦山是實(shí)現(xiàn)智能化、現(xiàn)代化煤炭生產(chǎn)的重要基礎(chǔ),對(duì)于煤炭產(chǎn)業(yè)的可持續(xù)發(fā)展有著極為重要的意義。采礦自動(dòng)化、運(yùn)輸智能化、管理信息化是實(shí)現(xiàn)數(shù)字化礦山的三項(xiàng)關(guān)鍵技術(shù)[1]。實(shí)現(xiàn)這些技術(shù)的前提是構(gòu)建智能感知系統(tǒng),而礦井行人檢測(cè)系統(tǒng)是實(shí)現(xiàn)井下智能調(diào)度、安全監(jiān)測(cè)等技術(shù)的先決條件[2]。
近些年來(lái),深度學(xué)習(xí)技術(shù)在多個(gè)計(jì)算機(jī)視覺(jué)領(lǐng)域迅猛發(fā)展[3],并在多個(gè)任務(wù)上獲得了優(yōu)異的性能,例如人臉檢測(cè)[4]、物體分揀[5]、缺陷檢測(cè)[6]。具體到行人檢測(cè)任務(wù)上,R-CNN[7]率先將深度學(xué)習(xí)技術(shù)應(yīng)用在目標(biāo)檢測(cè)任務(wù)。在此基礎(chǔ)上,F(xiàn)aster R-CNN[8]改進(jìn)候選框選擇機(jī)制,完備端對(duì)端檢測(cè)框架。2019年,來(lái)自Google Brain的TAN M等研究人員[9]提出了基于自動(dòng)網(wǎng)絡(luò)尋優(yōu)技術(shù)的EfficientNet,該模型通過(guò)動(dòng)態(tài)調(diào)整網(wǎng)絡(luò)的深度、寬度和分辨率,尋找最優(yōu)的模型設(shè)計(jì),在圖像分類(lèi)、目標(biāo)檢測(cè)等多個(gè)領(lǐng)域獲得先進(jìn)表現(xiàn)。
圖像在構(gòu)建和傳輸過(guò)程中,常因?yàn)橥饨绺蓴_而導(dǎo)致質(zhì)量退化。常見(jiàn)的解決方案是采用濾波方法對(duì)圖像做去噪處理[10]。濾波算法可分成兩類(lèi):線(xiàn)性濾波和非線(xiàn)性濾波。常見(jiàn)的線(xiàn)性濾波包括盒子濾波、高斯濾波;非線(xiàn)性濾波包括中值濾波、雙邊濾波等。在深度學(xué)習(xí)算法中,濾波算法常用于圖像預(yù)處理、特征提取、邊緣獲取等。尤其是對(duì)于邊緣檢測(cè),濾波算法基于研究人員對(duì)于圖像的先驗(yàn)知識(shí),充分地提取圖像的邊緣信息,實(shí)現(xiàn)對(duì)興趣區(qū)域的精準(zhǔn)定位分割[11]。傳統(tǒng)濾波算法受限于濾波核結(jié)構(gòu)和運(yùn)算機(jī)理,雖然可以抑制噪聲,但同時(shí)會(huì)造成邊緣信息丟失,對(duì)檢測(cè)模型產(chǎn)生負(fù)面影響。近些年來(lái),大量的保邊濾波算法被提出,用于保留的更多的邊緣信息,例如全變分濾波算法[12]、加權(quán)最小二乘濾波[13]和導(dǎo)向?yàn)V波[14]等。
對(duì)于礦井環(huán)境,構(gòu)建行人檢測(cè)模型需要考慮多個(gè)特定的環(huán)境因素,包括監(jiān)控設(shè)備所處環(huán)境光線(xiàn)不足、粉塵點(diǎn)多,且捕獲圖像存在較多干擾信號(hào)等硬件設(shè)備上的不利因素,又要考慮對(duì)多目標(biāo)、不同尺度的行人目標(biāo)實(shí)現(xiàn)準(zhǔn)確檢測(cè)的要求。針對(duì)這些難點(diǎn),本文從視頻圖像的處理和檢測(cè)模型的改進(jìn)兩個(gè)角度出發(fā),采用邊窗濾波抑制視頻圖像的干擾信號(hào),在模型網(wǎng)絡(luò)中引入擴(kuò)張卷積處理多尺度目標(biāo)。實(shí)驗(yàn)證明模型在礦井?dāng)?shù)據(jù)集上取得了優(yōu)異的檢測(cè)性能。本文的主要貢獻(xiàn)如下:針對(duì)礦井環(huán)境存在的多樣不利因素,采用邊窗濾波抑制視頻圖像的干擾信號(hào),為行人檢測(cè)模型提供優(yōu)質(zhì)的輸入圖像;采用先進(jìn)的EfficientNet作為網(wǎng)絡(luò)主干,用于提取輸入圖像的特征,并在網(wǎng)絡(luò)主干中引入擴(kuò)張卷積,增大特征的感受野,促使網(wǎng)絡(luò)在多尺度目標(biāo)上獲得更為優(yōu)異的檢測(cè)性能。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://theprogrammingfactory.com/resource/share/2000003018
作者信息:
劉 欣,李衛(wèi)龍,張燦明
(安徽省煤炭科學(xué)研究院,安徽 合肥230001)