japanese色视频在线播放,亚洲欧洲无码专区AV

基于邊窗濾波和擴(kuò)張卷積的礦井行人檢測(cè)

2020年電子技術(shù)應(yīng)用第10期

劉欣，李衛(wèi)龍，張燦明

安徽省煤炭科學(xué)研究院，安徽合肥230001

摘要： 在數(shù)字化礦山中，行人檢測(cè)系統(tǒng)能夠大幅減少事故傷亡，是保護(hù)工人安全的重要手段。為了構(gòu)建高性能的行人檢測(cè)系統(tǒng)，提出了一種基于邊窗濾波和擴(kuò)張卷積的礦井行人檢測(cè)模型。具體來(lái)說(shuō)，針對(duì)復(fù)雜惡劣的礦井環(huán)境，采用邊窗濾波抑制視頻圖像中的干擾信號(hào)，提升圖像質(zhì)量。此外，考慮到行人目標(biāo)的多尺度特性，在模型中引入擴(kuò)張卷積增加特征的感受野，進(jìn)而提升檢測(cè)性能。大量的對(duì)比實(shí)驗(yàn)證明了邊窗濾波和擴(kuò)張卷積的有效性，模型在礦井?dāng)?shù)據(jù)集上獲得94.3 mAP和99.1%檢測(cè)率的優(yōu)異性能。

關(guān)鍵詞： 行人檢測(cè) 邊窗濾波擴(kuò)張卷積深度學(xué)習(xí)

中圖分類(lèi)號(hào)： TN919.8；TP919.8；TP391.41
文獻(xiàn)標(biāo)識(shí)碼： A
DOI：10.16157/j.issn.0258-7998.200363
中文引用格式： 劉欣，李衛(wèi)龍，張燦明. 基于邊窗濾波和擴(kuò)張卷積的礦井行人檢測(cè)[J].電子技術(shù)應(yīng)用，2020，46(10)：42-46，50.
英文引用格式： Liu Xin，Li Weilong，Zhang Canming. Mine pedestrian detection based on side-window filter and dilated convolution[J]. Application of Electronic Technique，2020，46(10)：42-46，50.

Mine pedestrian detection based on side-window filter and dilated convolution

Liu Xin，Li Weilong，Zhang Canming

Anhui Academy of Coal Science，Hefei 230001，China

Abstract： In digitalized mines, pedestrian detection system is able to greatly reduce accident casualties, which is an essential strategy for guaranteeing workers′ well-being. In order to establish mine pedestrian detection system with high performance, a mine pedestrian detection based on side-window filter and dilated convolution is proposed. Specifically, in terms of mines environment with complicated and hostile conditions, side-window filter is adopted to suppress disturbing signals in surveillance pictures, improving image quality. In addition, considering the multi-scale characteristic of pedestrian objects, dilated convolution is introduced into model to increase receptive field of features, thus enhancing detection performance. A number of comparison experiments are conducted to illustrate the effectiveness of side-window filter and dilated convolution, and the model achieves excellent performance of 94.3 mAP and 99.1% of detection accuracy on the mine dataset.

Key words : pedestrian detection；side-window filter；dilated convolution；deep learning

0 引言

數(shù)字化礦山是實(shí)現(xiàn)智能化、現(xiàn)代化煤炭生產(chǎn)的重要基礎(chǔ)，對(duì)于煤炭產(chǎn)業(yè)的可持續(xù)發(fā)展有著極為重要的意義。采礦自動(dòng)化、運(yùn)輸智能化、管理信息化是實(shí)現(xiàn)數(shù)字化礦山的三項(xiàng)關(guān)鍵技術(shù)^[1]。實(shí)現(xiàn)這些技術(shù)的前提是構(gòu)建智能感知系統(tǒng)，而礦井行人檢測(cè)系統(tǒng)是實(shí)現(xiàn)井下智能調(diào)度、安全監(jiān)測(cè)等技術(shù)的先決條件^[2]。

近些年來(lái)，深度學(xué)習(xí)技術(shù)在多個(gè)計(jì)算機(jī)視覺(jué)領(lǐng)域迅猛發(fā)展^[3]，并在多個(gè)任務(wù)上獲得了優(yōu)異的性能，例如人臉檢測(cè)^[4]、物體分揀^[5]、缺陷檢測(cè)^[6]。具體到行人檢測(cè)任務(wù)上，R-CNN^[7]率先將深度學(xué)習(xí)技術(shù)應(yīng)用在目標(biāo)檢測(cè)任務(wù)。在此基礎(chǔ)上，F(xiàn)aster R-CNN^[8]改進(jìn)候選框選擇機(jī)制，完備端對(duì)端檢測(cè)框架。2019年，來(lái)自Google Brain的TAN M等研究人員^[9]提出了基于自動(dòng)網(wǎng)絡(luò)尋優(yōu)技術(shù)的EfficientNet，該模型通過(guò)動(dòng)態(tài)調(diào)整網(wǎng)絡(luò)的深度、寬度和分辨率，尋找最優(yōu)的模型設(shè)計(jì)，在圖像分類(lèi)、目標(biāo)檢測(cè)等多個(gè)領(lǐng)域獲得先進(jìn)表現(xiàn)。

圖像在構(gòu)建和傳輸過(guò)程中，常因?yàn)橥饨绺蓴_而導(dǎo)致質(zhì)量退化。常見(jiàn)的解決方案是采用濾波方法對(duì)圖像做去噪處理^[10]。濾波算法可分成兩類(lèi)：線性濾波和非線性濾波。常見(jiàn)的線性濾波包括盒子濾波、高斯濾波；非線性濾波包括中值濾波、雙邊濾波等。在深度學(xué)習(xí)算法中，濾波算法常用于圖像預(yù)處理、特征提取、邊緣獲取等。尤其是對(duì)于邊緣檢測(cè)，濾波算法基于研究人員對(duì)于圖像的先驗(yàn)知識(shí)，充分地提取圖像的邊緣信息，實(shí)現(xiàn)對(duì)興趣區(qū)域的精準(zhǔn)定位分割^[11]。傳統(tǒng)濾波算法受限于濾波核結(jié)構(gòu)和運(yùn)算機(jī)理，雖然可以抑制噪聲，但同時(shí)會(huì)造成邊緣信息丟失，對(duì)檢測(cè)模型產(chǎn)生負(fù)面影響。近些年來(lái)，大量的保邊濾波算法被提出，用于保留的更多的邊緣信息，例如全變分濾波算法^[12]、加權(quán)最小二乘濾波^[13]和導(dǎo)向?yàn)V波^[14]等。

對(duì)于礦井環(huán)境，構(gòu)建行人檢測(cè)模型需要考慮多個(gè)特定的環(huán)境因素，包括監(jiān)控設(shè)備所處環(huán)境光線不足、粉塵點(diǎn)多，且捕獲圖像存在較多干擾信號(hào)等硬件設(shè)備上的不利因素，又要考慮對(duì)多目標(biāo)、不同尺度的行人目標(biāo)實(shí)現(xiàn)準(zhǔn)確檢測(cè)的要求。針對(duì)這些難點(diǎn)，本文從視頻圖像的處理和檢測(cè)模型的改進(jìn)兩個(gè)角度出發(fā)，采用邊窗濾波抑制視頻圖像的干擾信號(hào)，在模型網(wǎng)絡(luò)中引入擴(kuò)張卷積處理多尺度目標(biāo)。實(shí)驗(yàn)證明模型在礦井?dāng)?shù)據(jù)集上取得了優(yōu)異的檢測(cè)性能。本文的主要貢獻(xiàn)如下：針對(duì)礦井環(huán)境存在的多樣不利因素，采用邊窗濾波抑制視頻圖像的干擾信號(hào)，為行人檢測(cè)模型提供優(yōu)質(zhì)的輸入圖像；采用先進(jìn)的EfficientNet作為網(wǎng)絡(luò)主干，用于提取輸入圖像的特征，并在網(wǎng)絡(luò)主干中引入擴(kuò)張卷積，增大特征的感受野，促使網(wǎng)絡(luò)在多尺度目標(biāo)上獲得更為優(yōu)異的檢測(cè)性能。

本文詳細(xì)內(nèi)容請(qǐng)下載:http://theprogrammingfactory.com/resource/share/2000003018

作者信息:

劉欣，李衛(wèi)龍，張燦明

(安徽省煤炭科學(xué)研究院，安徽合肥230001)

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容