《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 設(shè)計(jì)應(yīng)用 > 基于注意力特征金字塔的輕量級(jí)目標(biāo)檢測(cè)算法
基于注意力特征金字塔的輕量級(jí)目標(biāo)檢測(cè)算法
2021年電子技術(shù)應(yīng)用第10期
趙義飛,王 勇
北京工業(yè)大學(xué) 信息學(xué)部,北京100124
摘要: 基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法因其模型復(fù)雜度和對(duì)計(jì)算能力的要求,難以部署在移動(dòng)設(shè)備等低算力平臺(tái)上。為了降低模型的規(guī)模,提出一種輕量級(jí)目標(biāo)檢測(cè)算法。該算法在自頂向下的特征融合的基礎(chǔ)之上,通過(guò)添加注意力機(jī)制構(gòu)建特征金字塔網(wǎng)絡(luò),以達(dá)到更細(xì)粒度的特征表達(dá)能力。該模型以分辨率為320×320的圖像作為輸入,浮點(diǎn)運(yùn)算量只有0.72 B,并在VOC數(shù)據(jù)集上取得了74.2%的mAP,達(dá)到了與傳統(tǒng)單階段目標(biāo)檢測(cè)算法相似的精度。實(shí)驗(yàn)數(shù)據(jù)表明,該算法在保持了檢測(cè)精度的同時(shí)顯著降低了模型運(yùn)算量,更適合低算力條件下的目標(biāo)檢測(cè)。
中圖分類號(hào): TN98;TP391
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.211320
中文引用格式: 趙義飛,王勇. 基于注意力特征金字塔的輕量級(jí)目標(biāo)檢測(cè)算法[J].電子技術(shù)應(yīng)用,2021,47(10):33-37.
英文引用格式: Zhao Yifei,Wang Yong. Lightweight object detection algorithm based on attention feature pyramid network[J]. Application of Electronic Technique,2021,47(10):33-37.
Lightweight object detection algorithm based on attention feature pyramid network
Zhao Yifei,Wang Yong
Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China
Abstract: Object detection algorithms based on deep learning are difficult to deploy on low computing power platforms such as mobile devices due to their complexity and computational demands. In order to reduce the scale of the model, this paper proposed a lightweight object detection algorithm. Based on the top-down feature fusion, the algorithm built a feature pyramid network by adding an attention mechanism to achieve more fine-grained feature expression capabilities. The proposed model took an image with a resolution of 320×320 as input and had only 0.72 B FLOPs, achieved 74.2% mAP on the VOC dataset and the accuracy is similar to traditional one-stage object detection algorithms. Experimental data shows that the algorithm significantly reduces the computational complexity of the model, maintains the accuracy, and is more suitable for object detection with low computing power.
Key words : object detection;feature pyramid;attention mechanism;lightweight algorithm

0 引言

    目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)的關(guān)鍵組成部分之一,旨在探索統(tǒng)一框架下人類視覺(jué)認(rèn)知過(guò)程的模擬和行人檢測(cè)、人臉識(shí)別、文本檢測(cè)等特定應(yīng)用場(chǎng)景下視覺(jué)任務(wù)的完成。2012年,Krizhevsky等[1]提出的AlexNet將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用在了圖像分類算法之中并取得了驚人的效果,從此基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)算法開(kāi)始取代傳統(tǒng)的基于人工特征的算法,成為了計(jì)算機(jī)視覺(jué)領(lǐng)域的主流研究方向。

    目前基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法可分為單階段檢測(cè)算法和兩階段檢測(cè)算法兩類。單階段目標(biāo)檢測(cè)算法以SSD[2]和Yolo[3-5]系列算法為代表,是一種通過(guò)在卷積神經(jīng)網(wǎng)絡(luò)提取的特征圖上設(shè)置錨點(diǎn),并對(duì)每個(gè)錨點(diǎn)上預(yù)設(shè)的不同大小和長(zhǎng)寬比例的邊界框進(jìn)行檢測(cè)的方法。兩階段目標(biāo)檢測(cè)算法以RCNN[6-8]系列算法為代表,先在特征圖上采用額外步驟生成候選區(qū)域,再對(duì)候選區(qū)域進(jìn)行檢測(cè)。與單階段算法相比,兩階段算法一般擁有更高的檢測(cè)精度,但由于增加了額外的運(yùn)算量,檢測(cè)速度也相對(duì)較低。




本文詳細(xì)內(nèi)容請(qǐng)下載:http://theprogrammingfactory.com/resource/share/2000003778。




作者信息:

趙義飛,王  勇

(北京工業(yè)大學(xué) 信息學(xué)部,北京100124)




wd.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。