《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 一種基于改進(jìn)Mask R-CNN模型的遙感圖像目標(biāo)識別方法
一種基于改進(jìn)Mask R-CNN模型的遙感圖像目標(biāo)識別方法
信息技術(shù)與網(wǎng)絡(luò)安全
余慧明,周志祥,彭 楊,崔志斌
(武漢興圖新科電子股份有限公司 平臺產(chǎn)品部,湖北 武漢430073)
摘要: 目標(biāo)識別技術(shù)作為機(jī)器視覺領(lǐng)域的一個重要分支,在各個領(lǐng)域有著重要的應(yīng)用。鑒于一般的目標(biāo)識別模型在遙感圖片中表現(xiàn)不佳,另外需要識別的目標(biāo)數(shù)量較多,尺寸大小不一,因此在經(jīng)典的目標(biāo)識別Mask R-CNN模型的基礎(chǔ)上,提出了一種融合了通道注意力機(jī)制和數(shù)據(jù)增強(qiáng)技術(shù)的模型Mask R-CNN模型。在輸入圖片數(shù)據(jù)時,首先通過Random-Batch images操作對數(shù)據(jù)進(jìn)行增強(qiáng)處理,提高模型對尺寸大小不一的目標(biāo)識別的準(zhǔn)確率;然后提取特征時,將原Mask R-CNN模型中的FPN改進(jìn)為BiFPN,使提取到的特征能更好體現(xiàn)原本的圖片信息;在最后的Mask階段,增加了通道注意力機(jī)制,使得模型更多地得到需要的信息。經(jīng)過實驗表明,此模型在遙感圖像的特殊目標(biāo)細(xì)粒度識別中有良好的表現(xiàn)。對于同一個數(shù)據(jù)集,其評價指標(biāo)在各個方面都要優(yōu)于其他對比算法。
中圖分類號: TP389.1
文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2021.03.007
引用格式: 余慧明,周志祥,彭楊,等. 一種基于改進(jìn)Mask R-CNN模型的遙感圖像目標(biāo)識別方法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2021,40(3):38-42,47.
A remote sensing image target recognition method based on improved Mask R-CNN model
Yu Huiming,Zhou Zhixiang,Peng Yang,Cui Zhibin
(Wuhan Xing Tu Xin Ke Co.,Ltd.,Platform Products Department,Wuhan 430073,China)
Abstract: As an important branch in the field of machine vision, target recognition technology has important applications in various fields. In view of the fact that the general target recognition model does not perform well in remote sensing images, the number of targets that need to be recognized is large, and the sizes are different, based on the classic target recognition Mask R-CNN model, a Mask R-CNN model fusing channel attention mechanism and data enhancement technology is proposed. When inputting image data, the data through the Random-Batch images operation to improve the accuracy of the model′s recognition of targets of different sizes is first enhanced; then, when extracting features, the FPN in the original Mask R-CNN model is improved to BiFPN, so that the extracted features can better reflect the original picture information; in the final Mask stage, the channel attention mechanism is added, so that the model can get more information. Experiments show that this model is used in remote sensing images. It has a good performance in the fine-grained recognition of special targets. For the same data set, its evaluation indicators are superior to other comparison algorithms in all aspects.
Key words : target recognition;Mask R-CNN;channel attention;data enhancement

0 引言

隨著人工智能的興起,深度學(xué)習(xí)[1]算法各個領(lǐng)域的優(yōu)勢被體現(xiàn)出來。對視頻、圖像中的多目標(biāo)、細(xì)粒度的目標(biāo)識別技術(shù),可以方便人們在復(fù)雜的情景中快速定位到所需要的檢測目標(biāo)。隨著場景的復(fù)雜度加深,基于基礎(chǔ)模型的各種改進(jìn)版本層出不窮。

在過去近10年中,目標(biāo)識別技術(shù)又有了飛速的發(fā)展,從最開始的機(jī)器學(xué)習(xí)算法,再到目前主流的深度學(xué)習(xí)目標(biāo)識別算法,如RCNN[2]、SSP-Net[3]、Fast R-CNN[4]、Faster R-CNN[5],目標(biāo)識別技術(shù)已經(jīng)在各個領(lǐng)域都有了很好的應(yīng)用。但是,由于數(shù)據(jù)集的制約,針對遙感圖像的軍事目標(biāo)識別卻是一個例外。另外,軍事碼頭物體數(shù)量眾多,需要檢測的目標(biāo)與其他物體交錯相間,大大降低了模型的準(zhǔn)確性。對于一些密集型的目標(biāo)檢測,PAN X[6]等人提出了一個由特征選擇模塊(Feature Selection Module,F(xiàn)SM)和動態(tài)優(yōu)化頭(Dynamic Refinement Head,DRH)組成的動態(tài)優(yōu)化網(wǎng)絡(luò)。FSM使神經(jīng)元能夠根據(jù)目標(biāo)物體的形狀和方向調(diào)整接受野,而DRH使模型能夠以一種對象感知的方式動態(tài)地改進(jìn)預(yù)測。何代毅[7]等人就提出了一種基于改進(jìn) Mask-RCNN[8]的建筑物自動提取方法,在網(wǎng)絡(luò)的設(shè)計中添加了路徑聚合網(wǎng)絡(luò)和特征增強(qiáng)功能,通過監(jiān)督和遷移學(xué)習(xí)的方式在Inria航空影像標(biāo)簽數(shù)據(jù)集中進(jìn)行多線程迭代訓(xùn)練與模型優(yōu)化學(xué)習(xí),實現(xiàn)了建筑物的自動精確分割和提取。對于數(shù)據(jù)集缺乏等問題,林通[9]等人通過遷移姿態(tài)生成對抗網(wǎng)絡(luò)生成姿態(tài)不同的行人圖片,對數(shù)據(jù)集進(jìn)行了擴(kuò)充。


本文詳細(xì)內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000003422




作者信息:

余慧明,周志祥,彭  楊,崔志斌

(武漢興圖新科電子股份有限公司 平臺產(chǎn)品部,湖北 武漢430073)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。