文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.211980
中文引用格式: 潘新辰,楊小健,秦嶺. 基于雙注意力和多區(qū)域檢測的細(xì)粒度圖像分類[J].電子技術(shù)應(yīng)用,2022,48(8):117-122.
英文引用格式: Pan Xinchen,Yang Xiaojian,Qin Ling. Fine-grained image classification based on dual attentions and multi-region detection[J]. Application of Electronic Technique,2022,48(8):117-122.
0 引言
目前,深度學(xué)習(xí)技術(shù)已被廣泛應(yīng)用于圖像分類領(lǐng)域,細(xì)粒度圖像分類旨在區(qū)分同種對象的不同類別。相較于傳統(tǒng)圖像分類,細(xì)粒度圖像分類的難點在于:(1)不同類別之間的高相似性,難以找到具有辨別性的區(qū)域并提取細(xì)節(jié)特征;(2)同一種類別之間由于圖像視角、光照、背景和遮擋等因素的變化也存在著一定的差異性。因此,如何定位具有辨別性的局部區(qū)域,以及如何更精確地提取細(xì)粒度特征,成為目前細(xì)粒度圖像分類方法的主要研究方向。
為了檢測具有辨別性的局部區(qū)域,一些方法[1-2]通過人工標(biāo)注的方式對細(xì)粒度圖像中具有辨別性的區(qū)域進(jìn)行標(biāo)注,然后通過網(wǎng)絡(luò)學(xué)習(xí)定位辨別性局部區(qū)域,從而提高網(wǎng)絡(luò)模型的分類準(zhǔn)確性,需要花費大量的時間、人力對圖像進(jìn)行標(biāo)注,成本太大。還有一些方法[3-4]利用類別標(biāo)簽以弱監(jiān)督的方式來學(xué)習(xí)具有辨別性的局部區(qū)域,這類方法雖然不能夠達(dá)到使用人工標(biāo)注的標(biāo)簽進(jìn)行監(jiān)督學(xué)習(xí)的效果,但額外成本幾乎為零。
注意力機制作為提升網(wǎng)絡(luò)特征提取能力的重要手段[5]主要分為通道注意力機制和空間注意力機制,通道注意力機制可以學(xué)習(xí)到不同通道間的權(quán)重關(guān)系,空間注意力機制可以學(xué)習(xí)不同像素間的依賴關(guān)系。合理利用以上兩個注意力機制能夠更細(xì)粒度提取圖像的特征,從而能夠更好地進(jìn)行分類。
本文詳細(xì)內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000004663。
作者信息:
潘新辰,楊小健,秦 嶺
(南京工業(yè)大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,江蘇 南京211816)