中文引用格式: 丁鋆,徐愛俊,吳小芬,等. 基于多特征融合和知識蒸餾的亞熱帶常見喬木識別方法[J]. 電子技術(shù)應(yīng)用,2024,50(8):1-9.
英文引用格式: Ding Yun,Xu Aijun,Wu Xiaofen,et al. Common arbor identification method in subtropics based on multiple features fusion and knowledge distillation[J]. Application of Electronic Technique,2024,50(8):1-9.
引言
亞熱帶地區(qū)處于熱帶和溫帶之間,氣候和地理特征獨特,為喬木、灌木、草本植物以及濕地植被等多種植物提供了適宜的生存條件,形成了復(fù)雜多樣的植被環(huán)境[1-3]。喬木作為生態(tài)系統(tǒng)中的關(guān)鍵組成部分,其信息的準(zhǔn)確獲取對于珍稀瀕危樹木的保護和管理、木材資源的高效生產(chǎn)利用、亞熱帶地區(qū)生態(tài)系統(tǒng)健康的監(jiān)測和分析都至關(guān)重要。因此,如何在復(fù)雜環(huán)境下準(zhǔn)確識別喬木種類成為一項具有挑戰(zhàn)性的任務(wù)。
傳統(tǒng)的樹種識別主要依靠相關(guān)領(lǐng)域?qū)<矣^察樹木部分器官的形狀、顏色、紋理等特征來完成,該方法主觀性強且效率較低,不適于大量樹木的識別。隨著計算機視覺和機器學(xué)習(xí)的發(fā)展,樹種分類和識別方法取得了很大的進展,部分研究者利用圖像處理提取樹木顏色、紋理、邊緣、形狀等信息進而完成樹種識別[4-6],盡管分類效果較好,但該方法需要人工選擇特征,復(fù)雜的預(yù)處理過程增加了時間成本,降低了實用性。
近年來,深度學(xué)習(xí)技術(shù)在農(nóng)林領(lǐng)域的應(yīng)用日益增多,不少國內(nèi)外學(xué)者將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)用于樹種識別[7-10]。朱良寬等[11]利用深度卷積生成式對抗網(wǎng)絡(luò)(Deep Convolutional Generative Adversarial Networks, DCGAN)擴充15種葉片圖像,通過遷移學(xué)習(xí)訓(xùn)練Inception V3網(wǎng)絡(luò)后識別準(zhǔn)確率為0.965 7,但圖片選取局限于簡單背景,無法評估模型在復(fù)雜背景下的識別性能。劉嘉政等[12]設(shè)計3路并列CNN,融合RGB、H通道和局部二值模式(Local Binary Pattern, LBP)特征后,對6種常見樹種的樹皮紋理圖像識別準(zhǔn)確率為0.935 0,高于單一特征識別率,但樹皮圖像特征較為明顯易于區(qū)分。Cui等[13]使用ConvNeXt網(wǎng)絡(luò)的3種規(guī)格(ConvNeXt-Small、Base和Tiny)識別BarkNetV2數(shù)據(jù)集中的33種樹皮圖像,準(zhǔn)確率較高,分別為0.976 1、0.975 8和0.972 9,但參數(shù)量較大,其中參數(shù)量最小的Tiny網(wǎng)絡(luò)達到了28.59 M。上述研究證實了深度學(xué)習(xí)在樹種識別上的可行性,也取得了較好的效果,但普遍存在選取的樹木種類較少、部分?jǐn)?shù)據(jù)集背景單一特征明顯以及改進的網(wǎng)絡(luò)模型參數(shù)量較大等問題。
為準(zhǔn)確識別復(fù)雜背景下特征不明顯的遠距離喬木,本文提出了一種多特征融合的亞熱帶常見喬木識別模型MFFMN-KD-TA(Multiple Features Fusion MobileNetV3_Small complemented by Knowledge Distillation and Triplet Attention),模型將3個MobileNetV3_Small主干網(wǎng)絡(luò)融合為MFFMN模型,分別提取樹葉、樹干和樹木整體特征;再引入知識蒸餾策略,以3個ResNet50構(gòu)建的3-ResNet50融合模型作為教師網(wǎng)絡(luò)指導(dǎo)MFFMN訓(xùn)練,最終將蒸餾得到的MFFMN-KD模型與Triplet Attention注意力機制相結(jié)合,實現(xiàn)了自然環(huán)境下遠距離喬木的準(zhǔn)確識別。
本文詳細內(nèi)容請下載:
http://theprogrammingfactory.com/resource/share/2000006113
作者信息:
丁鋆1,2,3,徐愛俊1,2,3,吳小芬4,周素茵1,2,3
(1.浙江農(nóng)林大學(xué) 數(shù)學(xué)與計算機科學(xué)學(xué)院,浙江 杭州 311300;
2.浙江農(nóng)林大學(xué) 浙江省林業(yè)智能監(jiān)測與信息技術(shù)研究重點實驗室,浙江 杭州 311300;
3.浙江農(nóng)林大學(xué) 林業(yè)感知技術(shù)與智能裝備國家林業(yè)與草原局重點實驗室,浙江 杭州 311300;
4.杭州市臨安區(qū)農(nóng)村水務(wù)資產(chǎn)經(jīng)營有限公司,浙江 杭州 311300)