中文引用格式: 黃炯炯. 智慧農業(yè)下基于聯(lián)邦學習的水稻病蟲害分類研究[J]. 電子技術應用,2024,50(11):89-98.
英文引用格式: Huang Jiongjiong. Research on rice pest and disease classification based on federated learning under smart agriculture[J]. Application of Electronic Technique,2024,50(11):89-98.
引言
水稻是全世界重要的食物來源,在亞洲更是占據(jù)了不可代替的地位。中國60以上的人口以米飯為主食,水稻種植面積在3 000萬公頃左右,占我國總播種面積的五分之一以上[1]。在傳統(tǒng)的農業(yè)生產模式中,人力資源的消耗通常十分顯著。在水稻的種植過程中,細菌、真菌和其他微生物的侵害對水稻的健康狀況和產量構成了嚴重威脅,導致了巨大的損失。農業(yè)生產中為了應對病蟲害問題,需要投入大量勞動力,這不僅增加了農業(yè)成本,也加大了勞動力的工作負擔。
物聯(lián)網(wǎng)技術[2]和計算機視覺[3]等科技的引入、科技與農業(yè)的深度融合推動了農業(yè)智慧化方向的快速發(fā)展,實現(xiàn)智慧農業(yè)[4]的全新格局。在智慧農業(yè)下,農業(yè)通過智能農業(yè)設備進行水稻病蟲害的自動化治理,不僅顯著提升了農業(yè)種植的效率,更在減少農業(yè)損失方面發(fā)揮了至關重要的作用。這種智能化的治理模式不僅代表了農業(yè)現(xiàn)代化的重要方向,也為提高農業(yè)生產效益、促進農業(yè)可持續(xù)發(fā)展注入了新的動力與意義。
近年來,深度學習技術在各個領域都取得了巨大進展,特別是植物病蟲害分類方面。隨著農業(yè)智能化發(fā)展,人們對于智能治理植物病蟲害提出了更高要求。在智慧農場中,由于分散于不同地區(qū)且歸屬于不同組織機構的農業(yè)設備在運行中產生了數(shù)據(jù)孤島問題,給數(shù)據(jù)整合與分析帶來較大困擾。為了解決該問題,本文在研究中加入了聯(lián)邦學習框架(FL),聯(lián)邦學習在設備進行深度學習任務時對數(shù)據(jù)隱私保護和提高模型性有很大幫助。聯(lián)邦學習在2016年由谷歌研究院提出[5],它是一種分布式機器學習方法,允許在多個設備或計算節(jié)點上進行模型訓練,而無需將原始數(shù)據(jù)傳輸?shù)街醒敕掌鳌_@種學習方法的核心思想是在保護數(shù)據(jù)隱私的同時,允許多個參與方共同學習一個全局模型,聯(lián)邦學習有效地解決了數(shù)據(jù)孤島[6]這個難題。
在以往的研究中,不少學者通過改進深度學習的卷積神經(jīng)網(wǎng)絡(CNN)來提高水稻病蟲害的識別分類性能。比如Latif等學者[7]對預訓練模型VGG19進行改進,在非歸一化增強數(shù)據(jù)上擁有96.08的準確率,高于相同或類似數(shù)據(jù)集在其他研究中的表現(xiàn)。Bhimavarapu[8]在卷積神經(jīng)網(wǎng)絡中改進了激活和優(yōu)化函數(shù),減少了損失并明顯地提高了預測性能和分類準確性。預訓練能夠加速訓練過程并提高訓練效果,在研究中使用預訓練模型進行遷移學習也是不錯的方法[9]。Ahad等學者[10]對六種CNN預訓練模型進行了水稻病蟲害分類比較,對五種預訓練模型進行遷移學習,通過比較得到不同模型的效果及優(yōu)缺點。
傳統(tǒng)的集中式機器學習要面對數(shù)據(jù)安全隱私和數(shù)據(jù)中心化的挑戰(zhàn)[11],醫(yī)療和金融領域飽受這些問題的困擾[12]。谷歌團隊設計了聯(lián)邦學習應用在這些領域來解決以上矛盾。在醫(yī)療領域,Sheller等研究者[13]發(fā)現(xiàn),對十個醫(yī)療機構的數(shù)據(jù)進行聯(lián)邦學習的結果已經(jīng)達到了集中數(shù)據(jù)模型質量的99%。他們又進一步研究了合作機構間的數(shù)據(jù)分布對模型質量和學習模式的影響,通過與其他多種協(xié)作方法相比證明了聯(lián)邦學習的優(yōu)越性,聯(lián)邦學習在醫(yī)院數(shù)據(jù)上的應用將進一步推動個性化精準醫(yī)療的發(fā)展。Adnan等人[14]則是利用聯(lián)邦學習分析醫(yī)學上的組織病理學圖像,與傳統(tǒng)訓練相比他們所使用的差分私有聯(lián)邦學習是醫(yī)學圖像分析中機器學習模型協(xié)作開發(fā)的可行且可靠的框架。Li等人[15]提出一種聯(lián)邦學習用于金融信用風險管理領域的應用方案,聯(lián)邦學習在具有異構特征的Non-IID銀行小樣本數(shù)據(jù)下的金融信貸風險管理中的性能提高了14%。聯(lián)邦學習在近期開始應用到了農業(yè)領域中。Sharma等學者[16]利用聯(lián)邦學習下的CNN模型對馬鈴薯作物病蟲害進行準確分類;Kaur等人[17]則是利用該技術對辣椒葉的疾病進行了分類;Tripathy等人[18]在聯(lián)邦學習框架下,利用LeNet模型提取特征,對水稻病蟲害進行了分類優(yōu)化。聯(lián)邦學習在這些農業(yè)場景下都有不錯的表現(xiàn)。
盡管病蟲害識別技術已相當成熟,但隨著智慧農業(yè)的崛起,對該場景的需求也呈現(xiàn)出新的趨勢和變化。本文在智慧農業(yè)場景下,使用聯(lián)邦學習解決了不同機構和地區(qū)設備的數(shù)據(jù)孤島問題。不同的數(shù)據(jù)分布對聯(lián)邦學習產生影響,本文將水稻病蟲害圖像分為IID和Non-IID數(shù)據(jù)[19],并把預訓練模型作為初模型進行特征提取以獲得更高的效率和準確率。
針對以上幾點,本文做了相應的研究和實驗加以驗證,證實了該場景下應用聯(lián)邦學習和使用預訓練模型的方案可行性并探索了適合該方案和實驗環(huán)境下的預訓練模型和條件。
本文詳細內容請下載:
http://theprogrammingfactory.com/resource/share/2000006216
作者信息:
黃炯炯
(浙江農林大學 數(shù)學與計算機科學學院,浙江 杭州 311300)