文獻標識碼:A
DOI:10.19358/j.issn.2097-1788.2023.04.011
引用格式:邱浩宸,張信明.基于屬性加密的聯(lián)邦學習參與方選擇方案[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2023,42(4):62-69.
0 引言
隨著機器學習的廣泛應用,其在各個領(lǐng)域都取得了令人矚目的成就,從智慧城市產(chǎn)生的海量多源數(shù)據(jù)中建立機器學習模型的需求變得愈加強烈。在能源、醫(yī)療和社區(qū)治理等方面人們迫切需要使用機器學習模型來執(zhí)行諸如識別和預測等任務。然而,訓練數(shù)據(jù)的獲取是一個無法回避的關(guān)注點,嚴格的公民信息保護條例以及人們對個人隱私的保護要求使得城市正在誕生一個個“數(shù)據(jù)孤島”。聯(lián)邦學習被認為是在智慧城市的場景中訓練模型的很有應用前景的技術(shù)。在這個框架下,機器學習模型可以由分布在各地的參與方使用本地的數(shù)據(jù)進行合作訓練,從而避免了隱私數(shù)據(jù)的泄漏。自從谷歌公司提出使用聯(lián)邦學習來預測用戶下一個鍵盤輸入的應用以來,已經(jīng)有眾多研究者參與到這一熱門的研究方向。
有別于傳統(tǒng)的集中訓練,聯(lián)邦學習中的數(shù)據(jù)類別通常是非獨立同分布的,此外由于擁有的數(shù)據(jù)量不同,參與方可能在每個訓練輪次訓練不同數(shù)量的樣本。這些異質(zhì)性會顯著影響模型訓練時間和準確性,因此選擇恰當?shù)膮⑴c方進行訓練尤為重要。然而現(xiàn)有的聯(lián)邦學習參與方選擇方案要么是根據(jù)對模型更新的貢獻度量來選擇具有更高統(tǒng)計效用的客戶端,要么是根據(jù)計算資源和通信約束來選擇客戶端。這些方案雖然取得了一定的效果,但也存在著隱患,比如某些參與方利用上傳的梯度信息進行隱私推斷,以及某些參與方企圖以不勞而獲的方式得到全局模型。
本文詳細內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000005270
作者信息:
邱浩宸,張信明
(中國科學技術(shù)大學計算機科學與技術(shù)學院,安徽合肥230026)