文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2020.12.001
引用格式: 陳磊,薛見新,張潤(rùn)滋,等. 基于信息熵的數(shù)據(jù)集重標(biāo)識(shí)風(fēng)險(xiǎn)評(píng)估方法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(12):1-7.
0 引言
在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)共享、發(fā)布和交易等場(chǎng)景需求變得越來(lái)越多,一方面促進(jìn)了數(shù)據(jù)流通與價(jià)值利用,另一方面引發(fā)的個(gè)人數(shù)據(jù)與隱私安全事件近年來(lái)呈現(xiàn)爆發(fā)趨勢(shì)[1]。
為了應(yīng)對(duì)挑戰(zhàn),在法規(guī)層面,全球掀起了數(shù)據(jù)隱私的立法熱潮,如歐盟《通用數(shù)據(jù)保護(hù)條例》(GDPR)、美國(guó)《加州消費(fèi)者隱私法案》(CCPA)等。我國(guó)2017年實(shí)施的《網(wǎng)絡(luò)安全法》,其中一個(gè)章節(jié)專門明確個(gè)人信息安全;此外,我國(guó)《個(gè)人信息保護(hù)法》在加快立法與制定中。在技術(shù)層面,如何平衡數(shù)據(jù)利用與隱私保護(hù)問題,已經(jīng)成為學(xué)術(shù)界和工業(yè)界的一大研究熱點(diǎn)[2]。當(dāng)前,已經(jīng)發(fā)展出了保留格式加密(Format-Preserving Encryption,F(xiàn)PE)[3]、差分隱私(Differential Privacy,DP)[4]、K-匿名(K-Anonymity)[5]和L-多樣性(L-Diversity)[6]以及去標(biāo)識(shí)化(De-identification)[7]等技術(shù)。其中,去標(biāo)識(shí)化技術(shù)通過對(duì)原始個(gè)人信息進(jìn)行部分屏蔽、泛化和失真等數(shù)據(jù)變換操作,是一種意圖消除“個(gè)人身份”的隱私保護(hù)技術(shù)。由于其處理規(guī)則簡(jiǎn)單靈活且易于并行處理(高效),目前在隱私保護(hù)的數(shù)據(jù)發(fā)布和數(shù)據(jù)挖掘等實(shí)際場(chǎng)景中有廣泛應(yīng)用與部署。通常,在工業(yè)界習(xí)慣稱為“數(shù)據(jù)脫敏”。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://theprogrammingfactory.com/resource/share/2000003069
作者信息:
陳 磊1,2,薛見新1,2,張潤(rùn)滋1,2,劉文懋1
(1.綠盟科技集團(tuán)股份有限公司,北京100089;2.清華大學(xué) 自動(dòng)化系,北京100084)