2020年7月和10月,我國陸續(xù)發(fā)布兩部重磅級的法規(guī)草案——《數(shù)據(jù)安全法(草案)》和《個人信息保護法(草案)》。歐盟于 2018 年實施《通用數(shù)據(jù)保護條例》(GDPR),美國于 2020 年實施《加州消費者隱私法案》(CCPA),日本于2020年6月通過修訂版《個人信息保護法》。隨著全球數(shù)據(jù)安全法規(guī)監(jiān)管的不斷強化,合規(guī)性問題不得不納入企業(yè)數(shù)據(jù)安全建設(shè)考慮范圍。然而,法規(guī)對企業(yè)的更高的安全要求,給傳統(tǒng)的數(shù)據(jù)安全防護技術(shù)與措施帶來了前所未有的挑戰(zhàn)。
在此背景下,綠盟科技近日發(fā)布《擁抱合規(guī)、超越合規(guī):數(shù)據(jù)安全前沿技術(shù)研究報告》。在報告中,選取業(yè)界最為前沿與創(chuàng)新的十種數(shù)據(jù)安全技術(shù),對其技術(shù)原理與應(yīng)用進行全面的梳理與分析,包括處于學(xué)術(shù)前沿的差分隱私、同態(tài)加密、數(shù)據(jù)匿名;行業(yè)內(nèi)炙手可熱的安全多方計算、聯(lián)邦學(xué)習(xí)等。這些新興技術(shù),為企業(yè)的數(shù)據(jù)安全建設(shè)帶來新的思路與方案——助力其在滿足業(yè)務(wù)需求的同時解決合規(guī)的痛點與難點。
1 簡介
數(shù)據(jù)安全建設(shè)離不開具體的業(yè)務(wù)場景,數(shù)據(jù)安全技術(shù)需要從應(yīng)用場景出發(fā)。根據(jù)企業(yè)的業(yè)務(wù)系統(tǒng)與應(yīng)用、以及數(shù)據(jù)分布范圍的不同,我們將數(shù)據(jù)安全建設(shè)分為三類場景:
1) 用戶隱私數(shù)據(jù)安全合規(guī);
2) 企業(yè)內(nèi)部數(shù)據(jù)安全治理;
3) 企業(yè)間數(shù)據(jù)共享與計算。
如圖1所示,上述三大類場景根據(jù)具體業(yè)務(wù)與功能的不同,可進一步細分一些子場景。各個子場景不僅有自身內(nèi)部安全需求,也有相應(yīng)的合規(guī)性要求,具體可對應(yīng)到歐盟GDPR條款,以及我國已實施的《網(wǎng)絡(luò)安全法》的數(shù)據(jù)安全相關(guān)條款。后續(xù)三個章節(jié)將從三類場景以及子場景的應(yīng)用需求與合規(guī)挑戰(zhàn)出發(fā),研究與分析如何基于前沿技術(shù),實現(xiàn)超越合規(guī),解決安全痛點。
圖1 超越合規(guī):數(shù)據(jù)安全場景-前沿技術(shù)圖譜
2 前沿技術(shù)+用戶隱私數(shù)據(jù)安全合規(guī)
在該類場景中,企業(yè)需解決用戶隱私數(shù)據(jù)的采集、以及數(shù)據(jù)權(quán)利請求響應(yīng)的合規(guī)性問題,可引入下述創(chuàng)新技術(shù):
1) 差分隱私
技術(shù)原理:差分隱私是一種基于噪聲機制的隱私保護技術(shù)。在本地差分隱私模式下,每一個用戶終端都會運行一個差分隱私算法,每一個終端采集的數(shù)據(jù)都會加入噪聲,然后將其上傳給服務(wù)器;服務(wù)器雖然無法獲得某一個用戶的精確數(shù)據(jù),但通過聚合與轉(zhuǎn)換可以挖掘出用戶群體的行為趨勢。
合規(guī)遵循:GDPR的 32條和《網(wǎng)絡(luò)安全法》的42條。
行業(yè)應(yīng)用(代表公司):Google、Apple,其中Apple通過差分隱私可挖掘到iPhone用戶使用表情的頻率分布,但無法獲得具體某一個用戶的確切隱私。
圖2 iPhone差分隱私技術(shù)應(yīng)用[1]
2) 知識圖譜
技術(shù)原理:知識圖譜最早用于搜索引擎和社交網(wǎng)絡(luò),它簡單可以看成是一種基于圖的數(shù)據(jù)結(jié)構(gòu),由節(jié)點和邊組成,每個節(jié)點是一個實體,每條邊是兩條實體之間的關(guān)系。由于個人數(shù)據(jù)治理關(guān)鍵是個人數(shù)據(jù)實體識別,以及相關(guān)屬性與處理流程的關(guān)聯(lián),引入知識圖譜技術(shù)成為必然。通過知識圖譜技術(shù),可幫助企業(yè)了解所在敏感數(shù)據(jù)的位置,是如何被使用的,以及它的合同、法律和監(jiān)管義務(wù),達到個人信息治理與可視化作用。
合規(guī)遵循:可滿足GDPR的12-22條和《網(wǎng)絡(luò)安全法》的43條。
行業(yè)應(yīng)用(代表公司):RSA 2020創(chuàng)新沙盒冠軍Securit.ai公司,基于知識圖譜技術(shù)實現(xiàn)了個人數(shù)據(jù)圖譜應(yīng)用。
圖3 Securiti.ai的個人數(shù)據(jù)圖譜應(yīng)用[2]
3) 流程自動化
技術(shù)原理:用戶數(shù)據(jù)權(quán)利請求響應(yīng)是歐美等國外企業(yè)重要的隱私合規(guī)檢查項。流程自動化技術(shù)可幫助企業(yè)的數(shù)據(jù)安全運營團隊從繁瑣重復(fù)的手工處理“請求-響應(yīng)”轉(zhuǎn)為自動化處理,一方面可降低人工的運營成本,另一方面可減少由于響應(yīng)時間延誤(GDPR規(guī)定一般為一個月)帶來的違規(guī)風(fēng)險。
合規(guī)遵循:GDPR的12-22條和《網(wǎng)絡(luò)安全法》的43條。
行業(yè)應(yīng)用(代表公司):Securit.ai、BigID和OneTrust等。
3 前沿技術(shù)+企業(yè)內(nèi)部數(shù)據(jù)安全治理
在該類場景中,企業(yè)需解決內(nèi)部敏感數(shù)據(jù)治理的安全與合規(guī)問題,可引入下述技術(shù)解決安全與合規(guī)問題:
1) 智能敏感數(shù)據(jù)識別
技術(shù)原理:傳統(tǒng)基于關(guān)鍵詞、正則匹配的敏感數(shù)據(jù)識別方法不夠智能,易出現(xiàn)漏檢(尤其是在文檔等數(shù)據(jù))。引入相似度計算、聚類、監(jiān)督學(xué)習(xí)等智能方法,提升識別能力與檢測效果。
合規(guī)遵循:GDPR的30條和《網(wǎng)絡(luò)安全法》的21條。
行業(yè)應(yīng)用(代表公司):Securit.ai、BigID等。
2) 數(shù)據(jù)脫敏風(fēng)險評估
技術(shù)原理:數(shù)據(jù)脫敏在企業(yè)進行廣泛應(yīng)用,然而不同脫敏方法的安全效果不同。通過對脫敏數(shù)據(jù)集的身份標識度和隱私泄露風(fēng)險進行定量地評估與刻畫,實現(xiàn)風(fēng)險管理和控制。
合規(guī)遵循:GDPR的32條和《網(wǎng)絡(luò)安全法》的42條。
行業(yè)應(yīng)用(代表公司):Privacy Analytics、綠盟科技等。
圖4 綠盟科技的數(shù)據(jù)脫敏風(fēng)險評估應(yīng)用
4) 用戶實體行為分析
技術(shù)原理:通過對用戶實體持續(xù)的畫像與建模,并建立正常用戶行為基線,從海量收集的安全數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)泄露等異常行為。
合規(guī)遵循:GDPR的32條和《網(wǎng)絡(luò)安全法》的42條。
行業(yè)應(yīng)用(代表公司):Splunk、綠盟科技等。
圖5 綠盟科技的UEBA數(shù)據(jù)安全防護方案
4 前沿技術(shù)+企業(yè)間數(shù)據(jù)共享與計算
在該類場景中,企業(yè)需解決企業(yè)之間的數(shù)據(jù)安全共享與計算的安全與合規(guī)問題,可引入下述創(chuàng)新技術(shù):
1) 數(shù)據(jù)匿名
技術(shù)原理:對個人信息進行泛化和屏蔽等處理,使得對應(yīng)的個人信息主體無法被識別,以達到“匿名”的效果,包括K-匿名、L-多樣性和T-近似性等技術(shù)。
合規(guī)遵循:GDPR的前言26段和19條,以及《網(wǎng)絡(luò)安全法》的42條。
行業(yè)應(yīng)用(代表公司):Immuta、Privitar、 Anonos、綠盟科技等。
圖6 綠盟科技的自適應(yīng)匿名化算法應(yīng)用
2) 同態(tài)加密
技術(shù)原理:明文數(shù)據(jù)經(jīng)過同態(tài)加密后得到的密文數(shù)據(jù),在不解密情況下仍然可執(zhí)行密文數(shù)據(jù)的處理與操作。敏感數(shù)據(jù)在同態(tài)加密與計算環(huán)節(jié)處于加密狀態(tài),實現(xiàn)了數(shù)據(jù)的計算,同時保障了安全性。
合規(guī)遵循:GDPR的前言5條和32條,以及《網(wǎng)絡(luò)安全法》的42條。
行業(yè)應(yīng)用(代表公司):Duality 等。
圖7 Duality的同態(tài)加密平臺在金融數(shù)據(jù)共享應(yīng)用(圖引自[3])
3) 安全多方計算
技術(shù)原理:在參與方互不信任的情況下進行協(xié)同計算,在保證計算結(jié)果正確性同時不泄露任何一方輸入的原始數(shù)據(jù)和狀態(tài)數(shù)據(jù)。
合規(guī)遵循:GDPR的前言5條和32條,以及《網(wǎng)絡(luò)安全法》的42條。
行業(yè)應(yīng)用(代表公司):Google、螞蟻金服等。
4) 聯(lián)邦學(xué)習(xí)
技術(shù)原理:多個參與方(如企業(yè)、用戶移動設(shè)備)在不交換原始數(shù)據(jù)情況下,即在隱私保護前提下,實現(xiàn)聯(lián)合機器學(xué)習(xí)的建模、訓(xùn)練和模型部署。
合規(guī)遵循:GDPR的前言5條和32條,以及《網(wǎng)絡(luò)安全法》的42條。
行業(yè)應(yīng)用(代表公司):Google、Apple和微眾銀行等。
5 小結(jié)
隨著全球數(shù)據(jù)隱私法規(guī)的密集發(fā)布,包括歐盟GDPR,美國CCPA,國內(nèi)的《網(wǎng)絡(luò)安全法》,以及今年發(fā)布的《數(shù)據(jù)安全法(草案)》、《個人信息保護法(草案)》,合規(guī)性成為了企業(yè)數(shù)據(jù)安全建設(shè)與治理的重要驅(qū)動力。在合規(guī)視角下,數(shù)據(jù)安全的內(nèi)涵在合規(guī)與業(yè)務(wù)安全雙重需求驅(qū)動下不斷外延和擴展,數(shù)據(jù)安全的覆蓋的應(yīng)用場景將變得更加多樣化,給傳統(tǒng)的數(shù)據(jù)安全技術(shù)與方案帶來了巨大的挑戰(zhàn)。如何實現(xiàn)破局?本文簡要介紹的十種新興的數(shù)據(jù)安全技術(shù),可為破局新場景新挑戰(zhàn)帶來一些思路與啟發(fā)——助力企業(yè)在滿足安全合規(guī)同時創(chuàng)造更大的數(shù)據(jù)價值。