盡管歐盟的 《通用數(shù)據(jù)保護條例》(GDPR)和加利福尼亞的《加州消費者隱私法案》(CCPA)等數(shù)據(jù)隱私立法旨在防止隱私泄露,但消費者的隱私仍然經(jīng)常受到黑客、公司和政府的侵犯。隨著企業(yè)與第三方公司共享消費者數(shù)據(jù)以獲取洞察力、改善服務(wù)或?qū)?shù)據(jù)資產(chǎn)貨幣化,這種情況正在不斷加劇。隱私增強技術(shù)(PET)使企業(yè)能夠利用越來越多的數(shù)據(jù),同時確保個人或敏感信息保持私密性。
例如,人工智能公司和人工智能顧問經(jīng)常會遇到這個問題,因為他們需要使用客戶數(shù)據(jù)來構(gòu)建機器學習模型,這時候就需要一種安全的方式來訪問客戶數(shù)據(jù),而隱私增強技術(shù)可以實現(xiàn)這一點。
什么是隱私增強技術(shù)(PET)
隱私增強技術(shù)是一個籠統(tǒng)的術(shù)語,包括在隱私信息采集、存儲、以及在執(zhí)行搜索或分析過程中對于保護和增強隱私安全性的數(shù)據(jù)安全技術(shù),旨在提取數(shù)據(jù)價值,以充分發(fā)揮其商業(yè)、科學和社會價值,但同時又不會危及這些信息的隱私和安全性。
為什么隱私增強技術(shù)(PET)現(xiàn)在很重要?
與任何其他數(shù)據(jù)隱私解決方案一樣,隱私增強技術(shù)對于企業(yè)來說很重要,原因有以下三點:
GDPR和CCPA等數(shù)據(jù)保護法案正在迫使組織保護消費者數(shù)據(jù)。因為一旦發(fā)生數(shù)據(jù)泄露,企業(yè)可能需要支付高額罰款。根據(jù)DLA Piper 《2020年GDPR數(shù)據(jù)泄露調(diào)查》報告顯示,罰款舉措已經(jīng)落實,從2018年5月到2020年1月,GDPR罰款金額已經(jīng)超過1.26億美元。
由于您的企業(yè)在分析和應(yīng)用程序測試方面缺乏自給自足的能力,因此數(shù)據(jù)可能需要由第三方組織進行測試。隱私增強技術(shù)能夠在數(shù)據(jù)共享的同時實現(xiàn)隱私保護。
隱私泄露可能會損害您的企業(yè)聲譽,企業(yè)或客戶(取決于您的商業(yè)模式)可能終止與您的合作。一個例子就是劍橋分析公司丑聞后Facebook的股價下跌。
常見的隱私增強技術(shù)示例
密碼算法
1. 同態(tài)加密
同態(tài)加密是一種加密方法,被廣泛認為是加密的“圣杯”,允許對加密密文進行計算。它生成一個加密結(jié)果,當解密時,該結(jié)果匹配操作的結(jié)果,就好像它們是在未加密的數(shù)據(jù)(即明文)上執(zhí)行的一樣。這使得加密數(shù)據(jù)能夠被傳輸、分析并返回給數(shù)據(jù)所有者,數(shù)據(jù)所有者可以解密信息并查看原始數(shù)據(jù)的結(jié)果。因此,公司可以出于分析目的與第三方共享敏感數(shù)據(jù)。
同態(tài)加密不是一項新技術(shù),學術(shù)領(lǐng)域已經(jīng)進行了30多年的研究。盡管從歷史上來看同態(tài)加密一直是計算密集型的技術(shù),但現(xiàn)在的最新突破使之可廣泛用于各種商業(yè)應(yīng)用。
一些常見的同態(tài)加密類型包括:
全同態(tài)加密:同時支持乘法和加法,并且對執(zhí)行的操作數(shù)量沒有限制。利用全同態(tài)加密可以實現(xiàn)讓解密方只能獲知最后的結(jié)果,而無法獲得每個密文的消息與同態(tài)計算方式,從而提高隱私信息的安全性;
部分同態(tài)加密:可以對加密數(shù)據(jù)執(zhí)行一種類型的操作,例如僅提供乘法或加法,但不能同時進行;
有點同態(tài)加密:可以執(zhí)行多種類型的運算(例如加法、乘法),但只能執(zhí)行有限數(shù)量的運算;
2. 安全多方計算(SMPC)
這是同態(tài)加密的一個子領(lǐng)域,但存在一個區(qū)別:它允許多方共同對數(shù)據(jù)進行操作,同時保持其各自的輸入信息私有和安全。因此,機器學習模型可以應(yīng)用于加密數(shù)據(jù),因為SMPC適用于更大規(guī)模的數(shù)據(jù)。
3. 差分隱私
差分隱私可以防止共享有關(guān)個人的任何數(shù)據(jù)。在差分隱私中,出于混淆目的,將隨機生成的“噪聲”添加到基礎(chǔ)數(shù)據(jù)中,對更改后的數(shù)據(jù)執(zhí)行的任何計算僅在統(tǒng)計/方向上正確(即不準確)。因此,由于不能保證準確的結(jié)果并且限制了可能的計算,因此差分隱私的應(yīng)用領(lǐng)域比其他隱私增強技術(shù)要窄。
4. 零知識證明(ZKP)
ZKP 使用一組加密算法,允許在不泄露證明數(shù)據(jù)的情況下驗證信息。可用于身份驗證等場景,例如無需提交準確生日信息就可驗證用戶是否符合規(guī)定年齡。
數(shù)據(jù)屏蔽技術(shù)
一些隱私增強技術(shù)也是數(shù)據(jù)屏蔽技術(shù),企業(yè)使用它們來保護其數(shù)據(jù)集中的敏感信息。
5. 混淆
這是數(shù)據(jù)屏蔽的通用術(shù)語,它包含多種方法來通過向日志或配置文件添加分散注意力或誤導(dǎo)性的數(shù)據(jù)以替換敏感信息。
6. 假名化(Pseudonymisation)
術(shù)語“假名化”在GDPR中被提及15次之多,它是指在一個資料記錄中的識別字段被一個或多個人為的標識符或化名所代替的程序。GDPR建議使用假名化技術(shù)建立個人資料以降低資料主體的風險,并協(xié)助控制者與處理者履行資料保護的義務(wù)。
7. 小數(shù)據(jù)
與大數(shù)據(jù)相對應(yīng),小數(shù)據(jù)(Small Data)指人工智能或者機器學習系統(tǒng)借助數(shù)據(jù)增強、轉(zhuǎn)移學習、合成數(shù)據(jù)集等技術(shù),使用很少,甚至不使用真實數(shù)據(jù)。隨著小數(shù)據(jù)技術(shù)的興起,也許未來的人工智能模型將不再需要海量的訓(xùn)練數(shù)據(jù),同時也將極大降低隱私風險。
8. 通信匿名技術(shù)
通信匿名技術(shù)作為一種主要的隱私增強技術(shù)被廣泛應(yīng)用于互聯(lián)網(wǎng)的各個方面,現(xiàn)有的通信匿名技術(shù)主要是通過多次存儲轉(zhuǎn)發(fā)(利用Mix網(wǎng)絡(luò)和洋蔥路由技術(shù))來改變消息的外觀(報文延遲、亂序、報文填充等),并利用Mix網(wǎng)絡(luò)的刷新機制消除消息間的對應(yīng)關(guān)系,從而為在線用戶提供隱私保護,典型的低時延通信匿名系統(tǒng)包括Tor,I2P等。
這些通信匿名系統(tǒng)不僅提供了對Internet用戶的身份信息的保護,同時實現(xiàn)了對服務(wù)提供者的身份信息保護,它們允許用戶能夠在確保服務(wù)器IP不被泄漏的前提下提供網(wǎng)絡(luò)服務(wù)。
借助人工智能和機器學習算法的技術(shù)
9. 合成數(shù)據(jù)生成
合成數(shù)據(jù)本身就是人工智能對數(shù)據(jù)進行提取歸納的產(chǎn)物,這些算法會學習真實數(shù)據(jù)的結(jié)構(gòu)性和關(guān)聯(lián)性,生成無限量的相同質(zhì)量的人工數(shù)據(jù)。
這樣產(chǎn)生的數(shù)據(jù)可以符合原先數(shù)據(jù)的特征,依舊具有一定的價值,但是卻沒有隱私問題。
而且,在這個過程中可以對人工智能進行編程,以提供社會所需的公平性結(jié)果,從而從源頭上糾正偏見,以減少任何潛在的違反公平性的行為。其合成結(jié)果將會是公平的合成數(shù)據(jù),是完全匿名和去偏見的。
10. “聯(lián)邦學習”(Federated Learning)
“聯(lián)邦學習”指的是在滿足隱私保護和數(shù)據(jù)安全的前提下,設(shè)計一個機器學習框架,使各個機構(gòu)在不交換數(shù)據(jù)的情況下進行協(xié)作,提升機器學習的效果。其核心就是解決“數(shù)據(jù)孤島”和數(shù)據(jù)隱私保護的問題,通過建立一個數(shù)據(jù)“聯(lián)邦”,讓參與各方都獲益,推動技術(shù)整體持續(xù)進步。
具體的實現(xiàn)策略是:建立一個虛擬的共有模型。這個虛擬模型類似于把數(shù)據(jù)聚合在一起建立的最優(yōu)模型,但是在建立虛擬模型的時候,數(shù)據(jù)本身不移動,因此不泄露隱私,符合數(shù)據(jù)合規(guī)要求,建好的模型也僅在各自的區(qū)域為本地的目標服務(wù)。在這樣一個聯(lián)邦機制下,各個參與者的身份和地位相同,實現(xiàn)“共同富裕”。
隱私增強技術(shù)的主要用例
測試數(shù)據(jù)管理:應(yīng)用程序測試和數(shù)據(jù)分析有時需求由第三方提供商處理。即使是在內(nèi)部處理,公司也應(yīng)盡量減少對客戶數(shù)據(jù)的內(nèi)部訪問。使用不會顯著影響測試結(jié)果的合適隱私增強技術(shù) 對組織至關(guān)重要。
金融交易:由于公民有與其他方進行私人交易的自由,金融機構(gòu)有責任保護客戶的隱私。
醫(yī)療保健服務(wù):醫(yī)療保健行業(yè)收集并共享(在需要時)患者的電子健康記錄(EHR)。例如,臨床數(shù)據(jù)可用于搜索各種藥物組合的不良反應(yīng)。在這種情況下,醫(yī)療保健公司通過使用隱私增強技術(shù)可以確?;颊邤?shù)據(jù)的隱私。
?促進包括中介在內(nèi)的多方之間的數(shù)據(jù)傳輸:對于在雙方之間充當中間人的企業(yè),隱私增強技術(shù)的使用至關(guān)重要,因為這些企業(yè)負責保護雙方信息的隱私。
總結(jié)
用戶對隱私的渴望將是科技業(yè),更是網(wǎng)絡(luò)安全行業(yè)的下一個“金礦”。無論是在政府法規(guī)的引導(dǎo)下還是在消費者需求的引導(dǎo)下,企業(yè)都必須準備好在優(yōu)先考慮數(shù)據(jù)和隱私安全性的世界中運營。
此外,隨著隱私增強技術(shù)在商業(yè)領(lǐng)域中的日益流行和廣泛應(yīng)用,越來越多的企業(yè)將其作為數(shù)字化轉(zhuǎn)型的必備技術(shù)。但是,企業(yè)首先需要識別哪些是以隱私為中心的業(yè)務(wù),然后選擇投資最合適的隱私增強技術(shù)。