這次開發(fā)出的數(shù)據(jù)保護(hù)工具,可確保關(guān)鍵數(shù)據(jù)集中的敏感個人信息通過嚴(yán)密檢查后再公開共享,比如用于跟蹤COVID-19疫情蔓延的數(shù)據(jù)集。
澳大利亞國家科學(xué)機(jī)構(gòu)(CSIRO)下轄Data61專家小組、新南威爾士州政府、澳大利亞計(jì)算機(jī)協(xié)會(ACS)等多家機(jī)構(gòu)合作開發(fā)了一款隱私保障工具,被命名為個人信息因素(Personal Information Factor,簡稱PIF),可評估任意數(shù)據(jù)集內(nèi)的個人數(shù)據(jù)風(fēng)險(xiǎn),建立起有針對性的高效保護(hù)機(jī)制。
傳統(tǒng)上,這類評估往往由領(lǐng)先的數(shù)據(jù)與隱私專家進(jìn)行。如今,專家們可以使用計(jì)算機(jī)模型快速驗(yàn)證數(shù)據(jù)敏感性評估結(jié)果。
自2020年以來,澳大利亞國家科學(xué)機(jī)構(gòu)一直與本國網(wǎng)絡(luò)安全合作研究中心(CSCRC)合作探索增強(qiáng)這款工具的方法。
01 使用復(fù)雜的數(shù)據(jù)分析算法
PIF工具使用了一種復(fù)雜的數(shù)據(jù)分析算法,對數(shù)據(jù)集敏感信息的還原風(fēng)險(xiǎn)(已脫敏的個人信息是否還能與實(shí)際所有者重新匹配起來)做出評估。
自2020年3月以來,新南威爾士州政府一直使用這款工具的早期版本對州內(nèi)的COVID-19疫情傳播數(shù)據(jù)集進(jìn)行跟蹤,旨在保證數(shù)據(jù)內(nèi)容公開發(fā)布前得到適當(dāng)保護(hù)。
新南威爾士州政府首席數(shù)據(jù)科學(xué)家Ian Oppermann博士表示,“目前,PIF工具的作用可以說是獨(dú)一無二。它經(jīng)歷了長期的合作與發(fā)展,源自各州、聯(lián)邦政府以及行業(yè)從業(yè)者們的不懈努力。”
“每一天,它都在幫助我們對新南威爾士州民眾的匿名COVID-19感染數(shù)據(jù)集進(jìn)行安全性與隱私風(fēng)險(xiǎn)評估。在它的幫助下,我們能夠在公開發(fā)布數(shù)據(jù)內(nèi)容之前,將敏感信息還原風(fēng)險(xiǎn)降至最低水平?!?/p>
Oppermann博士還提到,COVID-19進(jìn)一步增強(qiáng)了公眾對于數(shù)據(jù)隱私需求的認(rèn)識。
Oppermann博士指出,“考慮到社區(qū)對于不斷增長的COVID-19病例的強(qiáng)烈關(guān)注,我們需要在細(xì)粒度層級上及時發(fā)布關(guān)鍵信息,詳細(xì)介紹何時、何處確認(rèn)了新的COVID-19病例。這項(xiàng)工作要求我們在疫情流行初期推理出可能的感染原因,并確認(rèn)感染者的年齡范圍?!?/strong>
“我們希望相關(guān)數(shù)據(jù)盡可能詳盡精準(zhǔn),同時切實(shí)保護(hù)與這些數(shù)據(jù)集相關(guān)的個人隱私與身份信息。”
02 數(shù)據(jù)去身份化方法可進(jìn)一步提高隱私水平
澳大利亞國家科學(xué)機(jī)構(gòu)Data61項(xiàng)目首席研究員兼高級研究科學(xué)家Sushmita Ruj博士表示,新的數(shù)據(jù)去身份化方法有望進(jìn)一步提高隱私水平,并保證個人私密數(shù)據(jù)得到嚴(yán)格保護(hù)。
Ruj博士提到,“在研究了多種隱私指標(biāo)之后,研究小組決定采取一種統(tǒng)一的衡量方法,用于評估對特定數(shù)據(jù)成功進(jìn)行身份還原的風(fēng)險(xiǎn)水平?!?/p>
“PIF一直在探索新的方法,考慮如何消除各類能夠?qū)崿F(xiàn)身份還原的攻擊方法,并據(jù)此對不同數(shù)據(jù)集采用量身定制的保護(hù)手段。以此為基礎(chǔ),該工具將為各個數(shù)據(jù)集做出一項(xiàng)PIF評分。”
如果PIF高于所需的閾值,則程序?qū)⑻岢鋈绾翁岣呖蚣馨踩健⒆C明數(shù)據(jù)集可以安全公開發(fā)布的相關(guān)建議。
澳大利亞網(wǎng)絡(luò)安全合作研究中心研究主任Helge Janicke教授表示,最重要的目標(biāo)是在信息共享需求與保護(hù)隱私之間找到平衡點(diǎn)。Janicke教授提到,“在PIF的幫助下,各方可以充分了解風(fēng)險(xiǎn)水平,這無疑補(bǔ)充了相關(guān)工具領(lǐng)域的空白。”
“數(shù)據(jù)分析已經(jīng)成為一項(xiàng)廣為人知的技術(shù)方案,但我們以往很難把握共享輸出結(jié)果的具體質(zhì)量。正因?yàn)槿绱?,PIF在根據(jù)指標(biāo)評估關(guān)鍵數(shù)據(jù)共享行為的道德保障與負(fù)責(zé)任水平方面,發(fā)揮著極為重要的作用。借助這項(xiàng)技術(shù),數(shù)據(jù)所有者可以全面評估與數(shù)據(jù)共享相關(guān)的風(fēng)險(xiǎn)與后續(xù)影響?!?/p>
PIF工具還可用于檢查其他有待發(fā)布的數(shù)據(jù)集,比如在COVID-19社交隔離期間收集到的家庭暴力數(shù)據(jù)與公共交通工具使用數(shù)據(jù)。CSIRO Data61與CSCRC將繼續(xù)開發(fā)PIF工具,并規(guī)劃在2022年6月之前進(jìn)入外部推廣階段。