摘 要
大數(shù)據(jù)時代,數(shù)據(jù)泄露事件層出不窮,數(shù)據(jù)安全已經(jīng)成為阻礙大數(shù)據(jù)發(fā)展的主要因素之一。因此,確保大數(shù)據(jù)時代下敏感數(shù)據(jù)的安全尤為重要。針對大數(shù)據(jù)安全所面臨的挑戰(zhàn),提出以數(shù)據(jù)安全治理為中心的安全防護方案,重點從數(shù)據(jù)全生命周期的角度闡述了數(shù)據(jù)流轉(zhuǎn)每個環(huán)節(jié)中的安全風(fēng)險以及防護措施,為大數(shù)據(jù)環(huán)境下敏感數(shù)據(jù)的安全提供全方位的保障。
0 引 言
當(dāng)前大數(shù)據(jù)已經(jīng)融入社會各行各業(yè)中,它對社會經(jīng)濟、教育、醫(yī)療、金融,甚至人們的消費習(xí)慣、思維習(xí)慣都帶來了非常大的轉(zhuǎn)變,充分展現(xiàn)了“世界是平的、溝通一瞬間”,實現(xiàn)了“存儲云共享、交流全息化”。但是我們也要看到,大數(shù)據(jù)是一把雙刃劍,在給我們帶來各種便利的同時,也伴隨著越來越多信息安全問題。比如經(jīng)常接到保險推銷、賣房推銷電話、提供貸款電話、早教班、輔導(dǎo)培訓(xùn)班推薦……這樣的例子比比皆是,給我們的生活帶來了很多困擾。IBM Security 和 Ponemon Institute 發(fā)布的《2018 年數(shù)據(jù)泄露成本分析報告》(如圖1所示),數(shù)據(jù)泄露的平均成本從2017年的362萬美元上升到386萬美元,平均每條失竊記錄的成本從141美元上升為148美元, 數(shù)據(jù)泄露的成本和數(shù)量都在持續(xù)攀升。
圖 1 單條數(shù)據(jù)泄露成本分析
我們不禁要問,這些敏感數(shù)據(jù)是怎么泄露的?特別是近些年,資產(chǎn)的價值從有形的實體資產(chǎn)向無形的數(shù)據(jù)資產(chǎn)轉(zhuǎn)移,數(shù)據(jù)的重要性被不斷提高。這些重要數(shù)據(jù)和個人信息在采集、存儲、傳輸、使用、共享、銷毀過程中的每個環(huán)節(jié)都有泄露風(fēng)險,一旦泄露將造成不可估量的損失,尤其對于政府職能部門,小至騷擾電話、電信詐騙等造成公民個人的經(jīng)濟損失,大到國家政策和宏觀調(diào)控的影響,造成國家利益損害。
國家對重要數(shù)據(jù)安全也越來越重視,一方面,相關(guān)的法律、法規(guī)越來越多,如《網(wǎng)絡(luò)安全法》規(guī)定個人信息是指“以電子或者其他方式記錄的能夠單獨或者與其他信息結(jié)合識別自然人個人身份的各種信息”,明確網(wǎng)絡(luò)運營者處理個人信息的規(guī)則;《互聯(lián)網(wǎng)個人信息安全保護指南》,該指南系首個由公安部牽頭出臺、現(xiàn)行有效且專門針對個人信息安全的文件,納入了網(wǎng)絡(luò)安全等級保護系列標(biāo)準(zhǔn)中的部分管理、技術(shù)要求,適用于通過互聯(lián)網(wǎng)提供服務(wù)的企業(yè),也適用于使用專網(wǎng)或非聯(lián)網(wǎng)環(huán)境控制和處理個人信息的組織或個人;《數(shù)據(jù)安全管理辦法》(征求意見稿)明確要求網(wǎng)絡(luò)運營者通過網(wǎng)站、應(yīng)用程序等產(chǎn)品收集使用個人信息,應(yīng)當(dāng)分別制定并公開收集使用規(guī)則。另一方面,國家不斷提升監(jiān)管力度,公安部召開320會議發(fā)布的《關(guān)于緊急排查整改重要數(shù)據(jù)和公民個人信息泄露安全隱患的通知》,要求各單位做好數(shù)據(jù)安全防護工作,防止數(shù)據(jù)泄露。
1 數(shù)據(jù)安全面臨挑戰(zhàn)
1.1 數(shù)據(jù)流轉(zhuǎn)復(fù)雜化使得數(shù)據(jù)泄露風(fēng)險增大
大數(shù)據(jù)的環(huán)境下,數(shù)據(jù)生命周期增加了共享、交易等環(huán)節(jié),數(shù)據(jù)的流動是“常態(tài)”,數(shù)據(jù)的靜止存儲才是“非常態(tài)”,多環(huán)節(jié)的信息隱性留存,導(dǎo)致數(shù)據(jù)流轉(zhuǎn)追蹤難、控制難。因此在復(fù)雜的流轉(zhuǎn)環(huán)境中,數(shù)據(jù)安全的首要需求是,如何保證國家重要數(shù)據(jù)、企業(yè)機密數(shù)據(jù)以及用戶個人數(shù)據(jù)等敏感數(shù)據(jù)的安全。實施和推進信息系統(tǒng)整合共享等一系列的舉措,海量數(shù)據(jù)資源進一步共享和匯聚,怎樣防止數(shù)據(jù)在使用、流通過程中不被非法復(fù)制、傳播和篡改等泄露行為的發(fā)生,成為又一大挑戰(zhàn)。
1.2 攻擊手段多樣化,傳統(tǒng)安全技術(shù)不足以防護
大數(shù)據(jù)存儲、計算、分析等技術(shù)的發(fā)展,催生出很多新型高級的網(wǎng)絡(luò)攻擊手段,使得傳統(tǒng)的檢測、防御技術(shù)暴露出嚴(yán)重不足,無法有效抵御外界的入侵攻擊。傳統(tǒng)防護通過在網(wǎng)絡(luò)邊界部署防火墻、IPS、IDS 等安全設(shè)備,以流量分析和邊界防護的方式提供保護,而針對大數(shù)據(jù)環(huán)境下的高級可持續(xù)攻擊(APT)通常具有隱蔽性高,感知困難等特點,常規(guī)安全措施基本無法防御。傳統(tǒng)防護體系側(cè)重于單點防護,而大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)攻擊手段及攻擊程序大量增多,導(dǎo)致出現(xiàn)了許多傳統(tǒng)安全防護體系無法應(yīng)對的問題,企業(yè)所面臨的風(fēng)險在不斷增加。
1.3 大數(shù)據(jù)中的用戶個人信息安全問題突出
近年來我國網(wǎng)絡(luò)購物、共享經(jīng)濟、移動支付等數(shù)據(jù)經(jīng)濟發(fā)展迅猛,為廣大民眾提供便捷的服務(wù)。然而,用戶享受便捷服務(wù)的同時也存在著個人信息泄露的風(fēng)險。如淘寶、亞馬遜、京東等各大購物網(wǎng)站都在記錄著用戶的購物習(xí)慣;QQ、微博、電話記錄等竊聽用戶的社交關(guān)系網(wǎng);監(jiān)視系統(tǒng)監(jiān)控著用戶的 Email、聊天記錄、上網(wǎng)記錄等。個人隱私的泄露可能影響到個人的情感、身體以及財物等多個方面。但是在大數(shù)據(jù)時代,基于大數(shù)據(jù)對人們狀態(tài)和行為的預(yù)測也是當(dāng)前面臨的主要威脅。如上所述的各大購物網(wǎng)站記錄人們的購物習(xí)慣,然后基于這些數(shù)據(jù)推測人們的需求,進而進行廣告的推送等,這些行為往往會對人們?nèi)粘I钤斐沈}擾。因此,如何有效保護個人信息的安全,是大數(shù)據(jù)時代面臨的巨大挑戰(zhàn)之一。
2 數(shù)據(jù)安全治理理念
在Gartner 2017安全與風(fēng)險管理峰會上,首次提到數(shù)據(jù)安全治理(Data Scurity Governance)這一概念,定義數(shù)據(jù)安全治理絕不僅僅是一套用工具組合的產(chǎn)品級解決方案,而是從決策層到技術(shù)層,從管理制度到工具支撐,自上而下貫穿整個組織架構(gòu)的完整鏈條,并認(rèn)為數(shù)據(jù)安全治理是新形勢下有效的數(shù)據(jù)安全防護手段。
傳統(tǒng)網(wǎng)絡(luò)安全為信息系統(tǒng)多方設(shè)防,相對于系統(tǒng)內(nèi)的數(shù)據(jù)則屬于靜態(tài)保護,因為防御措施不隨被保護的數(shù)據(jù)本身變化流動,對系統(tǒng)內(nèi)部人員泄露數(shù)據(jù)難以防范,所以是防外不防內(nèi)。大數(shù)據(jù)環(huán)境中,對內(nèi)部竊取、濫用、疏忽等數(shù)據(jù)泄露風(fēng)險有效的數(shù)據(jù)安全防護,關(guān)鍵在于明確哪些數(shù)據(jù)需要防護,各需要什么等級的防護,在此基礎(chǔ)上設(shè)置相應(yīng)的靶向防護策略與落地措施。數(shù)據(jù)安全治理思路如圖2所示,首先通過數(shù)據(jù)分類分級找出需要保護的敏感數(shù)據(jù),然后通過一系列技術(shù)措施盯住這些敏感數(shù)據(jù),無論敏感數(shù)據(jù)在全網(wǎng)什么地方、往哪里流動變化衍生,都能進行精準(zhǔn)的定位、追蹤、告警、阻斷、溯源等,執(zhí)行分類分級的監(jiān)控防護。所以,數(shù)據(jù)安全治理后的落地技術(shù)措施是靶向盯住敏感數(shù)據(jù)并隨之流轉(zhuǎn)變化的動態(tài)監(jiān)控,不分內(nèi)外, 而是全網(wǎng)追蹤、內(nèi)外兼防。
圖 2 數(shù)據(jù)安全治理思路
3 數(shù)據(jù)安全治理流程
數(shù)據(jù)安全治理流程,如圖3 所示。通過對相關(guān)法規(guī)標(biāo)準(zhǔn)的梳理,結(jié)合實際的業(yè)務(wù)場景數(shù)量,對信息系統(tǒng)中的數(shù)據(jù)進行安全性分類分級,制定相應(yīng)的分類分級防護策略、數(shù)據(jù)安全架構(gòu)及組織制度保障,形成對數(shù)據(jù)全生命周期的安全管控,對管控效果定期檢查、審計、評估,建立安全組織架構(gòu)和制度,并將各項安全策略與架構(gòu)落實到全套安全技術(shù)手段和安全服務(wù)措施中,從而實現(xiàn)對敏感信息的細(xì)粒度、全方位靶向監(jiān)控,建立有效的數(shù)據(jù)安全防護體系。
圖 3 數(shù)據(jù)安全治理流程
4 數(shù)據(jù)安全治理落地措施
數(shù)據(jù)安全治理落地措施如圖4所示。包括基于全生命周期的數(shù)據(jù)安全防護、檢查評估措施和安全服務(wù)措施三方面內(nèi)容。
圖 4 數(shù)據(jù)安全治理落地措施
4.1 基于全生命周期的數(shù)據(jù)安全防護
對數(shù)據(jù)生命周期的采集、存儲、傳輸、使用、共享、銷毀等環(huán)節(jié)進行防護,對涉密、重要、個人隱私、業(yè)務(wù)機密、傳播違禁等敏感數(shù)據(jù)執(zhí)行靶向監(jiān)控,實現(xiàn)針對數(shù)據(jù)的分類分級型安全防護。
4.1.1 數(shù)據(jù)采集環(huán)節(jié)
本環(huán)節(jié)主要關(guān)注采集的數(shù)據(jù)是否符合國家法律法規(guī)以及相關(guān)行業(yè)的規(guī)定?是否合規(guī)?并且采集的數(shù)據(jù)中是否存在各種涉密信息、用戶信息和業(yè)務(wù)敏感信息?從繁雜龐大的數(shù)據(jù)中發(fā)現(xiàn)敏感數(shù)據(jù)并進行安全保護,就很有必要對數(shù)據(jù)進行梳理,通過數(shù)據(jù)分類分級和數(shù)據(jù)標(biāo)識,快速準(zhǔn)時地識別出敏感數(shù)據(jù)并開展數(shù)據(jù)跟蹤溯源。
因此,數(shù)據(jù)采集環(huán)節(jié)需要進行針對敏感數(shù)據(jù)分類分級及其來源屬性的標(biāo)記、數(shù)據(jù)來源驗證等操作,以便后期對數(shù)據(jù)的泄露溯源。
4.1.2 數(shù)據(jù)存儲和傳輸環(huán)節(jié)
本環(huán)節(jié)主要關(guān)注:①數(shù)據(jù)的傳輸是否合規(guī)?是否存在高安全域終端向低安全域終端非法傳輸、拷貝機密信息等行為,同時也可能存在非法用戶獲取合法權(quán)限向數(shù)據(jù)中心調(diào)用和查看高密級信息的風(fēng)險;②存儲在數(shù)據(jù)庫和服務(wù)器的數(shù)據(jù)是否存在數(shù)據(jù)泄露的風(fēng)險?
數(shù)據(jù)傳輸存儲環(huán)節(jié)中的數(shù)據(jù)安全防護技術(shù)措施:
?。?)敏感數(shù)據(jù)自動識別技術(shù)
使用自然語言處理、數(shù)據(jù)挖掘和機器學(xué)習(xí)技術(shù)的聚類/分類器,配合機器學(xué)習(xí)自動生成規(guī)則庫,以提高對敏感內(nèi)容識別的準(zhǔn)確率和可靠性。
?。?)敏感數(shù)據(jù)發(fā)現(xiàn)、定位能力
對敏感數(shù)據(jù)定位的策略手段,包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的定位,可以對敏感信息進行定位,如源代碼、技術(shù)文檔、運營資料、政券信息等,實現(xiàn)有效的防護控制。
?。?)權(quán)限管控
根據(jù)文件的重要程度,按照組織架構(gòu)(部門、用戶、項目組等)對文件進行敏感分級授權(quán)管理。如可以對文檔進行分級授權(quán),設(shè)置只讀、打印、修改、再次授權(quán)、閱讀次數(shù)及生命周期等權(quán)限,授權(quán)用戶只能按規(guī)定權(quán)限使用數(shù)據(jù),無法通過屬性修改、內(nèi)容復(fù)制、副本另存等方式越權(quán)使用。
(4)透明加解密
透明加密意味著加密不需要太多的額外管理,主要體現(xiàn)在兩個方面:首先,應(yīng)用程序透明,用戶或者開發(fā)商不需要對應(yīng)用程序做任何改造;其次是加解密透明,對于具備密文訪問權(quán)限的用戶自動進行加解密,對于缺乏密文訪問權(quán)限的用戶拒絕訪問。
?。?)風(fēng)險審計
記錄所有外發(fā)數(shù)據(jù)的行為日志,依據(jù)安全規(guī)則及時發(fā)現(xiàn)異常行為并告警,提高安全人員的響應(yīng)速度,并為事后的審計追溯提供依據(jù)。
?。?)數(shù)據(jù)緩慢泄露防護
統(tǒng)計敏感數(shù)據(jù)在指定時間段內(nèi)的持續(xù)累計泄露行為,并進行響應(yīng)。
4.1.3 數(shù)據(jù)使用環(huán)節(jié)
本環(huán)節(jié)主要關(guān)注如何防控內(nèi)部人員竊密、濫用和疏忽而導(dǎo)致的數(shù)據(jù)泄露風(fēng)險;怎樣防止開發(fā)、測試、分析和運維人員等獲取敏感數(shù)據(jù)。
數(shù)據(jù)使用環(huán)節(jié)安全防護的目標(biāo)是保障數(shù)據(jù)在授權(quán)范圍內(nèi)被訪問、處理,防止數(shù)據(jù)遭竊取、泄露、損毀。為實現(xiàn)這一目標(biāo),在下一代防火墻、防DDoS、漏洞檢測等網(wǎng)絡(luò)安全防護技術(shù)措施外,還需要針對數(shù)據(jù)庫訪問、數(shù)據(jù)庫操作、數(shù)據(jù)第三方共享使用等環(huán)節(jié)和過程進行安全防護。
敏感數(shù)據(jù)脫敏技術(shù)從保護敏感數(shù)據(jù)機密性的角度出發(fā),對敏感數(shù)據(jù)進行模糊化處理,特別是對姓名、手機號碼、身份證件號碼等用戶個人敏感信息,當(dāng)需要查詢原始敏感信息時,需要應(yīng)用進行二次鑒權(quán)。在準(zhǔn)生產(chǎn)區(qū)進行系統(tǒng)的開發(fā)、測試、培訓(xùn)或數(shù)據(jù)挖掘算法驗證時,需要對生產(chǎn)數(shù)據(jù)進行批量脫敏,導(dǎo)入準(zhǔn)生產(chǎn)區(qū)環(huán)境。
4.1.4 數(shù)據(jù)共享環(huán)節(jié)
本環(huán)節(jié)主要關(guān)注如何管控高密級數(shù)據(jù)流向低密級業(yè)務(wù)口;如何將人、設(shè)備的身份權(quán)限對應(yīng)到應(yīng)用、服務(wù)及數(shù)據(jù)的安全級別上。
在大數(shù)據(jù)平臺的安全防護體系中,“零信任”身份權(quán)限控制是必要措施。在數(shù)據(jù)安全性分類分級的基礎(chǔ)上建立完整數(shù)據(jù)鑒權(quán)機制是今日信息安全防御的前沿首選。在信息共享傳輸過程中,需要保證數(shù)據(jù)完整性及可追溯性,可采用電子簽名及時間戳等相關(guān)技術(shù)來實現(xiàn)。另外,數(shù)據(jù)分享系統(tǒng)需要具備數(shù)據(jù)脫敏功能,實現(xiàn)部分敏感信息的脫敏。并且脫敏技術(shù)需要能在分享的大量數(shù)據(jù)中自動掃描發(fā)現(xiàn)敏感信息,實現(xiàn)高效、方便、準(zhǔn)確的信息脫敏。
4.1.5 數(shù)據(jù)銷毀環(huán)節(jié)
本環(huán)節(jié)主要關(guān)注如何監(jiān)控數(shù)據(jù)銷毀合規(guī)性;如何確保剩余敏感信息沒有繼續(xù)存留在數(shù)據(jù)庫、服務(wù)器和終端上;如何防護隱私性數(shù)據(jù)片段被挖掘泄露。
數(shù)據(jù)銷毀環(huán)節(jié)應(yīng)采用數(shù)據(jù)銷毀技術(shù),能夠完全刪除數(shù)據(jù)庫、服務(wù)器和終端上的剩余信息,并且銷毀后需要進行敏感數(shù)據(jù)檢查,以此驗證銷毀結(jié)果,防止部分刪除、邏輯刪除等現(xiàn)象。
4.2 檢查評估措施
4.2.1 敏感信息分類及合規(guī)性檢查
對敏感信息進行分類檢查,如保密檢查、隱私檢查或者敏感檢測等,檢查的內(nèi)容包括涉密信息、國家重要數(shù)據(jù)、業(yè)務(wù)機密信息、個人隱私信息、違禁傳播信息等,并依據(jù)相關(guān)法規(guī)審查這些敏感信息的存儲、傳輸或者使用的合規(guī)性。
4.2.2 風(fēng)險評估
依據(jù)國家有關(guān)部門關(guān)鍵信息基礎(chǔ)設(shè)施安全風(fēng)險評估及信息安全風(fēng)險評估等相關(guān)規(guī)定,對信息系統(tǒng)的信息資產(chǎn)、網(wǎng)絡(luò)威脅、系統(tǒng)脆弱性等方面進行檢測賦值,計算出信息系統(tǒng)的安全風(fēng)險評估值,應(yīng)對監(jiān)管部門檢查,把握信息安全風(fēng)險,及時消除隱患。
4.2.3 動態(tài)審計
依據(jù)國家相關(guān)法規(guī)的規(guī)定,如公共計算機不允許存在含有敏感信息的文檔,對敏感信息進行實時動態(tài)審計,一旦發(fā)現(xiàn)不合規(guī)行為,則按照預(yù)先設(shè)定的方式進行響應(yīng)(報警提示、記錄日志等),為防止或追查可能的泄密行為提供證據(jù)。
4.2.4 態(tài)勢分析
對各類敏感信息檢查及風(fēng)險評估結(jié)果進行統(tǒng)計分析,并可視化呈現(xiàn)敏感信息分布與走勢及信息安全風(fēng)險態(tài)勢。
4.3 安全服務(wù)措施
在對用戶提供法規(guī)與數(shù)據(jù)安全治理咨詢的基礎(chǔ)上,提供相應(yīng)的專業(yè)安全服務(wù),包括安全運維、應(yīng)急響應(yīng)、安全檢查與巡查、滲透測試、安全情報及安全培訓(xùn)等。
5 結(jié) 語
大數(shù)據(jù)的到來為我們的日常生活與工作帶來巨大的便利,同時更是受到各個領(lǐng)域前所未有的關(guān)注。在大數(shù)據(jù)時代,確保重要數(shù)據(jù)不被泄露已成為人們首要關(guān)注的問題。通過對大數(shù)據(jù)環(huán)境中存在的安全挑戰(zhàn)進行分析,并且從數(shù)據(jù)安全治理的角度,提出基于數(shù)據(jù)全生命周期的數(shù)據(jù)安全防護方案以及相關(guān)技術(shù)措施,該方案能夠適用于不同行業(yè)數(shù)據(jù)安全防護需求,確保敏感數(shù)據(jù)的安全。