文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.032
0 引言
數(shù)據(jù)安全是信息安全的關(guān)鍵環(huán)節(jié)。在當(dāng)今大數(shù)據(jù)技術(shù)和互聯(lián)網(wǎng)飛速發(fā)展的時代,數(shù)據(jù)是推動國家經(jīng)濟(jì)與社會發(fā)展的重要戰(zhàn)略資源。在電力行業(yè)領(lǐng)域,隨著信息技術(shù)的深入應(yīng)用,尤其是用電采集、SCADA等系統(tǒng)的應(yīng)用,業(yè)務(wù)數(shù)據(jù)量呈爆炸式增長,數(shù)據(jù)中蘊藏的巨大商業(yè)價值被逐步挖掘出來,同時也帶來了巨大的安全挑戰(zhàn)——個人隱私信息的保護(hù)。2017年6月,《中華人民共和國網(wǎng)絡(luò)安全法》正式實施,其中對個人信息的保護(hù)做了明確規(guī)定,網(wǎng)絡(luò)運營者應(yīng)當(dāng)采取技術(shù)措施和其他必要措施,確保其收集的個人信息安全,防止信息泄露、毀損、丟失。
由于非線性數(shù)據(jù)量巨大,數(shù)據(jù)關(guān)系錯綜復(fù)雜,傳統(tǒng)的安全手段難以提供完善的保障,攻擊者可通過大數(shù)據(jù)技術(shù)還原信息、竊取隱私。因此,針對大數(shù)據(jù)應(yīng)用建設(shè)過程中的安全問題,根據(jù)實際情況制定特有的數(shù)據(jù)脫敏規(guī)則加以保障,對提高電力大數(shù)據(jù)安全應(yīng)用具有重要意義。
1 電力大數(shù)據(jù)脫敏策略研究
電力大數(shù)據(jù)的應(yīng)用場景主要有重過載預(yù)測、日用電負(fù)荷預(yù)測、設(shè)備事故關(guān)聯(lián)分析、精準(zhǔn)客戶服務(wù)、業(yè)務(wù)工單分析等,涉及用戶數(shù)據(jù)、工單數(shù)據(jù)、流程數(shù)據(jù)、用電數(shù)據(jù)、設(shè)備數(shù)據(jù)等。為了保護(hù)客戶隱私數(shù)據(jù),提高電力信息安全,需要對重要數(shù)據(jù)進(jìn)行脫敏。
數(shù)據(jù)脫敏又叫數(shù)據(jù)漂白或者數(shù)據(jù)去隱私化,通過一定的規(guī)則,對某些重要信息進(jìn)行數(shù)據(jù)的變形,以實現(xiàn)對重要隱私數(shù)據(jù)的可靠保護(hù)。比如個人身份識別數(shù)據(jù)(personal identifiable data)、個人重要數(shù)據(jù)(personal sensitive data)和商業(yè)重要數(shù)據(jù)等,必須經(jīng)過脫敏后才能使用,尤其是在大數(shù)據(jù)應(yīng)用的開發(fā)測試階段。經(jīng)過數(shù)據(jù)脫敏后的數(shù)據(jù),就可以在規(guī)定的授權(quán)環(huán)境中使用。
在電力行業(yè)中,重要數(shù)據(jù)主要包括兩方面,一是工作中各業(yè)務(wù)系統(tǒng)的運行數(shù)據(jù),包括內(nèi)部郵件、組織架構(gòu)、業(yè)務(wù)流程數(shù)據(jù)、各類工單數(shù)據(jù)、現(xiàn)場工作票數(shù)據(jù)、各類電表儀器實時量測數(shù)據(jù)等;二是客戶的個人信息,包括個人客戶的姓名、性別、年齡、住址、手機(jī)號、身份證號、銀行賬號等,單位客戶的名稱、地址、行業(yè)等。
本文通過研究一種自適用于電力大數(shù)據(jù)應(yīng)用的數(shù)據(jù)脫敏手段,自適應(yīng)于電力大數(shù)據(jù)場景中的數(shù)據(jù)脫敏分類,精準(zhǔn)定位電力業(yè)務(wù)重要數(shù)據(jù),從而實現(xiàn)電力業(yè)務(wù)數(shù)據(jù)的多層次安全防護(hù)。
2 重點內(nèi)容及創(chuàng)新點
電力大數(shù)據(jù)脫敏的最大難點在于電力大數(shù)據(jù)不同業(yè)務(wù)場景下的數(shù)據(jù)安全(隱私保護(hù))和數(shù)據(jù)信息價值兩者之間的平衡,因此,電力大數(shù)據(jù)應(yīng)用建設(shè)中的重要數(shù)據(jù)保護(hù)需要在保護(hù)數(shù)據(jù)安全的基礎(chǔ)上更好地展現(xiàn)大數(shù)據(jù)的業(yè)務(wù)應(yīng)用價值,從而為電力事業(yè)提供更高水平的服務(wù)。
2.1 脫敏規(guī)則遵循原則
(1)數(shù)據(jù)可用性需求:要求脫敏后的數(shù)據(jù)能夠滿足各業(yè)務(wù)部門的大數(shù)據(jù)應(yīng)用需求。如分析用戶用電習(xí)慣,需要保留完整戶號信息、用戶電量信息,戶號作為用戶在電力系統(tǒng)里的唯一標(biāo)記,可在電力系統(tǒng)里作為基礎(chǔ)查詢標(biāo)識。而用戶姓名、性別、地址、聯(lián)系方式可以隱私數(shù)據(jù)可以脫敏展示。
(2)數(shù)據(jù)的邏輯關(guān)聯(lián):為滿足大數(shù)據(jù)的分析邏輯特征、統(tǒng)計分布特征,對于復(fù)雜的業(yè)務(wù),需要保留各種數(shù)據(jù)之間的關(guān)聯(lián)性。如工單數(shù)據(jù)分析,需要保留工單信息、客戶信息、內(nèi)部流程信息等數(shù)據(jù)之間的關(guān)聯(lián)性。
(3)數(shù)據(jù)可重現(xiàn)性:采用相同規(guī)則和參數(shù)配置,相同源數(shù)據(jù)脫敏后的數(shù)據(jù)必須保持一致。
(4)脫敏規(guī)則可配置:可以結(jié)合應(yīng)用需求和隱私保護(hù)的需要,動態(tài)配置脫敏規(guī)則及相關(guān)處理方法,從而滿足各種不同業(yè)務(wù)應(yīng)用的需要。
2.2 數(shù)據(jù)脫敏分類分級方法
在電力行業(yè)的大數(shù)據(jù)應(yīng)用建設(shè)過程中,因為數(shù)據(jù)的多樣性以及生產(chǎn)、營銷等應(yīng)用各自的分析側(cè)重點不同,對數(shù)據(jù)脫敏細(xì)分提出了更高要求?;陔娏Υ髷?shù)據(jù)場景數(shù)據(jù)安全(隱私保護(hù))和數(shù)據(jù)信息價值的共同追求,遵循以上數(shù)據(jù)脫敏規(guī)則,結(jié)合電網(wǎng)業(yè)務(wù)數(shù)據(jù)的實際情況,根據(jù)不同的應(yīng)用場景,按用戶編號、客戶姓名、電話號碼、用電地址、身份證號等不同類別進(jìn)行數(shù)據(jù)脫敏,并將數(shù)據(jù)脫敏工作按不同的數(shù)據(jù)類型分為三個等級,從一級到三級安全等級依次降低,從而實現(xiàn)了基于多層次安全等級防護(hù)的電力大數(shù)據(jù)應(yīng)用建設(shè)。
下面就用戶編號、客戶姓名、電話號碼、用電地址、身份證號等不同類別數(shù)據(jù)進(jìn)行等級劃分,具體舉例說明:
2.3 建立電力大數(shù)據(jù)脫敏管理平臺
電力大數(shù)據(jù)脫敏管理平臺及應(yīng)用架構(gòu)分別如圖1、圖2所示。
根據(jù)數(shù)據(jù)脫敏的規(guī)則以及本文提出的分類分級脫敏的設(shè)定,設(shè)計適用于電力大數(shù)據(jù)的數(shù)據(jù)脫敏機(jī)制:
(1)源數(shù)據(jù)層:電力大數(shù)據(jù)來源于電力系統(tǒng)內(nèi)部各系統(tǒng)的數(shù)據(jù),主要包括用戶數(shù)據(jù)、工單數(shù)據(jù)、流程數(shù)據(jù)、用電數(shù)據(jù)、設(shè)備數(shù)據(jù)等。
(2)脫敏處理:根據(jù)脫敏規(guī)則選取相應(yīng)的脫敏算法,將原始數(shù)據(jù)進(jìn)行拆分和脫敏存儲,并遵循設(shè)定的分級脫敏規(guī)則,對于重要數(shù)據(jù)進(jìn)行分級脫敏并分別存儲,形成數(shù)據(jù)中間庫。
(3)脫敏中間庫存儲:中間庫重要數(shù)據(jù)采用單獨字段分級脫敏存儲,保證數(shù)據(jù)存儲的安全性。同時中間庫的應(yīng)用也有助于提高系統(tǒng)的工作效率。
(4)脫敏數(shù)據(jù)服務(wù):根據(jù)應(yīng)用場景需求分析所要展示的數(shù)據(jù)及數(shù)據(jù)之間的關(guān)聯(lián)特性,并分析數(shù)據(jù)是否需要脫敏,自動識別脫敏的級別,從中間庫提取相關(guān)數(shù)據(jù)。如張三豐->張先生->張**->張*,某某某指揮部-> ***。系統(tǒng)同時進(jìn)行數(shù)據(jù)的校驗,符合數(shù)據(jù)安全規(guī)則的交由應(yīng)用層進(jìn)行相關(guān)展示。
(5)電力大數(shù)據(jù)應(yīng)用:根據(jù)各業(yè)務(wù)部門的需求,電力大數(shù)據(jù)的應(yīng)用場景主要有業(yè)務(wù)工單分析、精準(zhǔn)客戶服務(wù)、用電行為分析、設(shè)備故障管理分析、用電負(fù)荷預(yù)測。
采用本文的數(shù)據(jù)脫敏機(jī)制,在保證數(shù)據(jù)安全的基礎(chǔ)上,根據(jù)數(shù)據(jù)重要度不同的分級制度能夠更好地滿足業(yè)務(wù)場景應(yīng)用。如進(jìn)行業(yè)務(wù)工單的重復(fù)致電分析,需要展示的數(shù)據(jù)是電話號碼、戶號、姓名、地址、致電次數(shù)、關(guān)聯(lián)工單等。采用本方法的分級脫敏規(guī)則,電話號碼作為展示主體,采用三級脫敏,保留主要特征。戶號作為系統(tǒng)唯一標(biāo)記不脫敏。用戶姓名、身份證、地址信息采用二級脫敏,保證用戶隱私。即保證了大數(shù)據(jù)應(yīng)用的直觀展示,同時業(yè)務(wù)部門在系統(tǒng)中有據(jù)可查、有效處理,又保護(hù)了用戶的隱私,避免了數(shù)據(jù)安全風(fēng)險。
2.4 應(yīng)用實例介紹
以營銷服務(wù)工單熱詞分析場景為例,涉及的業(yè)務(wù)數(shù)據(jù)有全量工單數(shù)據(jù)、客戶基本信息數(shù)據(jù)、接入點信息數(shù)據(jù)、接入點計量表信息數(shù)據(jù)、計量表讀數(shù)數(shù)據(jù)、氣象數(shù)據(jù),這些原始數(shù)據(jù)有數(shù)據(jù)量大、數(shù)據(jù)形態(tài)多樣性等特點,具體情況如下表:
3 結(jié)論
數(shù)據(jù)脫敏是電力行業(yè)信息化應(yīng)用中的一個環(huán)節(jié),現(xiàn)有的脫敏方法既要滿足大數(shù)據(jù)價值分析應(yīng)用的需要,也要遵從整體信息安全治理的要求。本文研究了電力大數(shù)據(jù)典型應(yīng)用場景下的數(shù)據(jù)脫敏分級分類方法,通過電力大數(shù)據(jù)脫敏管理平臺實現(xiàn)電力業(yè)務(wù)數(shù)據(jù)內(nèi)容、性質(zhì)及應(yīng)用場景的自適應(yīng)脫敏,分級分類脫敏,并對數(shù)據(jù)脫敏的框架提出建議及具體的脫敏執(zhí)行方案,在保護(hù)用戶隱私、保證數(shù)據(jù)安全的前提下,滿足各業(yè)務(wù)單位、數(shù)據(jù)歸口單位、科技信息等部門大數(shù)據(jù)成果應(yīng)用需求。
參考文獻(xiàn)
[1] 張沛,楊華飛,許元斌.電力大數(shù)據(jù)及其在電網(wǎng)公司的應(yīng)用[J].中國電機(jī)工程學(xué)報,2014,34(增刊):85-92.
[2] 彭小圣,鄧迪元,程時杰,等.面向智能電網(wǎng)應(yīng)用的電力大數(shù)據(jù)關(guān)鍵技術(shù)[J].中國電機(jī)工程學(xué)報,2015,34(3):503-511.
[3] 張沛,和怡,張大海,等.電力大數(shù)據(jù)應(yīng)用的判斷原則[J].電力建設(shè),2017,38(5):85-90.
[4] Datamasker. Data masking:what you need to know[J].A Net 2000 Ltd.White Paper, 2016.
[5] CHOUDRY B. Masking the data on cloud[J].International Journal of Advances in Computing, 2012,1(04):388—390.
[6] CASTELLANOS M, Zhang BaimenezI,et al. Data desensitization of customer data for use in optimizer performance experiments[M].IEEE International Conference on Data Engineering, 2010:1081-1092.
[7] Gartner.Gartner 2014 Magic Quadrant Data Masking Report[R].2015.
[8] 王繼業(yè).智能電網(wǎng)大數(shù)據(jù)[M].北京:中國電力出版社.
作者信息:
黃凌宇1,叢中方1,趙 城2,葉紅星2,張豹鋒2
(1. 山東文登抽水蓄能有限公司,山東 威海264200;2. 北京易用視點科技有限公司,北京100144)