文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.01.003
引用格式: 黃冠杰. 基于Canopy-Kmeans算法的電力企業(yè)流量數(shù)據(jù)分析研究[J].信息技術(shù)與網(wǎng)絡(luò)安全,2022,41(1):18-22.
0 引言
隨著信息化與工業(yè)化的深度融合,各式各樣的信息系統(tǒng)得到了廣泛應(yīng)用,信息安全問題不斷涌現(xiàn),關(guān)于信息網(wǎng)絡(luò)的攻防戰(zhàn)也愈演愈烈。近幾年,國際上不法組織頻繁攻擊電力企業(yè),層出不窮的網(wǎng)絡(luò)攻擊可能會導(dǎo)致系統(tǒng)出現(xiàn)故障,造成網(wǎng)絡(luò)癱瘓,嚴(yán)重時造成大范圍較長時間的電網(wǎng)故障,產(chǎn)生巨大影響和危害。電力系統(tǒng)作為現(xiàn)代社會的關(guān)鍵信息基礎(chǔ)設(shè)施之一,其產(chǎn)生的大量業(yè)務(wù)數(shù)據(jù)及操作數(shù)據(jù),也就自然成為了網(wǎng)絡(luò)攻擊的重點(diǎn)目標(biāo)[1]。建立健全的電力數(shù)據(jù)分析體系,助力電力企業(yè)識別異常流量,保障電力數(shù)據(jù)安全迫在眉睫。
目前已有部分企業(yè)和專家針對電力數(shù)據(jù)的網(wǎng)絡(luò)安全進(jìn)行了研究,高翔[2]等人采用灰色關(guān)聯(lián)分析和支持向量機(jī)算法對電力信息系統(tǒng)網(wǎng)絡(luò)安全進(jìn)行態(tài)勢評估;李群[3]等人提出一種基于“聚類+分類”的惡意攻擊檢測方法,對流量預(yù)處理結(jié)果進(jìn)行聚類,基于CART決策樹對攻擊簇實(shí)現(xiàn)分類;高鵬[4]等人采用國產(chǎn)密碼、量子密鑰分發(fā)和區(qū)塊鏈技術(shù)對電力終端和數(shù)據(jù)進(jìn)行保護(hù);劉川[5]等人基于云計算平臺和SDN技術(shù)搭建了一體化電力數(shù)據(jù)安全防護(hù)框架,用于身份認(rèn)證、攻擊防范、入侵檢測。
但目前大部分電力企業(yè)對于收集到的流量數(shù)據(jù)的挖掘和綜合分析明顯還不夠。若要合理地進(jìn)行數(shù)據(jù)分析并分類治理,首先要做到電力企業(yè)流量數(shù)據(jù)的充分采集,通過對采集到的數(shù)據(jù)進(jìn)行ETL(Extract-Transform-Load,抽取-轉(zhuǎn)換-加載)、挖掘和分析[6-7],最終將分析結(jié)果應(yīng)用于實(shí)際安全運(yùn)維中,做到精準(zhǔn)治理。本文以某電力企業(yè)的實(shí)際運(yùn)行環(huán)境為例,首先簡述本文所需的流量數(shù)據(jù)的數(shù)據(jù)來源及采集方式,得到其各業(yè)務(wù)系統(tǒng)下已有的網(wǎng)絡(luò)安全設(shè)備中的流量數(shù)據(jù),然后分別利用傳統(tǒng)K-means算法與Canopy-Kmeans算法進(jìn)行流量數(shù)據(jù)聚類分析,挖掘出攻擊流量與業(yè)務(wù)流量的特征項,并排除部分誤報信息。本研究對合理開展網(wǎng)絡(luò)安全防護(hù)工作具有指導(dǎo)意義。
本文詳細(xì)內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000003931。
作者信息:
黃冠杰
(對外經(jīng)濟(jì)貿(mào)易大學(xué) 統(tǒng)計學(xué)院,北京100105)