《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 基于Canopy-Kmeans算法的電力企業(yè)流量數(shù)據(jù)分析研究
基于Canopy-Kmeans算法的電力企業(yè)流量數(shù)據(jù)分析研究
信息技術(shù)與網(wǎng)絡(luò)安全 1期
黃冠杰
(對外經(jīng)濟(jì)貿(mào)易大學(xué) 統(tǒng)計學(xué)院,北京100105)
摘要: 針對電力企業(yè)關(guān)鍵信息基礎(chǔ)設(shè)施大量業(yè)務(wù)數(shù)據(jù)易遭受網(wǎng)絡(luò)攻擊的現(xiàn)象,基于各業(yè)務(wù)信息系統(tǒng)下已有的網(wǎng)絡(luò)安全設(shè)備,通過輔助設(shè)備采集流量數(shù)據(jù),采用Canopy-Kmeans算法進(jìn)行數(shù)據(jù)分析研究。首先通過實(shí)驗(yàn)證明了Canopy-Kmeans算法在處理流量數(shù)據(jù)時,相比傳統(tǒng)K-means算法,具有更好的聚類效果,準(zhǔn)確率提高約11%;然后以采集到的電力關(guān)鍵業(yè)務(wù)系統(tǒng)的流量數(shù)據(jù)為基礎(chǔ),基于Canopy-Kmeans算法進(jìn)行挖掘分析實(shí)驗(yàn),完成相同類型流量數(shù)據(jù)的聚類,分析出攻擊流量與業(yè)務(wù)流量的特征項,排除部分誤報信息,合理開展網(wǎng)絡(luò)安全防護(hù)工作。
中圖分類號: TP391.1
文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.01.003
引用格式: 黃冠杰. 基于Canopy-Kmeans算法的電力企業(yè)流量數(shù)據(jù)分析研究[J].信息技術(shù)與網(wǎng)絡(luò)安全,2022,41(1):18-22.
Research on electric power enterprise flow data analysis based on Canopy-Kmeans algorithm
Huang Guanjie
(School of Statistics,University of International Business and Economics,Beijing 100105,China)
Abstract: Aiming at the phenomenon that a large number of business data of the key information infrastructure of electric power enterprises are vulnerable to network attacks, based on the existing network security equipment under each business information system, the flow data is collected through auxiliary equipment, and Canopy-Kmeans algorithm is used for data analysis and research. Firstly, through experiments, it is proved that the Canopy-Kmeans algorithm has a better clustering effect than the traditional K-means algorithm when processing flow data, and the accuracy rate is increased by about 11%. Then, the collected flow data of the power key business system is used,mining and analysis experiments are conducted based on the Canopy-Kmeans algorithm to complete the clustering of the same type of traffic data, analyze the characteristic items of attack traffic and business traffic, eliminate some misreporting information, and carry out network security protection work reasonably.
Key words : electricity;flow collection;Canopy-Kmeans;clustering;flow data analysis

0 引言

隨著信息化與工業(yè)化的深度融合,各式各樣的信息系統(tǒng)得到了廣泛應(yīng)用,信息安全問題不斷涌現(xiàn),關(guān)于信息網(wǎng)絡(luò)的攻防戰(zhàn)也愈演愈烈。近幾年,國際上不法組織頻繁攻擊電力企業(yè),層出不窮的網(wǎng)絡(luò)攻擊可能會導(dǎo)致系統(tǒng)出現(xiàn)故障,造成網(wǎng)絡(luò)癱瘓,嚴(yán)重時造成大范圍較長時間的電網(wǎng)故障,產(chǎn)生巨大影響和危害。電力系統(tǒng)作為現(xiàn)代社會的關(guān)鍵信息基礎(chǔ)設(shè)施之一,其產(chǎn)生的大量業(yè)務(wù)數(shù)據(jù)及操作數(shù)據(jù),也就自然成為了網(wǎng)絡(luò)攻擊的重點(diǎn)目標(biāo)[1]。建立健全的電力數(shù)據(jù)分析體系,助力電力企業(yè)識別異常流量,保障電力數(shù)據(jù)安全迫在眉睫。

目前已有部分企業(yè)和專家針對電力數(shù)據(jù)的網(wǎng)絡(luò)安全進(jìn)行了研究,高翔[2]等人采用灰色關(guān)聯(lián)分析和支持向量機(jī)算法對電力信息系統(tǒng)網(wǎng)絡(luò)安全進(jìn)行態(tài)勢評估;李群[3]等人提出一種基于“聚類+分類”的惡意攻擊檢測方法,對流量預(yù)處理結(jié)果進(jìn)行聚類,基于CART決策樹對攻擊簇實(shí)現(xiàn)分類;高鵬[4]等人采用國產(chǎn)密碼、量子密鑰分發(fā)和區(qū)塊鏈技術(shù)對電力終端和數(shù)據(jù)進(jìn)行保護(hù);劉川[5]等人基于云計算平臺和SDN技術(shù)搭建了一體化電力數(shù)據(jù)安全防護(hù)框架,用于身份認(rèn)證、攻擊防范、入侵檢測。

但目前大部分電力企業(yè)對于收集到的流量數(shù)據(jù)的挖掘和綜合分析明顯還不夠。若要合理地進(jìn)行數(shù)據(jù)分析并分類治理,首先要做到電力企業(yè)流量數(shù)據(jù)的充分采集,通過對采集到的數(shù)據(jù)進(jìn)行ETL(Extract-Transform-Load,抽取-轉(zhuǎn)換-加載)、挖掘和分析[6-7],最終將分析結(jié)果應(yīng)用于實(shí)際安全運(yùn)維中,做到精準(zhǔn)治理。本文以某電力企業(yè)的實(shí)際運(yùn)行環(huán)境為例,首先簡述本文所需的流量數(shù)據(jù)的數(shù)據(jù)來源及采集方式,得到其各業(yè)務(wù)系統(tǒng)下已有的網(wǎng)絡(luò)安全設(shè)備中的流量數(shù)據(jù),然后分別利用傳統(tǒng)K-means算法與Canopy-Kmeans算法進(jìn)行流量數(shù)據(jù)聚類分析,挖掘出攻擊流量與業(yè)務(wù)流量的特征項,并排除部分誤報信息。本研究對合理開展網(wǎng)絡(luò)安全防護(hù)工作具有指導(dǎo)意義。


本文詳細(xì)內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000003931。




作者信息:

黃冠杰

(對外經(jīng)濟(jì)貿(mào)易大學(xué) 統(tǒng)計學(xué)院,北京100105)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。