《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 設(shè)計(jì)應(yīng)用 > 基于改進(jìn)Stacking集成分類算法的用戶用電信息異常識別
基于改進(jìn)Stacking集成分類算法的用戶用電信息異常識別
2023年電子技術(shù)應(yīng)用第8期
閆相偉,宋國壯,劉怡豪
(重慶郵電大學(xué) 通信與信息工程學(xué)院,重慶 400065)
摘要: 隨著電力用戶信息采集系統(tǒng)的發(fā)展,更豐富的用戶用電信息被用于用戶用電信息異常的識別。基于FDI攻擊進(jìn)行虛假數(shù)據(jù)注入,構(gòu)造用戶用電信息異常數(shù)據(jù)集,并提出了一種基于召回率的改進(jìn)Stacking集成分類算法。該算法采用K-近鄰算法(k-Nearest Neighbors,KNN)、隨機(jī)森林模型(Random Forests,RF)、支持向量機(jī)(Support Vector Machine,SVM)以及梯度決策樹(Gradient Boosting Decision Tree,GBDT)作為Stacking結(jié)構(gòu)的基分類模型;采用邏輯回歸(Logistic Regression,LR)作為Stacking結(jié)構(gòu)的元分類模型。并基于召回率為基分類模型的輸出結(jié)果進(jìn)行權(quán)值賦值,從而作為元分類模型的輸入數(shù)據(jù)集。通過實(shí)驗(yàn)驗(yàn)證,所提的基于召回率的改進(jìn)Stacking集成分類算法相比于傳統(tǒng)Stacking集成分類算法擁有更高效的分類性能。
中圖分類號:TP3-0 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.223699
中文引用格式: 閆相偉,宋國壯,劉怡豪. 基于改進(jìn)Stacking集成分類算法的用戶用電信息異常識別[J]. 電子技術(shù)應(yīng)用,2023,49(8):13-18.
英文引用格式: Yan Xiangwei,Song Guozhuang,Liu Yihao. Abnormal identification of user electricity consumption information based on improved stacking integrated classification algorithm[J]. Application of Electronic Technique,2023,49(8):13-18.
Abnormal identification of user electricity consumption information based on improved stacking integrated classification algorithm
Yan Xiangwei,Song Guozhuang,Liu Yihao
(School of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China)
Abstract: With the development of power user information collection system, richer user electricity consumption information is used for the identification of user electricity consumption information anomalies. In this paper, a false data injection based on the FDI attack is performed to construct a dataset of user electricity consumption information anomalies, and an improved stacking integrated classification algorithm based on recall is proposed. K-nearest neighbors algorithm (KNN), random forest model (RF), support vector machine (SVM) and gradient decision tree (GBDT) are used as the scheme of base classification model of the stacking structure. Logistic regression (LR) is used as a meta-classification model of the stacking structure. The output of the basic classification model is weighted based on the recall rate, which is used as the input data set of the meta-classification model. The proposed improved stacking classification algorithm based on recall is shown to be more efficient than the traditional stacking classification algorithm.
Key words : user electricity consumption information;anomaly identification;improved stacking integrated classification algorithm;FDI

0 引言

近年來,隨著電力用戶信息采集系統(tǒng)的發(fā)展和普及,積累了大量高價(jià)值的用戶用電數(shù)據(jù)[1-2]。針對因?yàn)橹悄茈姳硪蜃匀徊豢煽沽?dǎo)致的損壞、用戶惡意篡改或通信網(wǎng)絡(luò)受到攻擊而導(dǎo)致的用戶用電信息異常,建立高效的異常識別模型,減少人力排查工作量,降低經(jīng)濟(jì)損失,被愈發(fā)重視[3]。

在現(xiàn)有的基于機(jī)器學(xué)習(xí)的用電信息異常檢測中,多數(shù)學(xué)者傾向于通過提取樣本的特征,利用機(jī)器學(xué)習(xí)模型挖掘出特征與標(biāo)簽之間隱藏的規(guī)律[4]。文獻(xiàn)[5]提出了DT與SVM的組合模型,將DT的輸出用來訓(xùn)練SVM分類器,達(dá)到了比較理想的結(jié)果。為了突破單一機(jī)器學(xué)習(xí)模型分類性能上限低的情況,文獻(xiàn)[6]提出了基于ISSA-RF的集成學(xué)習(xí)方法,有效提高了異常檢測的準(zhǔn)確性。文獻(xiàn)[7]基于Stacking集成學(xué)習(xí)策略,按時(shí)間多維度拆解用戶日用電量指標(biāo),驗(yàn)證了所提模型的有效性。

基于Stacking集成分類算法,文中提出用電信息異常檢測框架。以異常產(chǎn)生原因緊密相關(guān)的電氣指標(biāo)為基礎(chǔ),通過6種FDI攻擊方式生成異常數(shù)據(jù)集并提取特征,通過實(shí)驗(yàn)驗(yàn)證了Stacking集成分類算法效果高于單個(gè)基分類器。并且提出了一種基于召回率的改進(jìn)Stacking集成分類算法,通過實(shí)驗(yàn)證明了其有效提升了傳統(tǒng)Stacking集成分類算法的分類性能。



本文詳細(xì)內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000005496




作者信息:

閆相偉,宋國壯,劉怡豪

(重慶郵電大學(xué) 通信與信息工程學(xué)院,重慶 400065)

微信圖片_20210517164139.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。