文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.181324
中文引用格式: 劉永梅,杜松懷,盛萬興. 基于AdaBoost算法的剩余電流分類方法[J].電子技術應用,2018,44(12):147-150.
英文引用格式: Liu Yongmei,Du Songhuai,Sheng Wanxing. A residual current classification algorithm based on AdaBoost[J]. Application of Electronic Technique,2018,44(12):147-150.
0 引言
低壓電網(wǎng)中廣泛使用剩余電流保護裝置,用于預防火災,防止人身觸電傷亡事故。剩余電流保護裝置的動作原理主要在于動作整定值的設定,與是否是人體觸電電流,或是設備的啟動電流無直接關系。因此保護裝置會發(fā)生拒動、誤動,也間接造成了設備的投運率低等問題。如何智能判定當前剩余電流的種類是智能剩余電流保護裝置的亟待解決的一個問題。
當前國內(nèi)外的剩余電流檢測方法主要包括神經(jīng)網(wǎng)絡檢測法、最小二乘支持向量機檢測法和基于自適應算法的檢測法。文獻[1]-[5]將小波包變換、能量熵、量子遺傳等技術與人工神經(jīng)網(wǎng)絡相結(jié)合,建立了相關分類模型,為有效識別類型提供了理論支撐。文獻[6]采用最小二乘支持向量機可較為準確地從總漏電電流中識別出生物體觸電電流。文獻[7]基于自適應濾波原理,建立了自適應觸電電流檢測模型,噪聲魯棒性好,能有效消除保護動作死區(qū)。但文獻[1]-[4]的方法主要用于電力系統(tǒng)的故障識別,文獻[5]-[7]的方法主要用于觸電電流的識別。剩余電流保護有別于電力系統(tǒng)故障,同時會受到多樣負荷變化引起的漏電流變化的影響。
上述相關工作表明,針對剩余電流進行分類具有一定的可行性。本文將在現(xiàn)有工作的基礎上,對相關的剩余電流特征等進行構(gòu)建及提取,進而達到對剩余電流類型的預測。
1 剩余電流試驗與數(shù)據(jù)獲取
搭建生物體觸電物理實驗平臺如圖1所示。實驗平臺主要由實驗電源、負載、用戶對地泄漏阻抗、線路對地分布阻抗、觸電支路、故障錄波器和電壓電流互感器組成。實驗平臺的連接關系是采用實驗電源串聯(lián)負載供電,在實驗電源的電流出口處安裝電壓電流互感器,故障錄波器連接電壓電流互感器并讀取其中的觸電電壓電流數(shù)據(jù),觸電支路、線路對地分布阻抗、用戶對地泄漏阻抗的一端接在電壓電流互感器后面與負載中間,另一端接地。其中,采用三相電源作為實驗電源,通過調(diào)壓器向負載直接供電;負載采用實驗箱燈泡負載;以大電阻和電容的并聯(lián)來作為線路對地的絕緣阻抗;觸電支路是采用大電阻和生物體的串聯(lián)來實現(xiàn)的。
通過該觸電實驗平臺,可獲得植物觸電、動物觸電、間接觸電等觸電類型的剩余電流數(shù)據(jù)。典型的一類觸電數(shù)據(jù)可視化如圖2所示。
從該觸電數(shù)據(jù),可以看出典型的觸電數(shù)據(jù)一個時域的具有一定周期性特征的波形,為了對該數(shù)據(jù)進行分類及處理,亟待對該數(shù)據(jù)進行特征提取。為此,本文通過構(gòu)造7種不同的觸電數(shù)據(jù)特征以進行觸電數(shù)據(jù)的分類實驗。
2 特征參數(shù)提取
如上一節(jié)分析,當前的電流可根據(jù)信號的統(tǒng)計量計算原理[8-11]對剩余電流信號均值、標準差、方根幅值、均方根值、峰值、偏度、峰度7個典型時域特征量進行計算,這幾個特征將用于代表原始數(shù)據(jù)從而進行相關分類的操作。
(1)均值
為了表示信號波動能量的整體水平,信號x(t)的離散表達式xi(i=1,2,…,N)均值可以表示為:
均值屬于有量綱特征參數(shù)。均值表示的是信號幅值的算術平均值,那么對應地,絕對平均值則表示信號幅值絕對值的算術平均值,絕對平均值可以表示為:
(2)標準差
為了描述信號偏離中心趨勢μx的波動強度,方差用來表示信號的波動分量,標準差則為方差的正平方根值,屬于有量綱特征參數(shù)。對于有限平穩(wěn)信號x(i),其計算無偏標準差為:
(3)方根幅值
描述信號的波動強度大小,屬于有量綱特征參數(shù)。其表達式為:
(4)均方根值
信號的均方根用來反映信號的振動強度大小,也可以反映信號的能量大小。均方根值是相對于時間的平均,屬于有量綱特征參數(shù),它的表達式如式(5)所示:
同時,信號的均方根值可以通過方差和均值求得:
(5)峰值
峰值是指信號的最大瞬時值,用來反映信號的強度大小,屬于有量綱特征參數(shù),表達式為:
(6)偏度
偏度用來衡量信號相對于其均值的對稱性,定義為:
偏度的值可以為正,可以為負,甚至是無法定義。當分布偏左時,偏度為負值;當分布偏右時,偏度為正值;當分布關于均值對稱時,偏度為零。
(7)峰度
峰度可感知信號中的微小沖擊成分,可以描述分布形態(tài)的陡緩程度,其定義為:
正態(tài)分布的峰度為3,若峰度大于3表明有過度的峰度,峰度小于3則表明峰度不足。
3 基于AdaBoost算法的剩余電流類型識別
3.1 AdaBoost基本原理
AdaBoost是“Adaptive Boosting”(自適應增強)的縮寫,是一種迭代算法[17],在每一輪中加入一個新的弱分類器,直到達到某個預定的足夠小的錯誤率或迭代次數(shù)。每個訓練樣本都被賦予一個權(quán)重,表明它被某個分類器選入訓練集的概率。如果某個樣本點已經(jīng)被準確地分類,那么在構(gòu)造下一個訓練集中,它被選中的概率就被降低;相反,如果某個樣本點沒有被準確地分類,那么它的權(quán)重就得到提高。通過這樣的方式,AdaBoost方法能“聚焦于”那些較難分(更富信息)的樣本上。AdaBoost的自適應性就體現(xiàn)在前一個弱分類器被錯誤分類的樣本的權(quán)值在下次迭代時增大,而正確分類的樣本的權(quán)值會減小,并再次用來訓練下一個弱分類器。通過分析,本文的剩余電流分類問題可映射到AdaBoost的模型。本文通過建立多個特征用于刻畫剩余電流的特點,而后利用AdaBoost模型對剩余電流進行求解。
3.2 面向剩余電流分類的AdaBoost 算法
給定訓練數(shù)據(jù)集:(x1,y1),(x2,y2),…,(xN,yN),其中xi∈X,yi∈Y用于表示訓練樣本的標簽,i=1,2,…,N。其中xi代表本文第二部分的相關特征,yi代表相關分類的情況。最大迭代次數(shù)為T。具體的算法實施步驟如下所示。
(1)初始化訓練數(shù)據(jù)的權(quán)值分布。每個訓練樣本最開始是都被賦予相同的權(quán)值wi=1/N,訓練樣本集的初始權(quán)值分布D1(i)為:
(2)從t=1,2,…,T迭代:
①選取一個當前誤差率最小的弱分類器h作為第t個基本分類器Ht,并計算弱分類器ht:X→{-1,+1},該弱分類器在分布Dt上的誤差為:
在獲得相關的H之后,即可對相關的數(shù)據(jù)進行訓練及模型驗證。
3.3 實驗分析
實驗數(shù)據(jù)有三類:動物觸電數(shù)據(jù)85組、植物觸電數(shù)據(jù)75組、動物間接觸電數(shù)據(jù)120組。每組數(shù)據(jù)有3 000個采樣點,每100 μs采樣一次。得出樣本的7個特征參數(shù)后進行測試。
當訓練集為數(shù)據(jù)集的75%,參數(shù)algorithm為SAMME時,測試集的準確率最高,為0.914,算法的準確率、召回率等結(jié)果如表1所示。
由上表可知當三種觸電數(shù)據(jù)混合時,算法對動物觸電數(shù)據(jù)的分類結(jié)果最好,對植物觸電數(shù)據(jù)的分類結(jié)果最差。
3.4 方法對比
常用的分類算法有SVM、決策樹、隨機森林、貝葉斯分類器、神經(jīng)網(wǎng)絡等,作為對比實驗,本次使用SVM、決策樹、隨機森林進行測試。使用這三種算法在相同數(shù)據(jù)集上測試得到對應的準確率、召回率等結(jié)果如表2所示。
由表2可知,與AdaBoost算法相似,SVM、決策樹、隨機森林三種算法對動物觸電數(shù)據(jù)的分類準確率都很高,對植物觸電數(shù)據(jù)的分類準確率相對較低。在當前數(shù)據(jù)集效果下,AdaBoost的準確率最高。
四種算法分類準確率比較如圖3所示。由圖3可知,四種算法對動物觸電數(shù)據(jù)分類的準確率都比較高而且準確率差別很小;在植物觸電數(shù)據(jù)分類的準確率相對較低而且差別較大。其中AdaBoost對三種數(shù)據(jù)分類的準確率都在80%以上;SVM對植物觸電的分類準確率最低為50%,和隨機猜測的準確率相近。四種算法中,AdaBoost對三種數(shù)據(jù)的分類準確率都比較高,然后是隨機森林、決策樹。
4 結(jié)論
本文通過選取剩余電流中的多個特征作為訓練特征,構(gòu)建了基于AdaBoost的剩余電流分類方法,并對比了隨機森林、SVM等主流的分類算法。實驗表明,AdaBoost 對三種數(shù)據(jù)的分類效果較好,可以調(diào)整后用于實際觸電數(shù)據(jù)的分類,對未來的實際應用有一定的借鑒價值。未來將對AdaBoost的參數(shù)調(diào)整等進行研究,力爭達到更好的效果。
參考文獻
[1] 林圣,何正友,臧天磊,等.基于粗神經(jīng)網(wǎng)絡的輸電線路故障分類方法[J].中國電機工程學報,2010,30(28):72-80.
[2] 李孝全,莊德慧,張強.基于粗糙徑向基神經(jīng)網(wǎng)絡的電網(wǎng)故障診斷新模型[J].電力系統(tǒng)保護與控制,2009,37(18):20-24.
[3] 張舉,王興國,李志雷.小波包能量嫡神經(jīng)網(wǎng)絡在電力系統(tǒng)故障診斷中的應用[J].電網(wǎng)技術,2006,30(5):72-76.
[4] 李東敏,劉志剛,蘇玉香.基于多小波包和人工神經(jīng)網(wǎng)絡的電力系統(tǒng)故障類型識別[J].電力自動化設備,2009,29(1):99-104.
[5] 王金麗,劉永梅,杜松懷,等.基于剩余電流固有模態(tài)能量特征的生物體觸電故障診斷模型[J].農(nóng)業(yè)工程學報,2016,32(29):202-208.
[6] 韓曉慧,杜松懷,蘇娟,等.基于參數(shù)優(yōu)化的最小二乘支持向量機觸電電流檢測方法[J].農(nóng)業(yè)工程學報,2014,30(23):238-245.
[7] 熊曉祎,肖先勇,趙恒.基于自適應算法的觸電事故電流檢測[J].電力系統(tǒng)保護與控制,2017,45(4):139-144.
[8] 王濤,山拜·達拉拜,柳貴東.基于高階統(tǒng)計量的信號特征描述[J].通信技術,2011,44(2):151-154.
[9] 何海平,計時鳴,張利.基于高階統(tǒng)計量的信號分析與處理[J].機電工程,2003,20(5):85-87.
[10] 俞卞章.數(shù)字信號處理(第2版)[M].西安:西北工業(yè)大學出版社,2002.
[11] 張瓊,楊俊安,夏建明.基于偏度的低空目標聲信號盲抽取算法[J].數(shù)據(jù)采集與處理,2011,26(1):69-74.
[12] 杜松懷.電力系統(tǒng)接地技術[M].北京:中國電力出版社,2011.
[13] MITOLO M.Shock hazard in the presence of protective residual-current device[J].IEEE Transactions on Industry Applications,2010,46(4):1552-1557.
[14] Cheng Peng,Yan Han,F(xiàn)an Zhenqi.Design of a residual current circuit breaker IC with anti-interference technique[J].Analog Integr Circ Sig Process,2010,64:199-204.
[15] 李奎,陸儉國,岳大為,等.漏電信號的識別技術及其方法[J].低壓電器,2008(23):1-4.
[16] 蔡志遠,龐佳,陳廷輝.基于剩余電流和漏電阻抗的漏電保護方法的研究[J].電力系統(tǒng)保護與控制,2011,39(12):61-64.
[17] FREUND Y,SCHAPIRE R E.A decision-theoretic generalization of on-line learning and an application to boosting[J].CiteSeerX,1995.
作者信息:
劉永梅1,杜松懷1,盛萬興2
(1.中國農(nóng)業(yè)大學 信息與電氣工程學院,北京100083;2.中國電力科學研究院有限公司,北京100192)