文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.181019
中文引用格式: 楊曉軍,錢(qián)成. 一種基于電流狀態(tài)監(jiān)測(cè)分析的系統(tǒng)自我監(jiān)控管理技術(shù)[J].電子技術(shù)應(yīng)用,2018,44(9):79-81,86.
英文引用格式: Yang Xiaojun,Qian Cheng. A self-monitoring and management technology for systems based on real-time current monitoring and analysis[J]. Application of Electronic Technique,2018,44(9):79-81,86.
0 引言
現(xiàn)代社會(huì)對(duì)信息系統(tǒng)設(shè)備的高可靠性、易測(cè)試性的要求越來(lái)越高,“實(shí)時(shí)、動(dòng)態(tài)、快速、精確”已成為當(dāng)今信息系統(tǒng)的新主題。系統(tǒng)健康管理技術(shù)日益發(fā)展,已成為提高系統(tǒng)高可用性的關(guān)鍵技術(shù)之一[1],其基本思想是對(duì)系統(tǒng)的關(guān)鍵部件狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)測(cè),并基于系統(tǒng)的健康管理知識(shí)庫(kù),進(jìn)行實(shí)時(shí)的自主保障診斷、預(yù)測(cè)與健康管理,從而提高系統(tǒng)的高可用性。
在規(guī)則知識(shí)自動(dòng)挖掘獲取方面,從數(shù)據(jù)中挖掘提取規(guī)則知識(shí)的技術(shù)在很多領(lǐng)域取得了成功應(yīng)用,如:賀林曉利用關(guān)聯(lián)規(guī)則挖掘方法提取變電設(shè)備故障診斷規(guī)則[2];黃常海等人對(duì)船舶事故的因果關(guān)系數(shù)據(jù)進(jìn)行分析挖掘,提取預(yù)測(cè)和控制船舶事故的關(guān)聯(lián)規(guī)則[3]。
電源系統(tǒng)是信息系統(tǒng)的關(guān)鍵部件之一,可以通過(guò)對(duì)電源系統(tǒng)電流的實(shí)時(shí)監(jiān)測(cè)與數(shù)據(jù)挖掘分析,在線實(shí)時(shí)預(yù)測(cè)預(yù)警系統(tǒng)設(shè)備的運(yùn)行狀態(tài),并根據(jù)不同運(yùn)行狀態(tài)對(duì)其進(jìn)行狀態(tài)診斷與保障維護(hù),從而提高系統(tǒng)的高可用性。
本文以提高信息系統(tǒng)的高可用性、易測(cè)試性為目的,采用健康管理的技術(shù)理念,通過(guò)對(duì)一類(lèi)系統(tǒng)的電源系統(tǒng)架構(gòu)改造,增加了電流實(shí)時(shí)狀態(tài)監(jiān)測(cè)與診斷知識(shí)學(xué)習(xí)功能,通過(guò)對(duì)系統(tǒng)設(shè)備啟動(dòng)運(yùn)行中的電流監(jiān)測(cè),實(shí)現(xiàn)了對(duì)運(yùn)行狀態(tài)的在線自診斷,從而給系統(tǒng)的維護(hù)檢修提供輔助決策支持功能。
1 基于電流狀態(tài)監(jiān)測(cè)分析的自我狀態(tài)監(jiān)測(cè)診斷方法
本文設(shè)計(jì)的自我監(jiān)控診斷系統(tǒng)架構(gòu)如圖1所示。其基本思想如下:對(duì)系統(tǒng)運(yùn)行過(guò)程中的關(guān)鍵狀態(tài)數(shù)據(jù)進(jìn)行實(shí)時(shí)在線監(jiān)測(cè)記錄,保存到歷史數(shù)據(jù)庫(kù)中,并通過(guò)模式識(shí)別、數(shù)據(jù)挖掘等方法,挖掘提取出數(shù)據(jù)中潛在的規(guī)則知識(shí);然后在系統(tǒng)實(shí)際運(yùn)行中,根據(jù)關(guān)鍵狀態(tài)數(shù)據(jù)的實(shí)時(shí)監(jiān)測(cè)值,通過(guò)規(guī)則匹配及時(shí)診斷發(fā)現(xiàn)系統(tǒng)設(shè)備的異常運(yùn)行狀態(tài),進(jìn)行預(yù)警并提出相應(yīng)的系統(tǒng)保障預(yù)案,以便及時(shí)對(duì)系統(tǒng)進(jìn)行維護(hù)保障,從而提高系統(tǒng)的可用性。
供電系統(tǒng)是系統(tǒng)的關(guān)鍵部件之一,系統(tǒng)設(shè)備的不同工作負(fù)荷狀態(tài)往往對(duì)應(yīng)著一定的電流序列值。圖2反映了一個(gè)服務(wù)器設(shè)備在運(yùn)行大型程序、運(yùn)行普通程序、系統(tǒng)空閑時(shí)的電流變化的動(dòng)態(tài)狀態(tài)(采樣頻率為10 Hz)。系統(tǒng)空閑時(shí),電流穩(wěn)定在一個(gè)較小范圍內(nèi);當(dāng)運(yùn)行程序特別是在其運(yùn)行大型程序或處于CPU占用率較高時(shí),電流會(huì)出現(xiàn)明顯上升并至一定峰值高度??梢酝ㄟ^(guò)對(duì)計(jì)算機(jī)設(shè)備電流變化的特征判定計(jì)算機(jī)的當(dāng)前基本工作狀態(tài)。本文即采用對(duì)系統(tǒng)設(shè)備運(yùn)行中電流狀態(tài)的監(jiān)測(cè)與診斷分析的方法來(lái)進(jìn)行系統(tǒng)自我監(jiān)測(cè)診斷。
1.1 電源部件的改進(jìn)
一些老舊系統(tǒng)的供電系統(tǒng)一般不具備電流狀態(tài)在線監(jiān)測(cè)分析功能,為了對(duì)系統(tǒng)電流進(jìn)行實(shí)時(shí)狀態(tài)診斷分析,本文對(duì)現(xiàn)有某系統(tǒng)的電源系統(tǒng)架構(gòu)進(jìn)行改進(jìn),增加了電源參數(shù)監(jiān)控模塊來(lái)實(shí)時(shí)采樣記錄工作設(shè)備的電流數(shù)據(jù),對(duì)記錄的歷史數(shù)據(jù)通過(guò)數(shù)據(jù)聚類(lèi)分類(lèi)算法提取系統(tǒng)設(shè)備各種運(yùn)行模式時(shí)的電流序列模式知識(shí)庫(kù),實(shí)現(xiàn)基于知識(shí)庫(kù)的系統(tǒng)設(shè)備實(shí)時(shí)監(jiān)控自我保障預(yù)警分析。
在系統(tǒng)架構(gòu)中,電源是通過(guò)多個(gè)分線器與不同的工作設(shè)備連接來(lái)提供,原分線器不具備監(jiān)控各工作設(shè)備電流狀態(tài)的功能。為了采集記錄分析各工作設(shè)備的工作電流,本設(shè)計(jì)增加了一個(gè)智能電源記錄分析模塊,如圖3所示,它可以實(shí)時(shí)采集記錄各工作設(shè)備的工作電流值的歷史數(shù)據(jù)。
智能分線器按照10 Hz的采樣頻率對(duì)工作設(shè)備的電流進(jìn)行采樣記錄,并傳輸給診斷分析儀對(duì)數(shù)據(jù)進(jìn)行處理。由診斷分析模塊從歷史數(shù)據(jù)中挖掘系統(tǒng)設(shè)備工作模式的特征知識(shí)庫(kù),并基于實(shí)時(shí)采樣的電流序列,通過(guò)知識(shí)庫(kù)診斷分析系統(tǒng)設(shè)備的運(yùn)行狀態(tài)。
1.2 系統(tǒng)設(shè)備工作模式特征知識(shí)庫(kù)構(gòu)建
從圖2可以看出,設(shè)備的每種工作模式對(duì)應(yīng)著一定的電流特征模式,這里采用下列電流特征模型Mt來(lái)描述系統(tǒng)的不同工作狀態(tài)的模式模型:
對(duì)系統(tǒng)正常運(yùn)行中的歷史數(shù)據(jù)進(jìn)行模式學(xué)習(xí),建立模式知識(shí)庫(kù),當(dāng)實(shí)際運(yùn)行時(shí)的模式與模式庫(kù)中的正常模式匹配度較低時(shí),則預(yù)警設(shè)備維護(hù)人員,并記錄相應(yīng)的異常模式,以輔助設(shè)備維護(hù)人員及時(shí)進(jìn)行設(shè)備維護(hù)保障。
為了獲得較高的歸納能力,這里采用模糊數(shù)學(xué)的模糊值方法來(lái)描述電流的狀態(tài)、窗口的大小。其中,IS表示電流模糊取值為小,IM表示電流模糊取值中,IL表示電流模糊取值為大,IT表示電流模糊取值為特大;WS表示窗口大小取值為小,WM表示窗口大小取值為中,WL表示窗口大小取值為大。相應(yīng)的隸屬度函數(shù)曲線如圖4所示。
采用這種模型,對(duì)于圖2表示的某服務(wù)器工作模式曲線,可以建立如下的系統(tǒng)正常工作模式知識(shí)庫(kù):
學(xué)習(xí)獲得系統(tǒng)工作模式的算法流程如下:
輸入:電流序列數(shù)值ik;
輸出:系統(tǒng)工作模式知識(shí)S。
begin
(1)計(jì)算電流模式窗口Wt:
①當(dāng)|ik-ik-1|較小時(shí),則將k-1時(shí)刻作為Wt的開(kāi)始時(shí)刻;
②當(dāng)|ik-ik-1|較大,且在模式窗口狀態(tài)時(shí),將k時(shí)刻作為窗口Wt的結(jié)束時(shí)刻;
③按照W的模糊隸屬度函數(shù),計(jì)算得出Wt的離散值
(2)統(tǒng)計(jì)Wt窗口內(nèi)系統(tǒng)的電流值:
①去掉Wt窗口的電流狀態(tài)值中的最大、最小值,然后求其平均值iwt;
②根據(jù)電流模糊隸屬度函數(shù)求iwt的模糊值
(3)計(jì)算模式Mt=的支持度Ct:
①累計(jì)Mt的模式數(shù);
②Ct=Mt的模式數(shù)/總模式數(shù)。
(4)由支持度大于閾值的模式組成系統(tǒng)的模式知識(shí)庫(kù)S;
end
1.3 系統(tǒng)工作模式在線自診斷分析
從系統(tǒng)設(shè)備的正常運(yùn)行狀態(tài)下的電流歷史狀態(tài)數(shù)據(jù)中,學(xué)習(xí)建立了系統(tǒng)的正常模式知識(shí)庫(kù)后,就可以根據(jù)電流序列的狀態(tài)模式與知識(shí)庫(kù)中的模式進(jìn)行匹配,不能匹配的模式則為異常模式,或者人工分析判斷為正常時(shí)作為正常模式加入模式庫(kù)。
工作模式自診斷分析算法流程如下:
輸入:電流狀態(tài)值ik,模式知識(shí)庫(kù)S;
輸出:系統(tǒng)工作狀態(tài)。
begin
(1)計(jì)算電流模式窗口Wt的模糊值
(2)統(tǒng)計(jì)Wt窗口內(nèi)系統(tǒng)的電流值模糊狀態(tài)值
(3)計(jì)算系統(tǒng)工作模式知識(shí)庫(kù)中是否含有模式沒(méi)可匹配的模式時(shí),則預(yù)警系統(tǒng)存在異常工作狀態(tài);
end
2 試驗(yàn)分析
利用上述方法,本設(shè)計(jì)對(duì)某系統(tǒng)的無(wú)線通信設(shè)備6個(gè)月的正常運(yùn)行中歷史記錄電流數(shù)據(jù)進(jìn)行了學(xué)習(xí),建立了系統(tǒng)正常無(wú)故障工作狀態(tài)下的工作模式知識(shí)庫(kù)。對(duì)系統(tǒng)中正常運(yùn)行的無(wú)線發(fā)射設(shè)備以頻率10 Hz進(jìn)行電流采樣,通常情況下,在其進(jìn)行對(duì)外話(huà)音或數(shù)據(jù)通信時(shí)可以發(fā)現(xiàn)明顯的電流變化,且每次發(fā)射的電流變化過(guò)程基本一致。在無(wú)線發(fā)射設(shè)備靜默或待機(jī)狀態(tài),電流相對(duì)平穩(wěn),當(dāng)出現(xiàn)話(huà)音通信或定期的數(shù)據(jù)通信時(shí),其電流出現(xiàn)明顯的躍升,該電流變化特征可作為該無(wú)線發(fā)射設(shè)備工作狀態(tài)判定的依據(jù),工作模式知識(shí)數(shù)據(jù)如圖5所示。
在一次無(wú)線網(wǎng)絡(luò)互聯(lián)過(guò)程中發(fā)現(xiàn)數(shù)據(jù)通信中斷。一般情況下需要排查整個(gè)通信鏈路中參與通信的終端設(shè)備、網(wǎng)絡(luò)交換設(shè)備、路由設(shè)備、安防設(shè)備以及無(wú)線通信設(shè)備。在增加了電流數(shù)據(jù)采樣后,系統(tǒng)發(fā)現(xiàn)該無(wú)線通信設(shè)備電流數(shù)據(jù)長(zhǎng)時(shí)間保持在靜默待機(jī)狀態(tài),與以往運(yùn)行路由協(xié)議進(jìn)行周期數(shù)據(jù)發(fā)射模式明顯不同。
根據(jù)系統(tǒng)正常無(wú)故障狀態(tài)下工作模式知識(shí)庫(kù):S={(IS,WM,0.32),(IS,WT,0.28),(IM,WM,0.10),(IM,WT,0.13),(IL,WM,0.17)},對(duì)系統(tǒng)運(yùn)行中工作狀態(tài)進(jìn)行實(shí)時(shí)在線自診斷分析,并檢測(cè)出該無(wú)線通信設(shè)備工作異常狀態(tài)模式(IL,WS),進(jìn)一步對(duì)該異常進(jìn)行機(jī)理分析后,診斷為一電子器件老化故障。
3 結(jié)論
本文基于系統(tǒng)健康管理的思想,以提高系統(tǒng)的自我診斷保障功能為目標(biāo),通過(guò)對(duì)原有電源系統(tǒng)的改造,增加了運(yùn)行電流狀態(tài)實(shí)時(shí)監(jiān)測(cè)記錄功能,可以監(jiān)測(cè)系統(tǒng)設(shè)備運(yùn)行中的電流模式特征;建立了電流模式的特征模型,并通過(guò)歷史數(shù)據(jù)學(xué)習(xí)獲得正常模式知識(shí)庫(kù),根據(jù)實(shí)時(shí)運(yùn)行中的電流模式特征和知識(shí)庫(kù)自我監(jiān)測(cè)診斷,發(fā)現(xiàn)異常運(yùn)行狀態(tài),從而可以及時(shí)針對(duì)相應(yīng)的異常按照相應(yīng)異常預(yù)案進(jìn)行維護(hù)保障,以提高系統(tǒng)維護(hù)的實(shí)時(shí)性,有利于提高系統(tǒng)的高可用性。
參考文獻(xiàn)
[1] 胡蔦慶,胡雷,陳凌,等.裝備健康管理的現(xiàn)狀、未來(lái)與挑戰(zhàn)[J].國(guó)防科技,2015,36(1):10-15.
[2] 賀林曉.基于粗糙集的關(guān)聯(lián)規(guī)則挖掘在變電設(shè)備故障診斷中的應(yīng)用[D].北京:華北電力大學(xué),2015.
[3] 黃常海,高德毅,胡甚平,等.基于Apriori算法的船舶交通事故關(guān)聯(lián)規(guī)則分析[J].上海海事大學(xué)學(xué)報(bào),2014,35(3):18-22.
作者信息:
楊曉軍,錢(qián) 成
(中國(guó)電子科技集團(tuán)第二十八研究所,江蘇 南京210007)