《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 測(cè)試測(cè)量 > 設(shè)計(jì)應(yīng)用 > 一種基于電流狀態(tài)監(jiān)測(cè)分析的系統(tǒng)自我監(jiān)控管理技術(shù)
一種基于電流狀態(tài)監(jiān)測(cè)分析的系統(tǒng)自我監(jiān)控管理技術(shù)
2018年電子技術(shù)應(yīng)用第9期
楊曉軍,錢(qián) 成
中國(guó)電子科技集團(tuán)第二十八研究所,江蘇 南京210007
摘要: 信息系統(tǒng)的高可靠、易測(cè)試是保證其使用效能的重要因素,一些老舊系統(tǒng)受當(dāng)時(shí)技術(shù)發(fā)展的約束,無(wú)法做到易測(cè)試。如何提高這些系統(tǒng)的測(cè)試性從而保障系統(tǒng)的高可用性,是信息系統(tǒng)技術(shù)改造的關(guān)鍵技術(shù)之一。通過(guò)對(duì)一類(lèi)系統(tǒng)的電源系統(tǒng)架構(gòu)改造,增加系統(tǒng)電流實(shí)時(shí)狀態(tài)監(jiān)測(cè)與自我監(jiān)控診斷功能,通過(guò)對(duì)系統(tǒng)中設(shè)備啟動(dòng)運(yùn)行中的電流監(jiān)測(cè),實(shí)現(xiàn)對(duì)系統(tǒng)運(yùn)行狀態(tài)的在線自我狀態(tài)監(jiān)控診斷,從而給系統(tǒng)的維護(hù)檢修提供輔助決策支持功能。該技術(shù)對(duì)于提高系統(tǒng)的精準(zhǔn)維護(hù)與高可用性具有重要意義。
中圖分類(lèi)號(hào): TP311
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.181019
中文引用格式: 楊曉軍,錢(qián)成. 一種基于電流狀態(tài)監(jiān)測(cè)分析的系統(tǒng)自我監(jiān)控管理技術(shù)[J].電子技術(shù)應(yīng)用,2018,44(9):79-81,86.
英文引用格式: Yang Xiaojun,Qian Cheng. A self-monitoring and management technology for systems based on real-time current monitoring and analysis[J]. Application of Electronic Technique,2018,44(9):79-81,86.
A self-monitoring and management technology for systems based on real-time current monitoring and analysis
Yang Xiaojun,Qian Cheng
The 28th Research Institute of China Electronics Technology Group Corporation,Nanjing 210007,China
Abstract: The high reliability and easy testing of the information system are important factors to ensure the efficiency of the information system. Some old systems are constrained by the technological development of the past time, and can not be easily tested. How to improve the testability of these systems so as to ensure the high availability of the system is one of the key technologies for the technical transformation of information systems. In this paper, the power system architecture of a class of systems is transformed to increase the real-time state monitoring, self monitoring and diagnosis function of the system current. By monitoring the current of the equipment in the system, the on-line self state monitoring and diagnosis of the running state of the system is realized. It provides the auxiliary decision support function for the maintenance of the system, which is of great significance to improve the precision maintenance and high availability of the system.
Key words : information system;self-monitoring and management;high availability

0 引言

    現(xiàn)代社會(huì)對(duì)信息系統(tǒng)設(shè)備的高可靠性、易測(cè)試性的要求越來(lái)越高,“實(shí)時(shí)、動(dòng)態(tài)、快速、精確”已成為當(dāng)今信息系統(tǒng)的新主題。系統(tǒng)健康管理技術(shù)日益發(fā)展,已成為提高系統(tǒng)高可用性的關(guān)鍵技術(shù)之一[1],其基本思想是對(duì)系統(tǒng)的關(guān)鍵部件狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)測(cè),并基于系統(tǒng)的健康管理知識(shí)庫(kù),進(jìn)行實(shí)時(shí)的自主保障診斷、預(yù)測(cè)與健康管理,從而提高系統(tǒng)的高可用性。

    在規(guī)則知識(shí)自動(dòng)挖掘獲取方面,從數(shù)據(jù)中挖掘提取規(guī)則知識(shí)的技術(shù)在很多領(lǐng)域取得了成功應(yīng)用,如:賀林曉利用關(guān)聯(lián)規(guī)則挖掘方法提取變電設(shè)備故障診斷規(guī)則[2];黃常海等人對(duì)船舶事故的因果關(guān)系數(shù)據(jù)進(jìn)行分析挖掘,提取預(yù)測(cè)和控制船舶事故的關(guān)聯(lián)規(guī)則[3]。

    電源系統(tǒng)是信息系統(tǒng)的關(guān)鍵部件之一,可以通過(guò)對(duì)電源系統(tǒng)電流的實(shí)時(shí)監(jiān)測(cè)與數(shù)據(jù)挖掘分析,在線實(shí)時(shí)預(yù)測(cè)預(yù)警系統(tǒng)設(shè)備的運(yùn)行狀態(tài),并根據(jù)不同運(yùn)行狀態(tài)對(duì)其進(jìn)行狀態(tài)診斷與保障維護(hù),從而提高系統(tǒng)的高可用性。

    本文以提高信息系統(tǒng)的高可用性、易測(cè)試性為目的,采用健康管理的技術(shù)理念,通過(guò)對(duì)一類(lèi)系統(tǒng)的電源系統(tǒng)架構(gòu)改造,增加了電流實(shí)時(shí)狀態(tài)監(jiān)測(cè)與診斷知識(shí)學(xué)習(xí)功能,通過(guò)對(duì)系統(tǒng)設(shè)備啟動(dòng)運(yùn)行中的電流監(jiān)測(cè),實(shí)現(xiàn)了對(duì)運(yùn)行狀態(tài)的在線自診斷,從而給系統(tǒng)的維護(hù)檢修提供輔助決策支持功能。

1 基于電流狀態(tài)監(jiān)測(cè)分析的自我狀態(tài)監(jiān)測(cè)診斷方法

    本文設(shè)計(jì)的自我監(jiān)控診斷系統(tǒng)架構(gòu)如圖1所示。其基本思想如下:對(duì)系統(tǒng)運(yùn)行過(guò)程中的關(guān)鍵狀態(tài)數(shù)據(jù)進(jìn)行實(shí)時(shí)在線監(jiān)測(cè)記錄,保存到歷史數(shù)據(jù)庫(kù)中,并通過(guò)模式識(shí)別、數(shù)據(jù)挖掘等方法,挖掘提取出數(shù)據(jù)中潛在的規(guī)則知識(shí);然后在系統(tǒng)實(shí)際運(yùn)行中,根據(jù)關(guān)鍵狀態(tài)數(shù)據(jù)的實(shí)時(shí)監(jiān)測(cè)值,通過(guò)規(guī)則匹配及時(shí)診斷發(fā)現(xiàn)系統(tǒng)設(shè)備的異常運(yùn)行狀態(tài),進(jìn)行預(yù)警并提出相應(yīng)的系統(tǒng)保障預(yù)案,以便及時(shí)對(duì)系統(tǒng)進(jìn)行維護(hù)保障,從而提高系統(tǒng)的可用性。

ck1-t1.gif

    供電系統(tǒng)是系統(tǒng)的關(guān)鍵部件之一,系統(tǒng)設(shè)備的不同工作負(fù)荷狀態(tài)往往對(duì)應(yīng)著一定的電流序列值。圖2反映了一個(gè)服務(wù)器設(shè)備在運(yùn)行大型程序、運(yùn)行普通程序、系統(tǒng)空閑時(shí)的電流變化的動(dòng)態(tài)狀態(tài)(采樣頻率為10 Hz)。系統(tǒng)空閑時(shí),電流穩(wěn)定在一個(gè)較小范圍內(nèi);當(dāng)運(yùn)行程序特別是在其運(yùn)行大型程序或處于CPU占用率較高時(shí),電流會(huì)出現(xiàn)明顯上升并至一定峰值高度??梢酝ㄟ^(guò)對(duì)計(jì)算機(jī)設(shè)備電流變化的特征判定計(jì)算機(jī)的當(dāng)前基本工作狀態(tài)。本文即采用對(duì)系統(tǒng)設(shè)備運(yùn)行中電流狀態(tài)的監(jiān)測(cè)與診斷分析的方法來(lái)進(jìn)行系統(tǒng)自我監(jiān)測(cè)診斷。

ck1-t2.gif

1.1 電源部件的改進(jìn)

    一些老舊系統(tǒng)的供電系統(tǒng)一般不具備電流狀態(tài)在線監(jiān)測(cè)分析功能,為了對(duì)系統(tǒng)電流進(jìn)行實(shí)時(shí)狀態(tài)診斷分析,本文對(duì)現(xiàn)有某系統(tǒng)的電源系統(tǒng)架構(gòu)進(jìn)行改進(jìn),增加了電源參數(shù)監(jiān)控模塊來(lái)實(shí)時(shí)采樣記錄工作設(shè)備的電流數(shù)據(jù),對(duì)記錄的歷史數(shù)據(jù)通過(guò)數(shù)據(jù)聚類(lèi)分類(lèi)算法提取系統(tǒng)設(shè)備各種運(yùn)行模式時(shí)的電流序列模式知識(shí)庫(kù),實(shí)現(xiàn)基于知識(shí)庫(kù)的系統(tǒng)設(shè)備實(shí)時(shí)監(jiān)控自我保障預(yù)警分析。

    在系統(tǒng)架構(gòu)中,電源是通過(guò)多個(gè)分線器與不同的工作設(shè)備連接來(lái)提供,原分線器不具備監(jiān)控各工作設(shè)備電流狀態(tài)的功能。為了采集記錄分析各工作設(shè)備的工作電流,本設(shè)計(jì)增加了一個(gè)智能電源記錄分析模塊,如圖3所示,它可以實(shí)時(shí)采集記錄各工作設(shè)備的工作電流值的歷史數(shù)據(jù)。

ck1-t3.gif

    智能分線器按照10 Hz的采樣頻率對(duì)工作設(shè)備的電流進(jìn)行采樣記錄,并傳輸給診斷分析儀對(duì)數(shù)據(jù)進(jìn)行處理。由診斷分析模塊從歷史數(shù)據(jù)中挖掘系統(tǒng)設(shè)備工作模式的特征知識(shí)庫(kù),并基于實(shí)時(shí)采樣的電流序列,通過(guò)知識(shí)庫(kù)診斷分析系統(tǒng)設(shè)備的運(yùn)行狀態(tài)。

1.2 系統(tǒng)設(shè)備工作模式特征知識(shí)庫(kù)構(gòu)建

    從圖2可以看出,設(shè)備的每種工作模式對(duì)應(yīng)著一定的電流特征模式,這里采用下列電流特征模型Mt來(lái)描述系統(tǒng)的不同工作狀態(tài)的模式模型:

ck1-gs1-2.gif

    對(duì)系統(tǒng)正常運(yùn)行中的歷史數(shù)據(jù)進(jìn)行模式學(xué)習(xí),建立模式知識(shí)庫(kù),當(dāng)實(shí)際運(yùn)行時(shí)的模式與模式庫(kù)中的正常模式匹配度較低時(shí),則預(yù)警設(shè)備維護(hù)人員,并記錄相應(yīng)的異常模式,以輔助設(shè)備維護(hù)人員及時(shí)進(jìn)行設(shè)備維護(hù)保障。

    為了獲得較高的歸納能力,這里采用模糊數(shù)學(xué)的模糊值方法來(lái)描述電流的狀態(tài)、窗口的大小。其中,IS表示電流模糊取值為小,IM表示電流模糊取值中,IL表示電流模糊取值為大,IT表示電流模糊取值為特大;WS表示窗口大小取值為小,WM表示窗口大小取值為中,WL表示窗口大小取值為大。相應(yīng)的隸屬度函數(shù)曲線如圖4所示。

ck1-t4.gif

    采用這種模型,對(duì)于圖2表示的某服務(wù)器工作模式曲線,可以建立如下的系統(tǒng)正常工作模式知識(shí)庫(kù):

    ck1-gs3.gif

    學(xué)習(xí)獲得系統(tǒng)工作模式的算法流程如下:

    輸入:電流序列數(shù)值ik;

    輸出:系統(tǒng)工作模式知識(shí)S。

    begin

    (1)計(jì)算電流模式窗口Wt

    ①當(dāng)|ik-ik-1|較小時(shí),則將k-1時(shí)刻作為Wt的開(kāi)始時(shí)刻;

    ②當(dāng)|ik-ik-1|較大,且在模式窗口狀態(tài)時(shí),將k時(shí)刻作為窗口Wt的結(jié)束時(shí)刻;

    ③按照W的模糊隸屬度函數(shù),計(jì)算得出Wt的離散值ck1-t4-x1.gif

    (2)統(tǒng)計(jì)Wt窗口內(nèi)系統(tǒng)的電流值:

    ①去掉Wt窗口的電流狀態(tài)值中的最大、最小值,然后求其平均值iwt;

    ②根據(jù)電流模糊隸屬度函數(shù)求iwt的模糊值ck1-t4-x2.gif

    (3)計(jì)算模式Mt=ck1-t4-x3.gif的支持度Ct

    ①累計(jì)Mt的模式數(shù);

    ②Ct=Mt的模式數(shù)/總模式數(shù)。

    (4)由支持度大于閾值的模式組成系統(tǒng)的模式知識(shí)庫(kù)S;

    end

1.3 系統(tǒng)工作模式在線自診斷分析

    從系統(tǒng)設(shè)備的正常運(yùn)行狀態(tài)下的電流歷史狀態(tài)數(shù)據(jù)中,學(xué)習(xí)建立了系統(tǒng)的正常模式知識(shí)庫(kù)后,就可以根據(jù)電流序列的狀態(tài)模式與知識(shí)庫(kù)中的模式進(jìn)行匹配,不能匹配的模式則為異常模式,或者人工分析判斷為正常時(shí)作為正常模式加入模式庫(kù)。

    工作模式自診斷分析算法流程如下:

    輸入:電流狀態(tài)值ik,模式知識(shí)庫(kù)S;

    輸出:系統(tǒng)工作狀態(tài)。

    begin

    (1)計(jì)算電流模式窗口Wt的模糊值ck1-t4-x4.gif

    (2)統(tǒng)計(jì)Wt窗口內(nèi)系統(tǒng)的電流值模糊狀態(tài)值ck1-t4-x5.gif

    (3)計(jì)算系統(tǒng)工作模式知識(shí)庫(kù)中是否含有模式ck1-t4-x6.gif沒(méi)可匹配的模式時(shí),則預(yù)警系統(tǒng)存在異常工作狀態(tài);

    end

2 試驗(yàn)分析

    利用上述方法,本設(shè)計(jì)對(duì)某系統(tǒng)的無(wú)線通信設(shè)備6個(gè)月的正常運(yùn)行中歷史記錄電流數(shù)據(jù)進(jìn)行了學(xué)習(xí),建立了系統(tǒng)正常無(wú)故障工作狀態(tài)下的工作模式知識(shí)庫(kù)。對(duì)系統(tǒng)中正常運(yùn)行的無(wú)線發(fā)射設(shè)備以頻率10 Hz進(jìn)行電流采樣,通常情況下,在其進(jìn)行對(duì)外話(huà)音或數(shù)據(jù)通信時(shí)可以發(fā)現(xiàn)明顯的電流變化,且每次發(fā)射的電流變化過(guò)程基本一致。在無(wú)線發(fā)射設(shè)備靜默或待機(jī)狀態(tài),電流相對(duì)平穩(wěn),當(dāng)出現(xiàn)話(huà)音通信或定期的數(shù)據(jù)通信時(shí),其電流出現(xiàn)明顯的躍升,該電流變化特征可作為該無(wú)線發(fā)射設(shè)備工作狀態(tài)判定的依據(jù),工作模式知識(shí)數(shù)據(jù)如圖5所示。

ck1-t5.gif

    在一次無(wú)線網(wǎng)絡(luò)互聯(lián)過(guò)程中發(fā)現(xiàn)數(shù)據(jù)通信中斷。一般情況下需要排查整個(gè)通信鏈路中參與通信的終端設(shè)備、網(wǎng)絡(luò)交換設(shè)備、路由設(shè)備、安防設(shè)備以及無(wú)線通信設(shè)備。在增加了電流數(shù)據(jù)采樣后,系統(tǒng)發(fā)現(xiàn)該無(wú)線通信設(shè)備電流數(shù)據(jù)長(zhǎng)時(shí)間保持在靜默待機(jī)狀態(tài),與以往運(yùn)行路由協(xié)議進(jìn)行周期數(shù)據(jù)發(fā)射模式明顯不同。

    根據(jù)系統(tǒng)正常無(wú)故障狀態(tài)下工作模式知識(shí)庫(kù):S={(IS,WM,0.32),(IS,WT,0.28),(IM,WM,0.10),(IM,WT,0.13),(IL,WM,0.17)},對(duì)系統(tǒng)運(yùn)行中工作狀態(tài)進(jìn)行實(shí)時(shí)在線自診斷分析,并檢測(cè)出該無(wú)線通信設(shè)備工作異常狀態(tài)模式(IL,WS),進(jìn)一步對(duì)該異常進(jìn)行機(jī)理分析后,診斷為一電子器件老化故障。

3 結(jié)論

    本文基于系統(tǒng)健康管理的思想,以提高系統(tǒng)的自我診斷保障功能為目標(biāo),通過(guò)對(duì)原有電源系統(tǒng)的改造,增加了運(yùn)行電流狀態(tài)實(shí)時(shí)監(jiān)測(cè)記錄功能,可以監(jiān)測(cè)系統(tǒng)設(shè)備運(yùn)行中的電流模式特征;建立了電流模式的特征模型,并通過(guò)歷史數(shù)據(jù)學(xué)習(xí)獲得正常模式知識(shí)庫(kù),根據(jù)實(shí)時(shí)運(yùn)行中的電流模式特征和知識(shí)庫(kù)自我監(jiān)測(cè)診斷,發(fā)現(xiàn)異常運(yùn)行狀態(tài),從而可以及時(shí)針對(duì)相應(yīng)的異常按照相應(yīng)異常預(yù)案進(jìn)行維護(hù)保障,以提高系統(tǒng)維護(hù)的實(shí)時(shí)性,有利于提高系統(tǒng)的高可用性。

參考文獻(xiàn)

[1] 胡蔦慶,胡雷,陳凌,等.裝備健康管理的現(xiàn)狀、未來(lái)與挑戰(zhàn)[J].國(guó)防科技,2015,36(1):10-15.

[2] 賀林曉.基于粗糙集的關(guān)聯(lián)規(guī)則挖掘在變電設(shè)備故障診斷中的應(yīng)用[D].北京:華北電力大學(xué),2015.

[3] 黃常海,高德毅,胡甚平,等.基于Apriori算法的船舶交通事故關(guān)聯(lián)規(guī)則分析[J].上海海事大學(xué)學(xué)報(bào),2014,35(3):18-22.



作者信息:

楊曉軍,錢(qián)  成

(中國(guó)電子科技集團(tuán)第二十八研究所,江蘇 南京210007)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。