《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 測試測量 > 設(shè)計應(yīng)用 > 鐵路道岔故障的智能診斷
鐵路道岔故障的智能診斷
2020年電子技術(shù)應(yīng)用第4期
可 婷1,葛雪純2,張立東1,呂 慧1
1.天津科技大學(xué) 理學(xué)院,天津300457;2.北京華鐵信息技術(shù)有限公司,北京100081
摘要: 傳統(tǒng)的道岔故障檢測方式不僅會耗費大量人力、物力、財力,而且檢測結(jié)果完全依賴于個人工作經(jīng)驗。 隨著人工智能的飛速發(fā)展,研究鐵路道岔的智能診斷器是亟待解決的問題。提出一種智能檢測系統(tǒng),該系統(tǒng)從預(yù)處理數(shù)據(jù)、特征提取、構(gòu)建不均衡數(shù)據(jù)的智能識別器以及設(shè)計更符合要求的評價標(biāo)準(zhǔn)方面進(jìn)行了具體而深入的研究。 最后,通過MATLAB軟件對廣州鐘村站W(wǎng)1902#和W1904#型號的道岔動作電流數(shù)據(jù)進(jìn)行仿真實驗。實驗結(jié)果顯示,智能檢測系統(tǒng)不僅具有非常高的識別性能和泛化能力,而且識別時間僅為0.04 s, 滿足鐵路實時性要求。
中圖分類號: TN98;TP319
文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.191123
中文引用格式: 可婷,葛雪純,張立東,等. 鐵路道岔故障的智能診斷[J].電子技術(shù)應(yīng)用,2020,46(4):29-33.
英文引用格式: Ke Ting,Ge Xuechun,Zhang Lidong,et al. An intelligent diagnosis for railway turnout fault[J]. Application of Electronic Technique,2020,46(4):29-33.
An intelligent diagnosis for railway turnout fault
Ke Ting1,Ge Xuechun2,Zhang Lidong1,Lv Hui1
1.College of Science,Tianjin University of Science & Technology,Tianjin 300457,China; 2.Beijing Huatie Information Technology Co.,Ltd.,Beijing 100081,China
Abstract: The traditional turnout fault detection method not only leads to consume a lot of manpower, material resources and financial resources, but also relies on manual experience. With the rapid development of artificial intelligence, designing an intelligent diagnostic system to diagnose the turnout is a key problem. In this paper, an intelligent detection system is proposed, which contains data preprocessing, feature extraction, switch intelligent classifier and more suitable evaluation criterion design. It is simulated by MATLAB, the experimental results on Guangzhou village station switch current data of model W1902# and model W1904# shows that the current intelligent detection method not only has the ability of self-learning, but also can be detected efficiently in the complex changes of the environment, and the recognition time is only 0.04 s, which meets the real-time requirement of railway.
Key words : railway turnout;fault detection; support vector machine(SVM);imbalanced datasets;principal component analysis

0 引言

    作為一種重要的鐵路信號基礎(chǔ)設(shè)備,道岔的運行情況與列車的安全運行和運輸效率密不可分,一旦道岔運行發(fā)生故障沒有及時檢修,會帶來非常大的安全隱患,對人們的生命和財產(chǎn)安全造成巨大損失[1]。因此,實時監(jiān)控其運行狀態(tài)并及時處理故障是鐵路安全運行的關(guān)鍵問題之一。

    目前,我國大部分地區(qū)鐵路道岔故障的傳統(tǒng)檢測方法是利用微機監(jiān)測系統(tǒng)采集道岔轉(zhuǎn)轍機動作時的電流值。圖1給出了隨著時間變化,道岔轉(zhuǎn)轍機動作時產(chǎn)生的電流變化趨勢圖。該圖可分為切斷表示電流、解鎖、轉(zhuǎn)換、鎖閉、接通表示電流5個階段。道岔傳統(tǒng)的故障檢測方式主要是現(xiàn)場工作人員將微機監(jiān)測系統(tǒng)監(jiān)測出的道岔動作電流曲線與總結(jié)得到的電流曲線進(jìn)行人為比對,最終確定道岔的工作狀態(tài)。然而,這種人工識別方式存在3個方面的缺陷:(1)對維護(hù)人員的工作經(jīng)驗依賴度較高,容易出現(xiàn)誤判或漏判等情況,特別是當(dāng)?shù)啦砉收媳徽`判為正常狀態(tài)時,會導(dǎo)致未及時采取維護(hù)措施,造成無法挽回的損失;(2)在中國高速鐵路和客運專線飛速發(fā)展的今天,這種單純靠人工經(jīng)驗判斷錯綜復(fù)雜的道岔設(shè)備的運行狀態(tài)需要耗費大量的人力、物力和財力;(3)人工判斷效率極其低下,已經(jīng)完全不能滿足經(jīng)濟發(fā)展的要求和人民出行的需求。因此,在當(dāng)今人工智能和中國鐵路事業(yè)飛速發(fā)展的大背景下,研究一種具備學(xué)習(xí)能力的道岔故障智能識別系統(tǒng)是亟待解決的問題之一。

rgzn2-t1.gif

    隨著人工智能方法的逐漸成熟和完善,國內(nèi)外專家學(xué)者利用人工智能方法對鐵路道岔故障的識別進(jìn)行了初步的研究,并取得了一些成果。例如,邢玉龍等人考慮外部環(huán)境因素,對數(shù)據(jù)做特殊處理,建立數(shù)學(xué)模型進(jìn)行故障檢測[2]。然而,該模型和方法的分類性能并不穩(wěn)定,泛化能力不強。王思明、雷燁和關(guān)瓊利用支持向量機方法設(shè)計不同的求解算法,實現(xiàn)道岔設(shè)備的故障診斷[3-4]。鐘志旺、唐濤和王峰通過分詞算法將故障文檔表達(dá)在詞項特征空間中,并將故障文檔表達(dá)在主題特征空間上,以SVM算法構(gòu)造診斷器[5]。DIEGO J和GARCIA M F則是將模糊理論與神經(jīng)網(wǎng)絡(luò)結(jié)合設(shè)計改進(jìn)算法,用于道岔故障診斷[6-7]。然而,神經(jīng)網(wǎng)絡(luò)在訓(xùn)練樣本較少時分類性能不佳,會出現(xiàn)過擬合現(xiàn)象??傊?,以上方法只有在擁有大量的故障樣本(均衡數(shù)據(jù))時才具有較好的識別效果。事實上,在實際的運行環(huán)境中,每個道岔出現(xiàn)故障的概率十分小,即故障樣本遠(yuǎn)少于正常樣本,是一種不均衡問題。此外,不同道岔電流數(shù)據(jù)維度并不相同,且道岔電流數(shù)據(jù)往往維度很高,這也會導(dǎo)致以上方法的運算時間較長,不能滿足鐵路道岔實時檢測的要求。

    針對以上兩個普遍存在的問題,本文提出一種基于不均衡問題的鐵路道岔故障智能診斷技術(shù),具體地,包括道岔數(shù)據(jù)的缺失值補齊、特征提取、道岔智能識別問題的轉(zhuǎn)化、道岔的智能識別技術(shù)、識別性能指標(biāo)的設(shè)計等方面的研究。以廣州鐵路局的道岔數(shù)據(jù)為實驗數(shù)據(jù),在環(huán)境為MATLAB 2014a,Windows 7,Intel Core i3 2.4 GHz CPU下進(jìn)行實驗?zāi)M。實驗結(jié)果表明,本文的識別系統(tǒng)在不均衡道岔樣本中仍具有很好的識別能力,并具有強泛化能力,且其識別平均時間為0.04 s,滿足智能識別的實時性要求。

1 道岔故障智能識別系統(tǒng)

1.1 道岔電流數(shù)據(jù)特征選擇

    微機監(jiān)測采集數(shù)據(jù)的周期為0.04 s,道岔正常轉(zhuǎn)換時,需要6.4 s~10 s,于是會產(chǎn)生160~250個電流數(shù)據(jù);而道岔卡阻時,其轉(zhuǎn)換時間可能長達(dá)30 s,甚至更長時間,此時會采集600多個甚至更多的電流數(shù)據(jù)。因此,這就可能存在兩個問題:(1)以道岔動作一次得到的電流值為一個樣本向量,那么多次動作將得到多個樣本向量,以這些樣本向量作為本文的訓(xùn)練樣本,發(fā)現(xiàn)其維度并不相同,這將大大增加后面的訓(xùn)練難度; (2)道岔卡阻時會產(chǎn)生高維數(shù)據(jù),這必然增加模型學(xué)習(xí)的訓(xùn)練時間,導(dǎo)致道岔故障識別遲緩。因此,本文首先對數(shù)據(jù)進(jìn)行預(yù)處理,即利用缺失值補零的方式將所有數(shù)據(jù)補為維度相同的向量。然而,補零操作必會出現(xiàn)高維小樣本數(shù)據(jù),導(dǎo)致過擬合現(xiàn)象的出現(xiàn)。因此,接下來就需要對高維小樣本數(shù)據(jù)進(jìn)行特征提取,本文采取主成分分析方法對數(shù)據(jù)進(jìn)行特征選擇和提取。主成分分析(Principal Component Analysis,PCA)是KARL P發(fā)明的一種特征提取技術(shù)[8],它對多個樣本的輸入矩陣求協(xié)方差矩陣,根據(jù)協(xié)方差矩陣的特征值確定方差較大的屬性,通過獲得累計方差貢獻(xiàn)率,選擇協(xié)方差矩陣相應(yīng)的特征向量,確定主成分。具體的數(shù)據(jù)處理步驟如下:

    (1)輸入:鐵路道岔電流的n個樣本向量、參數(shù)θ;

    (2)原始數(shù)據(jù)預(yù)處理:以樣本的最高維度m為訓(xùn)練樣本的維度,將低于m維的樣本進(jìn)行補零操作,初步得樣本如下:

rgzn2-gs1-6.gif

1.2 智能識別問題的轉(zhuǎn)化

    一方面,道岔異??赡艹霈F(xiàn)在任何一個階段,且異常情況極其復(fù)雜;另一方面,出現(xiàn)異常道岔的概率較低,即本文得到的訓(xùn)練數(shù)據(jù)為不均衡數(shù)據(jù),正常數(shù)據(jù)較多,而異常數(shù)據(jù)極少。鑒于此特點,區(qū)別于已有方法,本文將學(xué)習(xí)問題轉(zhuǎn)化為不均衡分類問題,即設(shè)道岔故障電流曲線數(shù)據(jù)為正類數(shù)據(jù),記作x1,x2,…,xp,其標(biāo)簽記為yi=1,i=1,…,p;道岔正常電流曲線數(shù)據(jù)為負(fù)類數(shù)據(jù),記作xp+1,xp+2,…,xn,其標(biāo)簽記為yi=-1,i=p+1,…,n。與負(fù)類樣本相比較,正類數(shù)據(jù)的錯誤識別會導(dǎo)致更加嚴(yán)重的后果。因此,本文更看重正類數(shù)據(jù)的正確識別。本文在已知兩類訓(xùn)練樣本前提下,通過學(xué)習(xí)一個決策函數(shù)f(x)判斷任何新來道岔電流數(shù)據(jù)x∈Rr×1的所屬類別。

1.3 道岔故障識別器

    由CORTES C和VAPNIK V開發(fā)出來的分類技術(shù)[9]——支持向量機(SVM),是以結(jié)構(gòu)風(fēng)險最小化為原則,將最大間隔思想和基于核的方法結(jié)合起來,構(gòu)建優(yōu)化模型。在很多實際應(yīng)用中,該模型都表現(xiàn)出了很好的泛化能力。基于此,為了保證正類樣本能正確分類,本文設(shè)定正類樣本的懲罰參數(shù)大于負(fù)類樣本的懲罰參數(shù),來構(gòu)建如下非均衡學(xué)習(xí)的SVM模型:

rgzn2-gs7-9.gif

    由此可以推出:

rgzn2-gs10-13.gif

1.4 道岔故障識別性能指標(biāo)

    在學(xué)習(xí)到一個分類器之后,需要對它的分類性能進(jìn)行評估。目前,有許多標(biāo)準(zhǔn)來評估一個分類器性能,如:分類精度(分類的正確率)、分類錯誤率。然而,在鐵路道岔故障識別的電流數(shù)據(jù)中可能有高達(dá)98%的情況是正常道岔, 那么一個分類器不做任何分析而簡單地把每個數(shù)據(jù)分成“負(fù)類”就能達(dá)到98%的精度。顯然,分類精度這樣的評價準(zhǔn)則在鐵路道岔識別問題中是毫無用處的。本文更看重鐵路故障道岔(正類)的識別情況,受自然語言處理問題及部分監(jiān)督學(xué)習(xí)問題[10]的啟發(fā),本文設(shè)計正類樣本的查全率及查準(zhǔn)率兩個評價標(biāo)準(zhǔn)。具體的定義如下:

     rgzn2-gs14-15.gif

式(14)和(15)中各個指標(biāo)的具體含義如圖2所示。

rgzn2-t2.gif

    這兩個評估標(biāo)準(zhǔn)的直觀含義是十分明顯的,即更加關(guān)注正類樣本是否更加準(zhǔn)確及全面地識別。然而,由于這兩個標(biāo)準(zhǔn)從兩個角度說明正類樣本的識別性能,并不相關(guān)。這時,可以對查全率和查準(zhǔn)率求調(diào)和平均數(shù),得到新的評價標(biāo)準(zhǔn),即F值:

    rgzn2-gs16.gif

    該評價標(biāo)準(zhǔn)對故障道岔的識別提出更高的要求,只有查全率和查準(zhǔn)率都大時,F(xiàn)值才大;有一個小,F(xiàn)值就不高。

2 數(shù)值實驗

2.1 實驗安排

    本文實驗數(shù)據(jù)為廣州鐘村站的2016年11月28日-2017年6月14日的兩種類型鐵路道岔電流值,記為W1902#和W1904#。這些數(shù)據(jù)包括道岔的定位到反位、反位到定位數(shù)據(jù)(包括故障位)。經(jīng)過前期的數(shù)據(jù)缺失值補零預(yù)處理及特征提取后,隨機取其中的80%作為訓(xùn)練集,剩余的20%作為測試集進(jìn)行預(yù)測。實驗重復(fù)進(jìn)行100次,取平均F值即為本文分類器最終的分類性能的評估。

2.2 參數(shù)設(shè)置

    本文取累計貢獻(xiàn)率?茲=95%,保證95%的數(shù)據(jù)信息量不丟失,利用主成分分析進(jìn)行數(shù)據(jù)降維。本文采用十折交叉驗證方法對偏置-SVM的模型進(jìn)行選擇。十折交叉驗證(10-fold cross-validation)[11]是將數(shù)據(jù)集隨機分成10份,輪流將其中9份作為訓(xùn)練樣本,1份作為驗證樣本。懲罰參數(shù)C+,C-在集合{2-10,2-9,…,210}中選擇。此外,本文采用高斯核K(xi,x)=rgzn2-2.2-x1.gif進(jìn)行數(shù)據(jù)分類,核參數(shù)?滓在集合{2-10,2-9,…,210}中選擇。每組參數(shù)在十折交叉驗證中得到10個F值,計算其平均F值。本文取最高平均F值所對應(yīng)的參數(shù)為最優(yōu)參數(shù),同時偏置支持向量機的模型隨之確定。

2.3 實驗結(jié)果

    通過MATLAB軟件實現(xiàn)對數(shù)據(jù)的缺失值補零及PCA降維處理后,得到的訓(xùn)練樣本如表1所示。其中,#正樣本表示異常道岔數(shù)據(jù)量,#負(fù)樣本表示正常道岔數(shù)據(jù)量,#特征表示道岔數(shù)據(jù)通過PCA降維后的數(shù)據(jù)維數(shù),#訓(xùn)練(80%)表示隨機取80%數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)的個數(shù),#測試(20%)表示測試數(shù)據(jù)個數(shù)。通過表1發(fā)現(xiàn)在進(jìn)行數(shù)據(jù)降維之后,樣本的屬性個數(shù)有明顯的下降,從600多降到7~8維,這說明采集到的電流值大部分都是冗余的,沒有區(qū)分度和實際意義的。

rgzn2-b1.gif

    在進(jìn)行100次的實驗運行后,得到W1902#和W1904#道岔檢測的平均查全率、查準(zhǔn)率及F值,如表2、表3所示。表2說明W1902#道岔的查全率高達(dá)0.98以上,平均F值為0.94以上。

表3體現(xiàn)了W1904#極好的效果,平均查全率值高達(dá)100%,即本文偏置-SVM智能識別器可以精準(zhǔn)檢測故障道岔。

rgzn2-b2.gif

rgzn2-b3.gif

3 結(jié)論

    本文提出了一種鐵路智能檢測系統(tǒng),該系統(tǒng)從數(shù)據(jù)預(yù)處理、特征選擇、SVM建模到性能評價標(biāo)準(zhǔn)設(shè)計這幾個方面做了詳細(xì)的研究,最后針對廣州鐘村站的道岔電流數(shù)據(jù),利用MATLAB軟件進(jìn)行仿真實驗。實驗結(jié)果顯示,該智能系統(tǒng)具有強的泛化能力,即在環(huán)境復(fù)雜變化時仍具有極高的檢測效果,同時運行時間為0.04 s,滿足實時性要求。

參考文獻(xiàn)

[1] 中華人民共和國鐵道部.鐵路行車事故案例選編[M].北京:中國鐵道版社,1999.

[2] 邢玉龍,趙會兵,田健.道岔動作電流曲線的特征提取方法及道岔故障診斷方法:中國,CN105260595B[P].2017-03-15.

[3] 王思明,雷燁.一種基于LS-SVM的道岔控制電路故障診斷[J].蘭州交通大學(xué)學(xué)報,2010,29(4):1-5.

[4] 關(guān)瓊.基于FOA-LSSVM的高速鐵路道岔故障診斷[J].科技通報,2015,31(4):230-232.

[5] 鐘志旺,唐濤,王峰.基于PLSA和SVM的道岔故障特征提取與診斷方法研究[J].鐵道學(xué)報,2018,40(7):80-87.

[6] DIEGO J,PEDREGALA F P,GARCIA F S.RCM2 predictive maintenance of railway systems based on unobserved components models[J].Reliability Engineering and System Safety,2004,83(1):103-110.

[7] GARCIA M F,SCHMID F,CONDE J.Wear assessment employing remote condition monitoring:a case study[J].Wear,2003,255(7):1209-1220.

[8] KARL P.Principal component analysis[J].Chemometrics & Intelligent Laboratory Systems,1987,2(1):37-52.

[9] CORTES C,VAPNIK V.Support-vector network[J].Machine Learning,1995,20:273-297.

[10] KE T,JING L,LV H,et al.Global and local learning from positive and unlabeled examples[J].Applied Intelligence,2018,48(8):2373-2392.

[11] 鄧乃揚,田英杰.支持向量機——理論、算法與拓展[M].北京:科學(xué)出版社, 2009.



作者信息:

可  婷1,葛雪純2,張立東1,呂  慧1 

(1.天津科技大學(xué) 理學(xué)院,天津300457;2.北京華鐵信息技術(shù)有限公司,北京100081)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。