文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.191123
中文引用格式: 可婷,葛雪純,張立東,等. 鐵路道岔故障的智能診斷[J].電子技術(shù)應(yīng)用,2020,46(4):29-33.
英文引用格式: Ke Ting,Ge Xuechun,Zhang Lidong,et al. An intelligent diagnosis for railway turnout fault[J]. Application of Electronic Technique,2020,46(4):29-33.
0 引言
作為一種重要的鐵路信號基礎(chǔ)設(shè)備,道岔的運行情況與列車的安全運行和運輸效率密不可分,一旦道岔運行發(fā)生故障沒有及時檢修,會帶來非常大的安全隱患,對人們的生命和財產(chǎn)安全造成巨大損失[1]。因此,實時監(jiān)控其運行狀態(tài)并及時處理故障是鐵路安全運行的關(guān)鍵問題之一。
目前,我國大部分地區(qū)鐵路道岔故障的傳統(tǒng)檢測方法是利用微機監(jiān)測系統(tǒng)采集道岔轉(zhuǎn)轍機動作時的電流值。圖1給出了隨著時間變化,道岔轉(zhuǎn)轍機動作時產(chǎn)生的電流變化趨勢圖。該圖可分為切斷表示電流、解鎖、轉(zhuǎn)換、鎖閉、接通表示電流5個階段。道岔傳統(tǒng)的故障檢測方式主要是現(xiàn)場工作人員將微機監(jiān)測系統(tǒng)監(jiān)測出的道岔動作電流曲線與總結(jié)得到的電流曲線進(jìn)行人為比對,最終確定道岔的工作狀態(tài)。然而,這種人工識別方式存在3個方面的缺陷:(1)對維護(hù)人員的工作經(jīng)驗依賴度較高,容易出現(xiàn)誤判或漏判等情況,特別是當(dāng)?shù)啦砉收媳徽`判為正常狀態(tài)時,會導(dǎo)致未及時采取維護(hù)措施,造成無法挽回的損失;(2)在中國高速鐵路和客運專線飛速發(fā)展的今天,這種單純靠人工經(jīng)驗判斷錯綜復(fù)雜的道岔設(shè)備的運行狀態(tài)需要耗費大量的人力、物力和財力;(3)人工判斷效率極其低下,已經(jīng)完全不能滿足經(jīng)濟發(fā)展的要求和人民出行的需求。因此,在當(dāng)今人工智能和中國鐵路事業(yè)飛速發(fā)展的大背景下,研究一種具備學(xué)習(xí)能力的道岔故障智能識別系統(tǒng)是亟待解決的問題之一。
隨著人工智能方法的逐漸成熟和完善,國內(nèi)外專家學(xué)者利用人工智能方法對鐵路道岔故障的識別進(jìn)行了初步的研究,并取得了一些成果。例如,邢玉龍等人考慮外部環(huán)境因素,對數(shù)據(jù)做特殊處理,建立數(shù)學(xué)模型進(jìn)行故障檢測[2]。然而,該模型和方法的分類性能并不穩(wěn)定,泛化能力不強。王思明、雷燁和關(guān)瓊利用支持向量機方法設(shè)計不同的求解算法,實現(xiàn)道岔設(shè)備的故障診斷[3-4]。鐘志旺、唐濤和王峰通過分詞算法將故障文檔表達(dá)在詞項特征空間中,并將故障文檔表達(dá)在主題特征空間上,以SVM算法構(gòu)造診斷器[5]。DIEGO J和GARCIA M F則是將模糊理論與神經(jīng)網(wǎng)絡(luò)結(jié)合設(shè)計改進(jìn)算法,用于道岔故障診斷[6-7]。然而,神經(jīng)網(wǎng)絡(luò)在訓(xùn)練樣本較少時分類性能不佳,會出現(xiàn)過擬合現(xiàn)象??傊?,以上方法只有在擁有大量的故障樣本(均衡數(shù)據(jù))時才具有較好的識別效果。事實上,在實際的運行環(huán)境中,每個道岔出現(xiàn)故障的概率十分小,即故障樣本遠(yuǎn)少于正常樣本,是一種不均衡問題。此外,不同道岔電流數(shù)據(jù)維度并不相同,且道岔電流數(shù)據(jù)往往維度很高,這也會導(dǎo)致以上方法的運算時間較長,不能滿足鐵路道岔實時檢測的要求。
針對以上兩個普遍存在的問題,本文提出一種基于不均衡問題的鐵路道岔故障智能診斷技術(shù),具體地,包括道岔數(shù)據(jù)的缺失值補齊、特征提取、道岔智能識別問題的轉(zhuǎn)化、道岔的智能識別技術(shù)、識別性能指標(biāo)的設(shè)計等方面的研究。以廣州鐵路局的道岔數(shù)據(jù)為實驗數(shù)據(jù),在環(huán)境為MATLAB 2014a,Windows 7,Intel Core i3 2.4 GHz CPU下進(jìn)行實驗?zāi)M。實驗結(jié)果表明,本文的識別系統(tǒng)在不均衡道岔樣本中仍具有很好的識別能力,并具有強泛化能力,且其識別平均時間為0.04 s,滿足智能識別的實時性要求。
1 道岔故障智能識別系統(tǒng)
1.1 道岔電流數(shù)據(jù)特征選擇
微機監(jiān)測采集數(shù)據(jù)的周期為0.04 s,道岔正常轉(zhuǎn)換時,需要6.4 s~10 s,于是會產(chǎn)生160~250個電流數(shù)據(jù);而道岔卡阻時,其轉(zhuǎn)換時間可能長達(dá)30 s,甚至更長時間,此時會采集600多個甚至更多的電流數(shù)據(jù)。因此,這就可能存在兩個問題:(1)以道岔動作一次得到的電流值為一個樣本向量,那么多次動作將得到多個樣本向量,以這些樣本向量作為本文的訓(xùn)練樣本,發(fā)現(xiàn)其維度并不相同,這將大大增加后面的訓(xùn)練難度; (2)道岔卡阻時會產(chǎn)生高維數(shù)據(jù),這必然增加模型學(xué)習(xí)的訓(xùn)練時間,導(dǎo)致道岔故障識別遲緩。因此,本文首先對數(shù)據(jù)進(jìn)行預(yù)處理,即利用缺失值補零的方式將所有數(shù)據(jù)補為維度相同的向量。然而,補零操作必會出現(xiàn)高維小樣本數(shù)據(jù),導(dǎo)致過擬合現(xiàn)象的出現(xiàn)。因此,接下來就需要對高維小樣本數(shù)據(jù)進(jìn)行特征提取,本文采取主成分分析方法對數(shù)據(jù)進(jìn)行特征選擇和提取。主成分分析(Principal Component Analysis,PCA)是KARL P發(fā)明的一種特征提取技術(shù)[8],它對多個樣本的輸入矩陣求協(xié)方差矩陣,根據(jù)協(xié)方差矩陣的特征值確定方差較大的屬性,通過獲得累計方差貢獻(xiàn)率,選擇協(xié)方差矩陣相應(yīng)的特征向量,確定主成分。具體的數(shù)據(jù)處理步驟如下:
(1)輸入:鐵路道岔電流的n個樣本向量、參數(shù)θ;
(2)原始數(shù)據(jù)預(yù)處理:以樣本的最高維度m為訓(xùn)練樣本的維度,將低于m維的樣本進(jìn)行補零操作,初步得樣本如下:
1.2 智能識別問題的轉(zhuǎn)化
一方面,道岔異??赡艹霈F(xiàn)在任何一個階段,且異常情況極其復(fù)雜;另一方面,出現(xiàn)異常道岔的概率較低,即本文得到的訓(xùn)練數(shù)據(jù)為不均衡數(shù)據(jù),正常數(shù)據(jù)較多,而異常數(shù)據(jù)極少。鑒于此特點,區(qū)別于已有方法,本文將學(xué)習(xí)問題轉(zhuǎn)化為不均衡分類問題,即設(shè)道岔故障電流曲線數(shù)據(jù)為正類數(shù)據(jù),記作x1,x2,…,xp,其標(biāo)簽記為yi=1,i=1,…,p;道岔正常電流曲線數(shù)據(jù)為負(fù)類數(shù)據(jù),記作xp+1,xp+2,…,xn,其標(biāo)簽記為yi=-1,i=p+1,…,n。與負(fù)類樣本相比較,正類數(shù)據(jù)的錯誤識別會導(dǎo)致更加嚴(yán)重的后果。因此,本文更看重正類數(shù)據(jù)的正確識別。本文在已知兩類訓(xùn)練樣本前提下,通過學(xué)習(xí)一個決策函數(shù)f(x)判斷任何新來道岔電流數(shù)據(jù)x∈Rr×1的所屬類別。
1.3 道岔故障識別器
由CORTES C和VAPNIK V開發(fā)出來的分類技術(shù)[9]——支持向量機(SVM),是以結(jié)構(gòu)風(fēng)險最小化為原則,將最大間隔思想和基于核的方法結(jié)合起來,構(gòu)建優(yōu)化模型。在很多實際應(yīng)用中,該模型都表現(xiàn)出了很好的泛化能力。基于此,為了保證正類樣本能正確分類,本文設(shè)定正類樣本的懲罰參數(shù)大于負(fù)類樣本的懲罰參數(shù),來構(gòu)建如下非均衡學(xué)習(xí)的SVM模型:
由此可以推出:
1.4 道岔故障識別性能指標(biāo)
在學(xué)習(xí)到一個分類器之后,需要對它的分類性能進(jìn)行評估。目前,有許多標(biāo)準(zhǔn)來評估一個分類器性能,如:分類精度(分類的正確率)、分類錯誤率。然而,在鐵路道岔故障識別的電流數(shù)據(jù)中可能有高達(dá)98%的情況是正常道岔, 那么一個分類器不做任何分析而簡單地把每個數(shù)據(jù)分成“負(fù)類”就能達(dá)到98%的精度。顯然,分類精度這樣的評價準(zhǔn)則在鐵路道岔識別問題中是毫無用處的。本文更看重鐵路故障道岔(正類)的識別情況,受自然語言處理問題及部分監(jiān)督學(xué)習(xí)問題[10]的啟發(fā),本文設(shè)計正類樣本的查全率及查準(zhǔn)率兩個評價標(biāo)準(zhǔn)。具體的定義如下:
式(14)和(15)中各個指標(biāo)的具體含義如圖2所示。
這兩個評估標(biāo)準(zhǔn)的直觀含義是十分明顯的,即更加關(guān)注正類樣本是否更加準(zhǔn)確及全面地識別。然而,由于這兩個標(biāo)準(zhǔn)從兩個角度說明正類樣本的識別性能,并不相關(guān)。這時,可以對查全率和查準(zhǔn)率求調(diào)和平均數(shù),得到新的評價標(biāo)準(zhǔn),即F值:
該評價標(biāo)準(zhǔn)對故障道岔的識別提出更高的要求,只有查全率和查準(zhǔn)率都大時,F(xiàn)值才大;有一個小,F(xiàn)值就不高。
2 數(shù)值實驗
2.1 實驗安排
本文實驗數(shù)據(jù)為廣州鐘村站的2016年11月28日-2017年6月14日的兩種類型鐵路道岔電流值,記為W1902#和W1904#。這些數(shù)據(jù)包括道岔的定位到反位、反位到定位數(shù)據(jù)(包括故障位)。經(jīng)過前期的數(shù)據(jù)缺失值補零預(yù)處理及特征提取后,隨機取其中的80%作為訓(xùn)練集,剩余的20%作為測試集進(jìn)行預(yù)測。實驗重復(fù)進(jìn)行100次,取平均F值即為本文分類器最終的分類性能的評估。
2.2 參數(shù)設(shè)置
本文取累計貢獻(xiàn)率?茲=95%,保證95%的數(shù)據(jù)信息量不丟失,利用主成分分析進(jìn)行數(shù)據(jù)降維。本文采用十折交叉驗證方法對偏置-SVM的模型進(jìn)行選擇。十折交叉驗證(10-fold cross-validation)[11]是將數(shù)據(jù)集隨機分成10份,輪流將其中9份作為訓(xùn)練樣本,1份作為驗證樣本。懲罰參數(shù)C+,C-在集合{2-10,2-9,…,210}中選擇。此外,本文采用高斯核K(xi,x)=進(jìn)行數(shù)據(jù)分類,核參數(shù)?滓在集合{2-10,2-9,…,210}中選擇。每組參數(shù)在十折交叉驗證中得到10個F值,計算其平均F值。本文取最高平均F值所對應(yīng)的參數(shù)為最優(yōu)參數(shù),同時偏置支持向量機的模型隨之確定。
2.3 實驗結(jié)果
通過MATLAB軟件實現(xiàn)對數(shù)據(jù)的缺失值補零及PCA降維處理后,得到的訓(xùn)練樣本如表1所示。其中,#正樣本表示異常道岔數(shù)據(jù)量,#負(fù)樣本表示正常道岔數(shù)據(jù)量,#特征表示道岔數(shù)據(jù)通過PCA降維后的數(shù)據(jù)維數(shù),#訓(xùn)練(80%)表示隨機取80%數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)的個數(shù),#測試(20%)表示測試數(shù)據(jù)個數(shù)。通過表1發(fā)現(xiàn)在進(jìn)行數(shù)據(jù)降維之后,樣本的屬性個數(shù)有明顯的下降,從600多降到7~8維,這說明采集到的電流值大部分都是冗余的,沒有區(qū)分度和實際意義的。
在進(jìn)行100次的實驗運行后,得到W1902#和W1904#道岔檢測的平均查全率、查準(zhǔn)率及F值,如表2、表3所示。表2說明W1902#道岔的查全率高達(dá)0.98以上,平均F值為0.94以上。
表3體現(xiàn)了W1904#極好的效果,平均查全率值高達(dá)100%,即本文偏置-SVM智能識別器可以精準(zhǔn)檢測故障道岔。
3 結(jié)論
本文提出了一種鐵路智能檢測系統(tǒng),該系統(tǒng)從數(shù)據(jù)預(yù)處理、特征選擇、SVM建模到性能評價標(biāo)準(zhǔn)設(shè)計這幾個方面做了詳細(xì)的研究,最后針對廣州鐘村站的道岔電流數(shù)據(jù),利用MATLAB軟件進(jìn)行仿真實驗。實驗結(jié)果顯示,該智能系統(tǒng)具有強的泛化能力,即在環(huán)境復(fù)雜變化時仍具有極高的檢測效果,同時運行時間為0.04 s,滿足實時性要求。
參考文獻(xiàn)
[1] 中華人民共和國鐵道部.鐵路行車事故案例選編[M].北京:中國鐵道版社,1999.
[2] 邢玉龍,趙會兵,田健.道岔動作電流曲線的特征提取方法及道岔故障診斷方法:中國,CN105260595B[P].2017-03-15.
[3] 王思明,雷燁.一種基于LS-SVM的道岔控制電路故障診斷[J].蘭州交通大學(xué)學(xué)報,2010,29(4):1-5.
[4] 關(guān)瓊.基于FOA-LSSVM的高速鐵路道岔故障診斷[J].科技通報,2015,31(4):230-232.
[5] 鐘志旺,唐濤,王峰.基于PLSA和SVM的道岔故障特征提取與診斷方法研究[J].鐵道學(xué)報,2018,40(7):80-87.
[6] DIEGO J,PEDREGALA F P,GARCIA F S.RCM2 predictive maintenance of railway systems based on unobserved components models[J].Reliability Engineering and System Safety,2004,83(1):103-110.
[7] GARCIA M F,SCHMID F,CONDE J.Wear assessment employing remote condition monitoring:a case study[J].Wear,2003,255(7):1209-1220.
[8] KARL P.Principal component analysis[J].Chemometrics & Intelligent Laboratory Systems,1987,2(1):37-52.
[9] CORTES C,VAPNIK V.Support-vector network[J].Machine Learning,1995,20:273-297.
[10] KE T,JING L,LV H,et al.Global and local learning from positive and unlabeled examples[J].Applied Intelligence,2018,48(8):2373-2392.
[11] 鄧乃揚,田英杰.支持向量機——理論、算法與拓展[M].北京:科學(xué)出版社, 2009.
作者信息:
可 婷1,葛雪純2,張立東1,呂 慧1
(1.天津科技大學(xué) 理學(xué)院,天津300457;2.北京華鐵信息技術(shù)有限公司,北京100081)