馬彥昭,胡浩基,王曰海
?。ㄕ憬髮W 信息與電子工程學院,浙江 杭州 310027)
摘要:提出一種基于SIFT特征的鐵道檢測圖片的匹配方法。由人工標定鐵路上的目標位置圖片,通過匹配算法計算匹配圖片與目標位置圖片可匹配SIFT特征點的數(shù)量,利用DTW最優(yōu)路徑規(guī)劃得到全局最優(yōu)的匹配結(jié)果,從匹配結(jié)果中得到一張匹配度最高的圖片并將其輸出用于道路檢測。實驗證明,該算法在效率和準確度上均有較好的表現(xiàn)。
關(guān)鍵詞:匹配;鐵道;SIFT特征;DTW
0引言
隨著中國鐵路技術(shù)的發(fā)展,對鐵道的安全性也提出了更高的要求。為此,相關(guān)部門在列車上安裝了高幀率的攝像頭,并對獲得的圖片進行人工檢測,以發(fā)現(xiàn)鐵道及其周邊環(huán)境(如兩側(cè)的線桿)是否發(fā)生異常變化。然而,由于路程遠、幀率高,每輛列車僅僅在兩個站點之間獲取的圖片數(shù)量就達到了幾萬甚至幾十萬。對于人工檢測,無疑需要極高的勞動強度。而事實卻是,由于圖片之間較高的相似性和連續(xù)性,對于每根線桿都會有多張可供檢測的冗余的圖片,所以在這上萬張圖片中真正需要用來檢測的只有幾千張甚至幾百張。
針對鐵路檢測圖片的冗余問題,本文提出了一種降低圖片冗余度的方法,在準確度和效率上都有較好的表現(xiàn)。
1流程
此方法包括了數(shù)據(jù)選擇、尺度不變特征轉(zhuǎn)換(ScaleInvariant Feature Transform,SIFT)特征檢測與匹配、動態(tài)時間歸整(Dynamic Time Warping,DTW)、最佳匹配圖片輸出四個部分。每一部分具體操作過程將在后文中詳細介紹。
2數(shù)據(jù)選擇
2.1選擇目標位置圖片
選擇天氣良好時兩站點之間拍攝的一組圖片。按照電線桿標號的順序,依次從圖片中人工選擇出一張可清晰看到該線桿的圖片。如圖1所示,拍攝到線桿‘1220’共有6張圖片,從中選擇圖片d作為目標位置圖片(用黑實線標記出)。最終選擇的圖片數(shù)量為M1,圖片集設(shè)為Aim。
2.2輸入待匹配圖片
在每次的匹配中,使用新得到的具有冗余度的一組圖片(設(shè)為Match,數(shù)量為M2),并保證Match與Aim具有相同的起點和終點。
3SIFT特征檢測與匹配
3.1輸入待匹配圖片
SIFT特征是圖像的局部特征,其對旋轉(zhuǎn)、尺度縮放、亮度變化保持不變性,對視角變化、仿射變換、噪聲也保持一定程度的穩(wěn)定性[1-2],關(guān)于SIFT特征的具體提取與匹配方法,在參考文獻[3]中已有詳細的說明,此處不再作為重點陳述的對象。
3.2SIFT特征檢測與匹配
分別檢測Aim與Match中第i,j張圖片的SIFT特征,記為進行SIFT特征匹配。將匹配的特征點數(shù)量記為Ni,j,構(gòu)成矩陣N。
4DTW動態(tài)規(guī)劃
4.1DTW算法
該算法基于動態(tài)規(guī)劃(DP)的思想[4-5],原本是語音識別中的一種算法,用于孤立詞識別。此處將其最優(yōu)路徑作為不同圖片匹配結(jié)果。
4.2DTW最優(yōu)路徑規(guī)劃
搜索從N1,1點出發(fā),點(i,j)可達到的前一個格點只可能是(i-1,j),(i-1,j-1)和(i,j-1)。那么(i,j)選擇這三個距離中的最大者所對應(yīng)的點作為其前續(xù)格點,設(shè)Di,j為(i,j)到(1,1)的累計距離。則:
這樣從(1,1)點出發(fā)(令Di,j=0)搜索,反復(fù)遞推,直到DM1,M2就可以得到最優(yōu)路徑Road。Roadi,j=1表示路線經(jīng)過(i,j)點。Roadi,j=0,表示路線未經(jīng)過。
對于矩陣Road,若Roadi,j=1,則Matchj與Aimi匹配。
圖2是杭州至德清局部路段拍攝到的963張圖片匹配到選定的50張圖片的匹配結(jié)果。曲線經(jīng)過的地方表示Roadi,j=1。
由圖可以得到,對于每一張目標匹配圖片,有多張匹配圖片與之對應(yīng)。例如,以上選出的‘1220’線桿,在目標圖片中是第38張圖片。在匹配圖片中標號為771~779這9張圖片是與之匹配的結(jié)果。如圖3所示的a~i的9張圖片。
5最佳匹配圖片輸出
已知一張圖片Aimi對應(yīng)于多張圖片Matchj。則對于每一個i,找到使Ni,j最大時的j=jmax。將Matchjmax作為最佳的匹配圖片輸出。如上述找到的‘1220’所匹配的9張圖片中,N38,776是N38,771至N38,779中最大的值,則將編號為776的圖片,即圖3圖片f作為最后的匹配結(jié)果輸出。如圖4所示。
可以看出,在天氣條件不同、拍攝角度和拍攝圖片大小不同的情況下,此方法依然能夠找到一張最合適的圖片用于檢測。
對于每一張圖片Aimi,均可以找到一張最佳匹配的圖片Matchjmax,將找到的圖片作為匹配集合,共有圖片M1張。此時,便實現(xiàn)了將原有的數(shù)量為M2的圖片壓縮為數(shù)量為M1的圖片集合的目的。
6實驗結(jié)果
在MATLAB R2014a 環(huán)境下,對不同路段圖片,在天氣不同的條件下進行匹配。同時進行人工驗證,檢驗得到的匹配結(jié)果是否可以用于實際的檢測中。實驗結(jié)果如表1所示。
實驗結(jié)果證明:該匹配方法取得了較好的效果,輸出的匹配圖片可以滿足人工檢測的需求。
7結(jié)束語
本文提出了一種基于SIFT特征的鐵道檢測圖片的匹配方法,具有準確、高效率和極大降低人工勞動強度的優(yōu)點。同時此方法對環(huán)境、拍攝角度、拍攝器材和天氣的依賴較小,具有較好的魯棒性,可適用于多種場合。
SIFT特征提取與匹配需要較大的計算量,是日后繼續(xù)深入研究的重點。即考慮根據(jù)實際應(yīng)用環(huán)境,通過一定的約束條件,降低計算量,以提高計算的速度,使此方法具備更強的實際應(yīng)用能力。
參考文獻
[1] BROWN M, LOWE D G. Invariant features from interest point groups[C]. InBritish Machine Vision Conference,Cardiff, Wales, 2002:656-665.
?。?] 官云蘭,張紅軍,劉向美. 點特征提取算法探討[J].東華理工學院學報,2007,30(1):42-46.
?。?] DAVID G L. Distinctive image features from scaleinvariant keypoints[J].International Journal of Computer Vision, 2004,60(2):91-110.
?。?] KIM C,SEO K D. Robust DTWbased recognition algorithm for hand—held consumer devices[J].IEEE Transactions on Consumer Electronics,2005,51(2):699-709.
?。?] 趙力.語音信號處理[M].北京:清華大學出版社,2004.
?。?] LeCUN Y A, BOTTOU L, ORR G B, et al. Efficient backprop[C]. Neural Networks: Tricks of the Trade. Springer, 1998, 7:9-48.
?。?] LIU C, YUEN J, TORRALBA A.Sift flow: Dense correspondence across scenes and its applications[J]. Pattern Analysisand Machine Intelligence, IEEE Transactions on,2011,33(5):978-994.