摘 要: 將D-S證據(jù)理論引入車牌字符識別,結(jié)合神經(jīng)網(wǎng)絡(luò)容錯(cuò)能力強(qiáng)、能夠自適應(yīng)學(xué)習(xí)等優(yōu)點(diǎn),對待識別字符進(jìn)行統(tǒng)計(jì)和結(jié)構(gòu)等多方面的特征提取后,分別經(jīng)過神經(jīng)網(wǎng)絡(luò)分類器得到相應(yīng)的結(jié)果,并應(yīng)用D-S證據(jù)理論對各種結(jié)果進(jìn)行數(shù)據(jù)融合,從而實(shí)現(xiàn)了字符各方面特征的優(yōu)勢互補(bǔ),進(jìn)一步提高了字符識別的成功率。
關(guān)鍵詞: 字符識別;特征提??;D-S證據(jù)理論;數(shù)據(jù)融合
字符識別是模式識別的一個(gè)重要分支,是LPR系統(tǒng)中最后一個(gè)環(huán)節(jié),同時(shí)也是一個(gè)典型的大類別數(shù)模式識別問題。在車牌字符識別的過程中需要處理大量字符信息,傳統(tǒng)的字符識別流程如圖1所示。
通常提取的特征主要有紋理特征、顏色特征、形狀特征和空間關(guān)系特征等[1]。本文將待識別字符的統(tǒng)計(jì)特征和結(jié)構(gòu)特征都提取出來,揚(yáng)長避短,發(fā)揮各自優(yōu)點(diǎn)。分別使用神經(jīng)網(wǎng)絡(luò)的分類器得到相應(yīng)的結(jié)果,再將各種結(jié)果通過D-S證據(jù)理論進(jìn)行數(shù)據(jù)融合,充分利用字符各方面特征,從而達(dá)到進(jìn)一步提高字符識別成功率的目的。
1 字符識別
1.1 預(yù)處理
對輸入的數(shù)字圖像先進(jìn)行定位、二值化、去噪和大小規(guī)格化等預(yù)處理工作,這一環(huán)節(jié)是字符識別的重要步驟。二值化主要把原始圖像轉(zhuǎn)換成識別器所能接收的形式,尺寸和位置的規(guī)格化主要是消除一些與類別無關(guān)的因素。
1.2 特征提取
本文主要從待識別字符中提取基于網(wǎng)格特征和基于方向線素特征兩組統(tǒng)計(jì)特征,后者主要是對數(shù)字圖像分別在水平方向和垂直方向三等分的地方作水平線和垂直線穿過字符看其與字符邊緣交叉的次數(shù),以此作為特征進(jìn)行提取。雖然這兩組特征已然包含了較多的信息,具備一定的識別成功率,但是僅從這兩個(gè)特征入手還存在明顯的不足:(1)它們都是在尺寸歸一化以后進(jìn)行的,寬高比信息并沒有體現(xiàn)出來,這樣常導(dǎo)致“1”與其他的數(shù)字混淆;(2)由于是統(tǒng)計(jì)特征,對字形結(jié)構(gòu)的描述不足,使得一些在統(tǒng)計(jì)特征上差別很小但結(jié)構(gòu)完全不同的字符發(fā)生混淆,如“3”和“8”。鑒于此,本文又引入了寬高比和孔洞數(shù)兩個(gè)結(jié)構(gòu)特征。誠然,僅憑這兩個(gè)結(jié)構(gòu)特征并不能完成徹底的分類效果,但與前面的統(tǒng)計(jì)特征有很好的獨(dú)立性,通過合適的集成方式,能夠進(jìn)一步提高系統(tǒng)的識別成功率。
1.3 BP神經(jīng)網(wǎng)絡(luò)分類器
BP神經(jīng)網(wǎng)絡(luò)的核心目的是通過梯度下降法讓網(wǎng)絡(luò)的實(shí)際輸出和期望的均方差最小。BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的過程由信息的正向傳播和誤差的反向傳播兩個(gè)過程組成。當(dāng)實(shí)際輸出與期望輸出不符時(shí),進(jìn)入誤差的反向傳播階段。神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的過程就是周而復(fù)始的信息正向傳播和誤差反向傳播過程,同時(shí)也是各層權(quán)值不斷調(diào)整的過程。該過程一直持續(xù)到網(wǎng)絡(luò)實(shí)際輸出的誤差減少到可以接受的程度,或者預(yù)先設(shè)定的學(xué)習(xí)次數(shù)為止。
雖然BP神經(jīng)網(wǎng)絡(luò)具有一定的先進(jìn)性,但也存在著一定的缺陷:
?。?)BP算法根據(jù)梯度下降學(xué)習(xí)法進(jìn)行學(xué)習(xí)時(shí),可以使權(quán)值收斂到某個(gè)值,但無法保證該值為誤差平面的全局最小值??梢圆捎酶郊觿?dòng)量法來解決該問題。
?。?)隱層和隱層節(jié)點(diǎn)的數(shù)目尚無理論上的指導(dǎo),只能通過經(jīng)驗(yàn)或反復(fù)實(shí)驗(yàn)確定。
?。?)由于學(xué)習(xí)的速率是固定不變的,因此BP神經(jīng)網(wǎng)絡(luò)收斂的速度比較慢,訓(xùn)練時(shí)間較長。
(4)網(wǎng)絡(luò)的學(xué)習(xí)和記憶具有不穩(wěn)定性。
因此,在字符識別的過程中,如果應(yīng)用BP神經(jīng)網(wǎng)絡(luò)的方法,還需要根據(jù)具體的情況做相應(yīng)的修改,使其發(fā)揮應(yīng)有的優(yōu)勢。
本文采用3組BP神經(jīng)網(wǎng)絡(luò)作為分類器,輸入向量分別為以上提取的統(tǒng)計(jì)和結(jié)構(gòu)特征向量,統(tǒng)計(jì)特征向量包括粗網(wǎng)格特征和方向線素特征兩組,結(jié)構(gòu)特征向量為寬高比和孔洞數(shù)。輸出向量為3組向量,第1組為42維向量,其中每個(gè)分量分別與32個(gè)省市區(qū)漢字的簡稱和10個(gè)部隊(duì)、軍區(qū)等特殊機(jī)關(guān)部門的簡稱相對應(yīng);第2組為26維向量,其中每個(gè)分量分別與英文字母A~Z相對應(yīng);第3組為10維向量,其中每個(gè)分量分別與數(shù)字0~9相對應(yīng)。傳遞函數(shù)采用Sigmoid函數(shù)。訓(xùn)練時(shí),對應(yīng)每個(gè)輸入的數(shù)字圖像,輸出向量中相應(yīng)位置分量賦值1;測試時(shí),為了得到下一步證據(jù)理論所需的基本概率數(shù),還需對輸出向量的分量按式(1)進(jìn)行處理:
(3)不確定性區(qū)間長度必須小于某一閾值r;
?。?)目標(biāo)類別的信任度值必須大于不確定性區(qū)間長度。
關(guān)于閾值的選取并沒有一個(gè)統(tǒng)一的標(biāo)準(zhǔn),只能根據(jù)實(shí)際情況加以確定,閾值過大或過小都會直接影響到識別成功率,本文選取ε=0.1,r=0.3。
2 實(shí)驗(yàn)結(jié)果分析
本文所設(shè)計(jì)的車牌識別系統(tǒng)Vision1.0采用VisualC++6.0開發(fā)工具,并在具有Core(TM)2Duo CPU、2 GB內(nèi)存的計(jì)算機(jī)上實(shí)驗(yàn)得到數(shù)據(jù),支持像素100×100以上BMP和JPG格式圖像文件,具有一定的識別精度。
部分車牌識別實(shí)驗(yàn)的結(jié)果如圖2~圖7所示,實(shí)驗(yàn)結(jié)果分析如表1所示。
實(shí)驗(yàn)結(jié)果表明,該方法實(shí)現(xiàn)了普通車牌的字符識別功能,并能應(yīng)用于不同環(huán)境、不同顏色車牌的識別當(dāng)中。通過大量實(shí)驗(yàn)不難發(fā)現(xiàn),車牌字符識別的關(guān)鍵取決于漢字字符的識別成功與否,如果能夠成功識別出漢字字符,則在理想狀態(tài)下基本能夠準(zhǔn)確識別車牌中其余的英文字符和數(shù)字字符。如表1所示,有6個(gè)車牌是在漢字識別成功后未能成功識別其他字符的情況,主要是由于字符受損嚴(yán)重或受污染,導(dǎo)致無法正常匹配識別。對于識別過程中暴露的不足,在今后的工作中還有待完善。此外,由于識別漢字字符過程中對資源消耗較大,導(dǎo)致識別速度指標(biāo)不甚理想,在后續(xù)的研究中還需改進(jìn)。
參考文獻(xiàn)
[1] 周培德.計(jì)算幾何-算法分析與設(shè)計(jì)[M].北京:清華大學(xué)出版社,2008.
[2] 寧坤,劉翌南,楊潔,等.基于數(shù)據(jù)融合的識別方法研究[J].無線電工程,2004,34(12):56-57.
[3] 王奉濤,馬孝江,朱泓,等.基于Dempster-Shafer證據(jù)理論的信息融合在設(shè)備故障診斷中應(yīng)用[J].大連理工大學(xué)學(xué)報(bào),2003,43(4).
[4] 何友,王國宏,彭應(yīng)寧.多傳感器信息融合及應(yīng)用[M].北京:電子工業(yè)出版社,2001.
[5] 焦準(zhǔn),王偉平,張蓉.基于證據(jù)理論的多傳感器信息融合目標(biāo)識別方法[J].彈箭與制導(dǎo)學(xué)報(bào),2006,26(4):276-278.
[6] 龐圣波,王力宏,王培進(jìn).證據(jù)理論合成公式的討論及一些修正[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(20):56-59.
[7] 李弼程,王波,魏俊,等.一種有效的證據(jù)理論合成公式[J].數(shù)據(jù)采集與處理,2002,17(1):34-36.
[8] 何冰,胡紅麗.一種修正的D2S證據(jù)融合策略[J].航空學(xué)報(bào),2003,24(6):559-561.