《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 業(yè)界動態(tài) > 一種新的粘連字符圖像分割方法

一種新的粘連字符圖像分割方法

2009-09-17
作者:孔月萍1, 郭世雄1, 梁韶軍2

  摘??要: 針對監(jiān)控畫面采樣圖像中數(shù)字的自動識別問題,提出一種新的粘連字符圖像分割方法。該方法以預(yù)處理后二值圖像的連通狀況來判定字符粘連的存在,并對粘連字符圖像采用上下輪廓極值法確定候選粘連分割點,以雙向最短路徑確定合適的圖像分割線路。仿真實驗表明,該方法能有效解決粘連字符圖像的分割問題。
  關(guān)鍵詞: 字符分割; 連通狀況; 粘連字符; 輪廓; 最短路徑

?

  隨著監(jiān)視器等設(shè)備的廣泛使用,自動采集、記錄和分析監(jiān)控畫面信息在實際應(yīng)用中變得越來越重要。而使用CCD攝像頭采集畫面字符時,由于字符本身的大小、字體、字符間距以及攝像頭自身分辨率不高等原因,有可能造成圖像中字符的粘連。所以,在識別、分析、記錄前必須對粘連字符進行分割。
  參考文獻[1]中提出了基于字符投影的粘連分割方法,主要包括字符垂直投影、字符波形投影處理,但該方法分割準確率不高,且分割路徑只能垂直進行,會造成字符損傷,影響后期識別。參考文獻[2]采用了輪廓分裂與區(qū)域合并相結(jié)合的算法,能夠分割粘連字符,但過程復(fù)雜且準確率不高,抗干擾性一般。參考文獻[3]提出了一種基于骨架形態(tài)分析的粘連分割算法,但該方法利用閾值判定分割點位置和路徑,降低了準確率。參考文獻[4]采用滴水算法,模仿水滴從高處向低處滴落的過程實行對粘連字符的分割,即水滴從字符串頂部在重力的作用下沿字符輪廓向下滴落或水平滾動,最終水滴所經(jīng)過的軌跡就構(gòu)成了字符的分割路徑。但當水滴陷在輪廓的凹處時,將滲漏到字符筆劃中,會穿透筆劃后繼續(xù)滴落,易導(dǎo)致字符筆劃斷裂,因此也不能從根本上解決粘連字符的分割問題。參考文獻[5]采用了最短路徑算法,但其實行單向搜索路徑,且分割點的確定不準確,因此分割準確率不高。本文在參考文獻[5]的基礎(chǔ)上,設(shè)計了一種基于雙向最短路徑的粘連字符圖像分割方法,以期解決上述分割方法造成的字符損傷問題,并提高分割正確率和抗干擾能力。
1 粘連字符圖像分割算法
  攝像頭采集到的圖像為彩色圖像,直接處理復(fù)雜且效果不好,因此需要對圖像進行濾波、直方圖均衡化、顏色聚類得到二值圖像。經(jīng)過預(yù)處理后的圖像,由于字符本身的因素以及攝像頭自身分辨率不高等原因,會造成圖像中字符的粘連,因此通過提取連通分量,再采用二維檢測器[6]方法將連通分量分類。下面簡要介紹二維檢測器的基本思想。
  通過連通分量的寬高比和標準筆劃數(shù)[6]2個特征來確定單字符在二維空間的分布,從而得到1條直線用以正確判別單字符和粘連字符。如果這2個特征構(gòu)成的點落在直線的下方,則認為連通域包含1個字符;如果由這2個特征構(gòu)成的點落在直線的上方,則認為連通域包含多個字符。
  經(jīng)過上述方法處理后,字符被分為兩類:一類為單字符,另一類為粘連字符。前者直接送入分類識別器,后者需進行再分割。在對粘連字符圖像進行分割后續(xù)處理時,為避免出現(xiàn)參考文獻[1]~[4]的情況,以雙向最短路徑為基本思路,設(shè)計了一種新的粘連字符圖像分割方法。首先分析粘連字符圖像的上下輪廓,確定候選分割點,再以分割點開始,遵循最小代價原則搜索分割路徑。該方法的具體流程如圖1所示。

  預(yù)處理后的粘連字符圖像總是在其上下輪廓間的最短距離處發(fā)生粘連[7],如圖2(a)所示,通過確定粘連字符的上下輪廓,并求得上下輪廓的極值點,可以確定候選分割點。參考文獻[8]在解決圖書索引書號粘連字符的分割問題時,為確定字符的寬度,給出了字符串上、下輪廓的定義。

  設(shè)待處理的二值圖像為b(i,j)∈[0,1],其中,0為背景,1為前景,i=1,2,…,m,j=1,2,…,n,則字符串上輪廓可由b(i,j)中自上而下掃描到每列的第1個黑色像素點;相反可以給出字符串下輪廓的定義。這樣它們可以用一維向量top(j)和bottom(j)表達,其生成方法可形式化描述如下:
  For j=1:n
?   For i=1:m
???   if b(i,j)=1,top(j)=i;
???    if b(m-i+1,j)=1,bottom(j)=m-i+1;
  此處注意,當某列無字符時,表明無黑色像素點,則令top(j)=1,而令bottom(j)=m。據(jù)此,可檢測到粘連字符圖2(a)的上、下輪廓如圖2(b)所示。
  接下來,分別求取top(j)=1和bottom( j )=m的局部極大、極小值點,從而求出上、下輪廓的極大、極小點,即可視為字符粘連位置。以上面確定的極值點作為起始分割位置,分別以向上或向下雙向最小代價分析的策略來尋求最短分割路徑。定義分割移動方向的代價函數(shù)是很關(guān)鍵的。
  從(x,y)點出發(fā),以向下遍歷為例,按照滴水算法[4]和最短路徑[5]的思想,給出規(guī)定的3種可分割方向:垂直方向和左、右對角線方向。參考文獻[9]定義代價函數(shù)fee(i,j)如下:
  
  向上遍歷代價函數(shù)與此類似。搜索1條完整路徑的處理流程如圖3所示。

2 實驗結(jié)果和分析
  選擇預(yù)處理后的二值字符圖像200幅進行了仿真實驗,共包含字符串525個,粘連字符125個。分割實驗的部分效果如圖4所示。

?


  對參考文獻[3]提出的骨架形態(tài)分析算法、參考文獻[4]提出的滴水算法的分割正確率進行了比較,實驗數(shù)據(jù)如表1所示??梢钥闯觯羌苄螒B(tài)分析算法和滴水算法在分割粘連字符圖像時,正確分割率要低于本文提出的方法。

?


  在數(shù)字識別系統(tǒng)中,正確分割出單個字符是字符識別的前提和基礎(chǔ),在同等條件下,分割精度越高識別率就越高。字符粘連、有部分字符干擾是字符分割最棘手的問題,本文以雙向最短路徑方法設(shè)計的粘連字符圖像分割策略成功地解決了此問題,與現(xiàn)有方法相比,提高了正確分割率,獲得了較好的字符分割效果。

參考文獻
[1] 鄒榮金, 蔡士杰. 字符粘連及字線相交的分割與識別方法[J].軟件學(xué)報,1999,10(3):241-247.
[2] 曹迪銘,宣國榮.牌照字符分割中的區(qū)域分裂與合并[J].計算機工程,2000,26(10):18-24.
[3] 馬瑞. 一種用于手寫數(shù)字分割的滴水算法的改進[J].小型微型計算機系統(tǒng),2007,11(11):2110-2112.
[4] 盧達,謝銘培.一種基于骨架法形態(tài)分析的粘連字符圖像分切方法[J].中文信息學(xué)報,1998,2(13): 40-43.
[5] WANG J, JEAN J. Segmentation of merged characters by?neural networks and shortest path[J]. Pattern Recognition,1994, 27(5): 649-658.
[6] 張闖,吳銘.非限制自由手寫粘連數(shù)字串數(shù)字個數(shù)的判斷[J].北京郵電大學(xué)學(xué)報, 2004,6(27):63-64.
[7]?DIMAURO G,IMPEDOVO S, PIRLO A,et al.Automatic bank check processing: A new engineered system[J]. International Journal of Pattern Recognition and Artificial Intelligence,?1997,11(4):467-504.
[8] 胡小鋒,陳超,葉慶泰.圖書索書號粘連字符的切分[J].上海交通大學(xué)學(xué)報,2005,38(4):553-556.
[9] 陳兵.用神經(jīng)網(wǎng)絡(luò)方法分割粘連字符的一種改進方案[D] .大連理工大學(xué), 2006,6:21-22.

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。