摘 要: 由于手寫(xiě)體維文字符的特點(diǎn)以及個(gè)人書(shū)寫(xiě)風(fēng)格不同,會(huì)造成維文字符的傾斜,影響字符的特征提取和識(shí)別。提出了一種基于Hough變換的手寫(xiě)體維文雙線傾斜校正算法。實(shí)驗(yàn)結(jié)果表明,該算法能夠準(zhǔn)確、快速地檢測(cè)出傾斜手寫(xiě)體維文字符的傾斜角度,實(shí)現(xiàn)字符的傾斜校正。
關(guān)鍵詞: 維文字符; Hough變換; 傾斜校正
近年來(lái),隨著科技的發(fā)展,手機(jī)的應(yīng)用范圍越來(lái)越廣泛,這就給手機(jī)終端上的手寫(xiě)輸入以及手寫(xiě)識(shí)別提供了很大的發(fā)展空間。目前,國(guó)內(nèi)手機(jī)上的中文手寫(xiě)輸入技術(shù)發(fā)展很迅速,國(guó)外關(guān)于英文、阿拉伯文等文字的手機(jī)終端手寫(xiě)輸入技術(shù)已經(jīng)發(fā)展得比較成熟了。我國(guó)新疆地區(qū)的少數(shù)民族文字——維吾爾族文字與阿拉伯文非常相似,可以借鑒阿拉伯文手機(jī)終端的手寫(xiě)輸入技術(shù)。不同的人有不同的書(shū)寫(xiě)風(fēng)格,造成手寫(xiě)體維吾爾文有很大的隨意性;而且受手機(jī)屏幕大小的限制,導(dǎo)致手機(jī)終端上手寫(xiě)的維文字符會(huì)產(chǎn)生一定的傾斜度。進(jìn)行聯(lián)機(jī)和脫機(jī)維文字符的特征提取和識(shí)別[1]之前都需要對(duì)手寫(xiě)體維文字符進(jìn)行傾斜校正。
目前,比較常用的傾斜檢測(cè)方法有基于Hough變換的方法[2]、基于交叉相關(guān)性的方法、行間距跨度相關(guān)法[3]、基于Fourier變換的方法[3]、基于投影的方法[3]和K-最近鄰簇的方法等。
本文基于Hough變換檢測(cè)字符傾斜角度,利用Hough變換對(duì)灰度化之后的傾斜字符提取字符的基線,根據(jù)基線并結(jié)合維文字符的書(shū)寫(xiě)特點(diǎn),利用旋轉(zhuǎn)變換對(duì)手寫(xiě)體維文字符進(jìn)行傾斜校正。
1 手寫(xiě)體維文字符的特征
1.1 手寫(xiě)體維文字符的特征
手寫(xiě)體維文字符具有如下獨(dú)特的特征[4]。
(1)維吾爾文由32個(gè)基本字符組成,其中包括8個(gè)原音字符和24個(gè)輔音字符。
(2)根據(jù)每一個(gè)字符出現(xiàn)的位置不同(詞首、詞中、詞末等),通??梢苑譃楠?dú)立、前連、前后連和后連4種書(shū)寫(xiě)形式,因此,維文字符有120多種書(shū)寫(xiě)形式。
(3)維文字符書(shū)寫(xiě)時(shí)筆畫(huà)連續(xù)流暢,根據(jù)從右向左的方向書(shū)寫(xiě),主體筆劃方向特征明顯。
(4)維文字符的筆劃較少,許多字符的主體筆劃相同,僅僅根據(jù)不同的附加筆劃來(lái)區(qū)分,附加部分與字符主體上、下不粘連。一般地,主體筆劃是沿著基線書(shū)寫(xiě)的,而附加筆劃在基線的上方或下方分布,所以基線可以作為區(qū)分附加筆畫(huà)位置的參考線。
1.2 維文字符的分類(lèi)
維文字符的120多種形式是以32個(gè)基本字符為基礎(chǔ)的,是根據(jù)字符處于詞的不同位置而變換出來(lái)的。對(duì)32個(gè)基本字符按照基線進(jìn)行分類(lèi),其中基線為垂直線的有9個(gè),基線為水平線的有22個(gè), 其他1個(gè)。
2 基于Hough的傾斜檢測(cè)算法
2.1 Hough變換原理
Hough變換的原理[2,4]是:利用圖像空間和Hough參數(shù)空間的點(diǎn)-線對(duì)偶性, 將圖像空間的檢測(cè)問(wèn)題轉(zhuǎn)換到參數(shù)空間。通過(guò)在參數(shù)空間里進(jìn)行簡(jiǎn)單的累加統(tǒng)計(jì),再根據(jù)概率最大原理得到圖像空間的一些特性,最后將數(shù)據(jù)映射回圖像空間。Hough變換檢測(cè)受干擾的影響較小,是一種快速的直線檢測(cè)方法。在實(shí)際應(yīng)用中,通常圖像平面上的一個(gè)點(diǎn)就對(duì)應(yīng)到參數(shù)r-θ平面上的一條曲線上。如圖1所示,直線與原點(diǎn)的法線距離為r,法線與x軸的夾角為θ,直線上的每個(gè)點(diǎn)都滿(mǎn)足:
2.2 手寫(xiě)體維文字符雙線傾斜檢測(cè)算法
Hough變換在檢測(cè)過(guò)程中抗干擾性好,它利用圖像空間目標(biāo)像素的坐標(biāo)去計(jì)算參數(shù)空間中參考點(diǎn)的可能軌跡,是一種很好的直線提取方法。
2.2.1 維文字符預(yù)處理
進(jìn)行Hough變化之前還需要對(duì)字符圖像進(jìn)行預(yù)處理,包括灰度化和細(xì)化兩個(gè)過(guò)程。
(1)對(duì)字符圖像進(jìn)行灰度化。將24色位圖格式的傾斜維文字符圖像轉(zhuǎn)換成256色的灰度圖像,并進(jìn)行去噪處理。
(2)通過(guò)細(xì)化,對(duì)字符圖像進(jìn)行骨架提取。
2.3 維文字符的傾斜校正
根據(jù)檢測(cè)出的傾斜角度α和β,對(duì)維文字符進(jìn)行旋轉(zhuǎn)變換,實(shí)現(xiàn)字符的傾斜校正。
3 實(shí)驗(yàn)結(jié)果與分析
實(shí)驗(yàn)利用Visual Studio 2008為平臺(tái)編寫(xiě)程序來(lái)實(shí)現(xiàn)基于Hough變換的維文字符的傾斜校正。大多數(shù)手寫(xiě)體字符的傾斜校正角度在[-45°,45°]之間,少數(shù)手寫(xiě)體字符的傾斜校正角度超出這個(gè)范圍。以水平基線或者垂直基線為軸進(jìn)行校正,校正結(jié)果與印刷體原圖的對(duì)比如圖3、圖4所示。
一些字符使用基于水平或者垂直基線進(jìn)行校正之后,仍不能得到理想的效果。為了解決這一特殊情況,根據(jù)雙線檢測(cè)提取出兩個(gè)傾斜角度,可采用角平分線法,即將Hough變換檢測(cè)到的兩條直線的角平分線作為基線進(jìn)行傾斜校正。利用角平分線法進(jìn)行校正的結(jié)果如圖5、圖6所示。
可以看出,與單純使用水平基線或垂直基線作為旋轉(zhuǎn)軸相比,使用角平分線法對(duì)傾斜維文字符進(jìn)行校正,傾斜度有了明顯的改善。
對(duì)480幅傾斜手寫(xiě)體圖像進(jìn)行字符校正,結(jié)果如表2和表3所示,其中表3根據(jù)基線的檢測(cè)次序分類(lèi),表3根據(jù)基線的方向分類(lèi)。
本文根據(jù)維文字符的書(shū)寫(xiě)特點(diǎn)和字符基線位置的不同對(duì)字符進(jìn)行分類(lèi);對(duì)經(jīng)過(guò)預(yù)處理的維文手寫(xiě)體字符采用基于Hough變換的雙線傾斜校正算法提取傾斜角度。用該算法校正了480幅不同的手寫(xiě)體維文字符,得到了滿(mǎn)意的效果。國(guó)內(nèi)外均有文獻(xiàn)研究手寫(xiě)體數(shù)字的傾斜校正[5],本文算法也可用于手寫(xiě)體數(shù)字的傾斜校正。此外,該算法也可用于處于傾斜狀態(tài)的印刷體維文字符和印刷體數(shù)字的傾斜校正。
參考文獻(xiàn)
[1] 任宏宇,袁保社,田園. 基于BP神經(jīng)網(wǎng)絡(luò)的維吾爾聯(lián)機(jī)手寫(xiě)字符識(shí)別[J]. 微電子學(xué)與計(jì)算機(jī),2010,27(8):238-241.
[2] MAHMOUD A, SHATNAWI A,OMAR K. Skew detection and correction technique for arabic document images based on centre of gravity[J]. Journal of Computer Science,2009,21(3):363-368.
[3] 李政,楊揚(yáng),頡斌,等. 一種基于Hough變換的文檔圖像傾斜糾正方法[J].計(jì)算機(jī)應(yīng)用,2005,25(3):583-585.
[4] 萬(wàn)芳.聯(lián)機(jī)手寫(xiě)維吾爾文字識(shí)別技術(shù)的研究與實(shí)現(xiàn)[D].烏魯木齊:新疆大學(xué),2007.
[5] 王有偉,劉捷. 手寫(xiě)體數(shù)字識(shí)別中的一種新的傾斜校正的方法[J].計(jì)算機(jī)工程,2004,30(11):128-130.