摘 要: 半色調(diào)圖像的先驗性對于圖像的逆半調(diào)過程有重要的意義,分析了現(xiàn)有的半色調(diào)圖像識別方法之后,在傳統(tǒng)的灰度共生矩陣GLCM進行改進提出BGLCM。BGLCM適用于二值圖像的特征提取,省略了傳統(tǒng)共生矩陣特征值計算的過程,將提取的特征通過BP神經(jīng)網(wǎng)絡(luò)進行分類。實驗證明該方法提取的特征具有較好的時間復(fù)雜度及分類效果。
關(guān)鍵詞: 半色調(diào);逆半調(diào);特征提取;灰度共生矩陣
許多的圖像渲染技術(shù)只有二進制輸出,例如:印刷領(lǐng)域、壓縮存儲、紡織及醫(yī)學(xué)、數(shù)字打印設(shè)備等。將一幅0~255連續(xù)的圖像通過一定的技術(shù)將其轉(zhuǎn)換成0、1的二值圖像過程稱為圖像的半色調(diào)。圖像的半色調(diào)是通過一個二值設(shè)備裝置產(chǎn)生出一種連續(xù)圖像的錯覺方法,是使用黑白兩點的密度表示圖像像素值。有效的數(shù)字半色調(diào)可以大幅提高以最小的成本渲染圖像質(zhì)量,常用的半色調(diào)圖像技術(shù)主要分為有序抖動、誤差分散、點分散。通過誤差分散法實現(xiàn)的半色調(diào)圖像質(zhì)量最好但算法復(fù)雜度相對最高,點分散法次之,有序抖動法最差但算法復(fù)雜度也最低。
在紙質(zhì)圖像的數(shù)字化、數(shù)字出版社系統(tǒng)、半色調(diào)圖像的銳化、較色、壓縮等圖像的再處理領(lǐng)域需要將半色調(diào)圖像轉(zhuǎn)換成連續(xù)色調(diào)圖像為圖像的逆半調(diào)過程。逆半調(diào)技術(shù)在20世紀90年代有了一定的研究成果,當前公開報道過逆半調(diào)技術(shù)主要有濾波法、最優(yōu)化估計法、機器學(xué)習法、矢量法等。大部分的逆半調(diào)方法均需要知道產(chǎn)生半色調(diào)圖像的方法,例如參考文獻[1]采用多尺度梯度估計法以及參考文獻[2]采用MAP最大后驗概率估計的逆半調(diào)就需要知道誤差分散的分散核,針對誤差分散抖動掩膜技術(shù)[3]就需要知道相應(yīng)的半色調(diào)圖像抖動方法,所以半色調(diào)圖像的分類研究便顯得十分必要?;叶裙采仃嚕℅LCM)常用灰度圖像的特征提取,具有較好的效果。本文在傳統(tǒng)共生矩陣的基礎(chǔ)上對其進行改進提出適應(yīng)于二值圖像特征提取的BGLCM。
1 半色調(diào)圖像分類回顧
在公開發(fā)表的刊物中對半色調(diào)圖像分類研究的文獻相對較少,最早的為Chang Pao-Chi[4]在1997年提出了LMS濾波的半色調(diào)圖像復(fù)原即逆半調(diào)過程,為了設(shè)計不同種類濾波模板參數(shù),使用了一維自相關(guān)函數(shù)提取出半色調(diào)圖像特征,且用該數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),而后支持按半調(diào)類型初始化不同尺度的濾波模板,且依據(jù)LMS原理迭代生成相應(yīng)類型的濾波模板系數(shù)。但文中僅僅對clustered-dot、constrained average、dispersed-dot、error diffusion 4類半色調(diào)圖像進行了分類,顯然當前的半色調(diào)技術(shù)不止上述的3種,當error diffusion的誤差分散核就存在6種,而Bayesian算法在應(yīng)用中就需要知道誤差分散核的種類。
孔月萍[5]等人在Chang Pao-Chi的一維自相關(guān)函數(shù)基礎(chǔ)上提出了半色調(diào)圖像自相關(guān)與紋理特征相結(jié)合的半色調(diào)圖像分類算法,文中將半色調(diào)圖像通過適當?shù)姆直媛蔬M行按照式(1)“下采樣”將得到M/2×N/2(M、N為原圖像尺寸)的0~7級灰度級圖像。之后提取出共生矩陣(GLCM)、灰度游程矩陣(GLRM)的紋理逆差距特征C和線紋理特征R,之后結(jié)合自相關(guān)函數(shù)提取特征通過最鄰近分類器進行分類。實驗結(jié)果表明相對于參考文獻[4]分類的種類及準確率明顯提高,但文中僅將半色調(diào)圖像分成ED和有序抖動兩大類。半色調(diào)圖像類別除了ED和有序抖動兩大類還有塊置換法、模板替換像素法、meseDotDitherHvs、meseDotDitherWeighting等,且半色調(diào)圖像自相關(guān)與紋理特征相結(jié)合的半色調(diào)圖像分類算法時間復(fù)雜度高,會大大的降低特征提取效率。
3 算法設(shè)計
產(chǎn)生半色調(diào)圖像主要分為誤差分散(Error diffusion)、點分散(Dot diffusion)、有序抖動法(Ordered dither)、直接二值搜索法(Direct binary search)。通過參考文獻[9]可知有序抖動與點分散法時間復(fù)雜度低,但半色調(diào)圖像的質(zhì)量較差,誤差分散法時間復(fù)雜度低,質(zhì)量好,直接二值搜索法時間復(fù)雜度最高但產(chǎn)生的半色調(diào)圖像質(zhì)量最好。
在實際應(yīng)用與研究中雖然直接二值搜索法[10]能夠產(chǎn)生最好的半色調(diào)圖像,但由于其時間復(fù)雜度很高,所以并非常用。誤差分散法使用最多,其次為點分散法,最后為有序抖動法。誤差分散法和點分散法主要用于人物、景觀等打印顯示,有序抖動法主要用于圖形類圖像。
圖2為常見的半色調(diào)圖像,設(shè)計算法對其特征進行提取,將提取之后的特征通過BP神經(jīng)網(wǎng)絡(luò)分類,實驗結(jié)果證明該算法在半色調(diào)圖像分類準確率且分類種類均優(yōu)于傳統(tǒng)GLCM,適用于二值圖像的特征提取及分類,故將其稱為BGLCM。
4 實驗結(jié)果分析
本實驗在Windows XP操作系統(tǒng)環(huán)境下進行操作,采用VC6.0結(jié)合OpenCv及Matlab進行編程。通過對12種半調(diào)方法產(chǎn)生的半色調(diào)圖像庫中每一類隨機地取出2 000幅圖片通過上述傳統(tǒng)共生矩陣(GLCM)及改進之后共生矩陣(BGLCM)算法的特征進行提取及歸一化,之后從2 000個特征向量中隨機抽取10個特征向量形成特征曲線比較如圖4所示,由上至下依次對應(yīng)著圖2所示的半色調(diào)圖像類型。
圖4顯示了使用傳統(tǒng)共生矩陣(GLCM)和改進之后共生矩陣(BGLCM)對半色調(diào)圖像特征提取形成特征曲線圖,橫軸代表每幅半色調(diào)圖像的特征數(shù)8和40,縱軸為每一個特征數(shù)對應(yīng)的特征值,由圖中可見兩種算法產(chǎn)生的半色調(diào)圖像的特征曲線均具有很好的擬合度,但傳統(tǒng)的共生矩陣(GLCM)產(chǎn)生曲線圖在不同種類之間識別度不高而改進之后共生矩陣(BGLCM)不同類型的曲線又有很好的辨識度適合分類。
從產(chǎn)生的特征向量中選取500個特征對BP神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,之后隨機選取1 500個特征向量經(jīng)過訓(xùn)練之后的BP神經(jīng)網(wǎng)絡(luò)進行測試得其分類的準確率如表1、表2所示,表為一個矩陣A(i,j)(1≤i≤12,1≤j≤12),其中i,j分別對應(yīng)著圖2中的12類半色調(diào)圖像,A(i,i)(1≤i≤12)即對角線上數(shù)目為第i類正確數(shù)目,第13列為各類分類準確率。表中反應(yīng)出在同一個實驗環(huán)境由傳統(tǒng)的灰度共生矩陣對12類半色調(diào)圖像提取的特征通過BP神經(jīng)網(wǎng)絡(luò)進行分類的準確率較改進之后的BGLCM更差。
本文先介紹了半色調(diào)技術(shù)的應(yīng)用與常用的一些技術(shù)以及半色調(diào)圖像的再重建需要將二值圖像通過逆半調(diào)技術(shù)將其轉(zhuǎn)換成連續(xù)色調(diào)的灰度圖像。在逆半調(diào)技術(shù)中大部分需要知道相應(yīng)半色調(diào)圖像產(chǎn)生的方法,所以對半色調(diào)圖像的分類就顯得十分重要。之后分析現(xiàn)有的半色調(diào)圖像分類相關(guān)報道的不足之處,同時基于傳統(tǒng)的共生矩陣(GLCM)思想上對其進行相應(yīng)的改進使其適用二值圖像分類的BGLCM,改進之后的BGLCM省略了求共生矩陣的特征值而是對不同的相對算子Q含有(0,1)和(1,0)元素進行統(tǒng)計,相對傳統(tǒng)共生矩陣可以減少算法的時間復(fù)雜度,通過實驗分析可以看出在同一個實驗環(huán)境中經(jīng)過改進之后的BGLCM對二值圖像分類準確率優(yōu)于傳統(tǒng)的灰度共生矩陣。
參考文獻
[1] KITE T D, DAMERA-VENKATA N, EVANS B L, et al. A fast high-quality inverse halftoning algorithm for error diffused halftones[J]. Image Processing, IEEE Transactions on, 2000, 9(9): 1583-1592.
[2] STEVENSON R L. Inverse halftoning via MAP estimation[J]. Image Processing, IEEE Transactions on, 1997, 6(4): 574-583.
[3] KARNI Z, FREEDMAN D, SHAKED D. Fast inverse halftoning[C]. 31st International Congress on Imaging Science (ICIS 2010), Beijing, China. 2010.
[4] CHANG P C, YU C S. Neural net classification and LMS reconstruction to halftone images[C]. Photonics West′98 Electronic Imaging. International Society for Optics and Photonics, 1998: 592-602.
[5] 孔月萍,杜旭苗.一種半調(diào)圖像類型識別方法[J].計算機應(yīng)究,2009,26(12):4850-4851.
[6] 劉麗,匡綱要.圖像紋理特征提取方法綜述[J].中國圖象圖形學(xué)報,2009,14(4):622-635
[7] JULESZ B. Visual pattern discrimination[J]. Information Theory, IRE Transactions on, 1962, 8(2): 84-92.
[8] HARALICK R M, SHANMUGAM K, DINSTEIN I H. Textural features for image classification[J]. Systems, Man and Cybernetics, IEEE Transactions on, 1973 (6): 610-621.
[9] 孔月萍,曾平.圖像逆半調(diào)及其質(zhì)量評價技術(shù)研究[D].西安:西安電子科技大學(xué),2008.
[10] ANALOUI M, ALLEBACH J P. Model-based halftoning using direct binary search[C]. SPIE/IS&T 1992 Symposium on Electronic Imaging: Science and Technology. International Society for Optics and Photonics, 1992: 96-108.