摘 要: 針對(duì)已有的基于形狀的圖像檢索中目標(biāo)形狀描述方法的不足對(duì)其進(jìn)行改進(jìn)。首先對(duì)目標(biāo)圖像進(jìn)行一系列預(yù)處理,得到圖像的外部輪廓,利用改進(jìn)的霍夫變換提取目標(biāo)輪廓的線性特征;然后引入成對(duì)幾何特征即有向相對(duì)角和有向相對(duì)位置來(lái)描述圖像的形狀;最后利用直方圖相交算法衡量圖像特征間的相似度。實(shí)驗(yàn)證明,利用本文改進(jìn)的方法所描述的形狀屬性來(lái)檢索數(shù)據(jù)庫(kù)中的圖像具有較高的效率。
關(guān)鍵詞: 基于內(nèi)容的圖像檢索;霍夫變換;成對(duì)幾何特征;有向相對(duì)角;有向相對(duì)位置
近年來(lái),由于數(shù)字化和信息化技術(shù)的快速發(fā)展,越來(lái)越多的圖像都被數(shù)字化后保存在多媒體庫(kù)中。為了更好地使用這些圖像,就必須要求有一種快速、便捷的圖像檢索方法。因此,基于內(nèi)容的圖像檢索技術(shù)已經(jīng)成為人們研究的熱點(diǎn)。而在設(shè)計(jì)基于內(nèi)容的圖像檢索系統(tǒng)時(shí),檢索的有效率和準(zhǔn)確率則是兩個(gè)需要重點(diǎn)考慮的問(wèn)題[1]。
在基于內(nèi)容的圖像檢索方法中,其步驟一般是首先提取出圖像的突出特征(如顏色、紋理、形狀等),然后再根據(jù)這些特征來(lái)檢索。由于人類視覺(jué)在辨別物體的時(shí)候,最容易根據(jù)目標(biāo)的形狀來(lái)區(qū)分各個(gè)物體,因此形狀特征備受關(guān)注[2]。對(duì)基于目標(biāo)形狀的圖像檢索來(lái)說(shuō),目標(biāo)形狀的描述和匹配方法無(wú)疑是要首先解決的重要問(wèn)題,而通常使用的形狀描述符有:小波輪廓描述符[3]、不變矩(Moment Invariants)[4]、Zernike矩[5]、曲率尺度空間(Curvature Scale Space)[6]和區(qū)域密度函數(shù)[7]等。但是這些方法在尺度變換、旋轉(zhuǎn)變換以及抗噪性能上都有所缺陷。針對(duì)上述描述方法的缺陷,本文引入了成對(duì)幾何特征直方圖作為目標(biāo)形狀的描述方法,并將其應(yīng)用到基于形狀的圖像檢索系統(tǒng)中。
1 形狀描述符的構(gòu)造
目標(biāo)的形狀可以通過(guò)輪廓的提取或圖像分割的方法獲得。本文首先利用一系列的圖像預(yù)處理操作將圖像的外部輪廓提取出來(lái);然后利用改進(jìn)的Hough變換得到目標(biāo)輪廓的線性特征,再引入成對(duì)幾何直方圖描述目標(biāo)形狀的屬性;最后利用運(yùn)算復(fù)雜度比較低的直方圖相交算法來(lái)衡量目標(biāo)形狀的相似度,從而進(jìn)行目標(biāo)形狀的圖像檢索。
1.1 目標(biāo)輪廓的提取
(1)用戶輸入圖像,由計(jì)算機(jī)對(duì)輸入的圖像進(jìn)行預(yù)處理,包括圖像格式的轉(zhuǎn)換、尺寸的統(tǒng)一、圖像的增強(qiáng)與去噪等功能,為圖像的特征提取打下基礎(chǔ)。
(2)進(jìn)行圖像邊緣提取,經(jīng)過(guò)邊緣提取獲得圖像的輪廓特征。本文采取Canny算子[8]進(jìn)行邊緣提取。但由于有些圖像經(jīng)過(guò)邊緣提取過(guò)程所獲得的輪廓圖中存在著許多雜亂的線條,針對(duì)這種圖像,操作員要確認(rèn)是否對(duì)其進(jìn)行進(jìn)一步輪廓清晰化處理。對(duì)此,本文采用二值化以及圖像輪廓跟蹤處理來(lái)達(dá)到輪廓清晰化。通過(guò)輪廓清晰化處理后就基本得到了能夠較好反映圖像邊緣的輪廓圖像。
1.2 改進(jìn)的Hough變換算法
霍夫變換(Hough Transform)[8]用來(lái)檢測(cè)圖像中的直線和曲線。由于本系統(tǒng)要求得到的特征值中相對(duì)位置的幾何特征是要通過(guò)直線段獲取,但并沒(méi)有限制必須是全連接的直線段,因此,只要是圖像中存在的處于一條直線上的直線分割段都記為一條直線段。一般的霍夫變換算法只能檢測(cè)到直線,并不能劃分出符合試驗(yàn)要求的直線段,所以要對(duì)霍夫變換算法進(jìn)行改進(jìn)。即在現(xiàn)有的Hough變換中加入線段長(zhǎng)度測(cè)定功能。
改進(jìn)的算法基本思路是:充分利用Hough變換的參數(shù)空間數(shù)據(jù),增加Hough變換的后處理,克服Hough變換的缺陷,以檢測(cè)出包括諸如端點(diǎn)、方向等一些屬性的線段。具體的算法描述如下:
(7)轉(zhuǎn)到第(3)步。
(8)由Hough變換的局限性可知,某一條線段有可能同時(shí)被檢測(cè)出多條線段,所以要將這些相同的線段進(jìn)行合并,最后統(tǒng)計(jì)出圖像的線段條數(shù),以及它們的始末位置等一些屬性。
程序執(zhí)行完后,在數(shù)組Temp_Point[n]中保存了所檢測(cè)到的第n條線段的所有像素,由這些像素可以很容易地得到該線段的兩個(gè)端點(diǎn)以及其他參數(shù)。
1.3 成對(duì)幾何直方圖描述符
本文利用如圖1所示的成對(duì)幾何特征,即相對(duì)角和相對(duì)位置作為形狀特征來(lái)描述目標(biāo)輪廓,并采用關(guān)系直方圖統(tǒng)計(jì)這對(duì)幾何特征來(lái)進(jìn)行形狀索引。
1.3.3 成對(duì)幾何直方圖
二維幾何直方圖的描述是以上述成對(duì)幾何特征為基礎(chǔ)的。有向相對(duì)角的范圍為[-π,π],而有向相對(duì)位置的范圍為[1/2,∞)。當(dāng)計(jì)算直方圖時(shí)處理∞不是很實(shí)際,因?yàn)樵谠O(shè)計(jì)位置特征時(shí)是不一致的二進(jìn)制處理過(guò)程。所以為方便統(tǒng)計(jì),本文將有向相對(duì)位置公式稍做如下改動(dòng):
其中,i、j為從原始圖像中提取出的兩條線段,E為符合條件的邊集,eij為分段i和分段j的圖像邊界。
為了便于描繪直方圖,本文將原來(lái)直方圖矩陣中處于第i行第j列的元素轉(zhuǎn)換到直方圖數(shù)組中的第i×len+j位置處(其中,len為二維幾何直方圖水平方向總的等份數(shù)),這樣不但便于直方圖的描繪,還提高了直方圖相似性計(jì)算的速度。另外,為了便于描繪,對(duì)直方圖的范圍也統(tǒng)一量化到[0,255],對(duì)整個(gè)直方圖表達(dá)出來(lái)的統(tǒng)計(jì)效果不會(huì)產(chǎn)生不良的影響。直方圖量化示意圖如圖2所示。
1.4 直方圖相似度計(jì)算
對(duì)建立好的特征直方圖進(jìn)行匹配操作是:將所得的直方圖與特征數(shù)據(jù)庫(kù)中存儲(chǔ)的直方圖進(jìn)行匹配,在匹配閾值范圍之內(nèi)的圖像則認(rèn)為是與樣本圖像相關(guān)的圖像。
本系統(tǒng)中采用運(yùn)算復(fù)雜度比較低的直方圖相交算法來(lái)計(jì)算直方圖距離,其算法原理為:假定兩個(gè)目標(biāo)輪廓的直方圖A和B各有n個(gè)歸一化的直方圖單元{Ai}和{Bi},則這兩個(gè)直方圖之間的距離d為:
d值越小,則兩個(gè)直方圖之間的距離越近,表明兩幅圖像越相似;相反,則表明兩幅圖像相似性較小。當(dāng)d=0時(shí),表明兩幅圖像完全相同;d=1時(shí),則兩幅圖像完全不同。
2 實(shí)驗(yàn)與結(jié)果分析
實(shí)驗(yàn)利用VS2005和SQL 2005數(shù)據(jù)庫(kù)實(shí)現(xiàn)了基于目標(biāo)形狀的圖像檢索,模型系統(tǒng)實(shí)現(xiàn)了半自動(dòng)目標(biāo)輪廓提取,并計(jì)算目標(biāo)輪廓的幾何特征及描繪出相應(yīng)的幾何特征直方圖;檢索過(guò)程中提取并計(jì)算目標(biāo)輪廓幾何特征后,系統(tǒng)可以自動(dòng)完成檢索功能,減少了系統(tǒng)的繁瑣性。
2.1 實(shí)驗(yàn)步驟及結(jié)果
用一幅樣本圖像進(jìn)行試驗(yàn),系統(tǒng)對(duì)每幅圖像都進(jìn)行了圖像輸入、二值化、邊緣提取、輪廓跟蹤、Hough變換、特征提取6個(gè)處理步驟,其結(jié)果如圖3所示。
2.2 檢索結(jié)果
本文的實(shí)驗(yàn)圖庫(kù)為從標(biāo)準(zhǔn)測(cè)試圖像庫(kù)CBIR(Content-Based Image Retrieval)中選取的,由貓、狗、鳥(niǎo)類、蝴蝶等組成的120幅圖片。取CBIR中的一幅貓的圖像為樣本圖像(如圖3(a)),進(jìn)行特征提取及圖像匹配之后,在CBIR中檢索出了與樣本圖像形狀相似的圖像結(jié)果如圖4所示。
2.3 算法性能分析
為了檢驗(yàn)本文算法的魯棒性和有效性,實(shí)驗(yàn)中對(duì)原始圖像分別進(jìn)行了方向變換、尺度變換和部分遮擋變換。
2.3.1 方向變換下的算法性能
圖5為樣本圖像形狀經(jīng)過(guò)任意角度旋轉(zhuǎn)后的圖像及其相應(yīng)的幾何直方圖。由圖可知,雖然目標(biāo)形狀的方向發(fā)生了變換,但是其相應(yīng)的幾何直方圖仍然非常相近,這說(shuō)明了本文的算法對(duì)方向具有不變性。
2.3.2 尺度變換下的算法性能
圖6為樣本圖像形狀經(jīng)過(guò)各種尺度變換后的圖像及其相應(yīng)的幾何直方圖。由圖可知,雖然目標(biāo)形狀的尺度發(fā)生了變換,但是其相應(yīng)的幾何直方圖仍然非常相近,這說(shuō)明了本文的算法對(duì)尺度具有不變性。
2.3.3 部分遮擋下的算法性能
圖7為樣本圖像形狀經(jīng)過(guò)部分遮擋后的圖像及其相應(yīng)的幾何直方圖。由圖可知,雖然目標(biāo)形狀被不同部位的部分遮擋了,但是其相應(yīng)的幾何直方圖仍然非常相近,這說(shuō)明了本文的算法對(duì)部分遮擋情形有魯棒性。
基于內(nèi)容的圖像檢索技術(shù)是數(shù)字圖書(shū)館檢索的關(guān)鍵技術(shù),作為一個(gè)新興技術(shù),對(duì)它的研究才剛剛起步,還有許多問(wèn)題有待研究和進(jìn)一步完善。本文對(duì)其中的基于形狀的圖像檢索進(jìn)行了探討,通過(guò)對(duì)圖像的預(yù)處理、邊緣檢測(cè)、二值化、邊界跟蹤得到圖像的邊界輪廓,并采用Hough變換檢測(cè)線段的方法將輪廓邊界簡(jiǎn)化為直線表示,進(jìn)而用成對(duì)幾何特征方法來(lái)描述目標(biāo)輪廓。實(shí)驗(yàn)證明了此描述方法簡(jiǎn)單而有效,為多媒體信息檢索提供了一種有效的表示方法。
參考文獻(xiàn)
[1] KIM Y S, KIM W Y. Content-based trademark retrieval system using a visually salient feature [J].Image and Vision Computing, 1998, 16(9): 931-939.
[2] ZHANG D S, LU G J. Study and evaluation of different fourier methods for image retrieval [J]. Image and Vision Computing, 2005, 23(1): 33-49.
[3] 姚玉榮,章毓晉.利用小波和矩進(jìn)行基于形狀的圖像檢索[J].中國(guó)圖像圖形學(xué)報(bào),2000(3).
[4] CHEN C C. Improved moment invariants for shape discrimination[J]. Pattern Recognition, 1993,26(5):683-686.
[5] 云挺,顧磊,吳慧中.基于Zernike矩的區(qū)域匹配方法 [J].中國(guó)圖像圖形學(xué)報(bào),2008(8).
[6] MOKHTARIAN K, BOBER M. Curvature scale space representation: theory, applications and MPEG-7 standardization[M]. Boston MA, USA: Kluwer Academic Publishers(now Springer), 2003.
[7] 謝紅.基于目標(biāo)形狀的圖像檢索模型的改進(jìn)策略及其原型系統(tǒng)[D].廣州:暨南大學(xué),2001.
[8] 艾海舟,武勃.圖像處理、分析與機(jī)器視覺(jué)(第2版)[M].北京:人民郵電出版社,2003.