摘 要: 提出了應(yīng)用屬性論來(lái)實(shí)現(xiàn)無(wú)監(jiān)督圖像聚類的方法。首先提取圖像的底層特征,再利用屬性論方法中定性映射、轉(zhuǎn)換程度函數(shù)理論對(duì)圖像進(jìn)行分類。由于一次聚類并未達(dá)到很好的效果,因此采取了多次聚類的策略。實(shí)驗(yàn)結(jié)果表明,本方法簡(jiǎn)單明了并且有效。
關(guān)鍵詞: 屬性論;定性映射;轉(zhuǎn)換程度函數(shù);圖像聚類;HSV
隨著多媒體技術(shù)的飛速發(fā)展以及圖像獲取與存儲(chǔ)技術(shù)的提高,圖像數(shù)據(jù)庫(kù)得到了快速發(fā)展。面對(duì)如此龐大的圖像數(shù)據(jù)庫(kù),各個(gè)領(lǐng)域的圖像都非常多,想要檢索其中用戶感興趣的圖像十分不容易。因此,有必要對(duì)圖像數(shù)據(jù)庫(kù)中的圖像進(jìn)行聚類以減少圖像檢索的代價(jià)。俗話說(shuō)“物以類聚”,圖像的聚類即是將圖像數(shù)據(jù)庫(kù)中最為相似的部分劃為一類,使得類內(nèi)的相似度盡可能高,而類間的相似度盡可能低。
本文中的圖像聚類采用圖像的顏色以及輪廓兩種特征。利用熟知的HSV模型來(lái)得到圖像的顏色譜,以此作為顏色特征。輪廓特征則利用屬性論方法來(lái)獲取。在提取了特征之后,利用轉(zhuǎn)換程度函數(shù)來(lái)完成聚類。
1 圖像聚類
在聚類之前,先來(lái)介紹本文所用到的一些理論知識(shí)。好的聚類結(jié)果離不開(kāi)兩個(gè)重要方面:準(zhǔn)確有效的圖像特征以及合適的理論與方法。這兩方面缺任何一個(gè)都有可能達(dá)不到預(yù)期的效果。
1.1 定性映射[1-2]
眾所周知,事物有質(zhì)和量的兩種規(guī)定性,質(zhì)和量之間有質(zhì)量互變規(guī)律:只有超過(guò)度的范圍的量變才導(dǎo)致質(zhì)的變化,而限于度的范圍之內(nèi)的量變不導(dǎo)致質(zhì)變。 這一性質(zhì)可用如下定理表示:
1.3 輪廓特征提取
對(duì)圖像提取輪廓,首先將圖像進(jìn)行灰度化,然后獲得圖像的灰度直方圖,再確定圖像二值化的閾值,最后對(duì)圖像進(jìn)行二值化。
二值化后的圖像只有兩種顏色,從屬性論的觀點(diǎn)出發(fā),每幅圖片只有黑色和白色兩種屬性,它們所對(duì)應(yīng)的量值分別為0和255。由于圖像輪廓產(chǎn)生在這兩種屬性發(fā)生轉(zhuǎn)變的臨界部分,這樣圖像的輪廓就很容易提取出來(lái)了。將圖像分成若干個(gè)區(qū)域,在這些區(qū)域中利用表示白色與黑色屬性的定性映射做一個(gè)差,這個(gè)差值的絕對(duì)值不外乎兩種情況:1和0, 1表示發(fā)生了性質(zhì)的轉(zhuǎn)變,0表示未發(fā)生性質(zhì)的轉(zhuǎn)變。當(dāng)每一個(gè)區(qū)域中有1值時(shí),就將這個(gè)區(qū)域劃為輪廓,否則不劃為輪廓部分并將這個(gè)區(qū)域變成白色。
1.4 顏色特征提取
圖像顏色的表達(dá)有許多種方式,如比較常見(jiàn)的RGB空間、HSV空間、HIS空間等。HSV空間具有如下特點(diǎn):三個(gè)分量相對(duì)于人的視覺(jué)彼此獨(dú)立,信息結(jié)構(gòu)更緊湊;能夠獲得對(duì)彩色的直觀表示;各彩色值根據(jù)主觀評(píng)價(jià)均勻量化,彩色距離的大小與人眼的感覺(jué)一致;人對(duì)顏色的感覺(jué)比較均勻。因此,本文以此空間來(lái)表示圖像的顏色。HSV空間中,H表示色調(diào),S表示飽和度,V表示亮度。
HSV空間中,根據(jù)參考文獻(xiàn)[5],各分量的計(jì)算公式如下:
其中,Qs、Qv分別表示S、V的量化級(jí)數(shù),通過(guò)式(11)可知它們都取值為2。由式(12)式很容易得到l的取值范圍,然后再統(tǒng)計(jì)圖像中各值的分布,即可得到圖像的顏色譜。
1.5 聚類算法
將上面得到的顏色特征記為向量C,輪廓特征記為向量P。由于應(yīng)用的不同,可能想要得到的結(jié)果也就不同。通常的做法是為每一種特征都賦一個(gè)權(quán)值,由于并無(wú)確定權(quán)值的具體算法,因此只能從反復(fù)實(shí)驗(yàn)中獲得一組合理的。
聚類的步驟如下:
(1)由于開(kāi)始時(shí)并無(wú)類別之分,因此就將第一個(gè)待歸類的作為一個(gè)類別。
(2)若待匹配的類別中只有一個(gè)元素,則可以用普通
本文將屬性論方法應(yīng)用在圖像聚類中,從表1中的結(jié)果可以看出該方法的有效性。但是本文提出的算法還存在很多不足,如權(quán)值以及相似度閾值的確定都比較依賴于人們的經(jīng)驗(yàn)值或反復(fù)實(shí)驗(yàn)所獲得的合理值,在無(wú)監(jiān)督的聚類中,將這些值變?yōu)槌绦蛴?jì)算出來(lái)是很困難的。實(shí)驗(yàn)所用圖像庫(kù)是對(duì)物體做360°全方位拍攝所得的圖片,本文只對(duì)圖片做了一種變換(即對(duì)稱變換)。下一步的工作就是對(duì)圖像做一個(gè)三維的變換來(lái)提高聚類的正確率以及減少聚類的次數(shù)。
參考文獻(xiàn)
[1] 李文佩. 基于定型映射和轉(zhuǎn)化程度函數(shù)的漢字識(shí)別[D]. 上海:上海海事大學(xué),2004.
[2] 馮嘉禮. 定性映射、基準(zhǔn)變換、轉(zhuǎn)化程度函數(shù)、人工神經(jīng)元和集合模糊化[J].模糊數(shù)學(xué)與系統(tǒng),2004,18:53-56.
[3] 馮嘉禮. 基于屬性坐標(biāo)學(xué)習(xí)和分析的核事故評(píng)估與決策模型[J].應(yīng)用基礎(chǔ)與工程科學(xué)學(xué)報(bào),2006,5(14):1-8.
[4] 馮嘉禮. 基于定性映射的程度函數(shù)及其誘導(dǎo)的模糊拓?fù)淇臻g[J].計(jì)算機(jī)科學(xué),2003,30(5):106-108.
[5] 孫即祥. 圖像處理[M].北京:科學(xué)出版社,2009.
[6] 謝從華,沈鈞毅,宋余慶,等. 一種圖像數(shù)據(jù)庫(kù)聚類與歸類方法的研究[J].控制與決策,2008,6(6):701-704.