《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > DBSCAN算法與數(shù)學(xué)形態(tài)學(xué)在巖石薄片圖像分割中的應(yīng)用
DBSCAN算法與數(shù)學(xué)形態(tài)學(xué)在巖石薄片圖像分割中的應(yīng)用
2016年微型機(jī)與應(yīng)用第17期
蔣宜勤1,周基賢1,馮俊羲2,滕奇志2
1.新疆油田分公司實(shí)驗(yàn)檢測研究院,新疆 克拉瑪依 834000;2.四川大學(xué) 電子信息學(xué)院 圖像信息研究所,四川 成都 610065
摘要: 在巖石薄片圖像處理中,針對(duì)巖屑礦物個(gè)數(shù)未知、成像多為聚集的點(diǎn)狀的特點(diǎn),提出了一種基于DBSCAN(DensityBased Spatial Clustering of Applications with Noise)算法與數(shù)學(xué)形態(tài)學(xué)的礦物分割方法。首先,標(biāo)記出每個(gè)顆粒目標(biāo),求得其中心坐標(biāo);其次,利用DBSCAN算法對(duì)巖屑顆粒目標(biāo)中心進(jìn)行聚類,將不同區(qū)域的巖屑目標(biāo)分離出來;最后,利用數(shù)學(xué)形態(tài)學(xué)方法對(duì)聚類結(jié)果做膨脹、填孔、腐蝕等處理,得到顆粒的邊界。實(shí)驗(yàn)分析表明:該方法聚類效果良好,參數(shù)容易控制并有一定的抗噪性能,對(duì)巖屑顆粒目標(biāo)的提取有較好的效果。
Abstract:
Key words :

  1,周基賢1,馮俊羲2,滕奇志2

 ?。?.新疆油田分公司實(shí)驗(yàn)檢測研究院,新疆 克拉瑪依 834000;2.四川大學(xué) 電子信息學(xué)院 圖像信息研究所,四川 成都 610065)

     摘要:巖石薄片圖像處理中,針對(duì)巖屑礦物個(gè)數(shù)未知、成像多為聚集的點(diǎn)狀的特點(diǎn),提出了一種基于DBSCAN(DensityBased Spatial Clustering of Applications with Noise)算法與數(shù)學(xué)形態(tài)學(xué)的礦物分割方法。首先,標(biāo)記出每個(gè)顆粒目標(biāo),求得其中心坐標(biāo);其次,利用DBSCAN算法對(duì)巖屑顆粒目標(biāo)中心進(jìn)行聚類,將不同區(qū)域的巖屑目標(biāo)分離出來;最后,利用數(shù)學(xué)形態(tài)學(xué)方法對(duì)聚類結(jié)果做膨脹、填孔、腐蝕等處理,得到顆粒的邊界。實(shí)驗(yàn)分析表明:該方法聚類效果良好,參數(shù)容易控制并有一定的抗噪性能,對(duì)巖屑顆粒目標(biāo)的提取有較好的效果。

  關(guān)鍵詞:DBSCAN聚類;圖像分割;巖石薄片圖像;數(shù)學(xué)形態(tài)學(xué)

0引言

  利用巖石薄片圖像進(jìn)行巖石顆粒的粒度分析是地質(zhì)實(shí)驗(yàn)室的一種常用方法,而巖石顆粒的分割是粒度分析和礦物識(shí)別的前提。根據(jù)顆粒的光學(xué)性質(zhì)和礦物成分,可以分為以下兩類:

  (1)碎屑顆粒。該類顆粒成分較為單一,在正交偏光下,明暗變化比較一致,通常呈現(xiàn)整體地變亮變暗。其特點(diǎn)是顆粒目標(biāo)面積較大,邊界清晰,容易確定。隨著圖像處理技術(shù)的發(fā)展,目前已經(jīng)有一些典型顆粒分割方法應(yīng)用在碎屑顆粒分割上,取得了較好的效果,已經(jīng)在一定程度上解決了分割的問題。

 ?。?)巖屑顆粒。該類顆粒成分較為復(fù)雜,在正交偏光下明暗變化不一致,通常呈現(xiàn)出點(diǎn)狀。特點(diǎn)是目標(biāo)面積較小,邊界模糊,難以確定。目前有一些學(xué)者提出了超像素分割方法[1],該方法應(yīng)用到巖石薄片圖像的分割上,能夠大致地?cái)M合出顆粒的邊界,但是存在目標(biāo)過分割及區(qū)域合并易出錯(cuò)的問題。

  針對(duì)巖屑礦物的光學(xué)特性和成像特點(diǎn),本文提出一種基于算法密度的聚類算法(DensityBased Spatial Clustering of Applications with Noise,DBSCAN)與數(shù)學(xué)形態(tài)學(xué)的巖屑顆粒分割方法。該方法首先利用顆粒中心代表本身來簡化模型,然后利用DBSCAN算法對(duì)目標(biāo)中心進(jìn)行聚類,標(biāo)記出不同的顆粒目標(biāo);最后再結(jié)合改進(jìn)的數(shù)學(xué)形態(tài)學(xué)方法,近似地得到顆粒邊界。實(shí)驗(yàn)結(jié)果表明,本文方法對(duì)顆粒的分割和邊界提取有較好的效果,為顆粒邊界的刻畫提供了一種有效的途徑。

1問題描述與分析

  圖1是一幅巖石薄片樣本的單偏光圖像,其中既包含碎屑顆粒,又包含巖屑顆粒。對(duì)顆粒進(jìn)行分割的目的就是確定其邊界,但是僅通過這一張單片光圖片是很難對(duì)兩種顆粒進(jìn)行分割的。

圖像 001.png

  碎屑顆粒目標(biāo)成分單一,在正交偏光下成像簡單,通常為一整個(gè)顆粒,邊界比較容易確定,利用礦物在正交偏光下的這一消光特性[2],目前已有學(xué)者提出了一些分割算法[3],在工程應(yīng)用中取得了較好的效果;而對(duì)于巖屑顆粒而言,在正交偏光下成像復(fù)雜,通常呈現(xiàn)若干聚集的點(diǎn)狀,邊界模糊難以確定,常用的顆粒分割方法沒有明顯的效果。針對(duì)巖屑顆粒的光學(xué)特性和成像的特點(diǎn),考慮利用聚類的方法來進(jìn)行分割,再結(jié)合數(shù)學(xué)形態(tài)學(xué)做后期處理,就可以擬合出目標(biāo)邊界。

  1.1聚類算法分類

  目前的聚類算法大致可以分為以下4種:(1)基于分割的算法,如k均值[4]、k中心等。這類算法是將數(shù)據(jù)集分成若干的子集。特點(diǎn)是需要設(shè)定簇的數(shù)量,根據(jù)對(duì)象間的相似程度將每個(gè)對(duì)象劃歸最近的簇。(2)層次聚類算法。層次聚類是把數(shù)據(jù)按層次進(jìn)行分解,最終的結(jié)果形成了一顆類別樹,每個(gè)子集是樹的節(jié)點(diǎn)。算法有最近鄰、最遠(yuǎn)鄰和CURE等。(3)基于模型的算法。這類算法基于統(tǒng)計(jì)理論,假定給定的數(shù)據(jù)集是按照一個(gè)確定的模型產(chǎn)生的,找出數(shù)據(jù)集的最佳擬合模型。如期望最大化(EM)[5]算法。(4)基于密度的算法。主要思路是在數(shù)據(jù)集中,根據(jù)密度的高低,分隔出低密度區(qū)域,尋找到高密度區(qū)域,并將每個(gè)獨(dú)立的高密度區(qū)域作為一個(gè)簇。比較典型的算法有DBSCAN[6] 、OPTICS[7]等。

  1.2基于密度的聚類算法特點(diǎn)

  基于密度的聚類方法,是根據(jù)數(shù)據(jù)集在空間分布上的密集程度來進(jìn)行聚類,不需要人為設(shè)定簇的數(shù)量,非常適用于數(shù)據(jù)集的簇?cái)?shù)量未知的場合。本文所使用的DBSCAN算法是一種經(jīng)典的基于密度聚類算法,它以單位超球狀區(qū)域內(nèi)所包含數(shù)據(jù)對(duì)象的數(shù)量作為依據(jù),來衡量此區(qū)域密度的高低[8],它的特點(diǎn)是可以自動(dòng)確定簇的數(shù)量,能夠在帶有噪聲的數(shù)據(jù)空間中發(fā)現(xiàn)任意形狀的簇,并且可以標(biāo)記出離群點(diǎn)。

2基于DBSCAN算法與數(shù)學(xué)形態(tài)學(xué)的分割方法

  2.1DBSCAN算法基本理論

  DBSCAN算法最早由ESTER M[6]等人提出,是一種經(jīng)典的基于密度聚類算法,已經(jīng)在交通監(jiān)控[9]、數(shù)據(jù)挖掘等方面有著廣泛的應(yīng)用。DBSCAN算法的主要定義[6,8]如下:

  定義1(Eps鄰域):給定一個(gè)數(shù)據(jù)對(duì)象p,p的Eps鄰域NEps定義為以p為核心,以Eps為半徑的d維超球體區(qū)域,即:

  NEps(p)={q∈D|dist(p,q)≤Eps}

  定義2(核心點(diǎn)與邊界點(diǎn)):對(duì)于某個(gè)數(shù)據(jù)對(duì)象p∈D,給定一個(gè)整數(shù)minPts,若p的Eps鄰域內(nèi)對(duì)象的數(shù)量滿足|NEps(p)|≥minPts條件,則稱p為(Eps,minPts)條件下的核心點(diǎn);若p不滿足此條件,則它不是核心點(diǎn),又若p落在某個(gè)核心點(diǎn)的Eps鄰域內(nèi),則稱它為邊界點(diǎn)。

  定義3(直接密度可達(dá)):給定(Eps,minPts),如果對(duì)象p和q滿足以下兩個(gè)條件:p∈NEps(q);|NEps(q)|≥minPts,(即q是核心點(diǎn)),則稱對(duì)象p是從對(duì)象q出發(fā),直接密度可達(dá)的。

  定義4(直接密度可達(dá)):給定一個(gè)數(shù)據(jù)集D,當(dāng)存在一個(gè)對(duì)象鏈p1,p2,p3,...,pn,其中p1=q,pn=p對(duì)于pi∈D,如果在條件(Eps,minPts)下pi+1從pi直接密度可達(dá),則稱對(duì)象p從對(duì)象q在條件(Eps,minPts)下密度可達(dá)。

  定義5(密度相連):如果數(shù)據(jù)集D中存在一個(gè)對(duì)象o,使得對(duì)象p和q是從o在(Eps,minPts)條件下密度可達(dá)的,那么就稱對(duì)象p和q密度相連,密度相連是對(duì)稱的。

  定義6(簇和噪聲):由任意一個(gè)核心點(diǎn)對(duì)象開始,從該對(duì)象密度可達(dá)的所有對(duì)象構(gòu)成一個(gè)簇。不屬于任何簇的對(duì)象為噪聲。

  在巖石薄片圖像中,巖屑顆粒目標(biāo)就是呈現(xiàn)的聚集的點(diǎn)狀。而噪聲分布是雜亂無章的,聚集程度較低,與巖屑顆粒目標(biāo)的分布有著差別。在工程中,無法獲得顆粒數(shù)量等先驗(yàn)知識(shí),而DBSCAN算法在目標(biāo)簇的數(shù)量未知的情況下,可以尋找到任意形狀的簇。因此,DBSCAN算法很適合這種場景下的應(yīng)用。

  2.2巖屑顆粒分割及邊界提取步驟

  實(shí)際中本文得到的是一幅復(fù)雜多樣的圖片,首先要進(jìn)行面積預(yù)處理,然后為了簡化模型,利用目標(biāo)中心來代表本身,進(jìn)一步需要聚類、去噪、數(shù)學(xué)形態(tài)學(xué)處理等過程,最終才能得到分割的結(jié)果。

  在本文中,分割的結(jié)果是多值的,傳統(tǒng)二值圖像的形態(tài)學(xué)處理是不適用的,需要做一些改進(jìn),如對(duì)目標(biāo)進(jìn)行膨脹,邊界的顏色需要與當(dāng)前處理的目標(biāo)顏色一致。

  在實(shí)際中,巖石薄片圖像里既有大面積的碎屑顆粒目標(biāo),也有小面積、呈現(xiàn)出聚集點(diǎn)狀的巖屑顆粒目標(biāo),如圖2所示。提取巖屑顆粒目標(biāo)需要以下幾個(gè)步驟:

圖像 002.png

 ?。?)利用兩種顆粒面積大小不同的特點(diǎn),通過設(shè)定面積閾值,提取出巖屑顆粒目標(biāo),對(duì)其進(jìn)行單獨(dú)處理;

 ?。?)標(biāo)記出每個(gè)連通區(qū)域,并求出其中心坐標(biāo);

 ?。?)運(yùn)用DBSCAN算法對(duì)各區(qū)域進(jìn)行聚類,標(biāo)記出不同的巖屑顆粒和噪聲點(diǎn);

  (4)去除噪聲點(diǎn)并進(jìn)行膨脹、填孔等數(shù)學(xué)形態(tài)學(xué)的處理,得到巖屑顆粒的邊界。

3實(shí)驗(yàn)結(jié)果與分析

  對(duì)于實(shí)際中的一幅圖片,如圖2所示,先進(jìn)行面積的預(yù)處理,去除大面積的碎屑顆粒目標(biāo),便得到了含有噪聲的巖屑顆粒目標(biāo),如圖3所示。首先標(biāo)記出每個(gè)連通區(qū)域并求得其中心坐標(biāo);其次運(yùn)用DBSCAN算法對(duì)顆粒中心進(jìn)行聚類,提取出巖屑顆粒目標(biāo),并標(biāo)識(shí)出噪聲點(diǎn),其中灰色的為巖屑顆粒目標(biāo),純白色的為噪聲點(diǎn),結(jié)果如圖4所示。去除噪聲并對(duì)巖屑顆粒進(jìn)行膨脹,得到的結(jié)果如圖5所示。對(duì)膨脹結(jié)果進(jìn)行填孔、腐蝕處理得到最終的結(jié)果,如圖6所示?!?/p>

圖像 003.png

圖像 004.png

圖像 005.png

  對(duì)比圖3和圖4可以看出,DBSCAN算法可以有效地去除噪聲點(diǎn),能夠提取出巖屑顆粒,具有較好的抗噪性能。得到了巖屑顆粒目標(biāo)后,由于它們是呈散點(diǎn)狀的,還需要通過膨脹和后期的填孔處理。從圖5可以看出,膨脹后在顆粒邊界周圍,存在著一些小面積目標(biāo),這些目標(biāo)是孤立的,并不影響顆粒的總體輪廓,所以可以去除它們。從總體上看,經(jīng)過多次膨脹,目標(biāo)面積增大了,需要進(jìn)行適當(dāng)?shù)母g或開操作的處理,

圖像 006.png

4結(jié)論

  基于DBSCAN算法和數(shù)學(xué)形態(tài)學(xué)的巖石薄片圖像分割方法,首先經(jīng)過面積預(yù)處理,去除碎屑顆粒目標(biāo),保留巖屑顆粒目標(biāo);然后利用DBSCAN算法對(duì)含有噪聲的巖屑顆粒中心坐標(biāo)進(jìn)行聚類,從而去除大部分的噪聲點(diǎn);再對(duì)結(jié)果進(jìn)行改進(jìn)的膨脹、填孔、腐蝕等形態(tài)學(xué)處理,最終得到分割結(jié)果和顆粒目標(biāo)的邊界。

  實(shí)驗(yàn)結(jié)果表明,本文方法對(duì)巖屑顆粒的分割與邊界提取有一定的效果,為顆粒目標(biāo)提取和粒度分析提供了一種途徑。但該方法也存在著一些不足,如經(jīng)過數(shù)學(xué)形態(tài)學(xué)處理的結(jié)果邊緣不夠平滑;DBSCAN算法需要人為設(shè)定經(jīng)驗(yàn)性的參數(shù),目前還不能很好地自適應(yīng)。如何根據(jù)實(shí)際中復(fù)雜多樣的情況做出相應(yīng)的改進(jìn),將是需要進(jìn)一步解決的問題。

  參考文獻(xiàn)

  [1] ACHANTA R, SHAJI A, SMITH K, et al. SLIC superpixels compared to stateoftheart superpixel methods[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(11): 2274 2282.

 ?。?] 常麗華,陳曼云,金巍,等. 透明礦物薄片鑒定手冊(cè)[M]. 北京:地質(zhì)出版社, 2006.

 ?。?] 吳擁, 蘇桂芬, 滕奇志, 等. 巖石薄片正交偏光圖像的顆粒分割方法[J]. 科學(xué)技術(shù)與工程, 2013,13(31): 92019206.

 ?。?] MACQUEEN J. Some methods for classification and analysis of multivariate observations[C].Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, 1967, 1(14): 281297.

 ?。?] MOON T K. The expectationmaximization algorithm[J]. Signal Processing Magazine, IEEE, 1996, 13(6): 47 60.

 ?。?] ESTER M, KRIEGEL H P, SANDER J, et al. A densitybased algorithm for discovering clusters in large spatial databases with noise[C]. Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining (KDD′96).AAAI Press,1996: 226231.

  [7] ANKERST M, BREUNIG M M, KRIEGEL H P, et al. OPTICS: ordering points to identify the clustering structure[C]. In: Proceedings of the 1999 ACM SIGMOD International Conference on Management of Data, SIGMOD 1999:4960.

 ?。?] 夏魯寧, 荊繼武. SADBSCAN: 一種自適應(yīng)基于密度聚類算法[J]. 中國科學(xué)院研究生院學(xué)報(bào), 2009, 26(4): 530 538.

 ?。?] 劉衛(wèi)寧,曾嬋娟,孫棣華. 基于DBSCAN算法的營運(yùn)車輛超速點(diǎn)聚類分析[J]. 計(jì)算機(jī)工程,2009,35(5):268 270.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。