《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 顯示光電 > 設(shè)計(jì)應(yīng)用 > 基于Labelme的參考圖像的手工分割
基于Labelme的參考圖像的手工分割
2015年微型機(jī)與應(yīng)用第17期
吉江燕,方 挺
(安徽工業(yè)大學(xué) 電氣與信息工程學(xué)院,安徽 馬鞍山 243032)
摘要: 圖像分割算法雖然已經(jīng)有了大量的研究,但沒有適用于所有圖像的通用分割算法。因此針對(duì)不同圖像的實(shí)際情況,需要進(jìn)行大量的實(shí)驗(yàn)來(lái)選擇最優(yōu)的分割算法。通過比較算法分割得到的結(jié)果圖像與對(duì)應(yīng)手工分割得到的參考圖像之間的差異,可以得到一種圖像分割算法的性能評(píng)價(jià),因此本文提出一種參考圖像的獲取方法。通過結(jié)合算法和LabelMe在線注釋軟件,該方法能夠方便地完成圖像中各種目標(biāo)邊界的定位并保存圖像。
關(guān)鍵詞: 圖像分割 參考圖像 LabelMe
Abstract:
Key words :

  摘  要圖像分割算法雖然已經(jīng)有了大量的研究,但沒有適用于所有圖像的通用分割算法。因此針對(duì)不同圖像的實(shí)際情況,需要進(jìn)行大量的實(shí)驗(yàn)來(lái)選擇最優(yōu)的分割算法。通過比較算法分割得到的結(jié)果圖像與對(duì)應(yīng)手工分割得到的參考圖像之間的差異,可以得到一種圖像分割算法的性能評(píng)價(jià),因此本文提出一種參考圖像的獲取方法。通過結(jié)合算法和LabelMe在線注釋軟件,該方法能夠方便地完成圖像中各種目標(biāo)邊界的定位并保存圖像。

  關(guān)鍵詞: 圖像分割;參考圖像;LabelMe

0 引言

  參考圖像的手工分割對(duì)衡量圖像分割算法的性能具有非常重要的意義。目前衡量圖像分割算法性能的主要方法是通過其與手工分割的參考圖像進(jìn)行差異性對(duì)比來(lái)實(shí)現(xiàn)。由于差異性可以通過定義相關(guān)分割評(píng)價(jià)指標(biāo)來(lái)具體完成,所以該方法具有很高的評(píng)價(jià)分辨率。本文將以多目標(biāo)的礦石圖像為例,使用基于種子標(biāo)記的分水嶺算法獲取算法分割的礦石圖像,通過LabelMe在線注釋并結(jié)合離散點(diǎn)連線和閉合多邊形內(nèi)部填充算法完成手工分割的參考圖像的獲取,并將礦石目標(biāo)的等面積直徑作為分割評(píng)價(jià)指標(biāo)來(lái)衡量礦石圖像分割的效果。

1 礦石圖像的算法分割

001.jpg

  圖1給出了640×512的礦石灰度圖像,由于該圖像中有大量的細(xì)碎鐵礦石目標(biāo)且相互粘連,所以本文先通過預(yù)處理獲取圖2所示的種子標(biāo)記圖像,在此基礎(chǔ)上采用基于種子標(biāo)記的分水嶺算法完成圖像分割[1-2]?;诜N子標(biāo)記的分水嶺算法是通過標(biāo)記所在的區(qū)域?qū)υ瓐D像進(jìn)行區(qū)域生長(zhǎng),以此抑制噪聲對(duì)圖像分割的影響,標(biāo)記區(qū)域的結(jié)果影響圖像分割的準(zhǔn)確性。圖3給出了基于種子標(biāo)記分水嶺算法的分割結(jié)果圖像。該礦石圖像被基于種子標(biāo)記的分水嶺算法分割成為246個(gè)礦石目標(biāo)。

  為了檢驗(yàn)礦石圖像分割算法的可行性,本文將重點(diǎn)介紹如何使用LabelMe在線標(biāo)識(shí)工具完成礦石圖像的手動(dòng)分割并保存參考圖像。

2 LabelMe在線注釋

  LabelMe[3]是由麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(MIT CSAIL)創(chuàng)建的一個(gè)開放的注釋工具。目的是以此來(lái)創(chuàng)建計(jì)算機(jī)視覺研究所需要的圖像集并通過網(wǎng)絡(luò)立即共享,且隨著時(shí)間的推移與時(shí)俱進(jìn)。圖像的注釋以XML文件進(jìn)行保存。用戶可以下載平臺(tái)上已有的帶注釋的圖像集,包括原始圖像集和對(duì)應(yīng)的XML文件集,并通過LabelMe提供的MATLAB工具箱幫助對(duì)其進(jìn)行處理。MATLAB工具箱提供一些函數(shù),包括顯示注釋的圖像、查詢特定的注釋內(nèi)容、下載圖像集等。用戶同時(shí)也可以上傳圖像到該平臺(tái)上,并對(duì)該圖像中感興趣的區(qū)域進(jìn)行在線注釋。

002.jpg

  圖4給出了圖像中的一個(gè)礦石目標(biāo)在線注釋示意圖。通過點(diǎn)擊該礦石目標(biāo)的邊界來(lái)描繪包含該目標(biāo)的多邊形輪廓且命名為stone1。用戶可以對(duì)圖像中任意目標(biāo)進(jìn)行注釋,不同的注釋目標(biāo)在圖像中會(huì)用不同的顏色進(jìn)行標(biāo)記。對(duì)應(yīng)圖像注釋的XML文件中保存了各目標(biāo)的名稱和點(diǎn)擊目標(biāo)邊界所形成的多邊形的離散坐標(biāo)點(diǎn),可通過LabelMe提供的MATLAB工具箱中的LMplot函數(shù)將離散坐標(biāo)點(diǎn)進(jìn)行連接以完成注釋圖像的顯示。

003.jpg

  圖5給出了通過LabelMe完成的所有礦石目標(biāo)的在線注釋,該礦石圖像總共注釋了272個(gè)礦石目標(biāo)。在線注釋完畢后,下載對(duì)應(yīng)圖像的XML文件并結(jié)合MATLAB來(lái)作進(jìn)一步處理。

3 參考圖像的獲取

  由于XML文件中保存的是點(diǎn)擊目標(biāo)邊界所形成多邊形的離散坐標(biāo)點(diǎn),函數(shù)LMplot僅能夠在圖像上對(duì)各多邊形的離散坐標(biāo)點(diǎn)連線顯示,并不能為此保存參考圖像。因此本文通過更改LMplot函數(shù)實(shí)現(xiàn)參考圖像的存儲(chǔ)功能。具體完成的功能包括兩點(diǎn):離散點(diǎn)連線和閉合多邊形內(nèi)部填充。

  由于LMplot函數(shù)是先將XML文件中的一個(gè)礦石多邊形對(duì)應(yīng)的離散坐標(biāo)點(diǎn)取出并在圖像上進(jìn)行描繪,再循環(huán)取出下一個(gè)多邊形對(duì)應(yīng)的離散坐標(biāo)點(diǎn)予以描繪,所以只需在其循環(huán)描繪多邊形時(shí)對(duì)離散點(diǎn)連線并賦予相同且唯一標(biāo)識(shí)的顏色即RGB值構(gòu)成閉合的區(qū)域并進(jìn)行內(nèi)部填充,在圖像中所有礦石描繪完畢的同時(shí)便可獲取手動(dòng)分割的礦石圖像。

004.jpg

  如圖6所示,假設(shè)礦石目標(biāo)此時(shí)由6個(gè)離散點(diǎn)組成,且對(duì)應(yīng)在圖像上連線的順序是從①到⑥,分別對(duì)6個(gè)離散點(diǎn)進(jìn)行兩兩連線,即①與⑥連接,②與①連接,…,⑥與⑤連接。現(xiàn)在考慮兩點(diǎn)之間的連線方式,假設(shè)兩點(diǎn)的始末坐標(biāo)值分別為(x0,y0)和(x1,y1)。為使兩點(diǎn)之間的連線順滑,本文以兩點(diǎn)之間的斜率值為基礎(chǔ)進(jìn)行連線。根據(jù)起點(diǎn)和終點(diǎn)之間(x,y)坐標(biāo)值的大小變化可分為8種情況,分別為(x↑(↓),y↑(↓))、(x不變,y↑(↓))和(x↑(↓),y不變)。由于后四種情況下都有一個(gè)坐標(biāo)軸的值不改變,所以兩點(diǎn)之間的連線非常簡(jiǎn)單,不再贅述。

  本文將以(x↑,y↑)即x1>x0,y1>y0為例說明連線過程,其余的三種情況是同樣的原理。首先通過式(1)計(jì)算參數(shù)k,k的整數(shù)部分記為kint,余數(shù)部分記為krem。

  ]88Z$U03DRZ@TQO4JT6V1GF.png

  若x1-x0>y1-y0(x1-x0<y1-y0),則x(y)沿著增大的方向每填充kint個(gè)坐標(biāo)點(diǎn),y(x)沿增大的方向填充1個(gè)坐標(biāo)點(diǎn),直到填充到y(tǒng)1-1(x1-1)為止,記錄此時(shí)的x(y)值,再補(bǔ)齊y1(x1)的余數(shù)部分krem。圖7給出了(x↑,y↑)時(shí)x1-x0>y1-y0情況下兩點(diǎn)之間連線的示意圖。

005.jpg

  將描繪礦石目標(biāo)多邊形的離散點(diǎn)連線后,再對(duì)該閉合輪廓進(jìn)行內(nèi)部填充。首先找到該區(qū)域x的取值范圍,對(duì)該取值范圍內(nèi)的每一個(gè)x值根據(jù)輪廓的顏色標(biāo)識(shí)找到對(duì)應(yīng)y方向上的兩個(gè)端點(diǎn),并逐個(gè)用相同的顏色填充y方向兩端點(diǎn)之間的坐標(biāo)點(diǎn)。同理找到該區(qū)域y方向的取值范圍,并填充x方向兩端點(diǎn)之間的坐標(biāo)點(diǎn),最終的填充結(jié)果是兩者重疊的部分,以此消除單獨(dú)對(duì)一種方向上填充出現(xiàn)的填充錯(cuò)誤。圖8給出了加注釋的礦石圖像,圖9給出了通過算法獲取的手動(dòng)分割圖像。

4 分割效果評(píng)估

  本文采用等面積直徑來(lái)分析算法分割的效果[4]。等面積直徑d由式(2)計(jì)算得到,其中s代表了圖像中每個(gè)礦石目標(biāo)所包含的像素總個(gè)數(shù)。

  IE`7R8%}FAP0O@)N{90TC7M.png

006.jpg

  獲取礦石圖像中所有礦石目標(biāo)的等面積直徑后,利用核密度估計(jì)求出等面積直徑的概率密度分布,本文選用的核函數(shù)是高斯函數(shù),再由此求出等面積直徑的累積概率分布,得到累積粒度分布信息。圖10給出了手動(dòng)分割圖像和算法分割圖像的累積粒度分布圖。從圖10可知,真實(shí)粒度分布和估算粒度分布曲線很相近,說明基于標(biāo)記的分水嶺算法分割所獲取的礦石目標(biāo)邊緣與實(shí)際礦石的邊緣較吻合。

5 結(jié)束語(yǔ)

  本文提出了一種基于LabelMe的手工分割參考圖像的獲取方法,該方法能夠很方便地標(biāo)記圖像中的各目標(biāo),并且通過算法可以實(shí)現(xiàn)圖像的保存,由此可以方便地對(duì)圖像分割算法的性能進(jìn)行評(píng)價(jià)。

  參考文獻(xiàn)

  [1] 王蘭莎.多目標(biāo)礦業(yè)復(fù)雜圖像特征提取與分類[D].北京:北京化工大學(xué),2011.

  [2] 王鳳娥.改進(jìn)后的分水嶺算法在圖像分割中的應(yīng)用研究[D].濟(jì)南:山東大學(xué),2008.

  [3] RUSSELL B C, TORRALBA A, MURPHY K P, et al. LabelMe: a database and web-based tool for image annotation[J]. International Journal of Computer Vision, 2008,77(1-3):157-173.

  [4] ZHANG Z, SU X, DING L, et al. Multi-scale image segmentation of coal piles on a belt based on the Hessian matrix [J]. Particuology, 2013,11(5):549-555.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。