文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào): 0258-7998(2015)04-0159-04
0 引言
近年來(lái),隨著多媒體技術(shù)的快速發(fā)展,人們對(duì)圖像壓縮的要求越來(lái)越高,某些情況下,JPEG標(biāo)準(zhǔn)和JPEG2000標(biāo)準(zhǔn)已經(jīng)無(wú)法滿足要求,為此,必須采用一種新的壓縮技術(shù)對(duì)圖像進(jìn)行有效壓縮。感興趣區(qū)域(Region of Interest,ROI)編碼技術(shù)利用了人眼的視覺(jué)特性,已成為目前圖像壓縮研究的熱點(diǎn)。所謂ROI編碼,就是將圖像中比較關(guān)注區(qū)域(亦稱(chēng)ROI)的位平面設(shè)置得比其余區(qū)域(亦稱(chēng)BG)的位平面高,就可優(yōu)先傳輸ROI系數(shù),相對(duì)提高圖像質(zhì)量。
對(duì)于ROI編碼,一些學(xué)者根據(jù)JPEG2000標(biāo)準(zhǔn)提供的一般位移(General Shift,GShift)法和最大位移(Maximum Shift,MaxShift)法,提出了一些改進(jìn)方法。Wang Zhou[1]等提出了逐個(gè)位平面位移(BbBShift)法,該方法先上移重要的ROI位平面,然后逐個(gè)交替上移剩余的ROI位平面和一些BG位平面,剩余的BG位平面不位移。Liu Lijie[2]等提出了部分重要位平面位移(PSBShift)法,該方法將ROI位平面分為兩部分,上移其中重要的ROI位平面。梁燕[3]提出了通用的部分位平面位移(GPBShift)法,該方法上移重要的ROI位平面,同時(shí)下移非重要的BG位平面,其余的位平面保持不變。這些改進(jìn)方法的實(shí)質(zhì)都是先傳輸ROI系數(shù),然后傳輸BG系數(shù)和剩余的ROI系數(shù)。
本文通過(guò)研究前人的方法,提出了部分背景位平面位移(Partial Background Bitplanes Shift,PBBShift)法,并將此方法嵌入到多級(jí)樹(shù)集合分裂(Set Partitioning in Hierarchical Trees,SPIHT)算法中。該方法可使圖像觀察者先對(duì)圖像情況大致了解,然后決定是否需要。這種改進(jìn)的方法可用于帶寬受限的網(wǎng)絡(luò)中。
1 多級(jí)樹(shù)集合分裂(SPIHT)算法
SPIHT算法是在嵌入式零樹(shù)小波(EZW)算法[4]的基礎(chǔ)上提出的一種新算法[5]。該算法采用空間方向樹(shù)、全體子孫集合和非直系子孫集合的概念,提高了編碼效率[6]。SPIHT算法還能生成一個(gè)嵌入碼流,接收的碼流在任意點(diǎn)被截?cái)鄷r(shí)都可重構(gòu)圖像。
SPIHT算法的編碼過(guò)程由正向小波變換、量化編碼等組成。在SPIHT算法的基礎(chǔ)上嵌入ROI部分:確定ROI、生成ROI模板、下移BG位平面、ROI形狀和位置信息編碼,從而形成基于GShift法的ROI編碼過(guò)程,如圖1所示。解碼是編碼的逆過(guò)程。
圖1 基于GShift法的ROI編碼過(guò)程
2 ROI編碼
2.1 ROI掩模
定義ROI掩模來(lái)標(biāo)定小波系數(shù)中屬于ROI的點(diǎn)。若將ROI定義為矩形,此時(shí)只需確定矩形的左上角坐標(biāo)(x1,y1)和右下角坐標(biāo)(x2,y2)。ROI掩模M(i,j)可由式(1)表示[7],其生成過(guò)程[7]如圖2所示。
2.2 ROI編碼方法
GShift法和MaxShift法是兩種最基本、最常用的ROI編碼方法[8],如圖3所示。在GShift法中,選擇一個(gè)位移因子S把BG位平面都下降S位,這樣,ROI的最重要位平面就高于BG的所有位平面,ROI就可以?xún)?yōu)先編碼。解碼時(shí),ROI就能獲得較好的恢復(fù)。S越大,ROI相對(duì)BG的優(yōu)先級(jí)越高,質(zhì)量也就越高。當(dāng)GShift法中的位移因子S增大到使得ROI位平面與BG位平面無(wú)重疊時(shí),此時(shí)GShift法就變成了MaxShift法。
圖3 兩種ROI編碼方法[8]
3 改進(jìn)方法
3.1 部分背景位平面位移(PBBShift)法
某些情況下,觀察者想在圖像剛開(kāi)始解碼時(shí)了解一下圖像的大概情況,這就需要一部分BG位平面置于與ROI位平面同等高的位平面上。根據(jù)GShift法,本文提出了PBBShift法,如圖4所示,其中S1為BG的重要位平面,S2為BG剩余位平面的下移位數(shù)。PBBShift法將BG位平面分為兩部分:重要位平面和剩余位平面。編碼時(shí),BG的重要位平面不位移,剩余位平面向下位移。解碼時(shí)只需將BG的剩余位平面上移即可。由于該方法只需下移部分BG位平面,故稱(chēng)此方法為PBBShift法。
圖4 PBBShift法
3.2 編碼流程圖
相比GShift法的ROI編碼過(guò)程,PBBShift法的ROI編碼部分相對(duì)復(fù)雜些,它要將BG位平面分為兩部分分別進(jìn)行位移,具體的編碼過(guò)程如圖5所示。解碼是編碼的逆過(guò)程。
4 實(shí)驗(yàn)分析與結(jié)論
圖5 PBBShift法編碼過(guò)程
圖6 Lena原圖
實(shí)驗(yàn)選取Lena圖像(512×512,8 bit),如圖6所示,ROI定義在臉部,為矩形。實(shí)驗(yàn)采用MATLAB編程,將ROI部分嵌入到SPIHT算法中,先進(jìn)行6級(jí)9/7小波變換,然后用PBCBShift法對(duì)位平面進(jìn)行位移,其中S1=2,S2=2,最后得到編碼數(shù)據(jù)流。圖像的客觀評(píng)價(jià)用峰值信噪比(PSNR)表示,單位為分貝(dB),PSNR越大,質(zhì)量越好。圖7為PBBShift法下各區(qū)域的PSNR對(duì)比。圖8為PBBShift法得到的主觀視覺(jué)效果圖。實(shí)驗(yàn)還將PBBShift法與No-Shift法、GShift法作比較,圖9為3種方法得到的PSNR實(shí)驗(yàn)結(jié)果,其中,(a)為ROI的PSNR對(duì)比,(b)為BG的PSNR對(duì)比,(c)為全圖的PSNR對(duì)比。由于選取的ROI的面積占整幅圖像的比重小,所以全圖的PSNR接近于BG的PSNR。
圖7 PBBShift法各區(qū)域PSNR對(duì)比
從圖7可知,低碼率下,ROI和BG的PSNR都比較小,相差不大;隨著碼率的增大,ROI的PSNR先快速增大,然后平穩(wěn)增大,而B(niǎo)G的PSNR先緩慢增大,然后平穩(wěn)增大。從圖8看出,低碼率下,ROI和BG都比較模糊,但能看出輪廓;隨著碼率的增大,ROI比BG獲得更好的視覺(jué)效果,當(dāng)碼率增大到一定時(shí),ROI和BG都很清楚。
圖8 PBBShift法得到的主觀視覺(jué)效果圖
圖9 3種算法得到的PSNR對(duì)比
從圖9(a)看出,對(duì)于ROI,低碼率下,PBBShift法和No-Shift法得到的PSNR相差不大;隨著碼率的增大,PBBShift法的PSNR大于No-Shift法的PSNR,但是兩者的PSNR都低于GShift法的PSNR。從圖9(b)看出,對(duì)于BG,低碼率下,PBBShift法和No-Shift法得到的PSNR相差不大;隨著碼率的增大,PBBShift法的PSNR大于No-Shift法的PSNR,但是兩者的PSNR都高于GShift法的PSNR。
從上面幾組實(shí)驗(yàn),得出以下結(jié)論:
(1)本文提出的方法先解碼ROI系數(shù)和重要的BG系數(shù),后解碼剩余的BG系數(shù)。運(yùn)用該方法可先了解圖像的大致內(nèi)容,繼續(xù)解碼時(shí),ROI將比BG獲得更好的視覺(jué)效果。
(2)本文提出的方法介于GShift法和No-Shift法之間。要使BG在低碼率下能較清楚地顯示,只需增大S1的值,此時(shí)本文方法就接近No-Shift法。要使ROI與BG有更大的視覺(jué)對(duì)比度,只需增大S2的值,此時(shí)本文方法就接近GShift法。
5 總結(jié)
ROI編碼技術(shù)是靜態(tài)圖像壓縮標(biāo)準(zhǔn)支持的一種新技術(shù),該技術(shù)為圖像的高性能壓縮提供了很好的解決方案。本文在分析GShift法的基礎(chǔ)上,提出了一種改進(jìn)的ROI編碼方法,即PBBShift法。本文的創(chuàng)新點(diǎn)在于,該方法可以使觀察者先了解圖像的大致情況,如果是需要的圖像就繼續(xù)傳輸,ROI將比BG獲得更好的視覺(jué)效果,如果不是需要的圖像就停止傳輸,節(jié)省等待時(shí)間。實(shí)驗(yàn)證明,該方法是有效的。這種改進(jìn)的ROI編碼技術(shù)將在未來(lái)圖像壓縮領(lǐng)域發(fā)揮重大的作用。
參考文獻(xiàn)
[1] Wang Zhou,BOVIK A C.Bitplane-by-Bitplane shift (BbBShift)-a suggestion for JPEG2000 region of interest image coding[J].IEEE Signal Processing Letters,2002,9(5):160-162.
[2] Liu Lijie,F(xiàn)an Guoliang.A new JPEG2000 region of interest image coding method:partial significant bitplanes shift[J].IEEE Signal Processing Letters,2003,10(2):35-38.
[3] 梁燕.基于小波變換的序列圖像感興趣區(qū)域編碼[D].天津:天津大學(xué),2005.
[4] 牛德智,陳長(zhǎng)興,王曙釗,等.一種基于EZW改進(jìn)算法的圖像壓縮方法研究[J].電子技術(shù)應(yīng)用,2010,36(12):128-131.
[5] JAIN V,JAIN N,PARIKH A.Comparative analysis of image compression using image interpolation and SPIHT encoding[C].Engineering and Systems(SCES),2012:1-6.
[6] 陳秀梅,王偉,湯敏.基于Curvelet變換和SPIHT算法的醫(yī)學(xué)圖像感興趣區(qū)域壓縮[J].中國(guó)醫(yī)學(xué)影像學(xué)雜志,2014,22(10):786-792.
[7] 小野定康,鈴木純司.JPEG2000技術(shù)[M].北京:科學(xué)出版社,2004.
[8] 袁建亮,朱遠(yuǎn)平.基于JPEG2000的感興趣區(qū)域壓縮編碼算法[J].天津師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,34(1):42-46.