《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 基于PBBShift的ROI編碼方法
基于PBBShift的ROI編碼方法
陳 鑫1,2,陳 曉1,2,沈千里1,2,蔡婷婷1,2
1.南京信息工程大學(xué) 大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,江蘇 南京 210044; 2.南京信息工程大學(xué) 電子與信息工程學(xué)院,江蘇 南京210044
摘要: 為使觀察者提早了解圖像的大致情況,提出了基于部分背景位平面位移(PBBShift)的感興趣區(qū)域(ROI)編碼方法。該方法將背景(BG)位平面分為兩部分,編碼時(shí)下移剩余的BG位平面,解碼時(shí)可優(yōu)先傳輸ROI系數(shù)和重要的BG系數(shù),然后傳輸剩余的BG系數(shù)。實(shí)驗(yàn)證明,該方法在低碼率下,ROI和BG質(zhì)量相差無(wú)幾;在高碼率下,ROI獲得比BG更好的質(zhì)量。改進(jìn)的方法在帶寬受限的網(wǎng)絡(luò)中有很大的實(shí)用價(jià)值。
關(guān)鍵詞: PBBShift ROI編碼 BG位平面
中圖分類(lèi)號(hào): TN919.81
文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào): 0258-7998(2015)04-0159-04
ROI coding method based on PBBShift
Chen Xin1,2,Chen Xiao1,2,Shen Qianli1,2,Cai Tingting1,2
1.Collaborative Innovation Center of Atmospheric Environment and Equipment Technology, Nanjing University of Information Science and Technology,Nanjing 210044,China; 2.College of Electronic and Information Engineering,Nanjing University of Information Science and Technology, Nanjing 210044,China
Abstract: In order to make observer know a general idea of image in advance, this paper puts forward Region of Interest(ROI) coding method based on Partial Background Bitplanes Shift(PBBShift). This method divides background(BG) bitplanes into two parts, remaining BG bitplanes are shifted down during coding, ROI coefficients and significant BG coefficients will be transmitted firstly during decoding, then remaining BG coefficients can be transmitted. Experiments show that ROI and BG have the same quality under low bit rate, ROI gets a better quality than BG under high bit rate. This improved method has a great practical value in limited bandwidth of the network.
Key words : PBBShift;ROI coding;BG bitplanes


0 引言
    近年來(lái),隨著多媒體技術(shù)的快速發(fā)展,人們對(duì)圖像壓縮的要求越來(lái)越高,某些情況下,JPEG標(biāo)準(zhǔn)和JPEG2000標(biāo)準(zhǔn)已經(jīng)無(wú)法滿足要求,為此,必須采用一種新的壓縮技術(shù)對(duì)圖像進(jìn)行有效壓縮。感興趣區(qū)域(Region of Interest,ROI)編碼技術(shù)利用了人眼的視覺(jué)特性,已成為目前圖像壓縮研究的熱點(diǎn)。所謂ROI編碼,就是將圖像中比較關(guān)注區(qū)域(亦稱(chēng)ROI)的位平面設(shè)置得比其余區(qū)域(亦稱(chēng)BG)的位平面高,就可優(yōu)先傳輸ROI系數(shù),相對(duì)提高圖像質(zhì)量。
    對(duì)于ROI編碼,一些學(xué)者根據(jù)JPEG2000標(biāo)準(zhǔn)提供的一般位移(General Shift,GShift)法和最大位移(Maximum Shift,MaxShift)法,提出了一些改進(jìn)方法。Wang Zhou[1]等提出了逐個(gè)位平面位移(BbBShift)法,該方法先上移重要的ROI位平面,然后逐個(gè)交替上移剩余的ROI位平面和一些BG位平面,剩余的BG位平面不位移。Liu Lijie[2]等提出了部分重要位平面位移(PSBShift)法,該方法將ROI位平面分為兩部分,上移其中重要的ROI位平面。梁燕[3]提出了通用的部分位平面位移(GPBShift)法,該方法上移重要的ROI位平面,同時(shí)下移非重要的BG位平面,其余的位平面保持不變。這些改進(jìn)方法的實(shí)質(zhì)都是先傳輸ROI系數(shù),然后傳輸BG系數(shù)和剩余的ROI系數(shù)。
    本文通過(guò)研究前人的方法,提出了部分背景位平面位移(Partial Background Bitplanes Shift,PBBShift)法,并將此方法嵌入到多級(jí)樹(shù)集合分裂(Set Partitioning in Hierarchical Trees,SPIHT)算法中。該方法可使圖像觀察者先對(duì)圖像情況大致了解,然后決定是否需要。這種改進(jìn)的方法可用于帶寬受限的網(wǎng)絡(luò)中。
1 多級(jí)樹(shù)集合分裂(SPIHT)算法
    SPIHT算法是在嵌入式零樹(shù)小波(EZW)算法[4]的基礎(chǔ)上提出的一種新算法[5]。該算法采用空間方向樹(shù)、全體子孫集合和非直系子孫集合的概念,提高了編碼效率[6]。SPIHT算法還能生成一個(gè)嵌入碼流,接收的碼流在任意點(diǎn)被截?cái)鄷r(shí)都可重構(gòu)圖像。
    SPIHT算法的編碼過(guò)程由正向小波變換、量化編碼等組成。在SPIHT算法的基礎(chǔ)上嵌入ROI部分:確定ROI、生成ROI模板、下移BG位平面、ROI形狀和位置信息編碼,從而形成基于GShift法的ROI編碼過(guò)程,如圖1所示。解碼是編碼的逆過(guò)程。

201504wj-jsj2t1.jpg

圖1  基于GShift法的ROI編碼過(guò)程

2 ROI編碼
2.1 ROI掩模

    定義ROI掩模來(lái)標(biāo)定小波系數(shù)中屬于ROI的點(diǎn)。若將ROI定義為矩形,此時(shí)只需確定矩形的左上角坐標(biāo)(x1,y1)和右下角坐標(biāo)(x2,y2)。ROI掩模M(i,j)可由式(1)表示[7],其生成過(guò)程[7]如圖2所示。
MSNUASZRPSCEAA]7U%]7IJ3.png

W4MOS~8FD{5@1KRB{_EH%@C.png

2.2 ROI編碼方法
    GShift法和MaxShift法是兩種最基本、最常用的ROI編碼方法[8],如圖3所示。在GShift法中,選擇一個(gè)位移因子S把BG位平面都下降S位,這樣,ROI的最重要位平面就高于BG的所有位平面,ROI就可以?xún)?yōu)先編碼。解碼時(shí),ROI就能獲得較好的恢復(fù)。S越大,ROI相對(duì)BG的優(yōu)先級(jí)越高,質(zhì)量也就越高。當(dāng)GShift法中的位移因子S增大到使得ROI位平面與BG位平面無(wú)重疊時(shí),此時(shí)GShift法就變成了MaxShift法。

201504wj-jsj2t3.jpg

圖3  兩種ROI編碼方法[8]

3 改進(jìn)方法
3.1 部分背景位平面位移(PBBShift)法

    某些情況下,觀察者想在圖像剛開(kāi)始解碼時(shí)了解一下圖像的大概情況,這就需要一部分BG位平面置于與ROI位平面同等高的位平面上。根據(jù)GShift法,本文提出了PBBShift法,如圖4所示,其中S1為BG的重要位平面,S2為BG剩余位平面的下移位數(shù)。PBBShift法將BG位平面分為兩部分:重要位平面和剩余位平面。編碼時(shí),BG的重要位平面不位移,剩余位平面向下位移。解碼時(shí)只需將BG的剩余位平面上移即可。由于該方法只需下移部分BG位平面,故稱(chēng)此方法為PBBShift法。

201504wj-jsj2t4.jpg

圖4  PBBShift法

3.2 編碼流程圖
    相比GShift法的ROI編碼過(guò)程,PBBShift法的ROI編碼部分相對(duì)復(fù)雜些,它要將BG位平面分為兩部分分別進(jìn)行位移,具體的編碼過(guò)程如圖5所示。解碼是編碼的逆過(guò)程。
4 實(shí)驗(yàn)分析與結(jié)論

201504wj-jsj2t5.jpg

圖5  PBBShift法編碼過(guò)程

201504wj-jsj2t6.jpg

圖6  Lena原圖

    實(shí)驗(yàn)選取Lena圖像(512×512,8 bit),如圖6所示,ROI定義在臉部,為矩形。實(shí)驗(yàn)采用MATLAB編程,將ROI部分嵌入到SPIHT算法中,先進(jìn)行6級(jí)9/7小波變換,然后用PBCBShift法對(duì)位平面進(jìn)行位移,其中S1=2,S2=2,最后得到編碼數(shù)據(jù)流。圖像的客觀評(píng)價(jià)用峰值信噪比(PSNR)表示,單位為分貝(dB),PSNR越大,質(zhì)量越好。圖7為PBBShift法下各區(qū)域的PSNR對(duì)比。圖8為PBBShift法得到的主觀視覺(jué)效果圖。實(shí)驗(yàn)還將PBBShift法與No-Shift法、GShift法作比較,圖9為3種方法得到的PSNR實(shí)驗(yàn)結(jié)果,其中,(a)為ROI的PSNR對(duì)比,(b)為BG的PSNR對(duì)比,(c)為全圖的PSNR對(duì)比。由于選取的ROI的面積占整幅圖像的比重小,所以全圖的PSNR接近于BG的PSNR。

201504wj-jsj2t7.jpg

圖7  PBBShift法各區(qū)域PSNR對(duì)比

    從圖7可知,低碼率下,ROI和BG的PSNR都比較小,相差不大;隨著碼率的增大,ROI的PSNR先快速增大,然后平穩(wěn)增大,而B(niǎo)G的PSNR先緩慢增大,然后平穩(wěn)增大。從圖8看出,低碼率下,ROI和BG都比較模糊,但能看出輪廓;隨著碼率的增大,ROI比BG獲得更好的視覺(jué)效果,當(dāng)碼率增大到一定時(shí),ROI和BG都很清楚。

201504wj-jsj2t8.jpg

圖8  PBBShift法得到的主觀視覺(jué)效果圖

201504wj-jsj2t9.jpg

圖9  3種算法得到的PSNR對(duì)比

    從圖9(a)看出,對(duì)于ROI,低碼率下,PBBShift法和No-Shift法得到的PSNR相差不大;隨著碼率的增大,PBBShift法的PSNR大于No-Shift法的PSNR,但是兩者的PSNR都低于GShift法的PSNR。從圖9(b)看出,對(duì)于BG,低碼率下,PBBShift法和No-Shift法得到的PSNR相差不大;隨著碼率的增大,PBBShift法的PSNR大于No-Shift法的PSNR,但是兩者的PSNR都高于GShift法的PSNR。
    從上面幾組實(shí)驗(yàn),得出以下結(jié)論:
    (1)本文提出的方法先解碼ROI系數(shù)和重要的BG系數(shù),后解碼剩余的BG系數(shù)。運(yùn)用該方法可先了解圖像的大致內(nèi)容,繼續(xù)解碼時(shí),ROI將比BG獲得更好的視覺(jué)效果。
    (2)本文提出的方法介于GShift法和No-Shift法之間。要使BG在低碼率下能較清楚地顯示,只需增大S1的值,此時(shí)本文方法就接近No-Shift法。要使ROI與BG有更大的視覺(jué)對(duì)比度,只需增大S2的值,此時(shí)本文方法就接近GShift法。
5 總結(jié)
    ROI編碼技術(shù)是靜態(tài)圖像壓縮標(biāo)準(zhǔn)支持的一種新技術(shù),該技術(shù)為圖像的高性能壓縮提供了很好的解決方案。本文在分析GShift法的基礎(chǔ)上,提出了一種改進(jìn)的ROI編碼方法,即PBBShift法。本文的創(chuàng)新點(diǎn)在于,該方法可以使觀察者先了解圖像的大致情況,如果是需要的圖像就繼續(xù)傳輸,ROI將比BG獲得更好的視覺(jué)效果,如果不是需要的圖像就停止傳輸,節(jié)省等待時(shí)間。實(shí)驗(yàn)證明,該方法是有效的。這種改進(jìn)的ROI編碼技術(shù)將在未來(lái)圖像壓縮領(lǐng)域發(fā)揮重大的作用。
參考文獻(xiàn)
[1] Wang Zhou,BOVIK A C.Bitplane-by-Bitplane shift (BbBShift)-a suggestion for JPEG2000 region of interest image coding[J].IEEE Signal Processing Letters,2002,9(5):160-162.
[2] Liu Lijie,F(xiàn)an Guoliang.A new JPEG2000 region of interest image coding method:partial significant bitplanes shift[J].IEEE Signal Processing Letters,2003,10(2):35-38.
[3] 梁燕.基于小波變換的序列圖像感興趣區(qū)域編碼[D].天津:天津大學(xué),2005.
[4] 牛德智,陳長(zhǎng)興,王曙釗,等.一種基于EZW改進(jìn)算法的圖像壓縮方法研究[J].電子技術(shù)應(yīng)用,2010,36(12):128-131.
[5] JAIN V,JAIN N,PARIKH A.Comparative analysis of image compression using image interpolation and SPIHT encoding[C].Engineering and Systems(SCES),2012:1-6.
[6] 陳秀梅,王偉,湯敏.基于Curvelet變換和SPIHT算法的醫(yī)學(xué)圖像感興趣區(qū)域壓縮[J].中國(guó)醫(yī)學(xué)影像學(xué)雜志,2014,22(10):786-792.
[7] 小野定康,鈴木純司.JPEG2000技術(shù)[M].北京:科學(xué)出版社,2004.
[8] 袁建亮,朱遠(yuǎn)平.基于JPEG2000的感興趣區(qū)域壓縮編碼算法[J].天津師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,34(1):42-46.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。