《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 業(yè)界動態(tài) > 一種反映人眼視覺特性的JPEG壓縮編碼

一種反映人眼視覺特性的JPEG壓縮編碼

2009-08-31
作者:唐躍林 肖沙里 姚富光 丘

??? 摘? 要: 在分析標(biāo)準(zhǔn)JPEG編碼與解碼過程的基礎(chǔ)上,利用人眼的視覺特性調(diào)整量化矩陣,提高了編碼器的壓縮性能。

??? 關(guān)鍵詞: JPEG? 圖像壓縮? 人眼視覺特性? 量化

?

  JPEG標(biāo)準(zhǔn)不僅適用于靜止圖像的壓縮,也是電視圖像序列中幀內(nèi)圖像編碼所采用的方法。由于JPEG具有高的壓縮比和較小的圖像質(zhì)量失真,使得其廣泛應(yīng)用于多媒體和網(wǎng)絡(luò)程序中。在JPEG編碼過程中,DCT系數(shù)的量化對圖像質(zhì)量和壓縮率有著重要影響。本文將討論根據(jù)人眼的視覺特性來相應(yīng)地調(diào)整量化矩陣,以提高編碼器的壓縮性能。

1?JPEG編碼與解碼分析

  JPEG標(biāo)準(zhǔn)有4種編碼方式,其中基于DCT的編碼與解碼過程分別如圖1和圖2所示。

?

  在JPEG編碼過程中,正向離散余弦變換(FDCT)、DC差分脈沖編碼、AC系數(shù)排序及熵編碼均可認(rèn)為對圖像質(zhì)量沒有影響。而對圖像質(zhì)量和壓縮率起關(guān)鍵作用的是量化過程。對DCT系數(shù)進(jìn)行量化的目的是:在滿足圖像質(zhì)量的要求下進(jìn)一步提高壓縮率。量化的出發(fā)點(diǎn)是對于人眼敏感的低頻系數(shù)及亮度信息進(jìn)行細(xì)量化,以提高圖像的質(zhì)量。而對于人眼不敏感的高頻系數(shù)及色度信息采用較大的量化間隔,以取得更大的壓縮比。量化的方法是對每一個DCT系數(shù)F(u,v)除以相應(yīng)的量化間隔Q(u,v)并取整,即:FQ(u,v)=Integer Round(F(u,v)/Q(u,v))。

  評價(jià)JPEG壓縮算法性能的一個重要指標(biāo)是看它能否在給定的失真下產(chǎn)生最小的壓縮文件,或者能否在給定壓縮文件大小的情況下產(chǎn)生最小失真。而量化是影響圖像質(zhì)量和壓縮文件大小的主要因素。細(xì)量化帶來小的重建圖像失真,但文件大小卻得不到控制。粗量化可以得到更大的壓縮比,而圖像質(zhì)量卻得不到保證。如何在保證圖像質(zhì)量的情況下取得更高的壓縮比一直是人們關(guān)注的焦點(diǎn)。本文在JPEG基本順序編碼系統(tǒng)下,考慮人眼視覺特性,利用圖像的局部空間頻率特性來相應(yīng)地調(diào)整量化步長。改進(jìn)后的編碼系統(tǒng)如圖3所示。源圖像經(jīng)FDCT變換后,通過計(jì)算確定宏塊(Macro Block)的類別及計(jì)算宏塊的活動性,以相應(yīng)調(diào)整量化步長,得到最終的量化表。

?

2?基于人眼視覺特性的量化表的產(chǎn)生

  JPEG標(biāo)準(zhǔn)推薦了亮度和色度二個基本量化表(默認(rèn)量化表),其中考慮了人眼對空間頻率的敏感性,即對人眼敏感的低頻系數(shù)采用較小的量化步長,對人眼不敏感的高頻系數(shù)采用較大的量化步長。然而,這并未充分考慮人眼的視覺特性。人眼不僅對宏塊的空間頻率敏感性不同,而且,還依賴于其周圍的環(huán)境。人眼視覺系統(tǒng)對于邊緣區(qū)或均勻圖案區(qū)比復(fù)雜圖案區(qū)更敏感。而標(biāo)準(zhǔn)的JPEG使用的是線性均勻量化器,不能反映圖像的局部變化特征,從而增加了重建圖像的主觀失真,影響圖像的質(zhì)量。因此,針對不同區(qū)域的宏塊,相應(yīng)地調(diào)整量化步長,以減少圖像壓縮的主觀失真及提高壓縮率,是本文要解決的問題。

2.1 宏塊類別的界定

  由上面的論述可知,不同圖案區(qū)的宏塊相對于人眼具有不同的視覺敏感性。因此可利用宏塊的象素梯度(Pixel Gradients)信息及亮度信息來界定宏塊類別,同時(shí),也相應(yīng)地反映出圖像的主觀復(fù)雜度。

  宏塊的象素梯度信息計(jì)算:

  

  式中,sp(i,j)為原始宏塊的相應(yīng)象素值;det_H、det_V分別為宏塊的水平和垂直象素梯度信息;f_det用來度量宏塊的復(fù)雜性;TH1為人眼視覺系統(tǒng)所能感覺到的圖像變化的門限值,它隨宏塊的平均亮度而改變,即:

  

  根據(jù)上述公式,對宏塊可作如下分類及其相應(yīng)的量化調(diào)整因子為:

    

  式中,M是量化調(diào)整因子,NO1、NO2、NO3為宏塊的象素梯度閾值。

2.2 宏塊活動性的計(jì)算

  宏塊的活動性反映了宏塊的復(fù)雜程度?;顒有栽礁?人眼視覺感知能力越小,可以采用相對較大的量化步長。在MPEG-2 TM5中,宏塊的活動性是以4個亮度子塊的象素方差最小值作為度量標(biāo)準(zhǔn)的。本文為減少計(jì)算量,采用直接計(jì)算4個亮度子塊DCT中AC系數(shù)的絕對值之和的最小值作為該宏塊活動性水平的統(tǒng)計(jì)標(biāo)準(zhǔn)。即:

  

  宏塊的平均活動性則以所有8×8亮度子塊的AC系數(shù)的絕對值之和的平均值來表示。即:

  avg_act=mean(abs_sum)

2.3 量化表的產(chǎn)生

  根據(jù)上面所計(jì)算的宏塊的活動性,參考MPEG-2 TM5中計(jì)算宏塊復(fù)雜性的方法,可得歸一化活動性函數(shù)為:

  

  宏塊的活動性函數(shù)反映了人眼的視覺特性。當(dāng)塊的內(nèi)容復(fù)雜、包含高頻成分較多、宏塊活動性較高時(shí),人眼對此不敏感,可以采用較大的量化步長。相反,對于平坦區(qū)等活動性較低,人眼視覺相對敏感的宏塊則進(jìn)行細(xì)量化。同時(shí),考慮到不同的宏塊類別,則最后的量化矩陣為:

  

式中,Qj為第j個宏塊的量化矩陣;Qdef為JPEG推薦的量化表;Qsub為根據(jù)不同類型的宏塊而產(chǎn)生的量化調(diào)整矩陣。

3?實(shí)驗(yàn)結(jié)果

  實(shí)驗(yàn)中,針對二幅圖像(Lenna、Clumbia),利用本文的方法和使用默認(rèn)量化矩陣的標(biāo)準(zhǔn)JPEG壓縮方法進(jìn)行了模擬對比實(shí)驗(yàn),采用峰值信噪比PSNR(Peak Signal-to-Noise Ratio)和壓縮比CR(Compression Ratio)二項(xiàng)指標(biāo)作為實(shí)驗(yàn)結(jié)果的評價(jià)。實(shí)驗(yàn)結(jié)果如表1所示。

?

  從表1可以看出,本文的方法優(yōu)于采用默認(rèn)量化矩陣的標(biāo)準(zhǔn)JPEG壓縮編碼,提高了圖像的壓縮比和重構(gòu)圖像的質(zhì)量。

4? 結(jié)束語

  本文在分析標(biāo)準(zhǔn)JPEG編碼與解碼過程的基礎(chǔ)上,著重討論了與圖像質(zhì)量和壓縮率密切相關(guān)的量化過程。在此基礎(chǔ)之上,利用人眼的視覺特性,通過確定宏塊的類別和分析宏塊的活動特性,相應(yīng)地調(diào)整量化矩陣,以達(dá)到提高圖像的壓縮比和重構(gòu)圖像質(zhì)量的目的。實(shí)驗(yàn)結(jié)果表明,該方法的壓縮性能優(yōu)于采用默認(rèn)量化表的標(biāo)準(zhǔn)JPEG的壓縮性能。

?

參考文獻(xiàn)

1? 張益貞,劉滔.Visual C++實(shí)現(xiàn)MPEG/JPEG編解碼技術(shù).北京:人民郵電出版社,2002

2? 林福宗,陸達(dá).多媒體與CD-ROM.北京:清華大學(xué)出版社,1994

3? Chung T Y,Jung K H,Young N O et al.Quantization Control for Improvement of Image Quality Compatible

with MPEG2.IEEE Transactions on Consumer Electronics,1994;40(4)

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。