文獻標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.2016.10.030
中文引用格式: 雷海衛(wèi),劉文怡,王安紅. 3D-HEVC中深度圖幀內(nèi)預(yù)測模式判決過程的改進[J].電子技術(shù)應(yīng)用,2016,42(10):116-119.
英文引用格式: Lei Haiwei,Liu Wenyi,Wang Anhong. Improvement on mode decision process of depth map intra-predicted in 3D-HEVC[J].Application of Electronic Technique,2016,42(10):116-119.
0 引言
3D-HEVC(The 3D Extension of High-efficiency Video Coding)是繼HEVC之后由視頻編碼協(xié)作小組制定的又一個視頻編碼標(biāo)準(zhǔn),它是HEVC的擴展[1],主要用于實現(xiàn)3D視頻和自由視點視頻(Free Viewpoint Video,F(xiàn)VV)的編碼。在3D-HEVC中,除需要對幾個不同視點的紋理視頻(Texture)進行編碼外,還需要對相應(yīng)視點的深度圖(Depth)進行編碼。解碼端根據(jù)接收到的紋理視頻和深度圖利用基于深度圖繪制的技術(shù)(Depth Image Based Rendering,DIBR)[2]合成中間的虛擬視點視頻。從而可以由少數(shù)的幾個視點的視頻生成更多可觀看的視點。在采用3D-HEVC技術(shù)后,用戶可以欣賞到來自同一場景但從不同角度拍攝的視頻內(nèi)容,此外,視頻的呈現(xiàn)方式也可以是3D的,這樣的視頻被稱為自由視點立體視頻??梢钥闯觯捎?D-HEVC編碼的視頻能給人們帶來更好的視覺感受和增強用戶體驗。但這也造成了3D-HEVC的編碼結(jié)構(gòu)以及編碼過程十分復(fù)雜,進而使得編碼時間過長。
3D-HEVC基本沿用了HEVC中的編碼技術(shù),這些技術(shù)能高性能、高質(zhì)量地完成對紋理視頻的編碼,但對深度圖的編碼效果并不好,因為深度圖有不同于紋理圖的特征,深度圖通常包含了一些銳利的邊界和大片的平坦區(qū)域。采用HEVC中的編碼技術(shù)來編碼深度圖,解碼后的深度圖內(nèi)部邊界處會產(chǎn)生偽影效應(yīng),這將影響合成的虛擬視點的質(zhì)量。為了改善深度圖的編碼效果,3D-HEVC禁用和修改了HEVC中的幾個編碼工具。此外,還加入了一些新的編碼工具,包括深度圖建模模式(Depth Modelling Mode,DMM)[3]、簡化的深度圖編碼(Simplified Depth Coding,SDC)和單一深度幀內(nèi)模式(Single Depth Intra Mode)等。
1 深度圖建模模式
深度圖建模模式是一種新的幀內(nèi)預(yù)測模式,用于對深度值有明顯過渡的區(qū)域進行編碼。最初制定了4種預(yù)測模式,即DMM1、DMM2、DMM3和DMM4,目前保留使用的是DMM1(Explicit Wedgelet Signalling)和DMM4(Inter-component-predicted Contour partitioning)。兩者采用了不同的劃分類型:楔形和輪廓形劃分。兩種劃分方式均會把一個編碼塊劃分為兩部分(P1和P2),如圖1所示。
圖1中以8×8的編碼塊為例進行說明,左側(cè)為連續(xù)空間,右側(cè)為對應(yīng)的離散空間。深度圖建模模式除需要劃分信息外,還需要為劃分出的每個區(qū)域指定一個常量值,來表示這一區(qū)域的深度值。在使用深度圖建模模式對深度圖進行編碼時,可以選擇這兩種模型中的一種對當(dāng)前編碼塊進行建模,作為當(dāng)前編碼塊的預(yù)測信號。
在原有預(yù)測模式基礎(chǔ)上加入深度圖建模模式后,能有效地降低內(nèi)部邊界處的偽影效應(yīng),改善深度圖的編碼質(zhì)量,但同時也極大地增加了編碼的計算復(fù)雜度。復(fù)雜度的增加來自兩個方面:一方面,新增加的模式使可供選擇的模式數(shù)量增加,從而在模式判決時會消耗更多的時間;另一方面,深度圖建模模式自身的建模過程也非常耗時。因此,對模式判決過程或者建模過程進行優(yōu)化都會使編碼過程加速,從而提高編碼效率。本文旨在對模式判決過程進行優(yōu)化。
HEVC中原有35種幀內(nèi)預(yù)測模式,分別是Planar模式、DC模式以及33種角度模式。對這35種模式,首先采用基于殘差的哈達(dá)瑪變換方法進行粗選,針對64×64、32×32和16×16大小的編碼塊會選出3個,針對8×8和4×4大小的塊會選出8個預(yù)測模式加入全率失真候選列表,然后進行全率失真代價計算,選取使得率失真代價值最小的模式作為最佳的幀內(nèi)預(yù)測模式。深度圖建模模式被設(shè)計為幀內(nèi)預(yù)測模式,因此DMM1和DMM4也被加入到全率失真候選列表參與率失真代價計算。整個幀內(nèi)預(yù)測的模式判決過程如圖2所示。
2 相關(guān)工作
如前所述,深度圖包含了大塊的平坦區(qū)域,這也就表明并不是深度圖中的所有編碼塊都適用于深度圖建模模式。因此當(dāng)對某個塊進行預(yù)測編碼時,DMM1和DMM4兩個預(yù)測模式無條件地加入到全率失真候選列表進行全率失真代價的計算會額外增加編碼的計算復(fù)雜度。
針對這種情況,一些快速的模式判決算法被提出。文獻[4]基于最大概率模式提出了一個快速的深度圖建模模式選擇算法。文獻[5]提出當(dāng)預(yù)測塊中深度值的變化小于某個閾值時,則略過深度圖建模模式。在文獻[6]中,一個類似的采用閾值的方法被提出。文獻[7]中,一個簡化的邊檢測器和一個基于梯度的模式濾波器被用來決定是否略過深度圖建模模式。文獻[8]采用了一種基于哈達(dá)瑪域的邊分類算法來加速模式判決過程。
其中,文獻[4]和文獻[5]是在視頻編碼協(xié)作小組舉辦的國際會議上提交的提案。提案中的方法已被采納并加入到3D-HEVC的參考軟件HTM中。具體而言,它采用了兩個策略來判斷是否將深度圖建模模式加入到全率失真候選列表。一個是基于最大可能性統(tǒng)計,即認(rèn)為經(jīng)過粗選之后若候選列表中的第一個預(yù)測模式為Planar模式,則當(dāng)前塊極可能是平坦的或光滑的,因此深度圖建模模式將以極大的概率不會被選作最佳的預(yù)測模式。另一個是基于閾值的方法,閾值表達(dá)式如式(1)所示,其中QP表示當(dāng)前編碼塊的量化參數(shù)。當(dāng)當(dāng)前編碼塊的深度值變化大于此閾值時,才考慮把深度圖建模模式添加到全率失真候選列表。
3 提出的改進
文獻[5]和文獻[6]中提出的方案的目的是使對于那些明顯不適合采用深度圖建模模式進行預(yù)測編碼的塊進行模式判決時,不把DMM1和DMM4加入到全率失真候選列表。從而避免對DMM1和DMM4的全率失真代價計算過程,也略過這兩個預(yù)測模式自身建模的過程,進而加速了模式判決的過程。本文在此基礎(chǔ)上進一步優(yōu)化模式判決過程,主要提出了兩點改進。
3.1 基于塊特征的方法
如前所述,無論是DMM1還是DMM4,都會將當(dāng)前編碼的塊分割成兩個區(qū)域,并為每個區(qū)域指定一個常量值,用這樣的模型作為當(dāng)前塊的預(yù)測信號。深度圖建模模式只適用于對深度值有明顯過渡的塊進行預(yù)測,文獻[4]和文獻[5]中的改進也主要基于此思想。改進策略用表達(dá)式(2)描述,其中,uiRdModeList[0]表示候選列表中的第一個預(yù)測模式,等號右側(cè)的0代表Planar模式,variance表示當(dāng)前塊深度值的變化。
觀察發(fā)現(xiàn),采用此方案后,仍有少量平坦的塊被遺漏,因為方案中采用了“或”的運算關(guān)系,即當(dāng)?shù)谝粋€條件滿足時,當(dāng)前編碼塊仍有可能是平坦的。為此,本文采取邊緣檢測的方法進一步過濾遺漏掉的平坦塊。首先采用canny算法對整幀深度圖像進行邊緣檢測,最初的深度圖像如圖3所示,邊緣檢測的結(jié)果如圖4所示,圖中黑色的線條表示深度的過渡。然后,定義圖4中(大塊)的白色區(qū)域為平坦區(qū)域,如果當(dāng)前正在編碼的深度塊位于平坦區(qū)域處,則不把DMM1和DMM4加入全率失真候選列表。
3.2 基于塊大小的方法
與對紋理視頻的編碼方式一樣,對深度圖的編碼同樣也采用了基于塊的編碼方案。一幀圖像按行列的方式被劃分為多個編碼樹單元(Coding Tree Unit,CTU),每個編碼樹單元再以四叉樹的形式遞歸地劃分為更小的編碼單元(Coding Unit,CU)。編碼單元被劃分為更小的預(yù)測單元(Predicted Unit,PU),每一個預(yù)測單元可采用不同的預(yù)測模式來產(chǎn)生它的預(yù)測信號。在3D-HEVC標(biāo)準(zhǔn)配置模式下,編碼樹單元的大小為64×64。編碼樹單元允許最多4級的遞歸劃分,因此編碼單元的大小可以是64×64、32×32、16×16或8×8。在采用幀內(nèi)預(yù)測時,編碼單元要么整體作為一個預(yù)測單元,要么被四等分為4個預(yù)測單元。因此預(yù)測單元的大小可以是64×64、32×32、16×16、8×8或4×4。
由圖2可知,由粗選過程選出前3個(或者前8個)較好的幀內(nèi)預(yù)測模式與DMM1以及DMM4一并被加入到全率失真候選列表,進行全率失真代價計算,最終選取一種預(yù)測模式作為最佳預(yù)測模式。為了進一步分析深度圖建模模式的使用情況,對在不同塊大小情況下,深度圖建模模式的使用次數(shù)進行了統(tǒng)計,統(tǒng)計的結(jié)果如表1所示。
從表1中可以看出,當(dāng)預(yù)測塊的大小為32×32時,深度圖建模模式的使用次數(shù)最少(平均占比為8%)。因此,如果事先規(guī)定當(dāng)預(yù)測塊的大小為32×32時,深度圖建模模式(DMM1和DMM4)將不被加入到全率失真列表,那么就能使這些塊跳過深度圖建模模式全率失真代價的計算過程。在深度圖建模模式使用率較低的前提下,即使對某些特定大小的塊不使用DMM1(或DMM4),這一預(yù)測模式也不會對編碼質(zhì)量產(chǎn)生太大的影響。
3.3 改進后的模式判決過程
改進后的模式判決過程如圖5所示。為了方便描述,只給出了深度圖建模模式的模式判決過程,其中第1個判斷框為原有方案??梢钥吹?,改進后的方案能對深度圖建模模式起到進一步的過濾作用,從而加快整個模式判決過程。
4 實驗結(jié)果
為了評估提出的改進方案,進行了前后對比的測試實驗。實驗在3D-HEVC的參考軟件HTM15.1[9]上進行。8個標(biāo)準(zhǔn)的測試序列作為輸入,讀取每個序列的前100幀進行測試。編碼方案采用通用測試條件[10]中的編碼幀結(jié)構(gòu),選取的紋理和深度的量化參數(shù)QP分別為25:34、30:39、35:42和40:45。測試的結(jié)果如表2所示,表中列出了采用改進后的方案在編碼質(zhì)量和編碼時間方面較之前的變化??梢钥吹剑y理視頻的編碼質(zhì)量和合成視點的編碼質(zhì)量損失很少,分別為0.16%和0.19%,但整個編碼時間卻節(jié)省了3%。
5 結(jié)論
本文針對深度圖編碼中的幀內(nèi)預(yù)測的模式判決過程提出了兩點改進,旨在加快模式判決的過程。實驗結(jié)果表明,在基本不影響編碼質(zhì)量的前提下,改進后的方案能有效地加快模式判決的過程,從而使整體的編碼時間節(jié)省3%。這對促進3D-HEVC的實時性應(yīng)用具有一定意義。
參考文獻
[1] MULLER K,SCHWARZ H,MARPE D,et al.3D high-efficiency video coding for multi-view video and depth data [J].Image Processing,IEEE Transactions on,2013,22(9):3366-3378.
[2] FEHN C.Depth-image-based rendering(DIBR),compression and transmission for a new approach on 3D-TV[C].Proceedings of the Stereoscopic Displays and Virtual Reality Systems XI,2004:93-104.
[3] MERKLE P,BARTNIK C,MULLER K,et al.3D video:depth coding based on inter-component prediction of block partitions[C].Proceedings of the Picture Coding Symposium(PCS),2012:149-152.
[4] ZHOUYE G,JIANHUA Z,NAM L,et al.Fast depth modeling mode selection for 3D HEVC depth intra coding[C].Proceedings of the Multimedia and Expo Workshops(ICMEW),2013 IEEE International Conference on,2013:1-4.
[5] GU Z Y,ZHENG J H,LING N,et al.Fast intra prediction mode selection for intra depth map coding[C]. JCT3V-E0238 of JCT-3V,Vienna,AT,2013.
[6] ZHANG Q,LI N,WU Q.Fast mode Ddecision for 3D-HEVC depth intracoding[J].The Scientific World Journal,2014(3):620142.
[7] SANCHEZ G,SALDANHA M,BALOTA G,et al.DMMFast:a complexity reduction scheme for three-dimensional high-efficiency video coding intraframe depth map coding[J].ELECTIM,2015,24(2):1-15.
[8] CHUN-SU P.Edge-based intramode selection for depthmap coding in 3D-HEVC[J].Image Processing,IEEE Transactions on,2015,24(1):155-162.
[9] JCT-3V.Subversion repository for the 3D-HEVC test model version HTM-15.1[EB/OL].[2015-11-28].https://hevc.hhi.fraunhofer.de/svn/svn_3DVCSoftware/tags/HTM-15.1/.
[10] RUSANOVSKYY D,M?譈LLER K,VETRO A.Common test conditions of 3DV core experiments[C].JCT3V-F1100 of JCT-3V,Geneva,Switzerland,2013.