摘 要: 針對無線衰落信道中AMR-WB寬帶語音編碼,提出一種基于多速率刪余卷積碼的不等錯誤保護(hù)傳輸方案。根據(jù)AMR-WB語音編碼數(shù)據(jù)的不同重要性,采用強(qiáng)錯誤保護(hù)能力的刪余卷積碼為AMR-WB語音編碼中的A類數(shù)據(jù)提供錯誤保護(hù)能力,對B類數(shù)據(jù)采用高碼率刪余卷積碼提供錯誤保護(hù)能力。研究結(jié)果表明,在同樣傳輸帶寬條件下,不等錯誤能力保護(hù)可以有效改善無線衰落信道中AMR-WB語音質(zhì)量。
關(guān)鍵詞: 自適應(yīng)多速率寬帶語音編碼;無線衰落信道;不等錯誤保護(hù);刪余卷積碼
?
國際電信聯(lián)盟ITU(International Telecommunication Union)于2003年發(fā)布了高質(zhì)量的自適應(yīng)多速率寬帶AMR-WB(Adaptive Multi-Rate Wideband)語音編碼G.722.2作為未來全球移動通信系統(tǒng)GSM(Global System for Mobile)與寬帶碼分多址WCDMA(Wideband Code Division Multiple Access)移動通信系統(tǒng)的寬帶語音編解碼標(biāo)準(zhǔn)[1]。該語音編碼標(biāo)準(zhǔn)采樣率為16kHz,支持的語音帶寬為50~7 000Hz,其語音質(zhì)量相對于G.711、G.723、G.728都有明顯提高。G.722.2采用代數(shù)碼激勵線性預(yù)測ACELP(Algebraic Code-Excited Linear Prediction)算法,提供比特率從6.60kb/s到23.85kb/s的9種不同的編碼模式,語音聲碼器根據(jù)無線信道和傳輸狀況來自適應(yīng)地選擇合適速率進(jìn)行編碼傳輸,支持不連續(xù)傳輸模式、語音激活檢測和舒適背景噪聲產(chǎn)生的功能[2]。AMR-WB寬帶編解碼標(biāo)準(zhǔn)可以應(yīng)用于無線通信網(wǎng)絡(luò)和有線通信網(wǎng)絡(luò), 解決了不同網(wǎng)絡(luò)之間的語音編碼方式的轉(zhuǎn)換問題,可以緩解通信系統(tǒng)與設(shè)備之間不同語音編碼方式轉(zhuǎn)換帶來的額外復(fù)雜性[3]。
如何提高無線衰落信道中AMR-WB語音的傳輸質(zhì)量是無線多媒體通信研究的一個熱點,其中不等錯誤能力保護(hù)UEP(Unequal Error Protection)是一種簡單有效的手段。UEP通過對語音編碼中不同類型的數(shù)據(jù)提供不同的錯誤保護(hù)能力來改善語音的傳輸質(zhì)量。本文研究平坦Rayleigh衰落信道中UEP下AMR-WB的性能,采用不同碼率的變速率刪余卷積碼RCPC(Rate Compatible Punctured Convolutional Codes)為AMR-WB語音編碼數(shù)據(jù)提供的不同錯誤保護(hù)能力。研究結(jié)果表明,在語音質(zhì)量感覺評價準(zhǔn)則下,采用不等錯誤保護(hù)能力的RCPC可以改善衰落信道中AMR-WB語音的傳輸質(zhì)量。
1 AMR-WB語音編碼器的分類保護(hù)特性
AMR-WB編解碼器是按20ms為一幀進(jìn)行處理的,在每幀中包括了三部分:AMR-WB頭部、AMR-WB輔助信息(模式預(yù)測4bit、模式要求4bit、CRC校驗8bit)、AMR-WB核心幀。AMR-WB核心幀存放的是語音數(shù)據(jù)或舒適噪聲參數(shù)。由編碼器產(chǎn)生的比特順序為{s(1),s(2),…,s(K)}, K代表不同的編碼模式所產(chǎn)生的總比特數(shù)。這些比特在輸出編碼器之前將根據(jù)它們的主觀重要性的不同而重新調(diào)整順序,以達(dá)到不等錯誤保護(hù)的目的。排序算法為:
其中m=0,1,…,8為編碼模式,tablem(j)的內(nèi)容在G.722.2附件E表格E.5中給出。
重新排序的比特順序變?yōu)閧d(0),d(1),…,d(K)},其重要性隨著K的增大而減小。重新排序的比特流根據(jù)它們的主觀重要性被分成A、B和C三類數(shù)據(jù)。不同模式下三類分配的比特數(shù)如表1所示。
?
A類數(shù)據(jù)中的比特對錯誤非常敏感,其中的錯誤都會嚴(yán)重影響解碼端正常的解碼操作,因此需要采用合適的錯誤隱藏方法進(jìn)行解決,A類需要用在幀的輔助信息中加入CRC校驗來對數(shù)據(jù)進(jìn)行差錯校驗。8位CRC產(chǎn)生的多項式為
????
B類和C類較A類對錯誤有更強(qiáng)的魯棒性,其中的比特錯誤會降低語音質(zhì)量,但這些類的錯誤比特在解碼過程中不會影響到語音的可懂度。B類比C類對錯誤更敏感些。
2 AMR-WB編碼器算法
G.722.2中AMR-WB語音編碼采用ACELP算法,編碼模型為碼激勵線性預(yù)測CELP(Code Excited Linear Prediction)模型。CELP采用合成分析、碼本搜索過程、感覺加權(quán)、矢量量化和線性預(yù)測技術(shù)[4]。CELP合成模型如圖1所示。
?
在這種模型中,線性預(yù)測編碼LPC(Linear Prediction Coding)濾波器是一個16階的短時濾波器,其傳輸函數(shù)為:
其中,是量化的線性預(yù)測濾波器系數(shù),基音周期合成濾波器(長時合成濾波器)形式為:
其中, T為基音延時,gp為基音增益。CELP采用自適應(yīng)碼本中的一個矢量來逼近語音的長時基音結(jié)構(gòu);同時采用固定隨機(jī)碼本中的一個碼矢量來逼近語音短時、長時預(yù)測后的殘差信號。從兩個碼本中搜索出最佳碼矢量,乘以各自的最佳增益后相加,得到CELP激勵信號源。將激勵信號輸入線性預(yù)測綜合濾波器1/A(z),得到合成語音信號與原始信號s(n)的誤差經(jīng)過感覺加權(quán)濾波器W(z)得到感覺加權(quán)誤差e(n),CELP用感覺加權(quán)的最小均方預(yù)測誤差作為搜索最佳碼矢量及其幅度的度量準(zhǔn)則,使感覺加權(quán)誤差最小的碼矢量即是最佳碼矢量。AMR-WB的感覺加權(quán)濾波器的形式為:
???
??? AMR-WB編解碼器從每一幀中提取LPC濾波器系數(shù)、自適應(yīng)碼本和固定碼本的序號和增益;對這些參數(shù)經(jīng)過編碼后傳輸?shù)浇邮斩?。接收端從接收到的?shù)據(jù)流中提取參數(shù),構(gòu)建濾波器來重建語音。
3 無線衰落信道的編碼
??? RCPC是通過對標(biāo)準(zhǔn)碼率為碼率的卷積碼進(jìn)行周期性刪余得到不同碼率兼容的卷積碼,由同一個卷積碼刪余得到的各種碼率的RCPC可以共用一個Viterbi譯碼器進(jìn)行譯碼[5]。RCPC在通信系統(tǒng)中被廣泛應(yīng)用。本文利用不同速率的RCPC實現(xiàn)UEP功能,其中1/3卷積碼的生成元為(13,15,17)8,自由距離為10,刪余后1/2卷積碼的生成元為(15,17)8,自由距離為6,二者共用一個Viterbi譯碼器[6]。圖2為平坦瑞利信道中RCPC硬判決譯碼的性能,橫坐標(biāo)為比特信噪比(Eb/N0),縱坐標(biāo)為誤比特率BER(Bit Error Rate)。
??? 從圖2可知,在相同的信噪比條件下,1/3碼率的RCPC相對于碼率為1/2的RCPC大約有2dB的編碼增益。本文利用碼率為1/2和1/3的RCPC實現(xiàn)AMR-WB數(shù)據(jù)的不等錯誤保護(hù)。
4 仿真與實驗結(jié)果?
在對語音文件仿真時,使用ITU-T G.722.2附件D提供的語音測試序列作為語音原材料。其文件名為tst.inp, 大小為125KB,采用ITU編碼格式。實驗過程為:AMR-WB編碼器先對tst.inp進(jìn)行壓縮編碼,輸出碼流經(jīng)過RCPC信道編碼之后采用BPSK進(jìn)行調(diào)制,調(diào)制后的信號通過瑞利衰落信道傳送到接收端;接收端采用與發(fā)送端相反的操作,最終得到以.out為后綴的語音輸出文件。評判語音質(zhì)量時采用ITU-T建議P.862.3中給出的語音質(zhì)量感覺評價方法,即PESQ(Perceptual Evaluation of Speech Quality)算法[7]。PESQ得分用于衡量語音質(zhì)量。
AMR-WB編碼器提供了9種不同的編碼模式,對每種模式都采用RCPC信道編碼,對AMR-WB核心幀中重要程度最高的A類數(shù)據(jù)使用速率為1/3的信道編碼,對B類數(shù)據(jù)使用速率為1/2的信道編碼, C類數(shù)據(jù)沒有編碼比特,因此不予考慮。在不采用UEP時,對A和B類數(shù)據(jù)統(tǒng)一采用碼率為4/9的RCPC,這樣采用UEP和不采用UEP的編碼方案具有相同的傳輸帶寬。圖3給出了tst.inp語音文件在采用UEP和不采用UEP情況下的部分語音時域波形圖。從圖中可以看出,在沒有使用UEP情況下其質(zhì)量相對要差一些。
對AMR-WB核心幀采用UEP方案的PESQ得分與沒有采用UEP方案時的得分進(jìn)行比較,可以得到圖4的結(jié)果。在相同的編碼模式下, 使用刪余卷積碼對語音進(jìn)行刪余保護(hù),其PESQ值高于沒有使用時的得分。從圖中還可以看出在較低速率編碼模式下兩者的差別更為明顯,說明在低速率語音編碼情況下,采用UEP提高語音質(zhì)量的效果更為明顯。
?
本文利用不同碼率的刪余卷積碼對AMR-WB核心幀中不同重要程度的語音編碼數(shù)據(jù)提供不同的錯誤保護(hù)能力。研究結(jié)果表明,在相同傳輸帶寬的條件下,不同錯誤保護(hù)可以改善AMR-WB語音質(zhì)量,在低速率語音編碼模式下效果更為明顯。
參考文獻(xiàn)
[1]?ITU-T Recommendation G.722.2: Wideband coding of Speech at around 16kbit/s using Adaptive Multi-Rate
?Wideband(AMR-WB) [S]. ITU, 2003.
[2]?VARGA I, IACOVO R. Standardization of the AMR?wideband speech codec in 3GPP and ITU-T [J]. IEEE?Communications Magazine, 2006,44(5):66-73.
[3]?OJALA P, LAKANIEMI A. Wideband speech codec:?system characteristics, quality advances, and deployment
?strategies [J]. IEEE Communications Magazine,2006,44(5):59-65.
[4]?HUANG Yi Teng, BENESTY J. Audio signal processing?for ext-generation multimedia communication systems [M]. ?Boston, MA, USA: Kluwer Academic Publishers.
[5]?HAGENAUER J. Rate-compatible punctured convolutional?codes(RCPC Codes) and their applications[J].IEEE Trans.Comm, Apr.1988,36(4):389-399.
[6]?SHU LIN, COSTELLO D. Error control coding: fundamentals and applications [M]. Upper Saddle River, NJ,
?USA: Prentice Hall, 2003.
[7]?ITU-T recommendation P. 862.3: Application guide for?objective quality measurement based on recommendations?[S]. ITU, 2007.