《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 基于IP包拆分重組技術(shù)的混合語(yǔ)音壓縮編碼算法研究
基于IP包拆分重組技術(shù)的混合語(yǔ)音壓縮編碼算法研究
電子技術(shù)應(yīng)用
李凌云,李肖克,陳奕釗,王國(guó)法,王輝
中國(guó)電子科技集團(tuán)公司第三十四研究所
摘要: 針對(duì)某特殊通信網(wǎng)業(yè)務(wù)系統(tǒng)中,在10 kb/s的窄帶信道上傳輸1路標(biāo)準(zhǔn)G.729編碼格式的VoIP語(yǔ)音數(shù)據(jù)的特殊通信場(chǎng)景,提出一種基于IP包拆分重組技術(shù)的混合語(yǔ)音壓縮編碼算法,將G.729壓縮后的語(yǔ)音數(shù)據(jù)進(jìn)行解壓縮,再通過(guò)AMBE進(jìn)行二次壓縮,結(jié)合IP包拆分重組技術(shù),保留語(yǔ)音數(shù)據(jù)中有效載荷,剔除多余開(kāi)銷(xiāo)數(shù)據(jù),減小語(yǔ)音數(shù)據(jù)傳輸所需帶寬。仿真實(shí)驗(yàn)驗(yàn)證了該方法的有效性,當(dāng)G.729和AMBE的語(yǔ)音壓縮編碼速率分別為8 kb/s、2.4 kb/s,載荷長(zhǎng)度為20 ms,IP包打包周期為8包時(shí),實(shí)驗(yàn)表明無(wú)論在何種光路狀態(tài)下,平均句子可懂度達(dá)85%以上,話音信號(hào)等級(jí)達(dá)3級(jí)以上,滿足話音傳輸系統(tǒng)要求。
中圖分類(lèi)號(hào):TN912.3 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.245688
中文引用格式: 李凌云,李肖克,陳奕釗,等. 基于IP包拆分重組技術(shù)的混合語(yǔ)音壓縮編碼算法研究[J]. 電子技術(shù)應(yīng)用,2025,51(2):70-74.
英文引用格式: Li Lingyun,Li Xiaoke,Chen Yizhao,et al. Research on hybird speech compression coding algorithm based on IP packet splitting and reassembling technology[J]. Application of Electronic Technique,2025,51(2):70-74.
Research on hybird speech compression coding algorithm based on IP packet splitting and reassembling technology
Li Lingyun,Li Xiaoke,Chen Yizhao,Wang Guofa,Wang Hui
The 34th Research Institute of CETC
Abstract: Aiming at the special communication network service system, in order to transmit 1 channel of standard G.729 Voice over Internet Protocol(VoIP)voice data over 10 kb/s narrowband channel in the special communication scenario, a hybrid speech compression coding algorithm based on IP packet splitting and reassembling technology is proposed. The algorithm decomposes the voice data after G.729 compression, and then performs secondary compression through Advanced Multi-Band Excitation (AMBE). Combined with IP packet splitting and reassembly technology, the payload in the voice data is retained, the redundant overhead data is eliminated, and the bandwidth required for voice data transmission is reduced. The effectiveness of the method is verified by simulation experiment. The experiments show that when the speech compression coding rate of G.729 and AMBE is 8 kb/s and 2.4 kb/s respectively, the load length is 20 ms, and the IP packet packaging cycle is 8 packets, the average sentence intelligibility is above 85% and the voice signal level is above level 3 under any optical path state, which meets voice transmission system requirements.
Key words : speech compression coding;G.729;AMBE;IP packet splitting and reassembling;narrowband communication

引言

語(yǔ)音壓縮編碼是指為提高通信網(wǎng)中的信息傳輸效率及實(shí)現(xiàn)語(yǔ)音的高效存儲(chǔ),對(duì)編碼后的數(shù)字語(yǔ)音進(jìn)行壓縮的技術(shù)。由于現(xiàn)代通信網(wǎng)對(duì)傳輸帶寬、數(shù)據(jù)保密性等各種特殊場(chǎng)景的需要,低速率語(yǔ)音壓縮編碼技術(shù)因其占用帶寬少、抗干擾、保密性強(qiáng)及系統(tǒng)容量高等特點(diǎn)而成為語(yǔ)音研究領(lǐng)域中的一個(gè)重要課題。

在某特殊通信網(wǎng)業(yè)務(wù)系統(tǒng)中,既要在平均通信速率僅有10 kb/s的信道上傳輸1路基于IP的語(yǔ)音傳輸VoIP語(yǔ)音,又要求話音編碼標(biāo)準(zhǔn)采用G.729標(biāo)準(zhǔn)。傳統(tǒng)G.729標(biāo)準(zhǔn)話音數(shù)據(jù)需要34.4 kb/s的傳輸帶寬,僅采用一種語(yǔ)音壓縮編碼技術(shù)已明顯不能滿足要求。

研究人員提出一種基于混合激勵(lì)線性預(yù)測(cè)(Mixed Excited Linear Prediction,MELP)的0.6 kb/s的聲碼器算法,將多個(gè)連續(xù)語(yǔ)音幀合成一個(gè)超級(jí)幀,充分利用參數(shù)的幀間相關(guān)性進(jìn)行聯(lián)合量化,通過(guò)仿真驗(yàn)證了該算法可得到一個(gè)可懂度較高、清晰度和自然度較好的合成語(yǔ)音[1-5]。常亮等提出一種基于正弦激勵(lì)線性預(yù)測(cè)(Sinusoidal Excitation Linear Prediction,SELP)的0.56 kb/s多幀聯(lián)合分模式矢量量化算法,獲得接近電話質(zhì)量的語(yǔ)音[6]。Huang等提出一種矩陣量化方案和低速率的聲碼器算法,在低速率通信鏈路中獲得了高質(zhì)量語(yǔ)音[7]。Ozaydin等針對(duì)窄帶通信鏈路中語(yǔ)音信號(hào)特征,基于共軛結(jié)構(gòu)代數(shù)碼激勵(lì)線性預(yù)測(cè)編碼(Conjugate Structure-Algebraic Code Excited Linear Prediction,CS-ACELP)設(shè)計(jì)了一種低復(fù)雜度、高效的語(yǔ)音激活檢測(cè)(Voice Activity Detection,VAD)算法,該算法的實(shí)現(xiàn)將語(yǔ)音的平均通信速率約降至4 kb/s[8]。上述語(yǔ)音壓縮編碼算法的速率雖都達(dá)到了4.6 kb/s以下,甚至達(dá)到了0.56 kb/s,具有一定的借鑒意義,但上述算法并未使用G.729語(yǔ)音編碼標(biāo)準(zhǔn)。

鑒于此,本文提出一種基于IP包拆分重組技術(shù)的混合語(yǔ)音壓縮編碼算法,在使用G.729標(biāo)準(zhǔn)的基礎(chǔ)上,利用改進(jìn)的多帶激勵(lì)(Advanced Multi-Band Excitation,AMBE)語(yǔ)音編碼技術(shù)對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行二次壓縮解壓,結(jié)合IP包拆分重組技術(shù),使語(yǔ)音數(shù)據(jù)傳輸比特率達(dá)到5.7 kb/s,有效避免開(kāi)銷(xiāo)數(shù)據(jù)消耗過(guò)多信道帶寬,提高語(yǔ)音有效載荷的傳輸效率和質(zhì)量。


本文詳細(xì)內(nèi)容請(qǐng)下載:

http://theprogrammingfactory.com/resource/share/2000006328


作者信息:

李凌云,李肖克,陳奕釗,王國(guó)法,王輝

(中國(guó)電子科技集團(tuán)公司第三十四研究所,廣西 桂林 541004)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。