摘 要: 結(jié)合礦井的實(shí)際環(huán)境討論了井下數(shù)字漏泄移動(dòng)通信系統(tǒng)中語(yǔ)音編解碼方法的選擇原則;分析了LD-CELP算法的特點(diǎn)和優(yōu)勢(shì),研究了該算法的性能;給出了在TMS320DM643平臺(tái)上LD-CELP編解碼方法的具體設(shè)計(jì)方案。
關(guān)鍵詞: 井下數(shù)字通信;語(yǔ)音編解碼;LD-CELP;TMS320DM643
國(guó)家工信部近年將逐步停止對(duì)模擬對(duì)講機(jī)型號(hào)的核準(zhǔn),并將在幾年內(nèi)完成模擬對(duì)講機(jī)到數(shù)字對(duì)講機(jī)的過(guò)渡。根據(jù)這一規(guī)定及市場(chǎng)的發(fā)展前景可以看出,現(xiàn)有的礦井下模擬漏泄通信系統(tǒng)在未來(lái)5~6年后將逐步淘汰,因此開(kāi)發(fā)先進(jìn)的礦井下數(shù)字漏泄通信系統(tǒng)是現(xiàn)代通信技術(shù)發(fā)展的必然趨勢(shì)。而語(yǔ)音通信作為數(shù)字通信的核心部分必然會(huì)作為研究的重點(diǎn),其中選擇適應(yīng)井下復(fù)雜環(huán)境的數(shù)字語(yǔ)音編解碼方法顯得尤為重要。
1 語(yǔ)音編解碼技術(shù)及井下選擇標(biāo)準(zhǔn)
1.1 語(yǔ)音編碼的分類及介紹
語(yǔ)音信號(hào)的編碼方法可分為波形編碼、參數(shù)編碼和混合編碼三類。波形編碼自適應(yīng)能力強(qiáng),語(yǔ)音質(zhì)量好,但所需要的編碼速率較高,一般在16 kb/s以上。而參數(shù)編碼以數(shù)學(xué)模型模擬語(yǔ)音信號(hào)產(chǎn)生機(jī)制為基礎(chǔ),通過(guò)提取信號(hào)的特征參數(shù)來(lái)編碼,優(yōu)點(diǎn)是編碼速率低,但語(yǔ)音質(zhì)量較差,清晰度不高?;旌暇幋a則是在保留分析合成編碼的技術(shù)基礎(chǔ)上,引進(jìn)了波形編碼準(zhǔn)則去優(yōu)化激勵(lì)信號(hào),從而在低碼率上獲得了較高質(zhì)量的合成語(yǔ)音。連續(xù)可變斜率增量調(diào)制(CVSD)是增量調(diào)制的一種改進(jìn)方法。這種方法中信號(hào)斜率是根據(jù)碼流中連“1”或連“0”的個(gè)數(shù)來(lái)檢測(cè),所以又稱為數(shù)字檢測(cè)。低時(shí)延碼激勵(lì)線性預(yù)測(cè)編碼(LD-CELP)是G.728語(yǔ)音編碼標(biāo)準(zhǔn)算法,這種算法采用后向自適應(yīng)線性預(yù)測(cè)、50階全極點(diǎn)合成濾波、短激勵(lì)矢量(5個(gè)樣值)等改進(jìn)方法,達(dá)到高質(zhì)量和低時(shí)延的目的,總的編碼時(shí)延小于2 ms。
1.2 適合井下通信要求的編碼方式
礦井下環(huán)境復(fù)雜,存在著巷道繁多、干擾較大等特點(diǎn),所以在選擇編碼方式時(shí)一定要結(jié)合實(shí)際環(huán)境選擇適合井下通信的方法,其原則有:(1)雖然井下通信對(duì)語(yǔ)音的清晰度要求不是很高,但井下環(huán)境比較復(fù)雜,巷道距離長(zhǎng),彎道多,噪聲大,所以編碼應(yīng)有較強(qiáng)的抗噪聲干擾和抗誤碼性能;(2)井下帶寬資源有限,所以語(yǔ)音編碼速率在保證話音清晰的前提下應(yīng)盡可能低,以減少在系統(tǒng)帶寬中的占有率;(3)對(duì)編譯碼時(shí)延要求不是很高,但編譯碼器必須簡(jiǎn)單,性價(jià)比要高;(4)井下環(huán)境易燃易爆,所以設(shè)備功率要小,必須是本安型的防爆設(shè)備。目前國(guó)內(nèi)井下通信系統(tǒng)主要應(yīng)用的數(shù)字語(yǔ)音編碼方式為CVSD編碼,它主要有以下優(yōu)點(diǎn):原理簡(jiǎn)單,硬件要求低,抗誤碼性能強(qiáng)和技術(shù)成熟,具有專屬芯片產(chǎn)品CMX639。但隨著技術(shù)的發(fā)展,現(xiàn)代井下通信系統(tǒng)有了更高的要求,在語(yǔ)音通信的基礎(chǔ)上要求圖像或視頻的通信功能,這樣就要求利用DSP、FPGA等模塊化的嵌入式系統(tǒng)來(lái)實(shí)現(xiàn),而且要求語(yǔ)音編碼的速率更低,盡可能地不占用寶貴的井下帶寬資源。CVSD在編碼速率方面有著局限性,在16 kb/s以上語(yǔ)音質(zhì)量比較良好,但是在16 kb/s下語(yǔ)音質(zhì)量下降很快,不能適應(yīng)現(xiàn)代井下數(shù)字通信系統(tǒng)的要求,所以尋找一個(gè)更加合適的語(yǔ)音編碼方式勢(shì)在必行,而作為ITU-T的G.728標(biāo)準(zhǔn)的LD-CELP方法是系統(tǒng)最佳的選擇。
2 LD-CELP原理及實(shí)現(xiàn)
LD-CELP被ITU-T定為標(biāo)準(zhǔn)的G.728語(yǔ)音編碼協(xié)議,圖1和圖2是算法的編解碼器原理圖。LD-CELP和CELP(碼本激勵(lì)線性預(yù)測(cè))算法一樣利用了合成分析法進(jìn)行碼本搜索,并在此基礎(chǔ)上利用后向自適應(yīng)預(yù)測(cè)技術(shù)對(duì)短時(shí)譜包絡(luò)和增益進(jìn)行預(yù)測(cè),所以能達(dá)到算法延時(shí)0.625 ms,一路編解碼延時(shí)小于2 ms。編碼過(guò)程首先將速率為64 kb/s的A律或者μ律PCM輸入信號(hào)轉(zhuǎn)換成均勻量化的PCM信號(hào),接著由5個(gè)連續(xù)的語(yǔ)音樣點(diǎn)su(5n),su(5n+1),……su(5n+4)形成一個(gè)五維語(yǔ)音矢量。激勵(lì)碼本中共有1 024個(gè)五維的碼矢量。對(duì)于每個(gè)輸入語(yǔ)音矢量,編碼器利用合成分析法從碼本中搜索出最佳碼矢量,然后將10 bit的碼本標(biāo)號(hào)送出去。線性預(yù)測(cè)(LP)系數(shù)是用先前量化過(guò)的語(yǔ)音信號(hào)來(lái)提取和更新的。每4個(gè)相鄰的輸入矢量(20個(gè)樣點(diǎn))構(gòu)成一幀,每幀更新一次LP系數(shù);激勵(lì)的增益也是利用之前量化激勵(lì)信號(hào)的增益信息逐矢量地進(jìn)行提取和更新。LD-CELP這種獨(dú)特的編碼技術(shù)在16 kb/s速率上編解碼后的語(yǔ)音質(zhì)量在MOS(平均意見(jiàn)分,最大值5分)評(píng)分標(biāo)準(zhǔn)中達(dá)到了4.173的高分,基本可以還原原始的語(yǔ)音信號(hào),并且在低于16 kb/s速率下語(yǔ)音質(zhì)量能保持較好的穩(wěn)定狀態(tài)。其優(yōu)良的性能完全適合礦井下數(shù)字漏泄移動(dòng)通信的要求。
3 硬件設(shè)計(jì)
系統(tǒng)采用了SEED-DEC643作為算法實(shí)時(shí)實(shí)現(xiàn)的硬件平臺(tái),以高性能的32 bit定點(diǎn)DSP(TMS320DM643)為主控芯片的DSP系統(tǒng),處理能力達(dá)到了4 800 MIPS,完全滿足運(yùn)算的需求。芯片上集成了一個(gè)多通道音頻串行接口(McASP)外設(shè),具有8根串行數(shù)據(jù)線,由軟件配置輸入和輸出,具有很強(qiáng)的可編程能力,可以配置為多種同步串口標(biāo)準(zhǔn),可以和音頻ADC、DAC,Codec,數(shù)字音頻接口接收器DIR和S/PDIF傳輸物理層器件實(shí)現(xiàn)無(wú)縫連接,直接與各種器件高速接口。圖3所示為TMS320DM643接口框圖。
以TMS320DM643為核心的聲碼器結(jié)構(gòu)框圖如圖4所示。DEC643開(kāi)發(fā)板通過(guò)XDS510PLUS仿真器與PC機(jī)連接,由PC機(jī)通過(guò)CCS(Code Composer Studio)集成開(kāi)發(fā)環(huán)境進(jìn)行調(diào)試。運(yùn)行時(shí),語(yǔ)音信號(hào)由MIC輸入,經(jīng)A/D轉(zhuǎn)換為數(shù)字信號(hào),通過(guò)設(shè)定的串口0進(jìn)入DM643編碼器部分對(duì)該語(yǔ)音信號(hào)進(jìn)行編碼,編碼后進(jìn)入解碼模塊進(jìn)行解碼,輸出重建語(yǔ)音信號(hào),最后經(jīng)串口1送至D/A轉(zhuǎn)換器輸出至耳機(jī),從而完成編解碼的過(guò)程。
4 軟件設(shè)計(jì)
軟件設(shè)計(jì)主要采用混合編程方法實(shí)現(xiàn),在DSP資源配置、通信串口模塊、中斷模塊、濾波器等模塊采用了匯編程序編寫。編碼模塊流程圖和主程序流程圖分別如圖5、圖6所示。主程序首先用GEL文件對(duì)DM643進(jìn)行初始化,再初始化McASP模塊,然后打開(kāi)中斷控制寄存器,允許中斷請(qǐng)求,設(shè)置數(shù)據(jù)接收緩存,進(jìn)入主循環(huán),開(kāi)始接收、處理和發(fā)送數(shù)據(jù)。在接收過(guò)程中不斷檢測(cè)接收緩存區(qū),直至緩存區(qū)為空,數(shù)據(jù)接收完畢,將一幀數(shù)據(jù)從中取出,同時(shí)緩存區(qū)計(jì)數(shù)器清零,開(kāi)始對(duì)接收的語(yǔ)音數(shù)據(jù)進(jìn)行壓縮編碼處理。解碼過(guò)程則是編碼的逆過(guò)程。重復(fù)上述循環(huán)過(guò)程完成對(duì)一組語(yǔ)音數(shù)據(jù)的編解碼處理。
利用系統(tǒng)對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行采集與分析,對(duì)一段男聲錄音“合肥工業(yè)大學(xué)”的原始語(yǔ)音信號(hào)和編解碼后的信號(hào)的時(shí)域波形進(jìn)行比較,如圖7、圖8所示,可以看出,原始錄音人為夾雜了一些噪聲時(shí),波形相對(duì)比較尖銳,而在假定信道無(wú)噪聲干擾的情況下利用LD-CELP編解碼后的語(yǔ)音信號(hào)波形能夠很好地重建原始信號(hào)的包絡(luò),可以過(guò)濾出原始信號(hào)中尖銳的環(huán)境噪聲,并且語(yǔ)音編碼速率得到了很大的降低,實(shí)現(xiàn)在低速率下滿足人們對(duì)語(yǔ)音可懂度和清晰度的要求,節(jié)約了整個(gè)系統(tǒng)的帶寬。
本文通過(guò)對(duì)LD-CELP算法原理的分析,在TMS320DM643平臺(tái)上實(shí)現(xiàn)了編解碼的過(guò)程,演示了算法的性能。說(shuō)明了LD-CELP完全可以在數(shù)字通信快速發(fā)展的今天代替目前礦井下常用的CVSD算法,實(shí)現(xiàn)更高質(zhì)量的語(yǔ)音通信,并且其在低速率通信下能保持高清晰度的特點(diǎn),大大節(jié)省了整個(gè)漏泄通信系統(tǒng)的帶寬,為以后在DM643平臺(tái)上開(kāi)發(fā)礦井?dāng)?shù)字漏泄移動(dòng)通信系統(tǒng)中先進(jìn)的視頻通信模塊提供了良好的條件。在下一步的研究中將結(jié)合礦井下復(fù)雜的巷道環(huán)境,在傳輸過(guò)程中模擬加入一些礦井中常見(jiàn)的噪聲,進(jìn)一步分析LD-CELP算法在井下特定環(huán)境具有各種干擾的情況下能否適應(yīng)數(shù)字漏泄移動(dòng)通信系統(tǒng)對(duì)語(yǔ)音通信功能的要求。
參考文獻(xiàn)
[1] CCITT. Recommendation G.728.coding of speech at 16 kb/s using low-delay code excited linear prediction.Geneva,1992.
[2] Texas Instruments. TMS320DM643 user′s guide[Z]. 2004.
[3] 張雪英.數(shù)字語(yǔ)音處理及MATLAB仿真[M].北京:電子工業(yè)出版社,2010.
[4] 楊行峻.語(yǔ)音信號(hào)數(shù)字處理[M].北京:電子工業(yè)出版社,2007.
[5] SEED-DTK643V1.0實(shí)驗(yàn)手冊(cè).北京合眾達(dá)電子技術(shù)有限公司,2009.