文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.172043
中文引用格式: 張秀再,王婷,郭業(yè)才,等. 基于維納后置濾波的LS波束形成混響抑制算法[J].電子技術(shù)應(yīng)用,2018,44(3):131-134.
英文引用格式: Zhang Xiuzai,Wang Ting,Guo Yecai,et al. Reverberation suppression algorithm for LS beamforming based on Wiener post-filter[J]. Application of Electronic Technique,2018,44(3):131-134.
0 引言
麥克風(fēng)陣列能夠準(zhǔn)確獲取空間信息,廣泛地應(yīng)用于電話會(huì)議、免提語(yǔ)音通信、人機(jī)語(yǔ)音交互和助聽(tīng)設(shè)備等系統(tǒng)[1]。波束形成是一種重要的麥克風(fēng)陣列處理技術(shù),其主要目的是對(duì)特定方向的有用信號(hào)形成波束,同時(shí)抑制其他方向的干擾信號(hào)和噪聲[2]。近年隨著人們對(duì)語(yǔ)音通信研究的深入,麥克風(fēng)陣列得到更加廣泛地應(yīng)用。
在具有多個(gè)分布式麥克風(fēng)的語(yǔ)音通信應(yīng)用中,通常期望量化每個(gè)傳感器處感知信號(hào)的混響量,以便選擇具有最高質(zhì)量或最小混響的頻道。假設(shè)不同信道上的噪聲之間不相關(guān)的前提下,ZELINSKI R[3]提出具有維納后置濾波的波束形成器,利用空間信息解決了維納濾波器的估計(jì)問(wèn)題。但這種非相干噪聲場(chǎng)實(shí)際上很少遇到,特別是低頻噪聲場(chǎng)。BERKUN R[4]和MARRO C[5]提出基于麥克陣列與維納后置濾波器結(jié)合的降噪和去混響算法。MCCOWAN I[6]基于噪聲場(chǎng)復(fù)相干的假設(shè)知識(shí)開(kāi)發(fā)濾波器估計(jì)的更一般表達(dá)式,但該算法要求預(yù)先得到噪聲相干函數(shù),適用范圍受到限制。SIMMER K U[7]提出的多通道維納濾波器(MCWF),其可以分解為最小方差無(wú)失真響應(yīng)波束形成器和單通道后置濾波器,求最優(yōu)解表達(dá)式,對(duì)混響中語(yǔ)音質(zhì)量改善明顯。LUEBS A[8]在白噪聲和漫反射噪聲的基礎(chǔ)上增加點(diǎn)干擾處理,通過(guò)提供全局最優(yōu)的最小二乘解決方案,更有效地利用麥克風(fēng)陣列收集的信息,提高語(yǔ)音質(zhì)量。
本文提出具有維納后置濾波的最小二乘波束形成混響抑制算法。該算法對(duì)含混響語(yǔ)音信號(hào)通過(guò)分頻得到高頻和低頻分量,用LS波束形成算法分別進(jìn)行處理后疊加,并進(jìn)行維納后置濾波,再由逆傅里葉變換得到去混響后的語(yǔ)音信號(hào)。計(jì)算機(jī)仿真結(jié)果證明,本文提出的基于維納后置濾波的LS波束形成混響抑制算法具有較好的混響抑制能力。
1 信號(hào)模型
1.1 最小二乘波束形成算法
設(shè)基陣為M元均勻線陣,每個(gè)陣元通道后有一個(gè)L階FIR濾波器,接收寬帶信號(hào)的頻率帶寬Nf為[fl,fh],信號(hào)的傳播方向與基陣法線方向的夾角為θ,陣元間距d。在最小二乘波束形成器的設(shè)計(jì)方法[2,9]中,將代價(jià)函數(shù)定義為:
1.2 具有維納后置濾波的波束形成器
ZELINSKI R[3]提出的自適應(yīng)后置濾波器結(jié)構(gòu)如圖1所示。其中,A(i)表示第i個(gè)通道的自功率譜密度,C(i)表示互功率譜密度,y(t)為輸出信號(hào)。該系統(tǒng)首先對(duì)麥克風(fēng)陣列接收的語(yǔ)音信號(hào)進(jìn)行時(shí)延補(bǔ)償。把第i個(gè)通道接收到的信號(hào)xi(t)表示為:
1.3 基于維納后置濾波的LS改進(jìn)波束形成
根據(jù)LEBART K和BOUCHER J M提出的假設(shè)[10],即基于房間脈沖響應(yīng)h(k)是一個(gè)隨機(jī)過(guò)程,表示為:
假設(shè)sd(k)與sr(k)分別表示純凈語(yǔ)音信號(hào)s(t)與hd(k)和hr(k)的卷積,則sd(k)為待處理語(yǔ)音信號(hào)的直達(dá)信號(hào)部分,sr(k)為待處理語(yǔ)音信號(hào)的混響部分。
由以上分析得到改進(jìn)維納濾波器的估計(jì)增益[5]:
因?yàn)樗p因子Δ與混響時(shí)間T60存在聯(lián)系,而不同頻段的混響時(shí)間不同,故Δ是隨著特定房間對(duì)不同頻率的衰減和反射程度而改變的,即不同頻率的聲信號(hào)產(chǎn)生的混響有一定的差異,并且在實(shí)際聲場(chǎng)中低頻部分噪聲相干性較強(qiáng),因此采用分頻處理的思想,將傅里葉變換后的信號(hào)分為高頻和低頻分量,頻率分界點(diǎn)取為1 kHz。令α為加權(quán)矩陣系數(shù),是正常數(shù),將高、低頻權(quán)矢量hL、hH分別相加,即將分頻后的信號(hào),用LS波束形成算法分別進(jìn)行處理后再求和,將得到的信號(hào)Y(ω)進(jìn)行維納后置濾波,最后將信號(hào)進(jìn)行逆傅里葉變換得到去混響后的語(yǔ)音信號(hào)。基于維納后置濾波的LS改進(jìn)波束形成結(jié)構(gòu)如圖2所示。
由式(5)、式(12)可求得改進(jìn)波束形成器的最優(yōu)權(quán)向量為:
2 實(shí)驗(yàn)與評(píng)估
仿真環(huán)境:采用6個(gè)麥克風(fēng)傳感器均勻線陣,其中聲源位置(-5,1,0),最左邊第一個(gè)麥克風(fēng)位置為(-5,2,1),麥克風(fēng)陣元間隔1 m。四面墻、地板、天花板的反射系數(shù)分別為0.9,0.95,0.9,0.95,0.2,0.4。房間的對(duì)角坐標(biāo)為(-7,-3,0),(1,3,1.24)。本實(shí)驗(yàn)將一段純凈語(yǔ)音信號(hào)(第一課歡迎新同學(xué))與房間脈沖響應(yīng)函數(shù)做卷積得到混響后的信號(hào),純凈語(yǔ)音信號(hào)采樣頻率fs為8 000 Hz,持續(xù)2.3 s。從兩個(gè)指標(biāo)對(duì)提出的算法進(jìn)行驗(yàn)證。
(1)語(yǔ)譜圖:如圖3用三維的方式顯示語(yǔ)音頻譜特性,是一種動(dòng)態(tài)的頻譜。用顏色深淺表示特定頻帶的能量大小。
圖3(a)為純凈語(yǔ)音信號(hào)的語(yǔ)譜圖;圖3(b)為混響語(yǔ)音信號(hào)的語(yǔ)譜圖,從該圖可知共振峰前后重疊較嚴(yán)重,在橫軸(時(shí)間軸)上語(yǔ)音信號(hào)出現(xiàn)約0.17 s的延遲,語(yǔ)音質(zhì)量受損嚴(yán)重;圖3(c)中單通道維納濾波算法雖然對(duì)混響有一定的抑制作用,但是信號(hào)失真仍嚴(yán)重;圖3(d)中本文提出的算法對(duì)混響抑制效果較好,對(duì)信號(hào)失真改善較明顯。
(2)采用語(yǔ)音質(zhì)量感知評(píng)價(jià)(Perceptual Evaluation of Speech Quality,PESQ)對(duì)去混響的效果進(jìn)行評(píng)估,PESQ表示為:
式中,Dind、Aind分別是平均干擾值和平均的線性組合獲得的對(duì)稱干擾值。從表1中看出,加入混響后語(yǔ)音信號(hào)的PESQ下降為1.9,語(yǔ)音信號(hào)的質(zhì)量嚴(yán)重下降。經(jīng)過(guò)本文提出算法進(jìn)行混響抑制后PESQ達(dá)到2.3。
3 總結(jié)
本文提出的具有維納后置濾波的最小二乘波束形成混響抑制算法將混響后的信號(hào)分為直達(dá)部分和混響部分,得到改進(jìn)維納后置濾波器增益估計(jì),然后用最小二乘波束形成算法將信號(hào)進(jìn)行分頻處理,最后求解最優(yōu)權(quán)值,并通過(guò)仿真實(shí)驗(yàn)分別從信號(hào)的語(yǔ)譜圖和語(yǔ)音質(zhì)量感知指標(biāo)對(duì)算法進(jìn)行評(píng)估。仿真實(shí)驗(yàn)結(jié)果表明,相對(duì)于維納混響算抑制算法,本文提出算法混響抑制效果更加顯著。
參考文獻(xiàn)
[1] LOIZOU P C.Speech enhancement:Theory and practice[M].CRC Press,Inc.2013.
[2] DOBLINGER G.Optimization of wideband fixed beamformers with adaptive sensor calibration[C].Signal Processing Conference,2010,European.IEEE,2010:2062-2066.
[3] ZELINSKI R.A microphone array with adaptive post-filtering for noise reduction in reverberant rooms[C].International Conference on Acoustics,Speech,and Signal Processing.IEEE,2002,5:2578-2581.
[4] BERKUN R,COHEN I.Microphone array power ratio for quality assessment of reverberated speech[J].EURASIP Journal on Advances in Signal Processing,2015(1):1-11.
[5] MARRO C,MAHIEUX Y,SIMMER K U.Analysis of noise reduction and dereverberation techniques based on micro-phone arrays with postfiltering[J].IEEE Transactions on Speech & Audio Processing,2002,6(3):240-259.
[6] MCCOWAN I,BOURLARD H.Microphone array post-filter based on noise field coherence[J].IEEE Transactions on Speech & Audio Processing,2003,11(6):709-716.
[7] SIMMER K U,BITZER J,MARRO C.Post-filtering techniques[M].Microphone Arrays. Springer Berlin Heidelberg,2001:39-60.
[8] HUANG Y A,LUEBS A,SKOGLUND J,et al.Globally optimized least-squares post-filtering for microphone array speech enhancement[C].IEEE International Conference on Acoustics,Speech and Signal Processing.IEEE,2016:380-384.
[9] 王燕,吳文峰,梁國(guó)龍.基于穩(wěn)健最小二乘的魯棒波束形成[J].電子學(xué)報(bào),2013,41(12):2321-2326.
[10] LEBART K,BOUCHER J M,DENBIGH P N.A new method based on spectral subtraction for speech dereverberation[J].Acta Acustica United With Acustica,2001,87(3):359-366.
作者信息:
張秀再1,2,王 婷1,郭業(yè)才1,2,陳小燕1
(1.南京信息工程大學(xué) 電子與信息工程學(xué)院,江蘇 南京210044;
2.江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,江蘇 南京210044)