??? 摘? 要: 分析了耳蝸濾波器與小波變換" title="小波變換" target="_blank">小波變換的相似性,以耳蝸頻率響應(yīng)為基礎(chǔ),設(shè)計出相應(yīng)的小波變換基函數(shù),并通過二進尺度變換得到一組小波作為耳蝸濾波器組。研究了利用該小波濾波器組進行多分辨率分析的數(shù)字實現(xiàn)方法,給出了相應(yīng)的分析濾波器。理論和實驗結(jié)果均表明,利用小波變換來實現(xiàn)耳蝸濾波器組是可行的。?
??? 關(guān)鍵詞: 耳蝸濾波器組; 離散小波變換; 多分辨分析; 語音信號處理
?
??? 耳蝸濾波器在語音增強、語音編碼、語音識別等方面得到了廣泛的應(yīng)用[1-2]。耳蝸濾波器的設(shè)計因此也成了語音信號處理研究的一個熱點。耳蝸濾波器組的實現(xiàn)通常是在各頻率點上分別設(shè)計濾波器,然后利用VLSI(Very Large Scale Integration)來實現(xiàn)。這種方法設(shè)計出的濾波器各通道相互獨立,參數(shù)調(diào)整需要分別進行,增加了濾波器設(shè)計和修改的復(fù)雜度,并且由于采用模擬的方法,其可靠性和靈活性都受到了很大的限制[3]。數(shù)字耳蝸的實現(xiàn)近年來得到了廣泛的關(guān)注。Kate在1991年就提出了耳蝸濾波器數(shù)字實現(xiàn)的軟件算法,Summerfield于1992年利用ASIC實現(xiàn)了該算法[4]。然而這種數(shù)字濾波器是對耳蝸濾波器高度簡化的模式,它只是由一個二階濾波器后級聯(lián)數(shù)個一階濾波器構(gòu)成。1997年,Lim[5]設(shè)計出了基于VHDL的耳蝸濾波器組模型,不過他的濾波器是一階Butterworth濾波器。隨后也出現(xiàn)了一系列的數(shù)字濾波器模型, 然而這些濾波器都是對耳蝸濾波器組的高度簡化,其頻率響應(yīng)與生物學的測試結(jié)果也相去較遠。2002年,Apurva Mishra[6]以耳蝸濾波器的Hubbard’s TWAmp模型的頻率響應(yīng)為基礎(chǔ),通過最小均方誤差算法對模型的頻率響應(yīng)進行擬合,從而設(shè)計出數(shù)字濾波器的系數(shù),他采用IIR的方式來實現(xiàn),這種方法設(shè)計出的濾波器雖然與生物學模型吻合較好,但其普適性和設(shè)計的靈活性較差,而且IIR為非線性相位濾波器,相位失真會對聽覺系統(tǒng)后續(xù)處理產(chǎn)生影響。?
??? 本研究將小波變換的多分辨時頻分析思想引入到耳蝸濾波器組的設(shè)計中。利用生理學上獲得的耳蝸頻率響應(yīng)數(shù)據(jù)設(shè)計小波基函數(shù) (母小波),通過母小波獲得一組二進制離散小波基作為耳蝸濾波器組。這組濾波器覆蓋了人類聽覺范圍,并且由于它們都源自母小波,所以具有很好的一致性,其頻率響應(yīng)與生理學結(jié)果也能很好地吻合。?
1 小波變換與耳蝸濾波器?
??? 耳蝸是內(nèi)耳的主要組成部分,它是一條蝸牛狀卷曲的管子,里面充滿了液體,其形狀示意如圖1(a)所示。在耳蝸液體的中部有基膜,當有聲波進入時,基膜的不同區(qū)域會對不同頻率產(chǎn)生最大程度的響應(yīng),即沿基膜發(fā)生“諧振”。沿耳蝸各點的諧振頻率分布如圖1(a)所示。發(fā)生諧振時,基膜上的內(nèi)毛細胞會將諧振信息轉(zhuǎn)換為神經(jīng)脈沖并通過聽覺神經(jīng)傳輸?shù)酱竽X,也就是說,耳蝸的不同位置允許不同頻率的聲波信號通過[7]。從這種響應(yīng)模式的耳蝸的作用相當于沿基膜放置的一組帶通濾波器。實驗數(shù)據(jù)表明,這組濾波器的帶寬成對數(shù)增大,其頻率響應(yīng)曲線呈現(xiàn)恒定Q值的特點,并且這些濾波器具有非對稱的頻率響應(yīng),在高頻端比在低頻端的下降更為陡峭。這種結(jié)構(gòu)的濾波器組為聽覺系統(tǒng)提供了一個多分辨率分析系統(tǒng):當輸入為快速變化持續(xù)時間短的信號時,其頻率高,將會在高諧振頻率的通道產(chǎn)生激勵,而此通道濾波器帶寬大,可以獲得高的時間分辨率;而對頻譜尖銳的信號則可提供很好的頻率分辨率。所以,聽覺系統(tǒng)的時頻分析具有很高的靈活性和自適應(yīng)性。?
?
?
??? 拉直后的耳蝸的頻率響應(yīng)特性如圖1(b)所示,其中心頻率隨位置呈對數(shù)分布,將其頻率響應(yīng)記為Hω(x-ln(ω))[8],ln(ω)表示自然底對數(shù)。?
??? 假設(shè)輸入信號f(t),其Fourier變換?
????
??? ??
??? 這正是輸入信號f(t)的連續(xù)小波變換。τ為平移參數(shù),s為尺度參數(shù)。小波變換的基函數(shù)(母小波):?
?????
式中,WTf(s,τ)表示f(t)的小波變換,其中的*表示卷積。取不同的尺度因子s,得到一組濾波器Ψs(τ),這組小波濾波器具有恒定的Q值,這與耳蝸濾波器組的恒Q特性也是相符的。?
??? 離散小波變換的小波基Ψn,m(t)是通過對小波的尺度參數(shù)和平移參數(shù)抽樣得到的。實際中采用最多的是二進制抽樣,am=2-m,τn=nam,得到離散化小波:?
??? hn,m(t)=2m/2h(2mt-n), m,n∈Z?
??? 這是一種自然的抽樣,當比例因子以2為倍數(shù)增大時,小波濾波器的帶寬以2為倍數(shù)減小,同時,平移的抽樣率也以2為倍數(shù)減小,這樣,一半的帶寬采用一半的抽樣率,可以有效避免數(shù)據(jù)冗余。二進制小波濾波器組的自適應(yīng)性表現(xiàn)在:它利用一組恒Q值的帶通濾波器將信號劃分為若干倍頻頻帶,并且在各頻帶內(nèi)的時間抽樣與帶寬成正比。?
??? 上述分析表明,小波變換的特點與耳蝸的頻率分析特性極為相似,小波變換引入耳蝸濾波器組的設(shè)計中。從耳蝸頻率響應(yīng)的實測數(shù)據(jù)中獲得Hω(x-ln(ω)),便可根據(jù)(6)式計算小波基,進而通過尺度變換得到一組帶通濾波器,可以大大簡化濾波器設(shè)計。傳統(tǒng)的耳蝸濾波器組設(shè)計方法是對各通道分別設(shè)計,各通道相互獨立,參數(shù)調(diào)整需要分別進行,增加了濾波器設(shè)計的復(fù)雜度。而基于小波變換的濾波器組設(shè)計就可以很好地回避這個問題。?
2 聽覺小波濾波器組的設(shè)計與實現(xiàn)?
??? 人耳耳蝸響應(yīng)的頻率范圍大約為20 Hz~20 kHz,其對數(shù)中心頻率大約為f0=1 kHz。參考文獻[9]給出了這一中心頻率的耳蝸濾波器的幅頻響應(yīng)曲線,如圖2所示。
?
?
??? 利用MATLAB的invfreqz函數(shù)設(shè)計具有上述幅頻特性的濾波器系數(shù)。這種方法設(shè)計出的濾波器的頻率響應(yīng)是給定頻率響應(yīng)在最小均方誤差意義上的逼近。通過這組濾波器的系數(shù)便可得到相應(yīng)的小波基函數(shù)Ψ(t),如圖3所示。?
?
?
??? 以該沖擊響應(yīng)為小波基函數(shù),通過二進制尺度變換得到一組小波,這組小波濾波器的中心頻率從62.5 Hz(1 kHz×2-4)到16 kHz(1 kHz×24)呈對數(shù)分布,其幅頻響應(yīng)如圖4所示。與基于物理學原理的耳蝸濾波器模型的頻率響應(yīng)相比較,可以看出,該小波濾波器組反映出了耳蝸濾波器的本質(zhì)特征。圖5是基于物理學原理的耳蝸濾波器模型在各倍頻程上的頻率響應(yīng)。?
?
?
?
??? 得到小波函數(shù)Ψ(t)后,便可通過式(8)設(shè)計尺度函數(shù)φ(t)[10],得到的φ(t)如圖6所示。?
?
?
????
??? 結(jié)合Ψ(t)和φ(t),通過關(guān)系式(9)、式(10)計算二進制小波用于多分辨率分析的低通濾波器H(ω)和高通濾波器G(ω),進而得到濾波器系數(shù)h(n)和g(n)[11-12],如圖7所示。?
?
?
?????
??? 二進聽覺小波多分辨率分析實現(xiàn)框圖如圖8所示。?
?
?
3 實驗結(jié)果及討論?
??? 圖9為用上述設(shè)計的聽覺小波濾波器組對實際的語音信號進行處理的各通道的處理結(jié)果。其輸入信號為男音,內(nèi)容為“we,be”,采樣率為10 kHz,8 bit量化。濾波器組的輸出經(jīng)過全波整流和低通濾波(截止頻率300 Hz,二階IIR濾波器)。?
?
?
??? 圖9中,a是輸入語音信號的波形,b~g為各倍頻帶內(nèi)的輸出波形,由于語音信號頻率一般在50 Hz~5 kHz以內(nèi),所以實驗中只使用了62.5 Hz~4 kHz 這7個倍頻通道。由實驗結(jié)果可以看出,不同的音素會在不同的濾波通道出現(xiàn),例如,半元音|w|(對應(yīng)圖中樣點1~1 500)主要分布在中頻段(f0=125、250、500)三個通道;爆破音|b|濾(對應(yīng)圖中樣點6 000~7 000)則基本只出現(xiàn)在f0=125 Hz的通道,而元音|i:|則在低頻段和高頻段均會出現(xiàn)??梢姡〔ㄗ儞Q能很好地表征語音信號在頻域內(nèi)的特征。?
??? 二進聽覺小波對信號實施逐級抽取(如圖8),使得抽樣率自適應(yīng)匹配信號帶寬,從而有效減少了冗余數(shù)據(jù)。而且小波變換有快速算法,所以用小波變換來設(shè)計和實現(xiàn)耳蝸濾波器組可以提高語音處理系統(tǒng)的實時性。然而,從圖9中也可以看出,這種方法的缺點就是它只能在各倍頻程頻率點上實現(xiàn)濾波,對頻帶的劃分比較粗糙,而實際的生理系統(tǒng)中與耳蝸基膜相連的內(nèi)毛細胞多達上萬個,即耳蝸將聽覺頻段劃分成了上萬個子帶進行處理。所以這種方法還有進一步的改進之處。?
??? 理論分析及實驗結(jié)果均表明,二進制小波變換的特性與耳蝸濾波器組的特性存在很多相似之處,例如,頻率的對數(shù)分布特性、濾波器組的恒Q特性等。利用小波變換來實現(xiàn)耳蝸濾波,不僅可以使濾波器的設(shè)計和修改大大簡化,而且可以通過快速算法提高實時性。?
參考文獻?
[1] YU Shao, CHANG Chip Hong. A generalized timefrequency subtraction method for robust speech enhancement based on wavelet filter banks modeling of human?auditory system. IEEE Transactions on Systems,MAN,?and Cybernetic, Part B: Cybernetics, 2007,37(4):877-889.?
[2]?WONG Chun Kit. A decimated electronic cochlea?on a reconfigurable platform, Master thesis, Chinese?University of Hong Kong, July, 2006.?
[3]?LEONG M P,JIN C T,LEONG P H W.An FPGAbased electronic cochlea. EURASIP Journal on?Applied?? Signal Processing, 2003(7):629-638.?
[4] SUMMERFIELD C D, LYON R F.ASIC implementation of the lyon cochlea model. Proc. IEEE Int.Conf.Acoust., Speech, and Signal Processing, San?Francisco, CA, 1992:673-676.?
[5]?LIM S C, TEMPLE A R, JONES S, et al. VHDLbased design of biologically inspired pitch detection?system. in Proc. IEEE Int. Conf. Neural Networks,?vol. 2, Houston, TX, 1997, pp. 922-927.?
[6]?MISHRA A, HUBBARD A E. A cochlear filter implemented? with a field-programmable gate array. IEEE Transactions on Circuits and Systems II:Analog and Digital Signal?Processing, 2002,49(1):54-60.?
[7] SALIMPOUR Y, ABOLHASSANI M D, ZADEH S H.Auditory wavelet transform. The 3rd European Medical?and Biological Engineering Conference, November, 2005:20-25.?
[8] ALDROUBI A, UNCER M. Wavelets in medicine and?biology. CRC press, Inc.1996:528-529.?
[9]?KIANG N Y S. Processing of speech by the auditory?nervous system. Acoust. Soc. Am,1980,68(3):830-835.?
[10] MALLAT S. A wavelet tour of signal processing.Academic?Press, 1999.?
[11] KARMAKAR A, KUMAR A, PATNEY R K. Design of?optimal wavelet packet trees based on auditory perception?criterion. IEEE Signal Processing Letters,2007,14(4):240-243.?
[12] SALIMPOUR Y, ABOLHASSANI M D. Auditory wavelet?transform based on auditory wavelet families. Proceedings?of the 28th IEEE EMBS Annual International Conference?New York City, USA, Aug 30-Sept 3, 2006.