智能語音作為入口已滲透到了很多領(lǐng)域,從智能音箱到智能臺(tái)燈,從智能家電到汽車的智能中控、后視鏡,以及工業(yè)或陪伴式機(jī)器人,智能語音可在消費(fèi)、汽車、教育、工業(yè)等各個(gè)領(lǐng)域開花結(jié)果。
所謂的智能語音就是給語音加了“大腦”,讓其理解用戶通過語音表達(dá)出來的意圖和需求,并且可以把對(duì)應(yīng)的內(nèi)容返回給用戶。
“現(xiàn)階段,智能語音的落地主要受消費(fèi)電子市場激烈的競爭格局所驅(qū)動(dòng),各廠商都期望賦予產(chǎn)品新賣點(diǎn)與新亮點(diǎn)。語音在消費(fèi)市場尤為火熱,除了蘋果、谷歌、亞馬遜等行業(yè)巨頭紛紛入場之外,還存在眾多跟風(fēng)者。而其它領(lǐng)域,如汽車電子、工業(yè)醫(yī)療等,由于行業(yè)門檻或需求不集中等原因,雖被看好但仍需一定時(shí)間才能被市場接受?!?nbsp;意法半導(dǎo)體模擬、微電機(jī)產(chǎn)品部市場經(jīng)理倪明如是說。
意法半導(dǎo)體模擬、微電機(jī)產(chǎn)品部市場經(jīng)理倪明
市面上有很多智能語音方案,背后的關(guān)鍵技術(shù)是硬件、算法以及云服務(wù)。
倪明介紹道:“意法半導(dǎo)體在硬件上有自己的特色,能夠提供市場上應(yīng)用很普遍的STM32系列MCU作為主控,再加上2顆或4顆硅麥克風(fēng)組成麥克風(fēng)陣列;在聲學(xué)算法方面,意法半導(dǎo)體可提供Beam Forming (語音指向)、Sound Localization (聲源定位)、Echo Cancelation (回聲消除) 這些聲學(xué)前端算法,后端的聲學(xué)算法如本地、云端的語音識(shí)別,將由第三方合作伙伴 (如Sensory、科大訊飛等) 來提供?!?/p>
對(duì)于近場語音識(shí)別,比如智能穿戴、陪伴式機(jī)器人,上述意法半導(dǎo)體方案即可滿足需求;對(duì)于遠(yuǎn)場的語音識(shí)別,比如智能音箱,意法半導(dǎo)體將負(fù)責(zé)語音前端處理,AP或DSP的第三方算法將負(fù)責(zé)后端處理,因此需要與高通等后端AP廠商配合實(shí)現(xiàn)。
倪明表示:各廠商的智能語音方案都獨(dú)具特色,現(xiàn)有的語音方案在功能上基本滿足了市場的需求,但可擴(kuò)展性及性能仍有改進(jìn)空間。比如使用者會(huì)經(jīng)常遇到聽不到、聽不清的情況,語音產(chǎn)品易被干擾且存在功耗大等問題。解決這些問題需要系統(tǒng)各方面的共同改進(jìn)。意法半導(dǎo)體本著開放的態(tài)度與行業(yè)各方合作共贏。
倪明指出理想的應(yīng)用或產(chǎn)品應(yīng)該是“按需分配”:即根據(jù)用戶或市場的需求,系統(tǒng)可以做出適當(dāng)?shù)娜∩崤c調(diào)整。與此同時(shí),倪明介紹了意法半導(dǎo)體在理想化產(chǎn)品道路上做出的努力:
作為系統(tǒng)基礎(chǔ)的硬件,硅麥克風(fēng)至關(guān)重要。意法半導(dǎo)體在提高其本體性能方面,將SNR提高到65~67dB、 AOP提高到135dBSPL,以及在麥克風(fēng)ASIC電路中加入抗干擾的設(shè)計(jì)等;
在意法半導(dǎo)體Beamforming算法庫中有4種針對(duì)不同應(yīng)用場景的模式供選擇,既有適用于智能穿戴等語音方向較確定的場景下強(qiáng)指向模式 (Strong) ,也有適用于語音方向范圍較寬、環(huán)境噪聲較大場景下的消噪模式 (Cardioid denoise) ;
在功耗方面,意法半導(dǎo)體新發(fā)布的MP23DB01HP數(shù)字硅麥克風(fēng)可以支持低功耗模式,該模式下麥克風(fēng)的功耗還不到正常模式的一半,極大地提高了系統(tǒng)的持續(xù)工作時(shí)間。例如手機(jī)穿戴產(chǎn)品中需要集成度更高、更加低功耗的方案,意法半導(dǎo)體正在與合作伙伴研發(fā)將麥克風(fēng)與DSP合二為一的芯片“Smart MIC”,該芯片將大大節(jié)約PCB布板空間及系統(tǒng)功耗。