《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業(yè)界動態(tài) > 車載語音合成芯片的“多功能”和“大門道”

車載語音合成芯片的“多功能”和“大門道”

2020-06-01
來源:與非網
關鍵詞: ML2253x系列 LAPIS MCU

近年來,利用 ADAS(高級駕駛輔助系統(tǒng))等向行人和搭乘人員告知車輛狀態(tài)和存在已經變得非常重要,汽車制造商們正在推進語音輸出系統(tǒng)的開發(fā),通過音效和語音來發(fā)出警告或通知,仔細觀察的用戶會聽出不同品牌的汽車播報時長不同、聲音大小也不同。如果從安全角度考慮,警報聲的響應速度非常關鍵。通常汽車播報采用兩種控制方式,一種是 MCU 控制,一種是硬件控制。但是隨著車載功能的增加,主控 MCU 的負荷越來越重,方案廠商也在試圖減輕 MCU 的負擔。

 

羅姆集團旗下的藍碧石公司最近推出一款新型車載語音合成 LSI --ML2253x 系列,將語音播報功能通過硬件控制,從而將主控 MCU 解放出來。LAPIS 于 2008 年從日本沖電氣工業(yè)集團分離出來,并入了羅姆集團旗下,2011 年正式更名為藍碧石半導體股份有限公司。LAPIS 公司有四大核心技術:低功耗技術、高頻電路技術、數(shù)字模擬混載技術、存儲器設計技術,提供獨具特色的 LSI 產品和晶圓代工服務。LAPIS 的語音芯片經過 40 多年的發(fā)展,全球銷量一年 1500 萬片,在日本市場排名第一。

 

 

響應速度快,抗干擾能力強

通過 MCU 來實現(xiàn)語音輸出需要外接主控 MCU、放大器、存儲器等元器件,并且需要主控 MCU 的軟件支持,而且軟件設計非常復雜。主控 MCU 在進行非語音播報事件處理時,可能無法進行語音播報,或者推遲語音播報。

 

5ed0b42d3fdd1-thumb.png

 

羅姆公司高級工程師佘夢怡女士介紹,“我們的語音合成 LSI 全部由硬件組成,對主控 MCU 不會產生負荷,系統(tǒng)在接收到命令之后,5 毫秒內播放語音,另外,芯片中內置有通信接口、邏輯、存儲器、放大器,可構建不依賴于主控 MCU 的語音輸出系統(tǒng),并可減少軟件設計工時?!?/p>

 

汽車在行駛中會面臨各種噪音干擾,比如儀表盤旁邊的 AM 頻率干擾會影響 D 類功放,為了盡可能降低干擾,ML22Q53x 系列中配置了 AB 類功放,雖然 AB 類功放沒有 D 類功放的效率高,但是抗干擾能力比 D 類功放強。另外,如果客戶選用 AVAS(汽車聲音警報系統(tǒng))產品,芯片內置 1W 功放無法滿足要求,用戶可以將音頻輸出到外接的 10W 功放進行放大。

 

故障檢測功能:增強系統(tǒng)安全性

隨著自動緊急制動系統(tǒng)(AEBS)相關法律法規(guī)的實施,以及市場上 ADAS 警告類型增加,用戶對車內語音的要求也越來越嚴苛。車廠不僅要確保常規(guī)的車載品質,還必須保整車系統(tǒng)的安全性。因此,ML2253x 系列增加了故障檢測功能。

 

羅姆公司技術中心主管姚玲玲解釋,“以前車載系統(tǒng)接到指令后,并無法確定播放系統(tǒng)是否在播,播放的內容是否正確,加入了播放音異常檢測功能后,可以檢測出模擬電路的異常,并反饋給主控 MCU,還可以檢測出在系統(tǒng)端無法確認的語音播放問題,提高了應用的產品品質,隨時也確保終端產品的安全性,這個功能作為規(guī)避風險預案備受矚目。”

 

靈活配置Flash,通過MCU實現(xiàn)擦寫

ML2253x 系列包括兩種產品,一種內置 FLASH 的 M22Q53x 系列,F(xiàn)lash 大小提供 2M、4M、16M 三種可選,內部 FLASH 可擦寫的次數(shù)是 100 次;另外一種是外置存儲器的 ML22530 系列,最大可以擴到 128M。


5ed0b42fad4ba-thumb.png

 

 

佘夢怡表示,“該芯片可通過主控 MCU 進行 FLASH 的改寫,可在開發(fā)中進行修改數(shù)據(jù),即便是在終端產品上也可以通過主控 MCU 進行一個數(shù)據(jù)修改,既便捷又靈活?!?/p>

 

算法壓縮方式獨特,音效音質有保障

ML2253x 系列支持 HQ-ADPCM 的算法壓縮方式,據(jù)介紹,這一算法是由藍碧石半導體公司聯(lián)合日本九州工業(yè)大學共同開發(fā),可以保持高音質和音效的同時,進行一個高壓縮率的算法。相對 ADPCM 算法、非線性 PCM 以及 PCM 算法,它的壓縮率可以對比原文壓縮到五分之一的大小,用戶更加節(jié)省存儲空間,從而節(jié)省成本。

 

佘夢怡解釋,“我們的芯片采樣頻率是從 6.4K 到 48K,其中 48K 可以媲美 CD 的音質,而且每一段語音都可以設置不同的采樣頻率。同樣是 6.4K 的采樣頻率,采用 HQ-ADPCM 算法的最長播放時間在 128M 時可以達到 6541 秒,內置 2M Flash 也可以達到 90 秒。采用 HQ-ADPCM 方式還原后,很多硬件可以進行算法補充,在實際播放時存在 FLASH 的容量最多達到 40 倍的數(shù)據(jù)量,比如 5 個字節(jié)的數(shù)據(jù)可以擴展到 200 個字節(jié),數(shù)據(jù)量越多,語音表現(xiàn)越好?!?/p>

 

為了滿足音頻輸出需求,芯片設有 SPI 和 I2C 兩種接口,每個通道同時支持四通道混音后從一通道輸出,可以在不同的通道選擇不同的語音,比如音樂、語音可以從不同的通道播放。在進行播放輸出時雖然只有一通道輸出,但音源可以選擇兩通道混音、四通道混音、有背景音樂等不同的選項單獨播放。

 

一站式解決方案

關于實際應用,佘夢怡認為,“ML22Q53x 和 ML22530 適用于快速發(fā)聲場合,對于汽車的定位或者類型沒有特殊要求。區(qū)別是帶 Q 的有內置 FLASH,不帶 Q 的客戶可以外接 FLASH,比較靈活。目前,在日本本土已經有一些知名廠商在評估、測試階段,國內有一些客戶開始做前期測試,我們的產品 4 月份出樣品,在 8 月會量產?!?/p>

 

在客戶進行開發(fā)時,羅姆可以提供整套開發(fā)套件,開發(fā)套件的硬件部分包含聲音控制板、SDCB3 板,不同型號對應不同的燒寫板,兩塊板子連起來后,用戶可以連接電腦、連接揚聲器等一些硬件進行播放,同時羅姆提供一個自主研發(fā)的軟件 Speech LSI Utility,可以進行波形編輯、短語編輯試聽,生成工程文件、燒寫芯片等研發(fā)必備功能。

 

“羅姆一貫的特色是提供一站式服務,從產品開發(fā)到后面的選型、原理圖、PCB,以及 MCU 軟件,我們會協(xié)助客戶做調試,量產之后的問題也可以一起解決。車內語音市場的規(guī)模大概有 50 億日元,車載市場的入門門檻相對較高,需要通過 AEC-Q100 或者 ISO 26262 標準。羅姆的優(yōu)勢是有自主產品線和 LAPIS 產品線相互補充,還針對 ISO 26262 已經取得了流程認證?!辟軌翕a充。

 

ML22530x系列DEMO板演示

 

 

5ed0b42e1ec53-thumb.png


該 DEMO 板基于 ML22530 語音芯片設計,開發(fā)板上有語音芯片、MCU、外置 FLASH,以及外置功放組成。MCU 只需要發(fā)送一個簡單的指令就可以控制語音芯片,語音芯片從外部 FLASH 中讀取數(shù)據(jù)進行播放。芯片內部集成了 1W 功放,設置有一個 1W 的輸出口,連接上喇叭即可播放聲音,板子上設有三個按鈕進行語音數(shù)據(jù)選擇。

 

工程師展示了用在 AVAS(汽車聲音警報系統(tǒng))產品上的聲音,模擬電動汽車的引擎音,可以通過滑動變阻器調節(jié)聲音的大小,通過不同的阻值使用 AD 變換,再通過 MCU 選擇相應的語音數(shù)據(jù)進行播放。

 

針對車內安全性提醒的應用,可以模擬汽車轉向燈的聲音、汽車在剛啟動時的歡迎音樂等。佘夢怡強調,“如果客戶是用在 AVAS(汽車聲音警報系統(tǒng))產品上,由于芯片內部只有 1W 功放,我們建議客戶外置功放,這樣才能起到提醒的作用,讓路邊的行人聽到車子的引擎聲音?!?/p>


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。