《電子技術(shù)應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 瑞薩電子與Syntiant共同開發(fā)結(jié)合先進視覺與語音技術(shù)的 語音控制多模態(tài)AI解決方案

瑞薩電子與Syntiant共同開發(fā)結(jié)合先進視覺與語音技術(shù)的 語音控制多模態(tài)AI解決方案

全新方案在物聯(lián)網(wǎng)和邊緣應用中 實現(xiàn)對嵌入式視覺AI系統(tǒng)的低功耗語音控制操作
2021-07-28
來源:瑞薩電子

2021 年 7 月 28 日,日本東京和美國加州爾灣訊 - 全球半導體解決方案供應商瑞薩電子集團(TSE:6723),和致力在邊緣設備領(lǐng)域推動低功耗智能語音及傳感器處理技術(shù)的深度學習芯片技術(shù)供應商Syntiant今日宣布,共同開發(fā)出一款語音控制的多模態(tài)AI解決方案,在基于視覺AI的物聯(lián)網(wǎng)和邊緣系統(tǒng)(如自助收銀機、安全攝像頭和視頻會議系統(tǒng))以及智能家電(如掃地機器人等)中實現(xiàn)低功耗、非接觸式的圖像處理。 

瑞薩與Syntiant共同開發(fā)具備視覺和語音AI功能的語音控制多模態(tài)AI解決方案.jpeg

全新解決方案結(jié)合了瑞薩RZ/V系列視覺AI微處理器(MPU)和低功耗多模態(tài)、多功能Syntiant NDP120 Neural Decision Processor?,以提供先進的語音和圖像處理功能。該解決方案具備常開功能,可從待機模式快速通過語音激活,以執(zhí)行物體識別、面部識別等視覺任務,以及其它安防攝像機等系統(tǒng)的關(guān)鍵功能。如當用戶定義的語音提示激活并運行系統(tǒng)時,視覺AI將識別跟蹤操作員的行為,并控制操作或在檢測到可疑行為時發(fā)出警告。

多模態(tài)架構(gòu)使得為基于視覺AI的系統(tǒng)創(chuàng)建非接觸式用戶體驗變得更加容易。由于可以獨立于視覺AI功能進行軟件開發(fā),因此利用專用的高能效芯片進行語音識別可降低待機功耗,并加速系統(tǒng)開發(fā)。

瑞薩電子高級副總裁、物聯(lián)網(wǎng)及基礎設施事業(yè)本部SoC事業(yè)部部長新田啟人表示:“我們預計,作為提高易用性和安全性的一種有效途徑,對采用多輸入信息流(包括圖像和語音)的多模態(tài)系統(tǒng)需求將會增加。擁有先進低功耗圖像AI技術(shù)的瑞薩與語音AI技術(shù)優(yōu)秀供應商Syntiant緊密合作,將加速低功耗、超小型智能語音AI技術(shù)在嵌入式系統(tǒng)中的應用,并為全球客戶帶來新的綜合解決方案。”

Syntiant CEO Kurt Busch表示:“基于語音的用戶界面讓客戶獲得全新用戶體驗,將下一代創(chuàng)新理念從概念變?yōu)楝F(xiàn)實。我們的深度學習NDP全球出貨量已超過1500萬片,為各類消費和工業(yè)物聯(lián)網(wǎng)應用實現(xiàn)了常開語音功能。我們同瑞薩的合作打造了強大、低功耗的語音及圖像解決方案,相信它將會加速推動全球客戶在豐富設備和案例中的應用?!?/p>

用于視覺AI的瑞薩RZ/V系列MPU集成了瑞薩獨有的DRP-AI(動態(tài)可配置處理器-AI)加速器,并將高精度AI推理與業(yè)界領(lǐng)先能效充分結(jié)合。卓越能效可消除對散熱片或冷卻風扇等散熱措施的需求,從而降低材料清單(BOM)成本,使視覺AI集成至廣泛的嵌入式應用成為可能。

Syntiant NDP120芯片集成了復雜的AI功能,可用于眾多高精度免提語音應用,包括演講人識別、關(guān)鍵詞檢測、多喚醒詞和本地命令識別等。NDP120與Syntiant Core 2?神經(jīng)網(wǎng)絡推理引擎封裝,還可同時運行多個應用程序,并將功耗降至1mW電池功率。

全新語音控制多模態(tài)AI解決方案作為瑞薩電子“成功產(chǎn)品組合”的一部分,從瑞薩更廣泛的產(chǎn)品組合中選取多個相互兼容的器件,為客戶構(gòu)建更高階的原型設計平臺,以加速上市并降低風險。瑞薩“成功產(chǎn)品組合”包含卓越的模擬、電源和嵌入式處理產(chǎn)品組合,可幫助客戶加速設計并縮短上市時間。

供貨信息

全新多模態(tài)AI解決方案的參考設計現(xiàn)已推出,其中包括電路圖和BOM清單。

0.jpg

 


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。