《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動(dòng)態(tài) > 助力AI產(chǎn)業(yè)落地,云知聲展示全棧AI硬核技術(shù)

助力AI產(chǎn)業(yè)落地,云知聲展示全棧AI硬核技術(shù)

2019-04-21

繼北京站之后,4 月 18 日,云知聲開放日(Open Day)第 2 場(chǎng)來到深圳。本次云知聲開放日聚焦 AI 技術(shù)、應(yīng)用和產(chǎn)業(yè),云知聲董事長(zhǎng)/CTO 梁家恩博士與多位云知聲技術(shù)專家向深圳的合作伙伴、行業(yè)人士全面的秀出了全棧 AI 硬核技術(shù),并與騰訊杰出科學(xué)家/騰訊 AI Lab 副主任俞棟、攜住科技聯(lián)合創(chuàng)始人葉明、同行者科技聯(lián)合創(chuàng)始人葉維、金鷹卡通衛(wèi)視產(chǎn)品總監(jiān)戴文博、三諾聲智聯(lián)副總經(jīng)理喬嶠等多位嘉賓,剖析了 AI 技術(shù)在酒店、車載、教育等領(lǐng)域的應(yīng)用及落地。

微信圖片_20190421181325.jpg


全棧:技術(shù)能力全棧,產(chǎn)業(yè)服務(wù)全棧


梁家恩博士作為人工智能行業(yè)的資深從業(yè)者,在現(xiàn)場(chǎng)與我們復(fù)盤了發(fā)展歷程,他表示,在 AI 大潮退去之后,技術(shù)的產(chǎn)業(yè)化能力成為了決勝的關(guān)鍵。技術(shù)如果不能解決產(chǎn)業(yè)問題,那么技術(shù)將化為企業(yè)“炫技”的產(chǎn)物。基于此,梁家恩博士將云知聲的 AI 哲學(xué)概括為“全?!焙汀坝埠恕薄?/p>

微信圖片_20190421181349.jpg

云知聲董事長(zhǎng)/CTO 梁家恩博士



“全?!卑巳珬?AI 技術(shù)能力和全棧 AI 落地能力兩個(gè)維度。經(jīng)過多年的發(fā)展,目前,云知聲的 AI 能力已經(jīng)超了單一的語音技術(shù),覆蓋了 Atlas 機(jī)器學(xué)習(xí)超算平臺(tái),信號(hào)、語音、圖像、文本的感知和表達(dá)能力,知識(shí)、理解、分析、決策等認(rèn)知技術(shù),并朝著多模態(tài)人工智能系統(tǒng)方向發(fā)展。同時(shí),云知聲通過將能力封裝在自研 AI 芯片之上,打磨了“云端芯”一體化產(chǎn)品體系,推動(dòng) AI 技術(shù)在家居、車載、兒童、教育、醫(yī)療、金融、零售等多個(gè)領(lǐng)域?qū)崿F(xiàn)落地,實(shí)現(xiàn)了從 AI 技術(shù)到產(chǎn)業(yè)應(yīng)用的生態(tài)閉環(huán)。


硬核:確實(shí)、有效地解決產(chǎn)業(yè)規(guī)模化痛點(diǎn)


“硬核”,指技術(shù)方案能夠確實(shí)、有效地解決產(chǎn)業(yè)規(guī)?;袋c(diǎn),為終端用戶提供相對(duì)成熟的用戶體驗(yàn)。


以當(dāng)時(shí)最熱門的智能語音為例,經(jīng)歷了兩年的市場(chǎng)教育,現(xiàn)如今,語音交互技術(shù)被廣泛應(yīng)用到各大場(chǎng)景中,成為了 AI 技術(shù)落地最典型的應(yīng)用案例。然而,在實(shí)際使用中,AI 需要面對(duì)的情況比實(shí)驗(yàn)室中要復(fù)雜得多,一旦產(chǎn)品軟硬件的某一環(huán)處理不好,便容易出現(xiàn)“聽不到、聽不懂、答非所問”等問題。針對(duì)這類行業(yè)痛點(diǎn),在本次云知聲開放日深圳站現(xiàn)場(chǎng),云知聲的技術(shù)團(tuán)隊(duì)從語音交互技術(shù)的拾音、識(shí)別和交互等維度,深度剖析了技術(shù)難點(diǎn)和解決方案。


在 AIoT 場(chǎng)景下,設(shè)備首先要解決的便是遠(yuǎn)場(chǎng)拾音問題。云知聲 AI Labs 技術(shù)專家關(guān)海欣表示,解決遠(yuǎn)程語音識(shí)別的關(guān)鍵在前端信號(hào)處理階段,解決回聲、混響和噪音 3 大核心問題,以確保設(shè)備可以準(zhǔn)確識(shí)別到用戶指令。目前,云知聲在回聲消除、混響抑制、噪聲處理等方向均已有成熟的技術(shù)方案,相關(guān)技術(shù)指標(biāo)均達(dá)行業(yè)一流水準(zhǔn)。另外,未來遠(yuǎn)程語音識(shí)別還將呈現(xiàn) DSP+DL 結(jié)合、分布式拾音兩大趨勢(shì),對(duì)此,云知聲也已經(jīng)展開了相應(yīng)的技術(shù)部署。

微信圖片_20190421181418.jpg

云知聲 AI Labs 技術(shù)專家關(guān)海欣



在語音識(shí)別階段,則需要在聲學(xué)和語言層面,賦予機(jī)器感知并語音指令的能力。云知聲 AI Labs 技術(shù)專家李軼杰表示,聲學(xué)方面,云知聲基于大數(shù)據(jù)、前沿聲學(xué)建模、自適應(yīng)學(xué)習(xí)搭建了聲學(xué)模型;在語言層面,云知聲創(chuàng)建了一個(gè)數(shù)據(jù)規(guī)模大、融合能力強(qiáng)、靈活和個(gè)性化的語言模型,以上模型在還將基于超算平臺(tái)不斷優(yōu)化迭代。此外,云知聲還將其語音識(shí)別能力延展到語音評(píng)測(cè)、聲紋識(shí)別、情緒識(shí)別等多個(gè)方向。

微信圖片_20190421181549.jpg

云知聲 AI Labs 技術(shù)專家李軼杰



在對(duì)話階段,圍繞更加自然的人機(jī)交互,云知聲打造了流式交互、語用計(jì)算與知性會(huì)話 3 大硬核能力。云知聲 AI Labs 技術(shù)專家單波介紹到,流式交互最大的特點(diǎn)是在多輪對(duì)話免喚醒,大大的提升了人機(jī)對(duì)話過程中的流暢程度;語用計(jì)算則是將人機(jī)對(duì)話內(nèi)容放置到對(duì)應(yīng)的語境中,讓設(shè)備準(zhǔn)確的理解人的意圖;最后,知性會(huì)話則是通過將知識(shí)圖譜應(yīng)用到人機(jī)對(duì)話過程中,讓設(shè)備準(zhǔn)確的響應(yīng)用戶的問題。

微信圖片_20190421181608.jpg

云知聲 AI Labs 技術(shù)專家單波



基于上述技術(shù),2013 年,云知聲面向合作伙伴開放對(duì)話技能開放平臺(tái)(語義云),幫助合作伙伴打造更加自然的人機(jī)交互體驗(yàn),同時(shí)在實(shí)踐中不斷提升語義解析能力。目前這一平臺(tái)已經(jīng)支持 200 多個(gè)的對(duì)話內(nèi)容,覆蓋通訊、休閑娛樂、醫(yī)療健康、交通出行、設(shè)備控制等多個(gè)場(chǎng)景,語義解析準(zhǔn)確率高達(dá) 93%。

 

值得一提的是,語音感知與表達(dá)、語言與知識(shí)計(jì)算只是云知聲硬核 AI 技術(shù)的冰山一角,目前,云知聲硬核技術(shù)還包含了 AIoT 芯片、超算平臺(tái)與圖像、翻譯拓展等。

 

落地:覆蓋酒店、汽車、兒童、音箱等場(chǎng)景


在大數(shù)據(jù)、深度學(xué)習(xí)、超算平臺(tái)的加持下,人工智能底層技術(shù)將沖破閥值,帶來成熟的體驗(yàn),在技術(shù)和需求的雙重推動(dòng)下,人工智能將邁入發(fā)展的黃金階段,并掀起新一輪的 AIoT 產(chǎn)業(yè)變革。在下午的「智能+」分論壇中,云知聲副總裁康恒、云知聲 AIOS 架構(gòu)師郭洪光、與攜住科技、同行者科技、金鷹卡通、三諾聲智聯(lián)等多位合作伙伴,結(jié)合實(shí)際案例,深入探討了 AI 技術(shù)的在酒店、汽車、兒童和音箱等場(chǎng)景中的應(yīng)用。


云知聲副總裁康恒表示,在整個(gè)產(chǎn)業(yè)鏈中,AI 技術(shù)是個(gè)“基礎(chǔ)設(shè)施”,且這一基礎(chǔ)設(shè)置不可能在不加以定制的情況下適用全部場(chǎng)景。AI 在落地過程中,需要充分考慮使用場(chǎng)景和落地行業(yè)。基于對(duì)場(chǎng)景和產(chǎn)業(yè)的深度思考,2014 年,云知聲便開始結(jié)合產(chǎn)業(yè)鏈,將云知聲的 AI 技術(shù)賦能到個(gè)行業(yè)中去。

微信圖片_20190421181641.jpg

云知聲副總裁康恒


面向行業(yè),云知聲推出了一站式人工智能平臺(tái) UniOS。云知聲 AIOS 架構(gòu)師郭洪光表示,與同類產(chǎn)品相比,UniOS 具備開放、垂直兩大特性,其中,開放指的是云知聲面向行業(yè)和合作伙伴開放技能平臺(tái)和設(shè)備平臺(tái),并在此基礎(chǔ)上兼容第三方 AIOS;垂直則代表 UniOS 會(huì)針對(duì)特定的行業(yè)需求輸出解決方案,以此來幫助產(chǎn)業(yè)轉(zhuǎn)型。

微信圖片_20190421181716.jpg

云知聲 AIOS 架構(gòu)師郭洪光



攜住科技聯(lián)合創(chuàng)始人葉明跟我們介紹了 AI 技術(shù)在酒店場(chǎng)景中的應(yīng)用案例。葉明表示,針對(duì)酒店場(chǎng)景,攜住科技基于 AIoT 技術(shù),通過多種設(shè)備聯(lián)動(dòng)、場(chǎng)景定制,為酒店客戶帶來全新智能互聯(lián)的場(chǎng)景體驗(yàn);另一方面,通過信息整合和大數(shù)據(jù)分析,AI 還將提高酒店管理效率。

微信圖片_20190421181738.jpg

攜住科技聯(lián)合創(chuàng)始人葉明


同行者科技聯(lián)合創(chuàng)始人葉維分享了 AI 語音技術(shù)如何助力汽車產(chǎn)業(yè)升級(jí)。葉維表示,在車載場(chǎng)景下,語音即為服務(wù)——語音是用戶與設(shè)備、與互聯(lián)網(wǎng)連接的主要手段,承載了車聯(lián)網(wǎng)資源整合與用戶觸達(dá)的功能。因此,車載場(chǎng)景下的 AI 必須聚合豐富的內(nèi)容和服務(wù),并根據(jù)場(chǎng)景進(jìn)行智能匹配,打造千人千面的智能化體驗(yàn)。

微信圖片_20190421181812.jpg

同行者科技聯(lián)合創(chuàng)始人葉維


金鷹卡通衛(wèi)視產(chǎn)品總監(jiān)戴文博分享了金鷹卡通對(duì)兒童產(chǎn)品智能化的思考。戴文博指出,兒童和家長(zhǎng)對(duì)智能產(chǎn)品的需求與普通場(chǎng)景十分不同,基于此,金鷹卡通圍繞兒童場(chǎng)景的特征,將 AI 技術(shù)與“麥咭”的形象做了深度整合,打造麥咭智能親子智能產(chǎn)品生態(tài)。

微信圖片_20190421181839.jpg

金鷹卡通衛(wèi)視產(chǎn)品總監(jiān)戴文博


三諾聲智聯(lián)副總經(jīng)理喬嶠從產(chǎn)品角度出發(fā),與我們分享了人工智能產(chǎn)品設(shè)計(jì)思考。喬嶠指出,人工智能時(shí)代的設(shè)計(jì)方向是感知設(shè)計(jì),產(chǎn)品只有將形狀、外觀、聽覺、觸感等諸多因素綜合成一個(gè)完整的信息,充分調(diào)動(dòng)人類的本能,才有可能設(shè)計(jì)出更普遍更通用的產(chǎn)品。

微信圖片_20190421181941.jpg

三諾聲智聯(lián)副總經(jīng)理喬嶠


以帶屏音箱為例,屏幕為人機(jī)交互補(bǔ)充重要的視覺信息,更加接近用戶本能,“未來 5 年,單帶屏的智能音箱就會(huì)達(dá)到 3 億多臺(tái),超過 PC 的規(guī)模?!?/p>


關(guān)于云知聲 Open Day


OpenDay 是云知聲一年一度的對(duì)外進(jìn)行技術(shù)分享與交流的活動(dòng),是云知聲面向人工智能硬核科技,與合作伙伴、相關(guān)學(xué)術(shù)和產(chǎn)業(yè)研究機(jī)構(gòu)等共話人工智能前沿技術(shù)與產(chǎn)業(yè)應(yīng)用并探討合作的平臺(tái)。2019 首屆云知聲 OpenDay 設(shè)北京、深圳、上海、廈門四站。繼北京、深圳站之后,上海站活動(dòng)將于5月上旬正式開啟。


關(guān)于云知聲


云知聲成立于 2012 年,是一家專注于物聯(lián)網(wǎng)人工智能,擁有自主知識(shí)產(chǎn)權(quán)的智能語音人工智能企業(yè)。是中國人工智能行業(yè)成長(zhǎng)最快、商業(yè)化落地最好人工智能企業(yè)之一。云知聲業(yè)務(wù)主要覆蓋智慧生活和智慧服務(wù)兩大場(chǎng)景,在包括家居、車載、醫(yī)療、教育、政府、機(jī)器人等領(lǐng)域擁有廣泛布局??蛻艉w格力、美的、長(zhǎng)虹、海爾、華帝、北京協(xié)和醫(yī)院、吉利、平安集團(tuán)、京東、360等。 


2018 年 5 月份,云知聲正式推出第一代 UniOne 物聯(lián)網(wǎng) AI 芯片及其解決方案——雨燕(Swift)。該芯片由云知聲自主設(shè)計(jì)研發(fā),采用云知聲自主 AI 指令集,性能較通用方案提升超過 50 倍?;谠撔酒臉?biāo)準(zhǔn)化解決方案,可幫助傳統(tǒng)硬件產(chǎn)品在更短的時(shí)間周期內(nèi),以更少的成本快速實(shí)現(xiàn) AI 化,實(shí)現(xiàn)人機(jī)交互智能。



本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。