一本大道色婷婷在线,亚洲熟妇AV综合大全

京東探索研究院：多模態(tài)技術(shù)是未來(lái)人工智能應(yīng)用發(fā)展的方向

日期： 2021-11-01

來(lái)源：金融界網(wǎng)站

關(guān)鍵詞： 京東多模態(tài)技術(shù) 人工智能

日前，第29屆ACM國(guó)際多媒體頂級(jí)會(huì)議（ACM International Conference on Multimedia, 簡(jiǎn)稱(chēng)ACM Multimedia）在成都舉行，京東探索研究院AI團(tuán)隊(duì)?wèi){借多模態(tài)交互數(shù)字人技術(shù)、跨模態(tài)分析技術(shù)分別斬獲最佳演示獎(jiǎng)及最佳開(kāi)源項(xiàng)目獎(jiǎng)。會(huì)上，京東集團(tuán)副總裁梅濤當(dāng)選ACM Multimedia 2023大會(huì)共同主席（General Co-Chair）。

　　ACM Multimedia是計(jì)算機(jī)科學(xué)領(lǐng)域中多媒體領(lǐng)域的首要國(guó)際會(huì)議，1993年以來(lái)每年召開(kāi)一次，已成為多媒體領(lǐng)域頂級(jí)盛典，大會(huì)致力于推動(dòng)多媒體的研究和應(yīng)用，京東探索研究院的該兩項(xiàng)獲獎(jiǎng)技術(shù)均為ACM Multimedia頒發(fā)的該技術(shù)領(lǐng)域唯一獎(jiǎng)項(xiàng)，分量十足。

　　過(guò)去十年多媒體領(lǐng)域視覺(jué)和語(yǔ)言之間的跨模態(tài)分析出現(xiàn)了穩(wěn)定創(chuàng)新和突破的勢(shì)頭。然而，X-modaler出現(xiàn)之前，還沒(méi)有一個(gè)開(kāi)源的代碼庫(kù)來(lái)支持以統(tǒng)一和模塊化的方式訓(xùn)練和部署眾多的跨模態(tài)分析的神經(jīng)網(wǎng)絡(luò)模型。京東探索研究院的跨模態(tài)視覺(jué)分析代碼庫(kù)X-modaler是業(yè)界首個(gè)模塊化、標(biāo)準(zhǔn)化的跨模態(tài)視覺(jué)分析代碼庫(kù)，涵蓋了視覺(jué)語(yǔ)言領(lǐng)域各種前沿技術(shù)，并支持各種多模態(tài)任務(wù)。它可以輕松復(fù)現(xiàn)視覺(jué)語(yǔ)言領(lǐng)域目前主流的技術(shù)，促進(jìn)學(xué)術(shù)界在視覺(jué)語(yǔ)言領(lǐng)域的發(fā)展。同時(shí)也便于工業(yè)界集成跨模態(tài)視覺(jué)分析的模塊，推動(dòng)AI在工業(yè)互聯(lián)網(wǎng)應(yīng)用的落地應(yīng)用和技術(shù)進(jìn)步。

在傳統(tǒng)的AI認(rèn)知中，視覺(jué)領(lǐng)域、語(yǔ)音領(lǐng)域、自然語(yǔ)言領(lǐng)域等領(lǐng)域之前是獨(dú)立演進(jìn)的技術(shù)和應(yīng)用，可以認(rèn)為是單模態(tài)技術(shù)，而人是一個(gè)看、聽(tīng)、說(shuō)多模態(tài)共同工作的智能體，所以多模態(tài)技術(shù)是未來(lái)人工智能應(yīng)用發(fā)展的方向。京東探索研究院的多模態(tài)交互數(shù)字人技術(shù)ViDA-Man致力于打造具備多感官交互能力的人機(jī)交互系統(tǒng)，深入多模態(tài)交互技術(shù)研究，專(zhuān)注于人機(jī)交互的消費(fèi)科技產(chǎn)品打造?；谠摷夹g(shù)開(kāi)發(fā)的多模態(tài)交互數(shù)字人形象引擎，能夠提供快速的形象定制能力，從外觀的數(shù)字化逐漸深入到行為的交互化、情緒的智能化。

近年來(lái)，數(shù)字浪潮的推動(dòng)讓人工智能技術(shù)已經(jīng)實(shí)現(xiàn)從不可用到可用，AI產(chǎn)品化時(shí)期，諸如智能語(yǔ)音識(shí)別技術(shù)、智能圖片處理技術(shù)、基于用戶(hù)興趣的算法引擎推薦、智能審核技術(shù)、AR/VR技術(shù)、5G技術(shù)等成為了AI落地的抓手，掀起了科技創(chuàng)新的新浪潮。京東集團(tuán)副總裁梅濤表示，獲獎(jiǎng)技術(shù)早已服務(wù)于京東云打造的虛擬數(shù)字人、拍照購(gòu)、搭配購(gòu)等多個(gè)產(chǎn)品，并開(kāi)始在產(chǎn)業(yè)化、商業(yè)化項(xiàng)目中廣泛應(yīng)用。

　　這些技術(shù)已大規(guī)模應(yīng)用于正在如火如荼展開(kāi)的京東11.11。如，基于計(jì)算機(jī)視覺(jué)以圖搜圖的搜索應(yīng)用，輔助以語(yǔ)音對(duì)話交互技術(shù)的“拍照購(gòu)”和“搭配購(gòu)”功能已在剛剛拉開(kāi)帷幕的京東11.11中大放異彩，通過(guò)拍照或截圖方式，直接匹配搭配好的時(shí)尚單品，打造“一站加購(gòu)”、“一鍵買(mǎi)齊”的購(gòu)物新體驗(yàn)，幫助商家強(qiáng)種草、高轉(zhuǎn)化。

　　今年京東11.11期間，針對(duì)商品營(yíng)銷(xiāo)內(nèi)容推出的智能寫(xiě)作服務(wù)“達(dá)人寫(xiě)作”，形成一篇百余字商品文案僅需300毫秒，5分鐘可以創(chuàng)作出1000篇文案，覆蓋近3000個(gè)商品品類(lèi)，累計(jì)生成3,000萬(wàn)AI內(nèi)容，相比于人工撰寫(xiě)內(nèi)容點(diǎn)擊轉(zhuǎn)化率超過(guò)40%，成本降低93.2%。

　　除京東內(nèi)部應(yīng)用之外，這些獲得國(guó)際學(xué)術(shù)界頂尖榮譽(yù)的領(lǐng)先技術(shù)正在通過(guò)京東云這個(gè)統(tǒng)一平臺(tái)輸出對(duì)外賦能各行各業(yè)。比如，基于多模態(tài)交互數(shù)字人技術(shù)研發(fā)的“虛擬數(shù)字人”能助力京東云智能客服產(chǎn)品提升智能接待、服務(wù)和虛擬助手的體驗(yàn)。比如，京東云智能客服業(yè)務(wù)與某銀行合作，打造了全國(guó)第一個(gè)交互式數(shù)字人項(xiàng)目“數(shù)字柜員”，有別于播報(bào)式數(shù)字人，“數(shù)字柜員”涉及VTM虛擬坐席交互，利用AI技術(shù)，實(shí)現(xiàn)用虛擬人替代真人柜員辦理業(yè)務(wù)、把控風(fēng)險(xiǎn)。

可以看到，京東AI技術(shù)之所以能取得如此優(yōu)異的成績(jī)，是其在真實(shí)復(fù)雜場(chǎng)景的有效實(shí)踐和千錘百煉。作為京東集團(tuán)對(duì)外技術(shù)輸出的窗口，京東云不僅是政府、企業(yè)、家庭數(shù)字化轉(zhuǎn)型全生命周期合伙人，并基于人工智能、大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)、區(qū)塊鏈、隱私計(jì)算等技術(shù)，通過(guò)數(shù)智化全鏈條技術(shù)服務(wù)，助力千行百業(yè)數(shù)字化轉(zhuǎn)型，激發(fā)產(chǎn)業(yè)無(wú)限可能。

最后文章空三行圖片.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

京東探索研究院：多模態(tài)技術(shù)是未來(lái)人工智能應(yīng)用發(fā)展的方向

日期： 2021-11-01

來(lái)源：金融界網(wǎng)站

相關(guān)內(nèi)容