1月23日,由中國自動化學(xué)會模式識別與機器智能專委會、中國人工智能學(xué)會模式識別專委會主辦,國內(nèi)3D傳感領(lǐng)軍企業(yè)奧比中光承辦的“AI之眼,智見未來”3D傳感&人工智能前沿科技論壇在深圳南山舉行。
來自國內(nèi)多所知名大學(xué)的七位頂尖專家就基于深度學(xué)習(xí)的三維場景重建、動態(tài)場景三維重建、基于三維信息的行為理解、視覺SLAM、三維人臉和表情識別、三維人臉建模、三維場景智能感知與理解等三維計算機視覺領(lǐng)域的前沿科技進行闡述。深圳南山科創(chuàng)局南山區(qū)科創(chuàng)局(區(qū)科協(xié))常務(wù)副主席張漢國、奧比中光聯(lián)合創(chuàng)始人兼CTO肖振中出席論壇活動并致辭。
奧比中光聯(lián)合創(chuàng)始人兼CTO肖振中出席論壇活動并致辭
深圳市南山區(qū)科創(chuàng)局(區(qū)科協(xié))常務(wù)副主席張漢國在講話中表示,推動新一代人工智能與產(chǎn)業(yè)的深度融合已上升為國家戰(zhàn)略,此次論壇對于推進我國人工智能“產(chǎn)學(xué)研”的深度融合,推動AI 3D傳感技術(shù)的創(chuàng)新與發(fā)展具有重要意義。
深圳市南山區(qū)科創(chuàng)局(區(qū)科協(xié))常務(wù)副主席張漢國講話
7位頂尖學(xué)術(shù)專家分享3D傳感&人工智能最新科研成果
紀(jì)榮嶸:基于深度學(xué)習(xí)的場景信息重構(gòu)
廈門大學(xué)“閩江學(xué)者”特聘教授,博士生導(dǎo)師紀(jì)榮嶸表示,在實際應(yīng)用中,重構(gòu)場景語義信息和幾何信息非常重要,目前深度學(xué)習(xí)技術(shù)雖然在目標(biāo)檢測、視頻跟蹤等領(lǐng)域取得了重大突破,但在應(yīng)用中依然存在圖像遮擋等問題。對此,紀(jì)榮嶸教授介紹了其課題組在視覺里程計、圖像語義分割和圖像深度估計的研究進展,并舉例介紹了這些技術(shù)在移動端的應(yīng)用。
劉燁斌:實時便攜動態(tài)場景三維重建
清華大學(xué)自動化系副教授、博士生導(dǎo)師劉燁斌認為,真實世界視覺信息的采集、數(shù)字化記錄與重建是當(dāng)前視覺媒體技術(shù)發(fā)展的核心關(guān)鍵,隨著IPhone X等智能手機新增加實時深度探測模塊,動態(tài)場景的三維重建變得更加便捷。目前,動態(tài)場景的三維重建主要面臨精準(zhǔn)性、便捷性和實時性三方面的挑戰(zhàn)。對此,劉燁斌教授圍繞便捷性和實時性,回顧了動態(tài)場景三維重建的發(fā)展歷程,介紹了最新的關(guān)于便捷采集及實時生成的成果,主要是基于深度相機實時動態(tài)人體三維重建。此外,劉燁斌教授還圍繞視覺信息采集的計算攝像技術(shù),介紹了在視角維度的光場攝像、光譜維度的高光譜視頻成像、空間維度的十億像素視頻生成、時間維度的TOF瞬態(tài)成像方面的最新進展。
章國鋒:視覺SLAM技術(shù)及應(yīng)用
浙江大學(xué)CAD&CG國家重點實驗室教授,博士生導(dǎo)師章國鋒重點介紹了基于視覺的同時定位與地圖構(gòu)建(Visual SLAM)技術(shù),在滿足實際應(yīng)用需求中需要解決的關(guān)鍵性問題,包括:一是如何實現(xiàn)在移動設(shè)備上實時穩(wěn)定跟蹤,處理快速運動和強旋轉(zhuǎn)問題;二是如何重建三維幾何表面進行在線調(diào)整和誤差累積消除;三是如何實現(xiàn)高效的全局優(yōu)化等。
盧策吾:基于三維信息的行為理解
上海交通大學(xué)研究員,博士生導(dǎo)師盧策吾介紹了在行為理解和三維視覺的最新進展。行為理解研究主要涵蓋Deep RNN、Alphapose and beyond COCO、Interactiveness;三維視覺則包括PointSIFT、Pointwise Rotation-Invariant Network、DBNet。
黃迪:基于三維人臉數(shù)據(jù)的身份識別與表情分類
北京航空航天大學(xué)計算機學(xué)院長聘副教授,博士生導(dǎo)師黃迪首先介紹了三維人臉分析技術(shù)的發(fā)展,他表示,得益以奧比中光為代表的三維數(shù)據(jù)采集設(shè)備制造商的發(fā)展,相比過去,以較低成本快速編輯獲取高精度的三維數(shù)據(jù)成為現(xiàn)實,這促進了三維人臉分析技術(shù)的進一步發(fā)展和應(yīng)用。由于三維人臉能夠直接反映人臉形狀信息且能與紋理信息良好互補,目前已成為各機構(gòu)研究熱點。對此,黃迪教授介紹了在三維人臉分析在數(shù)據(jù)庫構(gòu)建、處理方法、實驗評價等方面的研究進展,并對其中涉及的人臉標(biāo)志點定位,人臉曲面配準(zhǔn)、曲面幾何表示、和二維三維信息融合等研究內(nèi)容、以及三維人臉識別和三維人臉表情分類的應(yīng)用做了詳細介紹。
趙啟軍:三維人臉建模:由圖到形的人臉識別
針對目前大熱的人臉識別,四川大學(xué)計算機學(xué)院副教授、博士趙啟軍在演講中表示,人臉能夠反映我們的很多信息,比如身份、種族、性別、年齡、情緒、注意力和健康狀況等等。但是,相比二維人臉圖像,獲取三維人臉數(shù)據(jù)仍然要更加昂貴和不便,導(dǎo)致其實際應(yīng)用依然存在諸多限制。對此,趙啟軍教授介紹了在由二維人臉圖像重建三維人臉形狀方面的工作,他表示,他們提出的方法能夠利用二維圖像生成三維人臉模型,且能夠大幅提升人臉識別準(zhǔn)確率。趙啟軍教授認為,隨著三維人臉獲取和建模技術(shù)的快速發(fā)展,三維人臉將在越來越多的應(yīng)用中發(fā)揮更加重要的作用。特別是奧比中光的3D傳感技術(shù)目前已經(jīng)應(yīng)用到諸多場景中,對于3D感知領(lǐng)域發(fā)展有非常大的促進作用。
郭裕蘭:三維場景智能感知與理解
國防科技大學(xué)電子科學(xué)學(xué)院講師郭裕蘭表示,得益于以奧比中光為代表的3D傳感企業(yè)的快速發(fā)展,三維視覺在近年來得到了廣泛關(guān)注,相比2D圖像,三維點云包含了更加豐富的幾何、形狀和結(jié)構(gòu)信息,從而為場景理解提供了更多可能。對此,郭裕蘭詳細介紹了其研究組在雙目深度估計、三維目標(biāo)識別以及三維場景標(biāo)注等方向的研究進展。他認為,未來,3D智能感知與理解在自動駕駛、機器人、VR/AR以及遙感等領(lǐng)域都有大量的應(yīng)用。
以自身為“橋梁”,打造AI 3D傳感“產(chǎn)學(xué)研”
論壇現(xiàn)場,來自各高校的研究人員和人工智能企業(yè)的研發(fā)人員齊聚一堂,與七位學(xué)術(shù)專家共同探討三維計算機視覺領(lǐng)域的前沿技術(shù)。如今,我國正在穩(wěn)步推進人工智能產(chǎn)業(yè)化進程,在此期間,“產(chǎn)學(xué)研”無疑是推動AI理論成果向產(chǎn)業(yè)研發(fā)應(yīng)用轉(zhuǎn)化的關(guān)鍵一環(huán)。肖振中在論壇致辭中表示,奧比中光十分重視與高校、科研機構(gòu)的“產(chǎn)學(xué)研”合作,承辦此次論壇不僅是自身進步的需要,也是推動學(xué)科和行業(yè)發(fā)展的社會責(zé)任。
此次論壇的舉辦為研發(fā)人員搭建了AI 3D傳感技術(shù)交流平臺,凸顯了奧比中光在AI 3D傳感領(lǐng)域的科研地位和學(xué)術(shù)影響力,今后,奧比中光將進一步加強與產(chǎn)學(xué)研各界的合作,并以自身為“橋梁”拉近AI 3D傳感產(chǎn)業(yè)與學(xué)術(shù)界的關(guān)聯(lián),以全自主知識產(chǎn)權(quán)技術(shù)助力產(chǎn)業(yè)升級,以產(chǎn)業(yè)需求推動學(xué)術(shù)進步,助推AI 3D傳感科研成果更好地向產(chǎn)品、市場轉(zhuǎn)化。