10 月 28 日至 29 日,由杭州未來科技城(海創(chuàng)園)管委會指導,DeepTech 主辦的世界科技青年論壇暨 “35 歲以下科技創(chuàng)新 35 人”(TR35)全球-亞太區(qū)線下發(fā)布儀式,在杭州未來科技城成功舉辦。
在 TR35 全球-亞太區(qū)線下發(fā)布儀式現(xiàn)場,一眾頂尖科學家、青年科技人才、科技創(chuàng)業(yè)人士對世界科技前沿技術和熱點問題進行了探討、交流。
阿里巴巴集團副總裁、達摩院自動駕駛實驗室負責人王剛以《無人駕駛從技術到產(chǎn)品再從產(chǎn)品到技術》為主題,分享了他對無人駕駛的看法。一般來說,人們對技術到產(chǎn)品的流程非常熟悉,但是從產(chǎn)品到技術卻不是很了解,此次分享,王剛便為大家詳細闡述了其中的邏輯區(qū)別。
圖 | 阿里巴巴集團副總裁、達摩院自動駕駛實驗室負責人王剛
瞄準末端無人駕駛,服務 “最后三公里” 需求
在大家的普遍認知里,無人駕駛或許離我們還很遙遠,但事實上,末端無人駕駛市場卻大有可為。
王剛指出,阿里達摩院致力于解決 “最后三公里” 的包裹配送需求,瞄準的市場正是末端無人駕駛,并在規(guī)?;彤a(chǎn)品化方面取得極大進展。目前,達摩院已經(jīng)在全國 22 個省和 71 個城市開展了常態(tài)化物流服務,累計服務接近 200 多個大學校園和社區(qū),配送單量超過一百萬單。
當然,相比于快遞市場或者對物流市場來講,這樣的數(shù)字并不值一提,但就無人駕駛領域而言,這個數(shù)字已經(jīng)實現(xiàn)了一個極大的突破,客觀上也佐證了達摩院的產(chǎn)品化能力。目前,該產(chǎn)品已輻射了全國大部分地取,東北到哈爾濱、南到廣州、西到成都,產(chǎn)品穩(wěn)定性值得肯定。
話題回歸到無人駕駛,王剛指出,目前我們針對的只是末端 “最后三公里” 的場景,而作為無人駕駛領域的從業(yè)者,其實每個人最想解決的是 “所有場景里都能夠自動駕駛” 的難題。
王剛表示,“我覺得前面做的一切事情,包括產(chǎn)品化和規(guī)?;?,都是幫助我們從技術路徑上實現(xiàn)目標,所以我們做末端三公里并不只是一個業(yè)務決策,更多的是技術決策?!?/p>
從數(shù)據(jù)里找規(guī)律,重新定義無人駕駛技術路徑
縱觀過去幾十年人工智能的發(fā)展,幾乎所有成功的經(jīng)驗都是基于統(tǒng)計學習。而統(tǒng)計學習的本質就是從數(shù)據(jù)里面找到規(guī)律,如果沒有數(shù)據(jù),再聰明的科學家也很難找到辦法讓機器變得更聰明。
在王剛看來,數(shù)據(jù)驅動無疑是解決無人駕駛目前問題的最佳技術路徑之一。
基于這樣的認識和了解,王剛提出,在當前條件下無人駕駛需要解決兩個問題:一是如何獲取海量數(shù)據(jù);二是如何利用數(shù)據(jù)。
那么我們該如何獲取海量數(shù)據(jù)呢?
據(jù)王剛介紹,其在三年前確定業(yè)務和技術方向的時候,就考慮過是否學習谷歌依靠測試車解決 robot taxi 問題。但由于交通場景的復雜性,測試數(shù)據(jù)和場景都顯得過于片面,最終放棄了這個想法。
接下來,王剛想到先通過垂直場景解決業(yè)務問題,再利用其產(chǎn)生的價值去推動汽車規(guī)模化,從而推動更多車輛的部署,當有更多車輛部署的時候,數(shù)據(jù)的采集就變成了一件自然而然的事,進而推進技術發(fā)展。
“時至今日,經(jīng)過不斷的技術研發(fā)和產(chǎn)品化、規(guī)?;膶嶒灒覀兂醪娇吹搅耸锕?,在未來幾年的技術發(fā)展里,我們會從傳統(tǒng)的路測驅動走向產(chǎn)品驅動,即從產(chǎn)品再到技術。” 王剛表示。
阿里達摩院計劃在兩到三年內部署一萬輛車的規(guī)模,覆蓋中國所有的大學還有大型的園區(qū)、社區(qū),并將今天的累計一百萬訂單發(fā)展成每天配送一百萬訂單。王剛表示,這一百萬訂單的背后會積累非常多有意思,對技術帶來非常大改變的數(shù)據(jù)。比如末端場景中經(jīng)常出現(xiàn)的行人、非機動車等,相比更容易檢測、預測的卡車和轎車,這類交通參與者才是無人駕駛里面最頭痛的問題。
而在達摩院構建的場景下,一輛車日均可檢測 4000 萬個障礙物,每天與行人和非機動車進行超過 5000 次的交互。隨著更多的車輛被部署后,其產(chǎn)生的數(shù)據(jù)將是難以想象的。
獲取數(shù)據(jù)之后,最重要的節(jié)點就是掌握利用數(shù)據(jù)的方法。
王剛表示,“數(shù)據(jù)是一個石油,但是怎么樣提煉出來是另外一個同樣重要的問題?!?而實現(xiàn)這樣的人工智能無外乎三個方向。
第一個方向是學習人腦。不過王剛也表示,人腦是非常復雜的結構,很難做到徹底了解,因此不宜在這個方向投入太多的資源。第二個方向是自動化學習,即通過仿真虛擬化場景提高人工智能能力,而不過度依賴人工的經(jīng)驗和能力。第三個方向是小樣本學習能力,同樣受人的啟發(fā)。
達摩院自動駕駛實驗室在自動化學習上做了很多努力,且擁有了獨屬于自身的差異化競爭優(yōu)勢,分別表現(xiàn)在硬件和工程上。王剛說道,“比如我們做了無人駕駛全鏈路的自動化學習,包括最困難的決策規(guī)劃、控制以及定位,而不僅僅是常見的感知和圖象識別,這就是我們工程上的差異化。”
將智能仿真和強化學習相結合
那么如何將智能仿真和強化學習結合在一起呢?
王剛表示,谷歌作為世界上最好的 AI 公司之一,其實已經(jīng)做了類似的探索,那就是阿爾法圍棋(AlphaGo)。作為第一個戰(zhàn)勝圍棋世界冠軍的人工智能機器人,AlphaGo 由谷歌旗下 DeepMind 公司戴密斯·哈薩比斯(Demis Hassabis)領銜的團隊開發(fā),其主要工作原理正是 “深度學習”。
但之所以這樣的方法沒有大規(guī)模應用在機器人和無人駕駛領域,在于其中仍有迫切需要解決的問題。
首先是如何仿真場景,因為在圍棋領域,仿真是非常容易的,把棋盤畫出來就可以了,而無人駕駛卻需要構造交通場景,這就需要工程上的投入。
其次,從算法上來講 AlphaGo 是離散空間,而無人駕駛場景卻是連續(xù)空間,所以達摩院也研發(fā)出了基于連續(xù)空間的蒙特卡洛樹搜索算法,從而讓該方法在連續(xù)空間里同樣得以實現(xiàn)。
在王剛看來,積累數(shù)據(jù)和用好數(shù)據(jù)都是為了去更好地解決自動駕駛問題。他表示,“目前我們已經(jīng)基本解決了末端的低速問題,不僅能滿足業(yè)務需求,還極大地降低了成本。在未來,我和團隊將圍繞更泛化的場景做進一步的研發(fā),并基于當前的經(jīng)驗以及數(shù)據(jù)去攻克更大的挑戰(zhàn)。”