此前業(yè)內(nèi)一直盛傳華為正在秘密研發(fā)AI芯片,現(xiàn)在真的來了。10月10日,以“+智能,見未來”為主題的2018華為全聯(lián)接大會(HUAWEI CONNECT)在上海世博展覽館正式開幕。在會上,華為輪值CEO徐直軍公布了華為全棧全場景AI解決方案,并正式推出了兩款A(yù)I芯片:昇騰910、昇騰310。
人工智能是新的通用目的技術(shù)
華為輪值董事長徐直軍在大會上發(fā)表“構(gòu)建萬物互聯(lián)的智能世界”的主題演講。1956年,達(dá)特矛斯第一次正式提出了“人工智能”的定義。“從那以后的60年里,人工智能經(jīng)歷了兩次發(fā)展的低谷,即所謂的‘冬天’,但其發(fā)展的腳步并未就此停止?!彼f。
徐直軍認(rèn)為,人工智能是一種新的通用目的技術(shù)。任何技術(shù)只有準(zhǔn)確的定位,才會充分發(fā)揮其價(jià)值。給人工智能技術(shù)進(jìn)行合理的定位,是我們理解和應(yīng)用此技術(shù)的基礎(chǔ)。
他說,“華為在實(shí)踐中發(fā)現(xiàn),人工智能不但可以替代人,還能夠自動降低生產(chǎn)成本。這是人工智能與信息化最大的不同,也是其最有價(jià)值的特點(diǎn)?!?人工智能觸發(fā)的產(chǎn)業(yè)變革,將涉及所有行業(yè),從交通、教育、醫(yī)療到翻譯、運(yùn)維和自動駕駛等等。
兩款A(yù)I芯片發(fā)布
昇騰910:計(jì)算密度最大的單芯片
昇騰910是目前單芯片計(jì)算密度最大的芯片,其算力可以達(dá)到 256TFOPS,采用7nm工藝制程,最大功耗為350W。
根據(jù)華為官方公布的性能數(shù)據(jù)顯示,昇騰910半精度為(FP 16):256 Tera FLOPS,整數(shù)精度(INT 8):512 Tera FLOPS,128通道 全高清 視頻解碼器- H.264/265。
華為還將昇騰910的性能與谷歌TPU v2、谷歌TPU v3、英偉達(dá)V100進(jìn)行了對比??梢钥吹?,昇騰910的算力比Nvidia 的 V100 還要高出一倍,計(jì)算力遠(yuǎn)超谷歌及英偉達(dá)。
此外,值得一提的是,華為基于昇騰910還構(gòu)建了一個昇騰 plus,它是迄今為止全球最大的分布式訓(xùn)練系統(tǒng)。
徐直軍介紹,通過把 1024個昇騰910連接起來,構(gòu)建一個 AI 計(jì)算機(jī)群,可提供高大 256 個 P 超高 AI 計(jì)算能力,實(shí)現(xiàn)人們過去從未想過的速度訓(xùn)練你的模型,不管多復(fù)雜的模型。
昇騰310:高效計(jì)算低功耗AI SoC
華為昇騰310屬于昇騰910的迷你系列,主打終端低功耗AI場景,采用臺積電12nm工藝制造,擁有8 TFLOPs半精度計(jì)算力,整數(shù)精度的算力達(dá)到16TFLOPS,同時昇騰310還集成了 16 個通道的高全高清視頻解碼器,是目前面向邊緣計(jì)算產(chǎn)品最強(qiáng)算力的 AI 芯片,也可以用于數(shù)據(jù)中心的訓(xùn)練和推理。最大功耗僅為8W。
兩款A(yù)I芯片均采用華為自研的達(dá)芬奇AI架構(gòu)。其中昇騰310目前已經(jīng)量產(chǎn),昇騰910將在明年第二季度量產(chǎn)。2019年,華為還將推出3款A(yù)I芯片,均屬昇騰系列,同時華為將會基于昇騰系列AI芯片提供AI云服務(wù)。
十大改變 開創(chuàng)未來
在會上,徐植軍表示,要解決人工智能“火熱”與“冷靜”之間的巨大落差,開創(chuàng)未來,要從技術(shù)、人才、產(chǎn)業(yè)這三個方面進(jìn)行主動的變革。徐植軍和大家分享了十個有關(guān)人工智能技術(shù)、人才和產(chǎn)業(yè)的重要變革方向。
改變之一:縮短訓(xùn)練模型的時間
按照目前的技術(shù)水平,訓(xùn)練某些復(fù)雜模型時往往需要數(shù)天甚至數(shù)月,而成功的創(chuàng)新發(fā)現(xiàn)往往需要多次迭代,這種訓(xùn)練速度嚴(yán)重制約了應(yīng)用創(chuàng)新。我們認(rèn)為,未來模型的訓(xùn)練要能在幾分鐘、甚至幾秒鐘內(nèi)完成。
改變之二:充裕經(jīng)濟(jì)的算力
算力是AI的基礎(chǔ),但目前的算力非常昂貴,是一種稀缺資源。如果說算力的進(jìn)步是當(dāng)下AI大發(fā)展的主要驅(qū)動因素,那么,算力的稀缺和昂貴正在成為制約AI全面發(fā)展的核心因素。
我們認(rèn)為,算力應(yīng)該是充裕且經(jīng)濟(jì)的,并且這種需求應(yīng)該盡快實(shí)現(xiàn)。
改變之三:人工智能要適應(yīng)任何部署場景
混合云已經(jīng)成為企業(yè)采用云服務(wù)的主要模式,當(dāng)前的AI主要在云,少量在邊緣,與企業(yè)的業(yè)務(wù)環(huán)境的結(jié)合有待進(jìn)一步深入。
我們認(rèn)為,未來AI將無處不在,要能夠部署在任何場景,并確保用戶隱私得到尊準(zhǔn)和保護(hù)。
改變之四:更高效更安全的算法
算法是推動AI發(fā)展的另一個主要動力,但目前運(yùn)用的主要算法多誕生于1980年代。隨著AI的廣泛普及,這些算法的不足愈發(fā)明顯。
我們認(rèn)為,未來的算法,要能夠基于更少的數(shù)據(jù)需求,即數(shù)據(jù)高效。也要能夠基于更低的算力和能耗,即能耗高效。同時要解決自身的安全問題,并實(shí)現(xiàn)可解釋…等等,這都是AI全面發(fā)展的重要技術(shù)基礎(chǔ)。
改變之五:更高的自動化水平
今天的人工智能,自身還需要大量的人工,特別是在數(shù)據(jù)標(biāo)注環(huán)節(jié),今天甚至還誕生了一個新的職業(yè)叫“數(shù)據(jù)標(biāo)注師”。有人調(diào)侃說,今天的人工智能,是沒有“人工”就沒有“智能”。
我們認(rèn)為,應(yīng)該大大提升AI自身的自動化水平,比如在數(shù)據(jù)標(biāo)注、數(shù)據(jù)獲取,特征提取,模型設(shè)計(jì)和訓(xùn)練等環(huán)節(jié),要實(shí)現(xiàn)自動化或半自動化。
改變之六:模型要面向?qū)嶋H應(yīng)用
2018年6月,伯克利大學(xué)的助理教授 Benjamin 等發(fā)表了一篇題目奇怪的論文--《CIFAR-10分類器能否泛化到CIFAR-10?》
該論文指出,在CIFAR-10分類器上測試準(zhǔn)確度出色的模型算法,卻在作者創(chuàng)建的與CIFAR-10非常接近的另一測試集上出現(xiàn)了偏差,分類識別準(zhǔn)確率下降了5-15個百分點(diǎn)不等。這也就意味著,這個模型算法的可用度大幅度下降。
由此,可見當(dāng)前很多優(yōu)秀的模型算法,更多的是“考試”優(yōu)秀,還未達(dá)到“工作”優(yōu)秀。
我們認(rèn)為,未來的模型必須實(shí)現(xiàn)工業(yè)級的優(yōu)秀,即滿足工業(yè)生產(chǎn)的需要,而不僅僅滿足于測試集上“考試”優(yōu)秀。
改變之七:模型更新
模型的準(zhǔn)確率并非是一成不變的,而是會隨著數(shù)據(jù)分布、應(yīng)用環(huán)境和硬件環(huán)境的變化而變化,始終保持準(zhǔn)確率在期望的范圍內(nèi)對于企業(yè)應(yīng)用是必須的。但目前的模型更新是非實(shí)時的,依賴人工周期性的更新,因此是一個半開環(huán)的系統(tǒng)。
我們認(rèn)為,未來的模型要能及時適應(yīng)各種變化,實(shí)時更新,實(shí)現(xiàn)閉環(huán)系統(tǒng),保證企業(yè)AI應(yīng)用始終處于最佳狀態(tài)。
改變之八:人工智能要多技術(shù)協(xié)同
每一個通用目的技術(shù),只有與其它技術(shù)充分協(xié)同配合,才能發(fā)揮到極致,創(chuàng)造巨大的經(jīng)濟(jì)價(jià)值。AI也不例外,但在目前我們探討AI時,更多的是僅僅聚焦AI本身。
我們認(rèn)為,AI需要與云、物聯(lián)網(wǎng)、邊緣計(jì)算、區(qū)塊鏈、大數(shù)據(jù)、數(shù)據(jù)庫…等技術(shù)充分協(xié)同,如此才能發(fā)揮更大價(jià)值。
改變之九:人工智能要成為由一站式平臺支持的基本技能
今天,AI還是一項(xiàng)只有具備高級技能的專家才能完成的工作,成熟、穩(wěn)定、完善的自動化工具還比較缺乏,獲得一個AI模型還是一個非常復(fù)雜,耗時耗力的事情。
我們認(rèn)為,應(yīng)該有一站式平臺,提供必需的自動化工具,讓AI應(yīng)用開發(fā)更容易,更快捷。從而,使AI成為所有應(yīng)用開發(fā)者甚至所有ICT技術(shù)從業(yè)人員的一項(xiàng)基本技能。
改變之十:以AI的思維解決AI的人才短缺
AI人才的短缺,特別是數(shù)據(jù)科學(xué)家的缺乏,一直是業(yè)界顧慮較多的一個制約因素。而且我們認(rèn)為,數(shù)據(jù)科學(xué)家將永遠(yuǎn)是稀缺的。
解決之道應(yīng)該是,以AI的思維解決AI的人才短缺。通過著力發(fā)展智能化、自動化、簡單易用的AI平臺和工具服務(wù),以及提供培訓(xùn)教育,培養(yǎng)大量的數(shù)據(jù)科學(xué)工程師,使他們能完成大量基本的數(shù)據(jù)科學(xué)相關(guān)工作。
通過這些大量的數(shù)據(jù)科學(xué)工程師與數(shù)據(jù)科學(xué)家和各領(lǐng)域?qū)<蚁嗷ヅ浜系奶菪谓Y(jié)構(gòu),來解決AI人才稀缺問題。
這十個改變,一定不是AI技術(shù)、人才、產(chǎn)業(yè)發(fā)展的全部,但都是未來發(fā)展的重要基礎(chǔ)。
華為的AI發(fā)展戰(zhàn)略:
徐直軍提出了10個人工智能的重要改變方向既是華為對AI產(chǎn)業(yè)發(fā)展的期望,也是華為制定AI發(fā)展戰(zhàn)略的源動力?;谶@十大改變,華為的AI發(fā)展戰(zhàn)略包括五個方面:
1. 投資基礎(chǔ)研究:在計(jì)算視覺、自然語言處理、決策推理等領(lǐng)域構(gòu)筑數(shù)據(jù)高效(更少的數(shù)據(jù)需求) 、能耗高效(更低的算力和能耗) ,安全可信、自動自治的機(jī)器學(xué)習(xí)基礎(chǔ)能力。
2. 打造全棧方案:打造面向云、邊緣和端等全場景的、獨(dú)立的以及協(xié)同的、全棧解決方案,提供充裕的、經(jīng)濟(jì)的算力資源,簡單易用、高效率、全流程的AI平臺。
3. 投資開放生態(tài)和人才培養(yǎng):面向全球,持續(xù)與學(xué)術(shù)界、產(chǎn)業(yè)界和行業(yè)伙伴廣泛合作,打造人工智能開放生態(tài),培養(yǎng)人工智能人才。
4. 解決方案增強(qiáng):把AI思維和技術(shù)引入現(xiàn)有產(chǎn)品和服務(wù),實(shí)現(xiàn)更大價(jià)值、更強(qiáng)競爭力。
5. 內(nèi)部效率提升:應(yīng)用AI優(yōu)化內(nèi)部管理,對準(zhǔn)海量作業(yè)場景,大幅度提升內(nèi)部運(yùn)營效率和質(zhì)量。
華為的AI全棧解決方案
在大會中,徐直軍用一張圖完整展示了華為的全棧全場景解決方案。
“我們提出的全場景,是指包括公有云、私有云、各種邊緣計(jì)算、物聯(lián)網(wǎng)行業(yè)終端以及消費(fèi)類終端等部署環(huán)境。我們說的全棧是技術(shù)功能視角,是指包括芯片、芯片使能、訓(xùn)練和推理框架和應(yīng)用使能在內(nèi)的全堆棧方案?!彼f。
華為的全棧方案具體包括:
Ascend: 基于統(tǒng)一、可擴(kuò)展架構(gòu)的系列化AI IP 和 芯片,包括Max,Mini,Lite,Tiny和Nano等五個系列。包括我們今天發(fā)布的華為昇騰910(Ascend 910),是目前全球已發(fā)布的單芯片計(jì)算密度最大的AI芯片,還有Ascend 310,是目前面向計(jì)算場景最強(qiáng)算力的AI SoC。2.CANN: 芯片算子庫和高度自動化算子開發(fā)工具
MindSpore:支持端、邊、云獨(dú)立的和協(xié)同的統(tǒng)一訓(xùn)練和推理框架應(yīng)用使能:提供全流程服務(wù)(ModelArts),分層API和預(yù)集成方案從華為云EI、人工智能引擎HiAI到全棧解決方案,華為構(gòu)建出自己的一套完整AI方案。
徐直軍表示,“今天,我們發(fā)布的全棧全場景解決方案是對華為云EI和HiAI的強(qiáng)有力支撐?;谶@個解決方案,華為云EI能為企業(yè)、政府提供全棧人工智能解決方案;HiAI能為智能終端提供全棧解決方案,且HiAI service是基于華為云EI部署的?!?/p>
從某種方面說,人工智能很“火”,但又很“冷靜”,這種差異被徐直軍稱為“令人興奮的落差”,是凝聚產(chǎn)業(yè)發(fā)展的巨大動力。
新的戰(zhàn)場,新的對手
在兩年前,華為另一名輪值董事長郭平就表示,公司每年至少拿出10億美元的研發(fā)預(yù)算,用于與數(shù)據(jù)中心相關(guān)的投入。
2017年9月,華為發(fā)布了面向企業(yè)、政府的人工智能服務(wù)平臺華為云EI。今年4月,華為又發(fā)布了面向智能終端的人工智能引擎HiAI。
但在投入的過程中,發(fā)現(xiàn)了一個普遍存在的問題,就是云服務(wù)平臺不賣終端芯片,賣終端芯片的平臺不提供云計(jì)算服務(wù)。因此,這種割裂的環(huán)節(jié)讓開發(fā)者浪費(fèi)了大量的時間和精力以及財(cái)力在訓(xùn)練和部署之間。
此前,谷歌云推出了用于邊緣計(jì)算的Edge TPU,作為Cloud TPU的補(bǔ)充,用戶可以在云上構(gòu)建和訓(xùn)練ML模型,然后通過Edge TPU硬件加速器在Cloud IoT Edge設(shè)備上運(yùn)行這些模型,這在某種程度上降低了開發(fā)者的成本。
但如果能出現(xiàn)一套框架,讓手機(jī)、公有云、私有云、邊緣計(jì)算等不同平臺的AI應(yīng)用應(yīng)用一次調(diào)校就能部署,將會比Edge TPU更有效率。
“今天,我們發(fā)布的全棧全場景解決方案是對華為云EI和HiAI的強(qiáng)有力支撐?;谶@個解決方案,華為云EI能為企業(yè)、政府提供全棧人工智能解決方案;HiAI能為智能終端提供全棧解決方案,且HiAI service是基于華為云EI部署的。”徐直軍說。
一位華為人士在社交平臺發(fā)表感嘆時表示,“(華為)又多了一些強(qiáng)大的全球頂級競爭對手。”