很遺憾,英偉達CEO黃仁勛缺席了昨天的GTC CHINA大會,作為英偉達一年一度的大會,并且極其看重中國市場的英偉達,“教主”級別的人物沒有慣例露面,還真是讓整個大會寡淡了許多。
看完主論壇以及高峰論壇的我,突然頓悟,雖人未到,但隔著一個大洋洲,我都感覺到黃教主皮衣下藏著的小心思。
“我不出現(xiàn),不代表沒有我”
公元2020年12月15日,我必須在日期前加上“公元”,因為我的小宇宙感受到黃教主想在這天創(chuàng)造一個改變產(chǎn)業(yè)的定律——“黃氏定律”(Huang's Law),即便我知道黃氏定律一詞在媒體上已經(jīng)傳播好幾年,但黃教主都沒有親自說出口。
“摩爾定律已死,新的定律正在形成,由于技術的飛速進步,圖形處理單元(GPU)有其自己的發(fā)展定律?!睅啄昵暗狞S教主已經(jīng)瘋狂暗示,訓練有素的科技圈記者們點頭示意。但黃教主終歸不好意思自己說出口,你看人家戈登摩爾,有在論文上寫“我今天創(chuàng)造一個摩爾定律”這句話嗎?最好的方法,就是借他人之口,這個“他人”就是英偉達首席科學家Bill Dally。
皮衣沒有出現(xiàn),帶貨的性感姿勢沒有出現(xiàn),“黃氏定律”出現(xiàn)了。一個本人都不要開口,卻充滿凡爾賽味道的定律出現(xiàn)了。
摩爾定律也不是摩爾一個人說有就有的,而是通過英特爾數(shù)十年的努力,來達到預期,所以才能閃耀半導體歷史,并且死去活來。聽Bill Dally的說法,“黃氏定律”也是如此。
英偉達首席科學家Bill Dally
屏幕中的Bill Dally以三個項目為例,講述了自己帶領的200人的研究團隊如何成功實現(xiàn)“黃氏定律”——預測GPU將推動AI性能實現(xiàn)逐年翻倍:“如果我們真想提高計算機性能,黃氏定律就是一項重要指標,且在可預見的未來都將一直適用?!?/p>
NVIDIA助力 AI推理性能每年提升一倍以上
此前,Dally曾負責NVIDIA在AI、光線追蹤和高速互連領域的相關研究。
二號凡爾賽玩家必須是Bill Dally,此人擁有120多項專利,在2009年加入NVIDIA之前,曾任斯坦福大學計算機科學系主任。當然我要說的是,全天下玩AI芯片的那么多,為什么且憑什么是你英偉達的GPU推動AI性能逐年翻倍,都不給其他GPU玩家,甚至AI芯片玩家機會?如此想來,Bill Dally秀的每一個技術背后的參數(shù)都是凡爾賽,且閃耀整個巴啦啦小魔仙芯球。
首先是一種名為MAGNet的工具,據(jù)介紹,其生成的AI推理加速器在模擬測試中,能夠達到每瓦 100 TeraOPS 的推理能力,比目前的商用芯片高出一個數(shù)量級。資料顯示,MAGNet采用了一系列新技術來協(xié)調并控制通過設備的信息流,最大限度地減少數(shù)據(jù)傳輸,而數(shù)據(jù)傳輸正是當今芯片中最耗能的環(huán)節(jié)。這一研究原型以模組化實現(xiàn),因此能夠靈活擴展。
另外,還有一項以更快速的光鏈路取代現(xiàn)有系統(tǒng)內的電氣鏈路的研究。
Bill Dally表示:“我們可以將連接GPU的NVLink速度提高一倍,也許還會再翻番,但電子信號最終會消耗殆盡。”該團隊正在與哥倫比亞大學的研究人員密切合作,探討如何利用電信供應商在其核心網(wǎng)絡中所采用的技術,通過一條光纖來傳輸數(shù)十路信號。
這種名為“密集波分復用”的技術,有望在僅一毫米大小的芯片上實現(xiàn)Tb/s級數(shù)據(jù)的傳輸,是如今互連密度的十倍以上。
除了更大的吞吐量,光鏈路也有助于打造更為密集型的系統(tǒng)。Dally舉例展示了一個未來將搭載160多個GPU的NVIDIA DGX系統(tǒng)模型。
軟件方面,NVIDIA的研究人員開發(fā)了全新編程系統(tǒng)原型Legate。開發(fā)者借助Legate,即可在任何規(guī)模的系統(tǒng)上,運行針對單一GPU編寫的程序——甚至適用于諸如Selene等搭載數(shù)千個GPU的巨型超級計算機。
Legate將一種新的編程速記融入了加速軟件庫和高級運行時環(huán)境Legion,目前它正在美國國家實驗室接受測試。
Bill Dally語速頗快,迅速的介紹完英偉達的項目,隨后便是一場線上圓桌式的高峰論壇,與其說是論壇,不如說是大型凡爾賽飆車現(xiàn)場。
凡爾賽圓桌
包括主持人在內的5位嘉賓,都是在來自英偉達,分別是英偉達亞太區(qū)銷售與營銷副總裁Raymond Teh、英偉達全球業(yè)務運營執(zhí)行副總裁Jay Puri、英偉達企業(yè)市場兼開發(fā)者計劃全球副總裁Greg Estes、英偉達醫(yī)療業(yè)務全球副總裁Kimberly Powell、英偉達亞太區(qū)戰(zhàn)略運營與合作伙伴副總裁Ashok Pandey。
這陣容,一唱一和,連上地球wifi,看直播的火星觀眾都直呼內行。
關于Arm,Jay Puri首先猛夸Arm,比如每年銷售220億個CPU,比如開創(chuàng)了IP許可模式,比如在移動端和嵌入式領域非常成功。這可以理解,畢竟是我英偉達看中的人,能有差的?
隨后話鋒一轉,為什么高通、博通、Marvell都嘗試用Arm進軍通用市場和云數(shù)據(jù)中心市場,為什么都失敗了呢?Jay Puri認為,Arm技術沒有問題,問題在于生態(tài),所以的應用領域都是圍繞X86生態(tài)建立的,Arm想要撬開一個口子,并大放異彩太難。
接著,又話鋒一轉。咱英偉達生態(tài)牛逼啊,未來數(shù)據(jù)中心的工作負載都圍繞加速計算和人工智能,英偉達平臺成熟,擁有可用的完整堆棧,且必要的生態(tài)伙伴都囊括了,還有200萬開發(fā)者。Jay Puri還許下諾言,一旦收購成功,將著重布局Arm在數(shù)據(jù)中心的成功,會有一個X86的替代方面。
醫(yī)療方面,Kimberly Powell口中的英偉達簡直賽華佗,“如今一個季度產(chǎn)生的數(shù)據(jù)規(guī)模,比大多數(shù)制藥行業(yè)300年積累的數(shù)據(jù)還要多?!盞imberly Powell這句話打開了醫(yī)療話題的話匣子:“研發(fā)新療法和疫苗的周期太長,有時即便投入10年20億美元的成本,最終也只是10%的成功幾率?!?/p>
Kimberly Powell強調了數(shù)據(jù)防御系統(tǒng)建立的必要性。隨后話鋒一轉,介紹了超級計算機DGX SuperPOD和Clara Discovery平臺。
其中,DGX SuperPOD系統(tǒng)以借助NVIDIA Mellanox HDR InfiniBand網(wǎng)絡互聯(lián)的20個模塊來銷售,AI性能最低可達到100 petaflops,最高可達700 petaflops,可運行最復雜的AI工作。此外,英偉達今年宣布的Cambridge-1建造計劃,是一款80節(jié)點的DGX SuperPOD,具備400 petaflops 的AI性能。今年年底一經(jīng)部署便將成為英國最快的超級計算機。該系統(tǒng)將被用于英國學術界、業(yè)界和初創(chuàng)企業(yè)在AI和醫(yī)療健康領域的合作研究。
Clara Discovery是專為 NVIDIA DGX 優(yōu)化的先進工具套件。包含多種框架、應用程序和 AI 模型,可實現(xiàn) GPU 加速的藥物研發(fā),支持的研究領域涵蓋基因組學、蛋白質組學、顯微鏡學、虛擬篩選、計算化學、可視化、臨床成像和自然語言處理(NLP)。
在與中國的云服務提供商(CSP)的合作中,Ashok Pandey用中文介紹了合作情況,他表示,與中國CSP已經(jīng)合作七年多,從一開始的深度學習訓練,到現(xiàn)在云服務。英偉達還聲稱,多家中國頂級云服務提供商及系統(tǒng)制造商紛紛采用NVIDIA A100 Tensor Core GPU和NVIDIA技術,為企業(yè)和行業(yè)的各類AI應用提速。
今年5月,英偉達推出了首款基于NVIDIA Ampere架構的NVIDIA A100 Tensor Core GPU。迄今為止,包括阿里云、百度智能云、滴滴云、騰訊云等在內的眾多中國云服務提供商紛紛推出搭載了NVIDIA A100的多款云服務及GPU實例。
A100 GPU配備了具有更高精度的第三代Tensor Core核心,性能較上一代產(chǎn)品有顯著提升??商峁?00GB/每秒GPU間連接傳輸速率的第三代NVIDIA NVLink、NVIDIA NVSwitch、PCIe Gen4與NVIDIA Magnum IO軟件SDK的組合,可實現(xiàn)成千上萬個GPU集群的高效擴展,這些技術得到了來自于NGC容器注冊中NVIDIA市場領先生態(tài)系統(tǒng)的支持。
在A100得到中國云服務提供商的迅速采用之外,最新發(fā)布的NVIDIA A100 PCIe版本以及NVIDIA A100 80GB GPU也迅速成為了包括新華三、浪潮、聯(lián)想、寧暢等在內的中國領先系統(tǒng)制造商的首選。
如果是前幾年,這些技術的厲害之處還得靠凡爾賽一號玩家黃教主來說出口,但由于黃氏定律官方發(fā)布的避嫌問題,我們有幸看到了英偉達內部各路凡爾賽高手登場。整個GTC CHINA2020大會,也隨著筆者抽獎抽到三次“謝謝參與”而結束,科技發(fā)展本就如一場夢。GTC大會,一場被大佬洗腦卻又無法反駁,只想靜靜思考穿皮衣是否真的有助于治療脫發(fā)的大會。凡爾賽的英偉達:科技就是這么枯燥且乏味。