過去十年中,卷積神經(jīng)網(wǎng)絡(luò)和其它人工智能技術(shù)突飛猛進(jìn)的發(fā)展不可避免地影響了處理器領(lǐng)域的格局?,F(xiàn)在,人工智能已經(jīng)成為很多行業(yè)的流行語,它是光,它是電,它是所有處理器制造商都想要的東西。而且,所有軟件供應(yīng)商都渴望投資AI,開發(fā)新的功能。剛剛進(jìn)入這個(gè)十年時(shí)還完全不存在的一個(gè)市場突然在過去幾年中成為了研究開發(fā)和新營收的焦點(diǎn)和中心。目前,已經(jīng)有一些處理器供應(yīng)商圍繞人工智能建立起了自己初具規(guī)模的小型帝國。
但是,現(xiàn)代的人工智能仍然處于其發(fā)展的早期階段,它的市場空間也是無可限量。數(shù)據(jù)中心繼續(xù)大批量地購買AI加速器,越來越多的消費(fèi)級(jí)處理器中也開始部署人工智能。在很多人都奮力爭奪的這個(gè)市場中,全球的處理器制造商都在試圖弄清楚他們自己如何躋身為新的AI處理器市場中的主導(dǎo)力量。人工智能的淘金熱已經(jīng)全面展開,每個(gè)人都在排著隊(duì)叫賣淘金的工具。
就其基礎(chǔ)技術(shù)及其背后的制造商而言,人工智能的淘金熱引起了全球各個(gè)角落科技公司的興趣。從GPU、CPU到FPGA、定制ASIC公司,從在邊緣節(jié)點(diǎn)處進(jìn)行推理、在云端進(jìn)行推理到在云端進(jìn)行訓(xùn)練,各種處理器試圖在各個(gè)鏈條上提供AI處理服務(wù)。不過,在人工智能的世界中,利潤最為誘人的依然是計(jì)算世界金字塔的頂端市場:數(shù)據(jù)中心。數(shù)據(jù)中心市場正在不斷擴(kuò)展,部署成本高昂,而且仍在實(shí)現(xiàn)跨越式發(fā)展,數(shù)據(jù)中心的運(yùn)營商們對(duì)于購買大量的處理器永不饜足,這是最為高端的市場盛宴?,F(xiàn)在,高通這位守在數(shù)據(jù)中心AI市場旁邊的巨頭終于要采取行動(dòng)了。
近日召開的是他們的第一個(gè)高通AI日,這位移動(dòng)世界的“金剛”宣布,高通正在以快速、激進(jìn)的方式進(jìn)入人工智能加速器市場。在活動(dòng)現(xiàn)場,高通發(fā)布了他們第一款分立式專用AI處理器,即高通云AI 100系列。該系列產(chǎn)品專為人工智能市場設(shè)計(jì),高通公司承諾為之構(gòu)建一整套廣泛的軟件棧。高通正在加緊工作,力爭在2020年將云AI 100推向市場,并借此將自己打造為供不應(yīng)求的人工智能推理加速器市場的主要供應(yīng)商。
嚴(yán)格來說,高通近日宣布的內(nèi)容更像是一支預(yù)告片,不大像產(chǎn)品發(fā)布,當(dāng)然更沒有具體技術(shù)規(guī)格的披露了。云AI 100系列數(shù)據(jù)中心推理加速器是高通公司計(jì)劃在2020年推出的產(chǎn)品,它將在今年晚些時(shí)候拿出樣片。簡而言之,要見到正經(jīng)八百的商業(yè)產(chǎn)品我們還得等上整整一個(gè)年頭。高通這次“發(fā)布會(huì)”做得不錯(cuò),它表達(dá)了自己的意圖和愿景,但沒有揭示自己的技術(shù)。我們可以認(rèn)為,它這次是在提前通知自己將要追求的大客戶。盡管如此,今天的發(fā)布依然很重要,因?yàn)楦咄鞔_地表示了自己未來要走的是和其兩大競爭對(duì)手-英偉達(dá)和英特爾-截然不同的方向。
高通云AI 100產(chǎn)品架構(gòu):專用推理ASIC
那么,高通當(dāng)下究竟在做什么呢?簡單來說,該公司正在面向數(shù)據(jù)中心市場開發(fā)一系列專用的AI推理加速器。該產(chǎn)品系列不是遵循從上到下衍生式的設(shè)計(jì),而是將采用各種外形尺寸,設(shè)計(jì)不同的總設(shè)計(jì)功耗,以滿足數(shù)據(jù)中心運(yùn)營商的多樣化需求。在這個(gè)市場上,高通公司希望打造最為高效的推理加速器,使其性能遠(yuǎn)遠(yuǎn)高于目前的GPU和FPGA領(lǐng)跑者。
對(duì)于云AI 100系列,高通公司目前沒有給出任何實(shí)質(zhì)性的架構(gòu)細(xì)節(jié),但是它還是透露了一些我們想知道的信息。首先,這些新器件將采用7納米工藝制造,高通可能會(huì)選擇臺(tái)積電以性能為優(yōu)先導(dǎo)向的7納米HPC工藝。此外,高通將提供各種板卡,不過目前尚不清楚它是否設(shè)計(jì)了不止一種處理器。高通還告訴我們,這是一個(gè)從頭開始的全新設(shè)計(jì),所以它并不是把驍龍855的AI功能擴(kuò)大化衍生出來的產(chǎn)品。
事實(shí)上,高通表明的該產(chǎn)品系列和驍龍855的關(guān)系可能才是最重要的信息。盡管高通今天沒有提供加速器的架構(gòu)細(xì)節(jié),但是它明確表示,這將是一款不折不扣的AI推理加速器。既不是AI訓(xùn)練加速器,也不能被稱為GPU或者其它名稱。它只能被用在AI推理上,即用來運(yùn)行業(yè)經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)。
這是一個(gè)非常重要的區(qū)別,因?yàn)?,魔鬼藏在?xì)節(jié)之中,高通公司的聲明很明確,它強(qiáng)有力地指出了該產(chǎn)品的基礎(chǔ)架構(gòu)-人工智能推理ASIC,就像谷歌的TPU系列那樣,它并非一種更為靈活的處理器。當(dāng)然,高通遠(yuǎn)遠(yuǎn)稱不上第一家專門為AI處理運(yùn)算構(gòu)建ASIC器件的廠商,但是,其它AI ASIC要么專注在低端市場上,要么只供內(nèi)部使用(我們又要拿谷歌的TPU做例子了),而高通面向的則是高端數(shù)據(jù)中心市場的客戶。而且,相對(duì)于競爭對(duì)手而言,高通給出的信息表明該器件更像是一種ASIC,而不是類似GPU那種設(shè)計(jì),要知道在AI GPU上,英偉達(dá)穩(wěn)占鰲頭,英特爾積極跟進(jìn),后來者很難再擠進(jìn)來。
高通的云AI 100處理器的設(shè)計(jì)策略非常巧妙,它收縮了戰(zhàn)線,只專注在AI推理上,這使得該產(chǎn)品的性能潛力值得期待。在處理器設(shè)計(jì)層面,架構(gòu)師需要兼顧靈活性和效率,一顆芯片越接近只實(shí)現(xiàn)固定功能的ASIC,它的能效就越高。正如GPU在AI性能上面實(shí)現(xiàn)了對(duì)CPU的巨大飛躍一樣,高通希望這款類似ASIC的處理器在AI性能上實(shí)現(xiàn)對(duì)GPU的飛躍。
當(dāng)然,凡事有利皆有弊,更加貼近固定功能的ASIC就意味著放棄靈活性。它能否應(yīng)對(duì)新的數(shù)據(jù)中心框架、執(zhí)行新的處理流程或者運(yùn)行全新的神經(jīng)網(wǎng)絡(luò)模型還有待觀察。但是,我相信,高通肯定肯定會(huì)在這里進(jìn)行一些必要而且重要的權(quán)衡,當(dāng)前最重要的問題是,這些權(quán)衡是否正確,以及目前整個(gè)市場是否已經(jīng)為專門面向數(shù)據(jù)中心的AI ASIC做好了準(zhǔn)備。
同時(shí),高通公司必須解決的另外一個(gè)重要技術(shù)問題在于,它的云AI 100系列是它們第一款專用的AI處理器。不可否認(rèn)的是,每款產(chǎn)品都有其技術(shù)積累的歷史淵源,對(duì)于高通及其云AI 100,他們肯定是希望將自己在人工智能方面的專業(yè)知識(shí)轉(zhuǎn)換為數(shù)據(jù)中心應(yīng)用上的人工智能。高通的旗艦級(jí)驍龍SoC已經(jīng)成為當(dāng)今世界上一股不容忽視的力量,高通公司認(rèn)為,他們?cè)诟吣苄гO(shè)計(jì)和信號(hào)處理方面的經(jīng)驗(yàn)將幫助它在數(shù)據(jù)中心AI市場也占據(jù)重要地位。
以高通公司目前的龐大體量,他們的產(chǎn)品一旦被市場證明,便能夠迅速提高產(chǎn)量。雖然,這并不能幫助它在對(duì)抗英偉達(dá)和英特爾這兩家巨頭上占得一點(diǎn)便宜,因?yàn)檫@兩家公司可以分別利用臺(tái)積電和自家的制造工廠迅速上量并取得規(guī)模經(jīng)濟(jì)性,但是,這將使得高通可以建立對(duì)無數(shù)也在追求AI ASIC的小型硅谷初創(chuàng)公司的優(yōu)勢。
高通為什么進(jìn)入數(shù)據(jù)中心推理市場?
除了技術(shù)方面的考慮之外,另外一個(gè)推動(dòng)高通公司進(jìn)入AI推理加速器市場的重要因素便是-錢!
盡管目前人們對(duì)人工智能推理市場的最終規(guī)模能達(dá)到多少存在很大爭議,但是高通公司認(rèn)為,到2025年,數(shù)據(jù)中心推理加速器市場可能會(huì)達(dá)到170億美元。如果預(yù)測成真,這確實(shí)是一個(gè)相當(dāng)大的市場,也是一個(gè)高通絕對(duì)不愿意錯(cuò)過的市場,它完全可以媲美高通當(dāng)前的芯片制造業(yè)務(wù)。
此外,值得注意的是,上面所說的還只是單純的推理市場,而不是整個(gè)數(shù)據(jù)中心推理+訓(xùn)練市場,這里存在很大的區(qū)別。因?yàn)?,雖然訓(xùn)練也很重要,但是針對(duì)訓(xùn)練的計(jì)算需求和針對(duì)推理的計(jì)算需求有很大不同。雖然可以使用相對(duì)低精度的數(shù)據(jù)類型(比如INT8,有時(shí)還會(huì)更低)執(zhí)行準(zhǔn)確的推理,但是目前大多數(shù)訓(xùn)練任務(wù)都需要FP16或者更高精度的數(shù)據(jù)類型。這就需要一種不同類型的芯片,特別是我們討論的是ASIC,而不是類似于GPU那樣的通用產(chǎn)品。
推理加速器的規(guī)模可以很容易地?cái)U(kuò)展:雖然訓(xùn)練神經(jīng)網(wǎng)絡(luò)可能需要部署大量資源,但是只需要部署一次就可以了,然后,訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)可以復(fù)制到推理加速器集群中去執(zhí)行。所以,對(duì)于和訓(xùn)練同樣重要的推理,潛在客戶需要的推理加速器數(shù)量要遠(yuǎn)大于訓(xùn)練用處理器。
與此同時(shí),盡管高通公司沒有明確喊話,但是很明顯,它正打算顛覆市場領(lǐng)導(dǎo)者英偉達(dá),英偉達(dá)已經(jīng)用自己的AI處理器建立了一個(gè)小型的人工智能帝國。目前,英偉達(dá)的特斯拉T4/P4/P40加速器構(gòu)成了數(shù)據(jù)中心AI推理處理器世界的支柱,從財(cái)報(bào)上來看,來自數(shù)據(jù)中心的收入是英偉達(dá)整體營收中利潤率很高的板塊。因此,即使整個(gè)數(shù)據(jù)中心市場沒有像之前預(yù)期的速度和規(guī)模增長,這依然是一塊非常有利可圖的業(yè)務(wù)。
加入這個(gè)戰(zhàn)局,高通還必須時(shí)刻牢記來自英特爾的威脅。英特爾公開表達(dá)了自己的人工智能計(jì)劃,從低功耗的Movidius加速器到最新的Cascade Lake Xeon可擴(kuò)展CPU,英特爾有幾個(gè)不同的AI產(chǎn)品系列計(jì)劃。不過,具體到高通公司想要進(jìn)入的數(shù)據(jù)中心AI推理加速器市場而言,來自英特爾最大的威脅可能是它即將推出的Xe GPU,這些GPU來自英特爾最近剛剛重建的GPU部門。和高通一樣,英特爾也在對(duì)英偉達(dá)發(fā)起挑戰(zhàn),因?yàn)槿斯ぶ悄芡评硎袌錾系母偁帉?duì)手們沒有一個(gè)希望失敗。
努力落地
高通公司只是表達(dá)勃勃的雄心遠(yuǎn)遠(yuǎn)不夠,在接下來的12個(gè)月內(nèi),它的重點(diǎn)將是發(fā)展第一批客戶。要做到這一點(diǎn),高通必須證明,它對(duì)于云AI 100系列所做的所有事情都是極其認(rèn)真的,它的硬件拿得出手,而且還能提供可以與競爭對(duì)手的軟件生態(tài)系統(tǒng)PK的易用軟件。所有這一切都不容易,所以高通公司需要從現(xiàn)在開始努力,以兌現(xiàn)吹過的牛逼。
多年來,高通公司一直對(duì)服務(wù)器和數(shù)據(jù)中心市場抱有各種各樣的夢想,但是都是“過于雄心勃勃”。比如,高通公司在2017年大張旗鼓地宣布將突出基于ARM的服務(wù)器CPU-Centriq系列,結(jié)果整個(gè)項(xiàng)目在一年內(nèi)就遭遇了滑鐵盧。高通公司的Centriq雖然失敗了,但是它的另外兩個(gè)拳頭產(chǎn)品-移動(dòng)處理器和調(diào)制解調(diào)器-都是非常強(qiáng)悍的存在。為了讓數(shù)據(jù)中心運(yùn)營商們信任并敢于使用云AI 100系列,高通公司不僅需要為其第一代產(chǎn)品制定一個(gè)偉大的計(jì)劃,還需要為未來幾代產(chǎn)品制定可以執(zhí)行落地的計(jì)劃。
在這個(gè)年輕、不斷增長的推理加速器市場中,數(shù)據(jù)中心運(yùn)營商也愿意嘗試CPU之外的新處理器。所以,我們沒有理由認(rèn)為高通的云AI 100系列肯定不會(huì)取得成功,但是,高通公司要說服在其它方面依然謹(jǐn)慎的數(shù)據(jù)中心運(yùn)營商,它就必須在其產(chǎn)品上投入更多的資源。
除了器件本身,軟件層面同樣重要。英偉達(dá)在人工智能領(lǐng)域取得的巨大成功在很大程度上應(yīng)該歸功于他們的人工智能軟件生態(tài)系統(tǒng),該生態(tài)系統(tǒng)本身就是自己十年前的CUDA生態(tài)系統(tǒng)的擴(kuò)展,CUDA生態(tài)系統(tǒng)讓其在GPU領(lǐng)域的競爭對(duì)手AMD被打壓得抬不起頭來。對(duì)于高通公司來說,它的優(yōu)勢在于目前已經(jīng)存在最流行的框架、運(yùn)行時(shí)工具。TensorFlow、Caffe2和ONNX都是很不錯(cuò)的選擇,高通知道這一點(diǎn),它也有能力實(shí)現(xiàn)它,所以它承諾為其AI加速處理器提供廣泛的軟件棧。不過,高通公司必須在軟件棧上加快速度,因?yàn)樗麄兊能浖?shí)際運(yùn)行性能如何決定了整個(gè)項(xiàng)目的成敗。高通必須提供良好的硬件和軟件組合才能在這個(gè)市場上取得成功。
高通公司今天發(fā)布的公告是一個(gè)預(yù)告片,它宣布了未來一年將要發(fā)生的事情。它制定了一項(xiàng)雄心勃勃的計(jì)劃,旨在打入日益增長的人工智能推理加速器市場,并提供和這個(gè)開放性的市場上其它任何產(chǎn)品都有所不同的加速器。從預(yù)告片到正式上映將會(huì)是一個(gè)巨大的挑戰(zhàn),但是高通公司是在資金和工程資源方面最有實(shí)力的處理器巨頭,所以,高通公司能夠在推理加速器市場上取得多大的成績?nèi)Q于它有多渴求這個(gè)市場。它有能力開發(fā)這種處理器,也知道如何避免導(dǎo)致之前的服務(wù)器處理器計(jì)劃失敗的失誤。
不過,最重要的是,高通公司也不會(huì)輕易地攻下推理加速器市場,它必須為之一戰(zhàn)。高通的成功等價(jià)于英偉達(dá)市場份額的丟失,英偉達(dá)肯定不會(huì)束手就擒,英特爾也在虎視眈眈,更不用說其他GPU廠商、FPGA供應(yīng)商和ASIC廠商了。在這個(gè)新興技術(shù)主導(dǎo)的年輕市場中,所有參與者都有可能迅速崛起和衰敗。所以,雖然距離2020年還有差不多一年,但是,人工智能加速器市場必將在2020年掀起第一場世界大戰(zhàn)。