過去十年中,卷積神經(jīng)網(wǎng)絡和其它人工智能技術(shù)突飛猛進的發(fā)展不可避免地影響了處理器領域的格局?,F(xiàn)在,人工智能已經(jīng)成為很多行業(yè)的流行語,它是光,它是電,它是所有處理器制造商都想要的東西。而且,所有軟件供應商都渴望投資AI,開發(fā)新的功能。剛剛進入這個十年時還完全不存在的一個市場突然在過去幾年中成為了研究開發(fā)和新營收的焦點和中心。目前,已經(jīng)有一些處理器供應商圍繞人工智能建立起了自己初具規(guī)模的小型帝國。
但是,現(xiàn)代的人工智能仍然處于其發(fā)展的早期階段,它的市場空間也是無可限量。數(shù)據(jù)中心繼續(xù)大批量地購買AI加速器,越來越多的消費級處理器中也開始部署人工智能。在很多人都奮力爭奪的這個市場中,全球的處理器制造商都在試圖弄清楚他們自己如何躋身為新的AI處理器市場中的主導力量。人工智能的淘金熱已經(jīng)全面展開,每個人都在排著隊叫賣淘金的工具。
就其基礎技術(shù)及其背后的制造商而言,人工智能的淘金熱引起了全球各個角落科技公司的興趣。從GPU、CPU到FPGA、定制ASIC公司,從在邊緣節(jié)點處進行推理、在云端進行推理到在云端進行訓練,各種處理器試圖在各個鏈條上提供AI處理服務。不過,在人工智能的世界中,利潤最為誘人的依然是計算世界金字塔的頂端市場:數(shù)據(jù)中心。數(shù)據(jù)中心市場正在不斷擴展,部署成本高昂,而且仍在實現(xiàn)跨越式發(fā)展,數(shù)據(jù)中心的運營商們對于購買大量的處理器永不饜足,這是最為高端的市場盛宴?,F(xiàn)在,高通這位守在數(shù)據(jù)中心AI市場旁邊的巨頭終于要采取行動了。
近日召開的是他們的第一個高通AI日,這位移動世界的“金剛”宣布,高通正在以快速、激進的方式進入人工智能加速器市場。在活動現(xiàn)場,高通發(fā)布了他們第一款分立式專用AI處理器,即高通云AI 100系列。該系列產(chǎn)品專為人工智能市場設計,高通公司承諾為之構(gòu)建一整套廣泛的軟件棧。高通正在加緊工作,力爭在2020年將云AI 100推向市場,并借此將自己打造為供不應求的人工智能推理加速器市場的主要供應商。
嚴格來說,高通近日宣布的內(nèi)容更像是一支預告片,不大像產(chǎn)品發(fā)布,當然更沒有具體技術(shù)規(guī)格的披露了。云AI 100系列數(shù)據(jù)中心推理加速器是高通公司計劃在2020年推出的產(chǎn)品,它將在今年晚些時候拿出樣片。簡而言之,要見到正經(jīng)八百的商業(yè)產(chǎn)品我們還得等上整整一個年頭。高通這次“發(fā)布會”做得不錯,它表達了自己的意圖和愿景,但沒有揭示自己的技術(shù)。我們可以認為,它這次是在提前通知自己將要追求的大客戶。盡管如此,今天的發(fā)布依然很重要,因為高通明確地表示了自己未來要走的是和其兩大競爭對手-英偉達和英特爾-截然不同的方向。
高通云AI 100產(chǎn)品架構(gòu):專用推理ASIC
那么,高通當下究竟在做什么呢?簡單來說,該公司正在面向數(shù)據(jù)中心市場開發(fā)一系列專用的AI推理加速器。該產(chǎn)品系列不是遵循從上到下衍生式的設計,而是將采用各種外形尺寸,設計不同的總設計功耗,以滿足數(shù)據(jù)中心運營商的多樣化需求。在這個市場上,高通公司希望打造最為高效的推理加速器,使其性能遠遠高于目前的GPU和FPGA領跑者。
對于云AI 100系列,高通公司目前沒有給出任何實質(zhì)性的架構(gòu)細節(jié),但是它還是透露了一些我們想知道的信息。首先,這些新器件將采用7納米工藝制造,高通可能會選擇臺積電以性能為優(yōu)先導向的7納米HPC工藝。此外,高通將提供各種板卡,不過目前尚不清楚它是否設計了不止一種處理器。高通還告訴我們,這是一個從頭開始的全新設計,所以它并不是把驍龍855的AI功能擴大化衍生出來的產(chǎn)品。
事實上,高通表明的該產(chǎn)品系列和驍龍855的關(guān)系可能才是最重要的信息。盡管高通今天沒有提供加速器的架構(gòu)細節(jié),但是它明確表示,這將是一款不折不扣的AI推理加速器。既不是AI訓練加速器,也不能被稱為GPU或者其它名稱。它只能被用在AI推理上,即用來運行業(yè)經(jīng)訓練好的神經(jīng)網(wǎng)絡。
這是一個非常重要的區(qū)別,因為,魔鬼藏在細節(jié)之中,高通公司的聲明很明確,它強有力地指出了該產(chǎn)品的基礎架構(gòu)-人工智能推理ASIC,就像谷歌的TPU系列那樣,它并非一種更為靈活的處理器。當然,高通遠遠稱不上第一家專門為AI處理運算構(gòu)建ASIC器件的廠商,但是,其它AI ASIC要么專注在低端市場上,要么只供內(nèi)部使用(我們又要拿谷歌的TPU做例子了),而高通面向的則是高端數(shù)據(jù)中心市場的客戶。而且,相對于競爭對手而言,高通給出的信息表明該器件更像是一種ASIC,而不是類似GPU那種設計,要知道在AI GPU上,英偉達穩(wěn)占鰲頭,英特爾積極跟進,后來者很難再擠進來。
高通的云AI 100處理器的設計策略非常巧妙,它收縮了戰(zhàn)線,只專注在AI推理上,這使得該產(chǎn)品的性能潛力值得期待。在處理器設計層面,架構(gòu)師需要兼顧靈活性和效率,一顆芯片越接近只實現(xiàn)固定功能的ASIC,它的能效就越高。正如GPU在AI性能上面實現(xiàn)了對CPU的巨大飛躍一樣,高通希望這款類似ASIC的處理器在AI性能上實現(xiàn)對GPU的飛躍。
當然,凡事有利皆有弊,更加貼近固定功能的ASIC就意味著放棄靈活性。它能否應對新的數(shù)據(jù)中心框架、執(zhí)行新的處理流程或者運行全新的神經(jīng)網(wǎng)絡模型還有待觀察。但是,我相信,高通肯定肯定會在這里進行一些必要而且重要的權(quán)衡,當前最重要的問題是,這些權(quán)衡是否正確,以及目前整個市場是否已經(jīng)為專門面向數(shù)據(jù)中心的AI ASIC做好了準備。
同時,高通公司必須解決的另外一個重要技術(shù)問題在于,它的云AI 100系列是它們第一款專用的AI處理器。不可否認的是,每款產(chǎn)品都有其技術(shù)積累的歷史淵源,對于高通及其云AI 100,他們肯定是希望將自己在人工智能方面的專業(yè)知識轉(zhuǎn)換為數(shù)據(jù)中心應用上的人工智能。高通的旗艦級驍龍SoC已經(jīng)成為當今世界上一股不容忽視的力量,高通公司認為,他們在高能效設計和信號處理方面的經(jīng)驗將幫助它在數(shù)據(jù)中心AI市場也占據(jù)重要地位。
以高通公司目前的龐大體量,他們的產(chǎn)品一旦被市場證明,便能夠迅速提高產(chǎn)量。雖然,這并不能幫助它在對抗英偉達和英特爾這兩家巨頭上占得一點便宜,因為這兩家公司可以分別利用臺積電和自家的制造工廠迅速上量并取得規(guī)模經(jīng)濟性,但是,這將使得高通可以建立對無數(shù)也在追求AI ASIC的小型硅谷初創(chuàng)公司的優(yōu)勢。
高通為什么進入數(shù)據(jù)中心推理市場?
除了技術(shù)方面的考慮之外,另外一個推動高通公司進入AI推理加速器市場的重要因素便是-錢!
盡管目前人們對人工智能推理市場的最終規(guī)模能達到多少存在很大爭議,但是高通公司認為,到2025年,數(shù)據(jù)中心推理加速器市場可能會達到170億美元。如果預測成真,這確實是一個相當大的市場,也是一個高通絕對不愿意錯過的市場,它完全可以媲美高通當前的芯片制造業(yè)務。
此外,值得注意的是,上面所說的還只是單純的推理市場,而不是整個數(shù)據(jù)中心推理+訓練市場,這里存在很大的區(qū)別。因為,雖然訓練也很重要,但是針對訓練的計算需求和針對推理的計算需求有很大不同。雖然可以使用相對低精度的數(shù)據(jù)類型(比如INT8,有時還會更低)執(zhí)行準確的推理,但是目前大多數(shù)訓練任務都需要FP16或者更高精度的數(shù)據(jù)類型。這就需要一種不同類型的芯片,特別是我們討論的是ASIC,而不是類似于GPU那樣的通用產(chǎn)品。
推理加速器的規(guī)??梢院苋菀椎財U展:雖然訓練神經(jīng)網(wǎng)絡可能需要部署大量資源,但是只需要部署一次就可以了,然后,訓練好的神經(jīng)網(wǎng)絡可以復制到推理加速器集群中去執(zhí)行。所以,對于和訓練同樣重要的推理,潛在客戶需要的推理加速器數(shù)量要遠大于訓練用處理器。
與此同時,盡管高通公司沒有明確喊話,但是很明顯,它正打算顛覆市場領導者英偉達,英偉達已經(jīng)用自己的AI處理器建立了一個小型的人工智能帝國。目前,英偉達的特斯拉T4/P4/P40加速器構(gòu)成了數(shù)據(jù)中心AI推理處理器世界的支柱,從財報上來看,來自數(shù)據(jù)中心的收入是英偉達整體營收中利潤率很高的板塊。因此,即使整個數(shù)據(jù)中心市場沒有像之前預期的速度和規(guī)模增長,這依然是一塊非常有利可圖的業(yè)務。
加入這個戰(zhàn)局,高通還必須時刻牢記來自英特爾的威脅。英特爾公開表達了自己的人工智能計劃,從低功耗的Movidius加速器到最新的Cascade Lake Xeon可擴展CPU,英特爾有幾個不同的AI產(chǎn)品系列計劃。不過,具體到高通公司想要進入的數(shù)據(jù)中心AI推理加速器市場而言,來自英特爾最大的威脅可能是它即將推出的Xe GPU,這些GPU來自英特爾最近剛剛重建的GPU部門。和高通一樣,英特爾也在對英偉達發(fā)起挑戰(zhàn),因為人工智能推理市場上的競爭對手們沒有一個希望失敗。
努力落地
高通公司只是表達勃勃的雄心遠遠不夠,在接下來的12個月內(nèi),它的重點將是發(fā)展第一批客戶。要做到這一點,高通必須證明,它對于云AI 100系列所做的所有事情都是極其認真的,它的硬件拿得出手,而且還能提供可以與競爭對手的軟件生態(tài)系統(tǒng)PK的易用軟件。所有這一切都不容易,所以高通公司需要從現(xiàn)在開始努力,以兌現(xiàn)吹過的牛逼。
多年來,高通公司一直對服務器和數(shù)據(jù)中心市場抱有各種各樣的夢想,但是都是“過于雄心勃勃”。比如,高通公司在2017年大張旗鼓地宣布將突出基于ARM的服務器CPU-Centriq系列,結(jié)果整個項目在一年內(nèi)就遭遇了滑鐵盧。高通公司的Centriq雖然失敗了,但是它的另外兩個拳頭產(chǎn)品-移動處理器和調(diào)制解調(diào)器-都是非常強悍的存在。為了讓數(shù)據(jù)中心運營商們信任并敢于使用云AI 100系列,高通公司不僅需要為其第一代產(chǎn)品制定一個偉大的計劃,還需要為未來幾代產(chǎn)品制定可以執(zhí)行落地的計劃。
在這個年輕、不斷增長的推理加速器市場中,數(shù)據(jù)中心運營商也愿意嘗試CPU之外的新處理器。所以,我們沒有理由認為高通的云AI 100系列肯定不會取得成功,但是,高通公司要說服在其它方面依然謹慎的數(shù)據(jù)中心運營商,它就必須在其產(chǎn)品上投入更多的資源。
除了器件本身,軟件層面同樣重要。英偉達在人工智能領域取得的巨大成功在很大程度上應該歸功于他們的人工智能軟件生態(tài)系統(tǒng),該生態(tài)系統(tǒng)本身就是自己十年前的CUDA生態(tài)系統(tǒng)的擴展,CUDA生態(tài)系統(tǒng)讓其在GPU領域的競爭對手AMD被打壓得抬不起頭來。對于高通公司來說,它的優(yōu)勢在于目前已經(jīng)存在最流行的框架、運行時工具。TensorFlow、Caffe2和ONNX都是很不錯的選擇,高通知道這一點,它也有能力實現(xiàn)它,所以它承諾為其AI加速處理器提供廣泛的軟件棧。不過,高通公司必須在軟件棧上加快速度,因為他們的軟件棧實際運行性能如何決定了整個項目的成敗。高通必須提供良好的硬件和軟件組合才能在這個市場上取得成功。
高通公司今天發(fā)布的公告是一個預告片,它宣布了未來一年將要發(fā)生的事情。它制定了一項雄心勃勃的計劃,旨在打入日益增長的人工智能推理加速器市場,并提供和這個開放性的市場上其它任何產(chǎn)品都有所不同的加速器。從預告片到正式上映將會是一個巨大的挑戰(zhàn),但是高通公司是在資金和工程資源方面最有實力的處理器巨頭,所以,高通公司能夠在推理加速器市場上取得多大的成績?nèi)Q于它有多渴求這個市場。它有能力開發(fā)這種處理器,也知道如何避免導致之前的服務器處理器計劃失敗的失誤。
不過,最重要的是,高通公司也不會輕易地攻下推理加速器市場,它必須為之一戰(zhàn)。高通的成功等價于英偉達市場份額的丟失,英偉達肯定不會束手就擒,英特爾也在虎視眈眈,更不用說其他GPU廠商、FPGA供應商和ASIC廠商了。在這個新興技術(shù)主導的年輕市場中,所有參與者都有可能迅速崛起和衰敗。所以,雖然距離2020年還有差不多一年,但是,人工智能加速器市場必將在2020年掀起第一場世界大戰(zhàn)。