其關鍵在于選擇、開放性和規(guī)模
Jeff McVeigh,英特爾副總裁兼超級計算事業(yè)部總經(jīng)理
高性能計算(HPC)代表了當今技術的頂峰,現(xiàn)代一些最重要的發(fā)現(xiàn)都借助了這些先進的機器?,F(xiàn)在,我們正站在新一代高性能計算的入口處,其技術的可擴展性和普遍性能夠為我們的生活帶來翻天覆地的變化。
這一點在抗擊新冠肺炎疫情中表現(xiàn)得最為明顯。疫情爆發(fā)之初,科研機構就在研究實驗室以及“高性能計算即服務”的云環(huán)境中利用這些先進的超級計算機,來監(jiān)測、研究、治療新冠病毒,并運用此項技術開發(fā)了用于治療新冠肺炎的藥物。人們正以驚人的速度逐步實現(xiàn)這些目標,這離不開高性能計算技術的廣泛應用。
其實在迎來E級運算時代之際,我們才剛剛起步。現(xiàn)階段,超級計算已經(jīng)推動了科學探索的發(fā)展,并能夠幫助解決氣候變化和慢性病治療等關鍵問題。未來,它將有助于解決我們尚未遇到、甚至無法想象的問題和危機。
英特爾的目標是普及高性能計算并實現(xiàn)高性能計算普及化。為此,我們必須擁抱各種技術,以實現(xiàn)數(shù)量級的性能提升、轉變高性能計算的可訪問性并重新思考我們?nèi)绾螛嫿檫@些系統(tǒng)提供動力的組件。基于此,我們以性能、開放性和規(guī)模作為策略基礎。
性能:從無所不在的計算架構開始
x86架構是當今高性能計算的發(fā)動機,為絕大多數(shù)系統(tǒng)提供動力。龐大的安裝量使開發(fā)人員和客戶能夠訪問世界上最大的生態(tài)系統(tǒng)以支持和部署高性能計算工作負載。x86 架構還提供了始終如一的代際性能提升。
現(xiàn)有的這一代英特爾?至強?可擴展處理器已被我們的高性能計算生態(tài)系統(tǒng)合作伙伴廣泛采用,而下一代英特爾至強可擴展處理器Sapphire Rapids也增加了新功能,目前也作為樣品正提供給客戶進行測試。Sapphire Rapids為高性能計算生態(tài)系統(tǒng)提供多種功能,首次封裝了能夠充分利用Sapphire Rapids多單元架構的高帶寬內(nèi)存HBM2e。Sapphire Rapids還帶來了增強的性能、新的加速器、PCIe 5.0和其他針對人工智能、數(shù)據(jù)分析和高性能計算負載而優(yōu)化的新功能。
高性能計算負載發(fā)展迅猛。它們變得更加多樣化、專有化,也同時需要混合的異構架構。盡管x86架構仍然是標量負載的動力來源,但如果要想實現(xiàn)數(shù)量級的性能提升并進一步超越E級運算時代,就必須以批判性的思維來審視高性能計算負載在矢量、矩陣和空間架構中的運行方式,并且必須確保這些架構能夠無縫地協(xié)同配合。
英特爾已經(jīng)采用了“整體工作負載”策略,即針對特定負載的加速器和圖形處理器(GPU),無論是硬件還是軟件,都可以與中央處理器(CPU)無縫配合。我們正在通過下一代英特爾至強可擴展處理器和Xe HPC GPU(代號“Ponte Vecchio”)來實施該戰(zhàn)略,它們將用于阿貢國家實驗室的2百億億次級*極光(Aurora)超級計算機。Ponte Vecchio具備最高的單插槽和單節(jié)點計算密度,利用我們先進的封裝技術即嵌入式多芯片互連橋接(EMIB)和Foveros封裝了47個單元。Ponte Vecchio上運行著100多個高性能計算應用。我們還與包括ATOS、戴爾、惠普、聯(lián)想、浪潮、Quanta以及超微在內(nèi)的合作伙伴和客戶合作,在他們最新的超級計算機上安裝部署Ponte Vecchio處理器。
通過開放性實現(xiàn)高性能計算的普及
要想真正普及高性能計算并實現(xiàn)高性能計算普及化,就需要一種開放的協(xié)作方式。英特爾致力于提供基于行業(yè)標準的開放平臺,以此促進廣泛的協(xié)作。我們的目標是推動標準制定并創(chuàng)建關鍵硬件平臺,讓整個行業(yè)團結在一起,在此基礎上進行開發(fā)。
眾所周知,GPU編程由于缺乏適用標準而發(fā)展受阻。因此自從GPU進入高性能計算領域以來,行業(yè)就面臨著CPU和GPU各有一個獨立的軟件堆棧的挑戰(zhàn),而oneAPI編程模式則試圖打破這些孤島。
oneAPI是一種開放、統(tǒng)一的跨架構編程模式,適用于CPU、GPU和諸如FPGA等的加速器架構,能夠允許異構計算環(huán)境的編程,所有這些都使用一個代碼庫和軟件堆棧。如此一來,開發(fā)人員只需跨架構編程一次,而且客戶也不會受制于某個單獨的供應商。
下個月,我們將發(fā)布英特爾? oneAPI 2022工具包。相比于去年12月份發(fā)布的oneAPI 2021版本,該款新的工具包增加了900多項新功能。通過第一個統(tǒng)一的C++/SYCL/Fortran 編譯器和數(shù)據(jù)并行Python,即將發(fā)布的版本增加了面向CPU和GPU的跨架構開發(fā)功能。今天,我們還宣布建立另外兩個oneAPI卓越中心,加入由領先的科研學術機構組成的蓬勃發(fā)展的全球生態(tài)系統(tǒng),提供開源端口并擴展硬件支持、新技術、服務和課程,以推動oneAPI在生態(tài)系統(tǒng)內(nèi)部的普及。
我們深知,要想真正普及高性能計算,還有很多工作有待完成?,F(xiàn)階段我們正在做的事將使人們能夠在未來隨時隨地利用最新的高性能計算技術。
大規(guī)模制造:英特爾的IDM 2.0戰(zhàn)略
高性能計算普及化需要規(guī)模效應。英特爾致力于提供推動創(chuàng)新和增長所需的組件和技術。通過英特爾IDM 2.0戰(zhàn)略的差異化優(yōu)勢,我們能夠帶領高性能計算客戶進入創(chuàng)新、制造和產(chǎn)品領先的新時代。
我們正在快速執(zhí)行為期多年的 IDM 2.0戰(zhàn)略,這對我們的高性能計算客戶來說,是個大好消息,因為我們能夠利用行業(yè)領先的制造能力以及我們在封裝技術方面的領先地位來設計最好的產(chǎn)品,并使用最好的IP,提供下一個超級計算機時代所需的產(chǎn)品。
我們堅定不移地致力于實現(xiàn)高性能計算普及化這一承諾,為此我們也持續(xù)投入以推動技術進步來解決最棘手的問題。
當我們越來越接近新一代超級計算機的時候,我們能取得哪些成就?我無比期待答案的揭曉。
Jeff McVeigh是英特爾公司副總裁兼超級計算事業(yè)部總經(jīng)理
1 巔峰性能