Xilinx 推出史上最強大加速器卡 Alveo U55C ,專為 HPC 與大數(shù)據(jù)工作負(fù)載打造
2021-11-18
來源:Xilinx
2021 年 11 月 16 日,中國北京———自適應(yīng)計算的領(lǐng)先企業(yè)賽靈思公司(Xilinx, Inc.,(NASDAQ: XLNX))今日在全球超級計算大會( SC21 )上宣布,推出 Alveo? U55C 數(shù)據(jù)中心加速器卡,以及一款基于標(biāo)準(zhǔn)、API-driven 的集群解決方案,用于大規(guī)模部署 FPGA。Alveo U55C 加速器可為高性能計算( HPC )和數(shù)據(jù)庫工作負(fù)載提供卓越的單位功耗性能,同時還能通過賽靈思? HPC 集群解決方案簡便擴展。
圖:Xilinx Alveo U55C 加速器卡
全新Alveo U55C 卡專為 HPC 和大數(shù)據(jù)工作負(fù)載而構(gòu)建,是賽靈思史上最強大的 Alveo 加速器卡,能夠提供 Alveo 加速器產(chǎn)品系列中的最高計算密度和 HBM 容量。結(jié)合賽靈思基于 RoCE v2 的全新集群解決方案,可令運行大規(guī)模計算工作負(fù)載的各類客戶大獲裨益,支持其利用現(xiàn)有數(shù)據(jù)中心基礎(chǔ)架構(gòu)和網(wǎng)絡(luò),實現(xiàn)強大的基于 FPGA 的 HPC 集群。
賽靈思執(zhí)行副總裁兼數(shù)據(jù)中心事業(yè)部總經(jīng)理 Salil Raje 表示:“現(xiàn)在,針對目標(biāo) HPC 工作負(fù)載擴展 Alveo 計算能力比以往更簡單、更高效、更強大。在架構(gòu)層面,以 Alveo 卡為代表的 FPGA 加速器,能夠以最低成本為眾多計算密集型工作負(fù)載提供最高性能。我們引入了基于標(biāo)準(zhǔn)的方法,其支持利用客戶的現(xiàn)有基礎(chǔ)架構(gòu)和網(wǎng)絡(luò)創(chuàng)建 Alveo HPC 集群。借助這一方法,我們正將這些主要優(yōu)勢大規(guī)模應(yīng)用于任意數(shù)據(jù)中心。這是實現(xiàn) Alveo 和自適應(yīng)計算在數(shù)據(jù)中心更廣泛應(yīng)用的一次重大飛躍。”
專為 HPC 和大數(shù)據(jù)應(yīng)用打造
Alveo U55C 卡融合了當(dāng)前 HPC 工作負(fù)載所需的眾多關(guān)鍵特性。它能提供更高的數(shù)據(jù)流水線并行度、卓越的存儲器管理、優(yōu)化的整個流水線的數(shù)據(jù)遷移,以及 Alveo 產(chǎn)品系列中最高的單位功耗性能。 Alveo U55C 卡采用單插槽、全高半長( FHHL )外形尺寸,最大功耗低至 150W。與前一代雙插槽Alveo U280 卡相比,Alveo U55C 提供了優(yōu)異的計算密度,還將 HBM2 容量翻倍至 16GB。U55C 以更小的外形尺寸提供了更高的算力,有助于創(chuàng)建基于 Alveo 加速器的密集集群。它專為需要性能擴展的高密度流式數(shù)據(jù)、高 I/O 數(shù)學(xué)和大型計算問題而開發(fā),例如大數(shù)據(jù)分析和 AI 應(yīng)用。
圖:Xilinx Alveo U55C 加速器卡
通過利用 RoCE v2 和數(shù)據(jù)中心橋接技術(shù),再結(jié)合 200 Gbps 帶寬,這款 API-driven 的集群解決方案使 Alveo 網(wǎng)絡(luò)可在性能和時延方面媲美 InfiniBand 網(wǎng)絡(luò),且無需對廠商加鎖。MPI (信息傳遞接口)集成功能使 HPC 開發(fā)人員能以賽靈思 Vitis? 統(tǒng)一軟件平臺擴展 Alveo 數(shù)據(jù)流水線。利用現(xiàn)有開放標(biāo)準(zhǔn)和框架,現(xiàn)在能跨數(shù)百張 Alveo 卡上進行性能擴展,無需考慮服務(wù)器平臺和網(wǎng)絡(luò)基礎(chǔ)架構(gòu),同時還能共享工作負(fù)載和存儲器。
借助面向應(yīng)用和集群的高層次編程,軟件開發(fā)者和數(shù)據(jù)科學(xué)家能夠運用 Vitis 平臺,解鎖 Alveo 和自適應(yīng)計算的優(yōu)勢。賽靈思大力投入于 Vitis 開發(fā)平臺和工具流程,旨在令不具備硬件專業(yè)知識的軟件開發(fā)者和數(shù)據(jù)科學(xué)家,也能更容易地使用自適應(yīng)計算。Vitis 平臺支持 Pytorch 和 Tensorflow 等主流 AI 框架,還支持 C、C++ 和 Python 等高層次編程語言,使開發(fā)者能利用特定 API 和庫來構(gòu)建領(lǐng)域解決方案,或者使用賽靈思軟件開發(fā)套件,從而在現(xiàn)有數(shù)據(jù)中心內(nèi)輕松加速關(guān)鍵 HPC 工作負(fù)載。
HPC 客戶用例
CSIRO 是澳大利亞的國立研究機構(gòu),擁有全球最大的射電天文望遠鏡天線陣列。CSIRO現(xiàn)正使用 Alveo U55C 卡,用于其平方公里陣列( Square Kilometer Array )射電望遠鏡的信號處理。將 Alveo 卡部署為配備 HBM 的網(wǎng)絡(luò)附加加速器,能夠在整個 HPC 信號處理集群中實現(xiàn)大規(guī)模吞吐量。基于 Alveo 加速器的集群使 CSIRO 能夠處理海量計算任務(wù),從 13.1 萬根天線中實時聚合、過濾、準(zhǔn)備和處理數(shù)據(jù)。420 張 Alveo U55C 卡通過支持 P4 語言的 100Gbs 交換機實現(xiàn)完全聯(lián)網(wǎng),在整個信號處理集群中提供了 460GBs 的 HBM2 帶寬。Alveo U55C 集群的處理性能可達 15Tb/s 的總吞吐量,功耗更低且更具成本效益,顯著節(jié)省了成本。CSIRO 現(xiàn)正完成一項 Alveo 參考設(shè)計,以助力其他射電天文學(xué)或相鄰產(chǎn)業(yè)獲得同樣的成功。
圖:Xilinx Alveo U55C 加速器卡
Ansys LS-DYNA 碰撞仿真軟件幾乎用于全球所有的汽車公司。安全性和結(jié)構(gòu)系統(tǒng)的設(shè)計往往取決于模型性能,因其能以計算機輔助設(shè)計有限元方法( FEM )仿真來降低物理碰撞測試的成本。FEM 求解器是驅(qū)動具備數(shù)億個自由度仿真的主要算法,而這些龐大的算法可以細(xì)分為更基本的求解器,如 PCG、稀疏矩陣、ICCG。與 x86 CPU 相比,利用超并行數(shù)據(jù)流水線在大量 Alveo 卡上進行性能擴展,LS-DYNA 能夠?qū)崿F(xiàn)超過 5 倍的性能加速。這能在一個 Alveo 流水線中提高單位時鐘周期的工作效率,令 LS-DYNA 客戶受益于突破性的仿真時間。
Ansys 戰(zhàn)略合作伙伴總監(jiān) Wim Slagter 表示:“秉持不懈創(chuàng)新的精神,我們很高興與賽靈思展開合作,在我們的 LS-DYNA 仿真應(yīng)用中大幅加速有限元求解器,表征隱式有限元方法 90% 的負(fù)載特性。我們期待在賽靈思加速的助力下,實現(xiàn)支持創(chuàng)新者設(shè)計未來的使命。”
TigerGraph 是一家領(lǐng)先的圖分析平臺提供商,正使用多張 Alveo U55C 卡為兩種最高效算法進行集群與加速,以驅(qū)動基于圖的推薦和集群引擎。對于數(shù)據(jù)科學(xué)家而言,圖數(shù)據(jù)庫可謂一種顛覆性平臺。圖從信息孤島中采集數(shù)據(jù)并重點關(guān)注數(shù)據(jù)間的關(guān)系。圖領(lǐng)域的下一個前沿是實時查找答案。Alveo U55C 將推薦引擎的查詢和預(yù)測時間從數(shù)分鐘縮短至數(shù)毫秒。與基于 CPU 的集群相比,使用多張 U55C 卡擴展分析所提供的出色計算能力和存儲器帶寬,可將圖查詢速度提升高達 45 倍。質(zhì)量評分也提升高達 35%,從而顯著提升置信度,將誤報幾率降至低個位數(shù)。
產(chǎn)品供貨與輕松評估
Alveo U55C 卡目前可通過 China.xilinx.com 和賽靈思授權(quán)分銷商購買。該產(chǎn)品還可通過基于公有云的 FaaS( FPGA-as-a-Service,F(xiàn)PGA 即服務(wù) )供應(yīng)商進行簡便評估,也可以通過選定的托管數(shù)據(jù)中心進行專屬預(yù)覽。集群解決方案現(xiàn)已提供專屬預(yù)覽,預(yù)計將于明年第二季度全面問世。
賽靈思將于本周舉辦的全球超級計算大會( SC21 )上展示 Alveo U55C 加速器卡及合作伙伴解決方案。歡迎注冊 SC21,訪問賽靈思虛擬展臺。