3 月 14 日消息,英特爾近日發(fā)布公告,分享了關(guān)于 AI 戰(zhàn)略和加速器的更多信息,在更多產(chǎn)品和軟件中整合 AI 元素,更好服務企業(yè)和數(shù)據(jù)中心未來發(fā)展。
加速 AI 布局
在人工智能方面,英特爾開發(fā)了一套完整的企業(yè) AI 堆棧(Enterprise AI stack),使用 OpenVINO、Intel Developer Cloud oneAPI & Synapse 等開源標準,推進硬件、系統(tǒng)、應用的快速發(fā)展。
硬件分為三個分支:數(shù)據(jù)中心(可擴展系統(tǒng)、加速器、CPU)、網(wǎng)絡(開放標準和可配置性、基礎設施)以及 Client & Edge(AI PC、NPU、GPU、CPU)。
Gaudi 2 性價比更高
英特爾表示,在定價方面,Gaudi 2 采用的工藝與英偉達 A100 相同,都是臺積電的 7nm 工藝,但關(guān)鍵區(qū)別在于,在 Stability Diffusion 和生成式 AI 負載方面,Gaudi 2 性能是 A100 的 3 倍,這意味著使用 Gaudi 2 可以比英偉達的 A100 節(jié)省更多成本。
在某些工作負載中,Gaudi 2 硬件的性能也優(yōu)于最新的 H100 GPU,英特爾表示會繼續(xù)擴大這些優(yōu)勢,將在未來繼續(xù)保持領先地位。
Gaudi 3 計劃 2024 年第 3 季度上市
在路線圖方面,英特爾仍將 Gaudi 3 定位為 Gaudi 2 和 Falcon Shores 的后續(xù)產(chǎn)品。英特爾表示,Gaudi 3 加速器目前已進入驗證實驗室,將于 2024 年第 3 季度全面上市。
英特爾表示,在軟件 / 應用方面為 Gaudi 3 構(gòu)建了廣泛的 OEM 生態(tài)系統(tǒng)和英特爾開發(fā)者云網(wǎng)絡,在硬件方面,Gaudi 3 加速器將采用與 Gaudi 2 相同的高性能架構(gòu),不過計算能力是其 4 倍,網(wǎng)絡帶寬是其 2 倍,HBM 內(nèi)存帶寬是其 1.5 倍。
Falcon Shores 計劃 2025 年上市
Falcon Shores 是首個專為人工智能工作負載設計的 GPU 架構(gòu)。它將 Gaudi 人工智能 IP 和英特爾 GPU 技術(shù)的精華結(jié)合到一個融合產(chǎn)品中。Falcon Shores 的開發(fā)工作進展順利,目標是在 2025 年推出。
3-5 行代碼就能實現(xiàn)模型遷移
AI 開發(fā)人員的一個主要擔憂是,遷移到新硬件會帶來一些問題,例如修改代碼以支持新的加速器。根據(jù)英特爾的說法,大多數(shù)開發(fā)人員都在堆棧的高層(Hugging Face、Mosiac ML、PyTorch 等)上工作,利用英特爾的軟件解決方案,他們只需在 Python 腳本中添加幾行代碼,就能遷移現(xiàn)有模型或新模型。
英特爾的 "模型遷移" 只需 3-5 行代碼即可將現(xiàn)有模型或新模型遷移到新硬件上。對于高級軟件,英特爾提供從英偉達到整個 Gaudi 甚至下一代獵鷹海岸加速器陣容的遷移支持。
該公司還在努力增加底層模型,如 OpenAPI、Triton 和 TPC-C,以便從英偉達?(NVIDIA?)硬件遷移到 Falcon Shores GPU 時獲得支持。
將推出中國提供版 Gaudi 硬件
英特爾表示在完全遵守美國當局的規(guī)定前提下,針對中國市場定制 Gaudi 硬件,以便可以出口到中國市場。