《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動態(tài) > AI推理性能最高提升20倍,IBM首款7nm商用處理器POWER10面世

AI推理性能最高提升20倍,IBM首款7nm商用處理器POWER10面世

2020-08-18
來源:機(jī)器之心
關(guān)鍵詞: 7nm AI IBM POWER10

微信圖片_20200818170037.png

  歷時 5 年,制程由 14nm 減至 7nm,更加重視 AI 推理性能,IBM 最新 POWER10 處理器將在商用領(lǐng)域打出一片天地。

  在今年的 Hot Chips 2020 會議上,IBM 正式宣布了新一代 CPU POWER10。作為 Power 9 的繼任者,POWER10 的處理效率是前者的三倍,同時又提供了更高的工作負(fù)載量和容器密度。

  基于 Power 9 處理器并使用 Nvidia Tesla GPU 作為加速器的 Summit,就是世界上最快的超級計算機(jī)之一。目前看來,繼任者 POWER10 更加值得期待。

  POWER10 的設(shè)計歷時五年,擁有數(shù)百項新型以及正在申請的專利。早在 2015 年,IBM、三星和 IBM 研究聯(lián)盟的其他成員生產(chǎn)了第一批測試芯片。它的獨(dú)特之處在于,這是 IBM 的首款商用 7 nm 處理器。

  POWER10 架構(gòu)師 William Starke 表示,單芯片模塊產(chǎn)品最多不超過 15 個 SMT8 核心,雙芯片模塊產(chǎn)品最多不超過 30 個 SMT8 核心。

  IBM POWER 系列芯片的發(fā)展路線圖。

  制程由 14nm 縮減至 7nm,更加重視 AI 推理性能

  吞吐量和功率效率的提升部分得益于硅制程技術(shù),該技術(shù)使得 POWER9 中使用的 14nm GlobalFoundries 制程縮減為三星的 7nm EUV。制程微縮使得 IBM 可以添加更多的核心和更多的緩存。

  設(shè)計方法也有重大更改。新的設(shè)計更加模塊化,具有新的核心核心微架構(gòu)和新的 AI 指令。POWER10 還添加了更多的安全硬件。內(nèi)存受到全內(nèi)存加密保護(hù),同時也沒有降低速度。

  此外,POWER10 還為多租戶(multi-tenant)云工作負(fù)載內(nèi)置了「嘈雜的鄰居(noisy neighbor)」保護(hù)功能。為了確保云工作負(fù)載的安全性,處理器支持安全的 container。該架構(gòu)通過其 PowerVM 虛擬機(jī)來管理程序和內(nèi)存池聚合功能,以提升靈活性,通過 PB 級系統(tǒng)內(nèi)存支持來處理各種工作負(fù)載。

  考慮到 AI 越來越重要,IBM 增加了對其他指令和數(shù)據(jù)類型的支持。處理器通過新的可擴(kuò)展指令集支持 Power 的 3.1 版本。POWER10 也意味著 IBM 更加重視 CPU 中的 AI 推理性能。

  IBM 表示,推理處理中使用的矩陣數(shù)學(xué)函數(shù)可將性能提升 10-20 倍。緩存帶寬上也有改進(jìn),以使 SIMD 單元獲得數(shù)據(jù)。

  越來越多的企業(yè)將 AI 部署到實(shí)際應(yīng)用 AI 的運(yùn)營工作負(fù)載中。所以,IBM 仍將支持訓(xùn)練加速器,例如 GPU 和 FPGA,但 AI 部署基于的推理使用的是訓(xùn)練創(chuàng)建的模型。

  實(shí)際上,AI 的推理用途是能夠產(chǎn)生商業(yè)實(shí)效的。IBM 將在 PCIe5.0 版本上通過 OpenCAPI 支持加速器。IBM 也放棄了英偉達(dá)的 NVLink 接口,因為 PCIe v5 提供了足夠的帶寬。

  POWER10 的推理性能展示。

  其他技術(shù)細(xì)節(jié)

  IBM 在 Hot Chips 會議上展示了 POWER10 的大量技術(shù)細(xì)節(jié)。芯片面積為 600 平方毫米,具有 180 億個晶體管。最多兩個管芯可以被放入 POWER10 服務(wù)器的包中。

  每個芯片具有 15 個活躍的 CPU 核,其中管芯上還有一個用于提升成品率的備用核。此外,每個 CPU 可以支持 8 個線程(虛擬 CPU),所以每個插槽中共計有 120 個線程。

  管芯上緩存內(nèi)存總量為 150MB 以上。在接口設(shè)置上,下一代 PCI Express Gen 5 具有 64 條通路,傳輸速度高達(dá) 32GT/s。

  IBM POWER10 芯片的技術(shù)規(guī)格細(xì)節(jié)。

  POWER10 將會有兩個版本。一個版本采用雙管芯封裝,時鐘頻率達(dá)到 3.5GHz,并且能夠連接 4 個插槽。另一版本為單芯片插槽,有更高的時鐘頻率,為 4GHz 或更高,最多可連接 16 個插槽。每個插槽的 PowerAXON 接口都支持超過 TB/s 級的帶寬,而開放式內(nèi)存接口(OMI)可以支持相同的帶寬。

  POWER10 最重要的創(chuàng)新就是它能在整個 POWER 服務(wù)器機(jī)架上聚合內(nèi)存。本地內(nèi)存通過低延遲、高帶寬的 OMI 進(jìn)行連接,從而提供高達(dá) 4TB 的內(nèi)存以及高帶寬,而且沒有一般高帶寬內(nèi)存的限制和費(fèi)用。OMI 還可被用于連接存儲類內(nèi)存(SCM)。

  PowerAXON 接口可用于連接其他 16 個 POWER10 插槽,但也可以通過 OpenCAPI 連接到加速器。但它最有趣的用途是內(nèi)存集群。本地處理器可以將其本地內(nèi)存映射到相鄰的處理器,因此需要更多內(nèi)存的工作負(fù)載可以用相鄰處理器的內(nèi)存,而無需將頁面交換到速度較慢的存儲內(nèi)存中。這種靈活性對于管理大型數(shù)據(jù)集來說至關(guān)重要。2PB 的地址空間使之變?yōu)榱丝赡?,而且這種內(nèi)存共享功能也可以擴(kuò)展到企業(yè)級系統(tǒng)。

  從 CPU 設(shè)計到軟件堆棧,POWER10 都展示出了 IBM 一直以來的企業(yè)級計算傳統(tǒng)。更重要的是,它現(xiàn)在支持更多的 AI 功能、硬件輔助虛擬環(huán)境、更具擴(kuò)展性的云部署以及更大的數(shù)據(jù)集處理,使其與現(xiàn)代企業(yè)和云工作負(fù)載更加相關(guān)。

  與此前的 Power 系列處理器一樣,POWER10 也向 OpenPower 基金會的 250 多個成員開放許可和允許修改,包括谷歌、英偉達(dá)、Mellanox、 Tyan 等企業(yè)。

 


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。