12 月 3 日消息,據(jù)阿里云官方微信公眾號發(fā)布,阿里達(dá)摩院成功研發(fā)出存算一體芯片。這是全球首款基于 DRAM 的 3D 鍵合堆疊存算一體芯片。該芯片突破了馮?諾依曼架構(gòu)的性能瓶頸,滿足人工智能等場景對高帶寬、高容量內(nèi)存和極致算力的需求。在特定 AI 場景中,該芯片性能提升 10 倍以上,效能比提升高達(dá) 300 倍。
為了拉近計算資源和存儲資源的距離,達(dá)摩院計算技術(shù)實驗室創(chuàng)新性采用混合鍵合 (Hybrid Bonding) 的 3D 堆疊技術(shù)進(jìn)行芯片封裝 —— 將計算芯片和存儲芯片 face-to-face 地用特定金屬材質(zhì)和工藝進(jìn)行互聯(lián)。
相比業(yè)內(nèi)常見的封裝方案 HBM,混合鍵合 3D 堆疊技術(shù)擁有高帶寬、低成本等特點,被認(rèn)為是低功耗近存計算的完美載體之一;內(nèi)存單元采用異質(zhì)集成嵌入式 DRAM ,擁有超大內(nèi)存容量和超大帶寬優(yōu)勢。
在計算芯片方面,達(dá)摩院研發(fā)設(shè)計了流式的定制化加速器架構(gòu),對推薦系統(tǒng)進(jìn)行“端到端”加速,包括匹配、粗排序、神經(jīng)網(wǎng)絡(luò)計算、細(xì)排序等任務(wù)。
這種近存架構(gòu)有效解決了帶寬受限的問題,最終內(nèi)存、算法以及計算模塊的完美融合,大幅提升帶寬的同時還實現(xiàn)了超低功耗,展示了近存計算在數(shù)據(jù)中心場景的潛力。
達(dá)摩院表示,最終的測試芯片顯示,這種存算技術(shù)和架構(gòu)的優(yōu)勢顯著,能通過拉近存儲單元與計算單元的距離增加帶寬,降低數(shù)據(jù)搬運(yùn)的代價,緩解由于數(shù)據(jù)搬運(yùn)產(chǎn)生的瓶頸,而且與數(shù)據(jù)中心的推薦系統(tǒng)對于帶寬/內(nèi)存的需求完美匹配。
目前,該芯片的研究成果已被芯片領(lǐng)域頂級會議 ISSCC 2022 收錄。