11月3日,據(jù)官方消息披露,寒武紀(jì)正式發(fā)布第三代云端AI芯片思元370。據(jù)介紹,思元370基于7nm工藝打造,也是寒武紀(jì)首款采用Chiplet(小芯片or芯粒)技術(shù)的AI芯片。思元370集成了390億個(gè)晶體管,最大算力高達(dá)256TOPS(INT8),是寒武紀(jì)第二代產(chǎn)品思元270算力的2倍。
官方表示,憑借寒武紀(jì)最新智能芯片架構(gòu)MLUarch03,相較于峰值算力的提升,思元370實(shí)測(cè)性能表現(xiàn)更為優(yōu)秀。
以ResNet-50為例,MLU370-S4加速卡(半高半長(zhǎng))實(shí)測(cè)性能為同尺寸主流GPU的2倍。MLU370-X4加速卡(全高全長(zhǎng))實(shí)測(cè)性能與同尺寸主流GPU相當(dāng),能效則大幅領(lǐng)先。
值得一提的是,思元370也是國(guó)內(nèi)第一顆支持LPDDR5內(nèi)存的云端AI芯片,內(nèi)存帶寬是上一代產(chǎn)品的3倍,訪存能效達(dá)GDDR6的1.5倍。
解碼方面,思元370支持132路1080p視頻解碼或10路8K視頻解碼。
編碼上,全新編碼器通過靈活的碼率優(yōu)化(RDO)控制、多參考幀、二次編碼等特性組合,在相同圖像質(zhì)量(全高清視頻PSNR)的情況下比上一代產(chǎn)品節(jié)省42%帶寬,有效降低帶寬成本。
從云端推理思元270、邊緣推理思元220、云端訓(xùn)練思元290,到最新發(fā)布的推訓(xùn)一體思元370,寒武紀(jì)為用戶提供了覆蓋不同場(chǎng)景、不同算力規(guī)模的全系列產(chǎn)品。此次發(fā)布的256TOPS算力的思元370主要面向中高端推訓(xùn)場(chǎng)景,與主要面向訓(xùn)練的512TOPS高端產(chǎn)品思元290形成協(xié)同,共同為客戶提供全功能、全場(chǎng)景的智能算力。
思元370在2020年三季度流片,相關(guān)加速卡產(chǎn)品于2021年二季度陸續(xù)送測(cè)客戶。目前,部分客戶已完成測(cè)試、導(dǎo)入,產(chǎn)品進(jìn)入早期銷售階段。
日前寒武紀(jì)發(fā)布了2021第三季度業(yè)績(jī)報(bào)告。2021年前三季度,寒武紀(jì)營(yíng)業(yè)收入2.22億元,同比增長(zhǎng)41.19%;研發(fā)投入合計(jì)7.04億元,同比增加62.62%,研發(fā)投入占營(yíng)業(yè)收入的比例為316.72%,同比增加41.74%。