寒武紀宣布推出第二代云端AI芯片思元270(MLU270)及板卡產品,目標是提供速度更快、功耗更低、性價比更高的AI加速解決方案。思元270芯片采用TSMC 16nm工藝制造,其板卡產品可以通過PCIe接口快速部署在服務器和工作站內。
寒武紀本次公開的思元270板卡產品面向人工智能推斷任務,在ResNet50上推理性能超過10000fps。MLU270-S4 型板卡(半高半長)面向數(shù)據(jù)中心部署,集成16GB DDR4 內存,支持ECC;MLU270-F4型板卡(全高全長)采用主動散熱設計,面向非數(shù)據(jù)中心部署場景,集成16GB DDR4 內存,支持ECC。面向人工智能訓練任務的思元270訓練版板卡產品將于本年度第四季度推出。
思元270采用寒武紀公司自主研發(fā)的MLUv02指令集,可支持視覺、語音、自然語言處理以及傳統(tǒng)機器學習等高度多樣化的人工智能應用,更為視覺應用集成了充裕的視頻和圖像編解碼硬件單元。思元270芯片處理非稀疏深度學習模型的理論峰值性能提升至上一代MLU100的4倍,達到128TOPS(INT8);同時兼容INT4和INT16運算,理論峰值分別達到256TOPS和64TOPS;支持浮點運算和混合精度運算。
官方表示,寒武紀在定點訓練領域已實現(xiàn)關鍵性突破,思元270訓練版板卡將可通過8位或16位定點運算提供卓越的人工智能訓練性能,該技術有望成為AI芯片發(fā)展的重要里程碑。在系統(tǒng)軟件和工具鏈方面,思元270繼續(xù)支持寒武紀Neuware軟件工具鏈,支持業(yè)內各主流編程框架。此外,為方便開發(fā)者更好地挖掘思元270超強的運算能力、開拓更多的應用領域,寒武紀將在近期向社區(qū)和開發(fā)者開放專用編程語言。
寒武紀的人工智能處理器已經(jīng)在智能手機中大規(guī)模出貨,在云端產品方面,寒武紀去年5月推出第一代云端AI芯片MLU100及板卡于2018年5月發(fā)布。MLU100系列產品已為客戶在智能視頻分析、語音合成、推薦引擎、AI云等多個領域提供了高能效比的解決方案。
寒武紀表示,此次推出中文品牌“思元”是對MLU品牌的有機補充,其含義為“思考的基本單元”。思元商標的字體來自于中國元代書法家趙孟頫。