《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計 > 業(yè)界動態(tài) > 壁仞科技實現(xiàn)中國首個三種異構(gòu)GPU混訓(xùn)技術(shù)

壁仞科技實現(xiàn)中國首個三種異構(gòu)GPU混訓(xùn)技術(shù)

壁仞+英偉達+其他國產(chǎn)芯片
2024-09-06
來源:快科技

9月5日消息,據(jù)國內(nèi)媒體報道,國產(chǎn)AI芯片公司壁仞科技即將在2024全球AI芯片峰會上,首次公布自主原創(chuàng)的異構(gòu)GPU協(xié)同訓(xùn)練方案HGCT。

據(jù)了解,這將是中國首個三種異構(gòu)芯片混訓(xùn)技術(shù),業(yè)界首次支持3種及以上異構(gòu)GPU混合訓(xùn)練同一個大模型(壁仞GPU+英偉達GPU+其他國產(chǎn)芯片),用一套統(tǒng)一方案支持多種不同型號、不同廠商的GPU,而且一行代碼適配多種框架。

在此之前,AI Infra公司無問芯穹的4+2芯片,最多僅支持2種GPU同時訓(xùn)練。

性能方面,HGCT混訓(xùn)方案的異構(gòu)協(xié)同通信效率大于98%、端到端訓(xùn)練效率90-95%,一舉突破了大模型異構(gòu)算力孤島難題。

可靠性上,目前可以實現(xiàn)千卡集群、千億參數(shù)的自動斷點續(xù)訓(xùn)小于10分鐘,15天連續(xù)訓(xùn)練不中斷,4天連續(xù)訓(xùn)練無故障。

據(jù)悉,壁仞科技正在聯(lián)合客戶、合作伙伴、科研機構(gòu)共同推動異構(gòu)GPU協(xié)同訓(xùn)練生態(tài),包括:中國移動、中國電信、商湯科技、國網(wǎng)智能電網(wǎng)研究院有限公司、上海智能算力科技有限公司、上海人工智能實驗室、中國信息通信研究院等。

公開資料顯示,壁仞科技成立于2019年9月,主要研發(fā)通用 GPU(GPGPU),用于人工智能訓(xùn)練和推理等領(lǐng)域。

2021年3月,壁仞科技完成B輪融資,累計融資額超47億元人民幣

20202年8月,壁仞科技正式發(fā)布首款通用GPU芯片BR100,創(chuàng)下全球算力紀(jì)錄,16位浮點算力達到1000T以上、8位定點算力達到2000T以上,單芯片峰值算力達到PFLOPS級別。

甚至與NVIDIA當(dāng)時4nm 旗艦H100相比,BR100的紙面性能數(shù)據(jù)也毫不遜色。

0.png


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。