8月17日消息,當(dāng)下,幾乎所有軟件巨頭們都在大力投入AI推理業(yè)務(wù)。近日,大摩(摩根士丹利)的一份重磅報(bào)道顯示,AI推理原來是一門利潤驚人的生意。而選擇不同的AI GPU芯片,利潤率也差距非常大。
但總體來看,一座標(biāo)準(zhǔn)的“AI推理工廠”,無論采用哪家巨頭的芯片,其平均利潤率普遍超過50%。
據(jù)悉,摩根士丹利首創(chuàng)了一套標(biāo)準(zhǔn)化分析框架,即“100MW AI工廠模型”,將不同技術(shù)路徑的AI解決方案,置于同一商業(yè)維度下進(jìn)行量化評(píng)估。
毫無懸念,NVIDIA的GB200 NVL72以近78%的利潤率遙遙領(lǐng)先。據(jù)悉,這主要得益于其領(lǐng)先的計(jì)算性能以及CUDA軟件生態(tài)的深厚壁壘,展現(xiàn)出了絕對(duì)的市場一哥的統(tǒng)治力。
谷歌自研的TPU v6e pod以74.9%的利潤率排名第二,AWS(亞馬遜云)的Trn2 UltraServer取得了62.5%的利潤率,而華為的昇騰CloudMatrix 384平臺(tái)也取得了47.9%的利潤率。
AMD的MI300X和MI355X意外遭遇滑鐵盧,利潤率竟然為負(fù),分別為-28.2%和-64%。
報(bào)告指出,雖然AMD前期投入很大,但其token產(chǎn)出效率所能創(chuàng)造的收入,遠(yuǎn)不足以覆蓋其高昂的成本。
本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。