12月24日消息,半導(dǎo)體研究機(jī)構(gòu)Semianalysis在進(jìn)行了5個(gè)月的調(diào)查后發(fā)現(xiàn),AMD最新的AI芯片MI300X因?yàn)榇嬖谥卮筌浖毕荩瑢?dǎo)致性能不如預(yù)期,難以撼動(dòng)英偉達(dá)(Nvidia)的市場(chǎng)主導(dǎo)地位。
Semianalysis在研究報(bào)告中指出,雖然MI300X規(guī)格看來(lái)令人印象深刻,擁有192 GB HBM3內(nèi)存,可以提供1,307 TeraFLOPS的FP16精度算力。而英偉達(dá)H100 的算力只有989 TeraFLOPS,只配備了80 GB HBM內(nèi)存,H200也只配備了141 GB HBM內(nèi)存。相比之下,AMD MI300X硬件配置更高,定價(jià)也更便宜,這也意味著MI300X更具性價(jià)比。
但是Semianalysis認(rèn)為,AMD這些優(yōu)勢(shì)卻幾乎發(fā)揮不了多少作用。因?yàn)锳MD MI300X配套的軟件存在缺陷,若大量錯(cuò)誤不能排除,會(huì)讓訓(xùn)練AI模型變成幾乎不可能的任務(wù)。相比之下,英偉達(dá)卻持續(xù)推出全新功能、工具庫(kù)并升級(jí)性能,持續(xù)保持領(lǐng)先。
SemiAnalysis指出,其研究團(tuán)隊(duì)執(zhí)行了大量測(cè)試,當(dāng)中包括GEMM、單節(jié)點(diǎn)訓(xùn)練(single-node training)等,發(fā)現(xiàn)AMD MI300X存在軟件缺陷,其研究團(tuán)隊(duì)必須跟AMD工程師一同修正無(wú)數(shù)軟件缺陷,才能達(dá)到堪用的標(biāo)竿測(cè)試結(jié)果。
SemiAnalysis稱,“AMD產(chǎn)品開(kāi)箱后非常難以操作,需要相當(dāng)大的耐心及努力才能達(dá)到可用的狀態(tài)”。相比之下,英偉達(dá)的AI解決方案開(kāi)箱就能順暢運(yùn)作。
SemiAnalysis還透露,AMD最大云端客戶Tensorwave,必須免費(fèi)提供基于這些GPU實(shí)例的使用時(shí)間,以便于給AMD團(tuán)隊(duì)來(lái)解決軟件問(wèn)題,這實(shí)在瘋狂,畢竟Tensorwave已經(jīng)支付了這些GPU的費(fèi)用。
Semianalysis首席分析師Dylan Patel還通過(guò)社交平臺(tái)X指出,他跟AMD CEO蘇姿豐(Lisa Su)開(kāi)了1.5小時(shí)的會(huì)議,逐一反饋了相關(guān)問(wèn)題。他建議蘇姿豐重金投入軟件開(kāi)發(fā)與測(cè)試,尤其應(yīng)配置數(shù)千顆MI300X芯片來(lái)做自動(dòng)化測(cè)試——跟進(jìn)英偉達(dá)的做法。此外,他還建議蘇姿豐簡(jiǎn)化復(fù)雜的環(huán)境變數(shù),實(shí)施更好的預(yù)設(shè)設(shè)定。“請(qǐng)讓產(chǎn)品開(kāi)箱便可用!”他寫(xiě)道。
蘇姿豐則回應(yīng)稱,感謝Patel具有建設(shè)性的對(duì)話,并坦承AMD軟件方面的不足之處。她表示,“Patel的反饋是個(gè)禮物、即便它很?chē)?yán)苛。AMD已大量投入客戶和工作量?jī)?yōu)化作業(yè),但為支持廣泛的生態(tài)系統(tǒng),尚有許多努力空間。非常感謝大家的回饋。AMD致力打造世界一流的開(kāi)源軟件,2025年有很多計(jì)劃。祝大家佳節(jié)愉快!”