《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > 英偉達(dá)對華特供的H20RTX4090D將受限新規(guī)則

英偉達(dá)對華特供的H20RTX4090D將受限新規(guī)則

2024-04-02
來源:快科技
關(guān)鍵詞: 英偉達(dá) H20 RTX4090D 對華特供

近年來,美方持續(xù)升級(jí)相關(guān)AI芯片的對華出口,即便是AI芯片龍頭英偉達(dá)推出符合要求的針對中國市場的“特供版”產(chǎn)品,也是一再遭到限制。

早在2022年10月,美國首次正式推出限制AI芯片對華出口的政策,要求ECCN 3A090、4A090類目下的高性能計(jì)算設(shè)備、芯片及組件,如果“同時(shí)滿足以下兩個(gè)條件的即為受管制的高性能計(jì)算芯片:

(1)芯片的I/O帶寬傳輸速率大于或等于600 Gbyte/s;(2)數(shù)字處理單元/原始計(jì)算單元每次操作的比特長度乘以TOPS 計(jì)算出的算力之和大于或等于4800TOPS?!?/p>

此舉,直接導(dǎo)致了英偉達(dá)的A100、H100等高性能AI芯片無法對華出口。隨后,英偉達(dá)為了挽回中國市場,針對中國市場推出了符合美國限制政策的AI芯片:A100和A800,主要是降低了互聯(lián)速率。

但是,在2023年10月17日,美國政府又推出了新的限制規(guī)則,進(jìn)一步收緊了限制范圍:

(1)ECCN 3A090a針對最高性能芯片,集成電路中包含一個(gè)或多個(gè)處理單元達(dá)到以下任一標(biāo)準(zhǔn):a) 綜合運(yùn)算性能(Total Processing Performance,TPP)達(dá)到4800,或b) 綜合運(yùn)算性能達(dá)到1600,同時(shí)“性能密度”(Performance Density,PD)達(dá)到5.92。

(2)ECCN 3A090b針對次高性能芯片,集成電路中包含一個(gè)或多個(gè)處理單元達(dá)到以下任一標(biāo)準(zhǔn):a) 綜合運(yùn)算性能達(dá)到2400但低于4800,性能密度達(dá)到1.6但低于5.92;b) 綜合運(yùn)算性能達(dá)到1600,性能密度達(dá)到3.2但低于5.92。

但凡只要在上述兩項(xiàng)性能標(biāo)準(zhǔn)范圍內(nèi)的美國芯片都將會(huì)受到限制。這也直接導(dǎo)致了英偉達(dá)針對中國市場推出的A100和A800芯片的對華出口受限,英偉達(dá)在A100和A800這兩款芯片上的投資也是損失不小。此外,英偉達(dá)L40S、高端顯卡RTX 4090等產(chǎn)品也受到了限制。

不過,英偉達(dá)依舊不甘心放棄中國這個(gè)龐大的AI芯片市場。于是在去年四季度,英偉達(dá)又針對中國市場開發(fā)出了符合美國最新限制政策的四款A(yù)I芯片,包括 HGX H20、L20 PCle 和 L2 PCle。同時(shí)還開發(fā)了符合新規(guī)的高端顯卡RTX 4090 D。

1.jpg

從公布的參數(shù)來看,其中最強(qiáng)的H20的FP16、INT8等主要算力參數(shù)僅為A100的不足1/2,更是僅為H100的約1/7;L20的主要算力參數(shù)則相較于之前的L40、L40S分別下降約1/3、2/3。此前NVIDIA內(nèi)部人士在訪談中也承認(rèn),H20單卡算力僅有H100的20%,相比某國產(chǎn)芯片,其性能也只有其60%多。

此外,RTX 4090 D的核心數(shù)量相較RTX 4090也減少約11%,整體性能或降低了10%!

顯然,英偉達(dá)這些最新針對中國市場定制的產(chǎn)品性能被大幅閹割,使得市場大多對其性能表現(xiàn)、性價(jià)比持悲觀或懷疑態(tài)度。

不過,即便如此,美國方面似乎還是不放心。

近日,美國又公布了將于今年4月4日生效的新的限制規(guī)則,4A003類目下 “數(shù)字計(jì)算機(jī)”、“電子組件”及其相關(guān)設(shè)備和“組件”,對于所有目的地(除EAR第740部分第1號(hào)補(bǔ)充文件國家組E:1或E:2中的國家外),“調(diào)整后峰值性能”(“APP”)超過70 Weighted TeraFLOPS(WT,每秒計(jì)算萬億次浮點(diǎn)運(yùn)算,主要針對GPU性能,CPU和NPU主要提供定點(diǎn)/整數(shù)算力)的計(jì)算機(jī)和4A003.c中所述的“電子組件”都需要許可證(NLR)。

2.png

這里需要補(bǔ)充說明的是,在AI訓(xùn)練方面,通常使用浮點(diǎn)格式FP16和FP32,因?yàn)樗鼈兙哂凶銐蚋叩木?。而在AI推理方面則通常使用整數(shù)數(shù)據(jù)格式INT8和INT4。

也就是說,現(xiàn)有的美國廠商的計(jì)算機(jī)產(chǎn)品或組件,如果其綜合浮點(diǎn)算力超過70 TFLOPS,則需要申請?jiān)S可證才能出口。而這似乎是針對的是英偉達(dá)此前針對中國市場新推出的RTX 4090-D以及H20。

數(shù)據(jù)顯示,RTX 4090-D的FP16/FP32算力為74TFLOPS,H20的TF32算力為74 TFLOPS(L20的FP32/16算力為60TFLOPS不到)。這也意味著,英偉達(dá)RTX 4090-D以及H20對華出口可能需要申請?jiān)S可,至于是否能夠獲批,則可能需要“逐案審查”(case-by-case review)。

雖然也有國內(nèi)媒體報(bào)道稱,該政策可能將會(huì)限制到高性能的AI PC產(chǎn)品。但是,芯智訊認(rèn)為,目前AMD、英特爾、高通、蘋果等廠商所推出的集成了AI內(nèi)核的面向AI PC的處理器,其浮點(diǎn)運(yùn)算能力目前仍比較有限,更多還是提升整數(shù)運(yùn)算能力,并不會(huì)受到新規(guī)限制。

比如英特爾在去年底推出的Meteor Lake芯片(Core Ultra) 基于其AI引擎、NPU、CPU和GPU,可提供34TOPS(注意不是FLOPS)的算力。

不過,以上只是筆者對于該規(guī)則的解讀。目前英偉達(dá)官方面尚未有相關(guān)信息公布。芯智訊也有咨詢英偉達(dá)中國區(qū)相關(guān)負(fù)責(zé)人,但對方并未對此進(jìn)行回應(yīng)。

值得注意的是,美國商務(wù)部長雷蒙多在12月2日舉辦的“里根國防論壇”(Reagan National Defense Forum)上曾表示,即便會(huì)讓企業(yè)難做,美國政府仍將持續(xù)修改(change constantly)先進(jìn)芯片的出口管制,因?yàn)椤翱萍紩?huì)變、對手也會(huì)變,我們必須跟上”。

雷蒙多指出,就算業(yè)者重新設(shè)計(jì)出一款能規(guī)避現(xiàn)有法令的芯片,只要被關(guān)注國家將之用來發(fā)展AI,“我第二天就會(huì)立刻出手控管”(I’m going to control it the very next day)。

針對雷蒙多發(fā)言,英偉達(dá)CEO黃仁勛(Jensen Huang)曾于12月6日在新加坡召開的記者會(huì)上表示,英偉達(dá)一直都在積極配合美國政府,打造符合法規(guī)的產(chǎn)品?!拔覀兇蛩憷^續(xù)配合美國政府,開發(fā)符合新規(guī)定的全新系列產(chǎn)品”。

黃仁勛之前還曾表示,美國對華半導(dǎo)體出口的限制,也進(jìn)一步刺激了中國努力發(fā)展半導(dǎo)體產(chǎn)業(yè)的決心,中國大陸目前已有數(shù)十家公司正在開發(fā)可與英偉達(dá)產(chǎn)品競爭的技術(shù),這對英偉達(dá)在中國市場的發(fā)展也很不利。過去多年來,中國市場約占英偉達(dá)營收的20%。


雜志訂閱.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。