《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 臺(tái)積電的最強(qiáng)武器

臺(tái)積電的最強(qiáng)武器

2023-04-11
來(lái)源:半導(dǎo)體行業(yè)觀察
關(guān)鍵詞: 臺(tái)積電 AI

  說(shuō)到AI伺服器的能耗問(wèn)題,不少半導(dǎo)體業(yè)者的直覺(jué)反應(yīng),就是靠摩爾定律解決不就好了?例如,臺(tái)積剛量產(chǎn)的3納米制程,能耗可以較前一代5納米降三成到三成五。但有趣的是,英偉達(dá)最新、最高階的GPU都不是當(dāng)下臺(tái)積的最先進(jìn)制程。

  「已經(jīng)好幾代都是這樣,」一位資深半導(dǎo)體分析師也觀察到這現(xiàn)象。

  「黃仁勛算盤打得很精,」該分析師說(shuō),主要是近年先進(jìn)制程愈來(lái)愈貴,得到的效能提升卻愈來(lái)愈小,英偉達(dá)寧可等個(gè)兩年,待制程良率穩(wěn)定、價(jià)格下跌再進(jìn)場(chǎng),并選擇將資源投在軟體優(yōu)化、新架構(gòu)上,「效果可能好上10倍,可說(shuō)是本小利多,」該分析師坦言。

  英偉達(dá)能如此好整以暇,一大原因也是其寡占AI市場(chǎng),沒(méi)有導(dǎo)入昂貴新制程的迫切理由。這對(duì)于臺(tái)積的未來(lái)可能是個(gè)警訊。

  首先,去年臺(tái)積高速運(yùn)算業(yè)務(wù)占營(yíng)收比重達(dá)41%,首度超越智能型手機(jī)的39%。

  微信截圖_20230411143057.png微信截圖_20230411143057.png

  業(yè)界都將之視為典范轉(zhuǎn)移。智能型手機(jī)市場(chǎng)已成熟,以AI為首的高速運(yùn)算,將成為未來(lái)臺(tái)積的成長(zhǎng)火車頭。

  但英偉達(dá)對(duì)最先進(jìn)制程的不積極態(tài)度,讓上述說(shuō)法,顯得有點(diǎn)一廂情愿。

  然而,一位英偉達(dá)供應(yīng)商高層告訴《天下》,英偉達(dá)GPU之一H100的技術(shù)重點(diǎn),其實(shí)是在旁邊整顆用臺(tái)積的CoWoS技術(shù),與6顆昂貴的第三代高頻記憶體(HBM3)連接起來(lái)的架構(gòu),每一顆記憶體可擴(kuò)充到80GB、每秒3TB的超高速資料傳輸,讓美國(guó)科技媒體驚呼「怪物」。

  這是「后摩爾時(shí)代」的技術(shù)特征。英偉達(dá)競(jìng)爭(zhēng)者超微的MI300,也有類似架構(gòu)。與此同時(shí),據(jù)臺(tái)灣《電子時(shí)報(bào)》,近期業(yè)界傳出,微軟正在接觸臺(tái)積電供應(yīng)鏈及旗下設(shè)計(jì)公司,希望將臺(tái)積電代工廠的CoWoS封裝技術(shù)用于其自研AI芯片。

  臺(tái)積電CoWoS:10年進(jìn)化5代的封裝技術(shù)

  正如之前所說(shuō),臺(tái)積電根據(jù)中介層(interposer)的不同,將其“CoWoS”封裝技術(shù)分為三種類型。一種是“CoWoS_S(Silicon Interposer)”,它使用硅(Si)襯底作為中介層。這種類型是2011年開(kāi)發(fā)的第一個(gè)“CoWoS”技術(shù),在過(guò)去,“CoWoS”是指以硅基板作為中介層的先進(jìn)封裝技術(shù)。

  另一種是“CoWoS_R(RDL Interposer)”,它使用重新布線層(RDL)作為中介層。

  第三個(gè)是“CoWoS_L(Local Silicon Interconnect and RDL Interposer)”,它使用小芯片(chiplet)和RDL作為中介層。請(qǐng)注意,“本地硅互連”通常被臺(tái)積電縮寫為“LSI”。

  微信截圖_20230411143134.png

  “CoWoS_S”(傳統(tǒng)的“CoWoS”)的橫截面結(jié)構(gòu)示例。是所謂2.5D封裝的代表。通過(guò)在作為中介層的硅基板上形成高密度布線和硅通孔(TSV),可以在硅芯片之間緊密放置并傳輸高速信號(hào)

  繼續(xù)擴(kuò)大中介層面積、晶體管數(shù)量和內(nèi)存容量

  “CoWoS_S”(原“CoWoS”)于2011年開(kāi)發(fā)。這被稱為“第一代(Gen-1)”CoWoS封裝技術(shù)首先是被 Xilinx 的高端 FPGA 采用。其中,Si 中介層的最大尺寸為775mm 2 (25 mm x 31 mm)。它接近一個(gè)掩模版的曝光尺寸(26mm x 33mm)(在 ArF 浸入式光刻機(jī)的情況下)。FPGA 芯片制造技術(shù)是 28 納米 CMOS 工藝。采用該技術(shù)的賽靈思高端FPGA“7V2000T”在“CoWoS_S”中配備了四個(gè)FPGA邏輯芯片。

  在2014年開(kāi)發(fā)的第二代“CoWoS_S”中,硅中介層擴(kuò)大到1150mm2。接近1287mm2,這是1.5分劃板的曝光面積。2015年被賽靈思高端FPGA“XCVU440”采用。它配備了三個(gè) FPGA 邏輯芯片。FPGA 芯片制造技術(shù)是 20 納米 CMOS 工藝。

  在2016年開(kāi)發(fā)的第三代“CoWoS_S”中,雖然Si中介層的尺寸沒(méi)有太大變化,但高速DRAM模塊“HBM”和邏輯首次混合使用。2016年率先被NVIDIA的高端GPU“GP100”采用。在這種封裝下,GPU 芯片和“HBM2”混合在一起。HBM2 是硅片疊層模塊(4 個(gè) DRAM 芯片和 1 個(gè)基片(底部)通過(guò) TSV 連接),“GP100”配備了 4 個(gè)16GB(128Gbit的HBM2 模塊和大容量的DRAM和GPU高速連接。

  在 2019 年開(kāi)發(fā)的第4代“CoWoS_S”中,Si 中介層的尺寸已擴(kuò)大到相當(dāng)于兩個(gè)光罩的曝光面積——大約1700 mm 2。這個(gè)巨大的中介層裝有一個(gè)大型邏輯芯片和 6 個(gè) HBM2。由于一個(gè)HBM2存儲(chǔ)的容量增加到8GB(64Gbit),所以總?cè)萘繛?8GB(384Gbit),是第三代容量的3倍。

微信截圖_20230411143421.png

  要集成的邏輯和內(nèi)存總是很大

  在上文中我們談到,高性能封裝技術(shù)“CoWoS(Chip on Wafer on Substrate)”從首次開(kāi)發(fā)起約10年的時(shí)間內(nèi)推出了多款衍生產(chǎn)品。接下來(lái),讓我們還回顧一下“CoWoS”技術(shù)自 2011 年首次開(kāi)發(fā)以來(lái)的發(fā)展歷程。

  最初的“CoWoS”技術(shù)使用硅(Si)襯底作為中間襯底(中介層)。目前,臺(tái)積電稱這種類型為“CoWoS_S(Silicon Interposer)”。正如第一部分所解釋的,從2011年的第一代到2019年的第四代,CoWoS技術(shù)不斷擴(kuò)大中介層面積、晶體管數(shù)量和內(nèi)存容量。

  微信截圖_20230411143446.png

     中介層原本很大,但現(xiàn)在變得更大了。第一代的面積相當(dāng)于一個(gè)標(biāo)線(775mm2),第二代和第三代的面積相當(dāng)于1.5個(gè)標(biāo)線(1150mm2和1170mm2)。在第 4 代中,它變得更大,達(dá)到了相當(dāng)于兩個(gè)標(biāo)線 (1700mm2 ) 的面積。

  最初,安裝在中介層上的硅芯片是多個(gè)邏輯芯片。從第3代開(kāi)始,它支持邏輯和內(nèi)存的混合加載。它現(xiàn)在配備了一個(gè)邏輯 (SoC) 芯片和一組高速DRAM模塊“HBM(高帶寬內(nèi)存)”的層壓芯片。具體來(lái)說(shuō),將一個(gè)SoC芯片和四個(gè) HBM(4GBx4,總共16GB)安裝在一起。到了第4代,SoC die的面積(集成規(guī)模)擴(kuò)大了,要混合的 HBM 數(shù)量增加到了6個(gè)。通過(guò)將一個(gè) HBM 的存儲(chǔ)容量增加一倍,HBM 的總?cè)萘恳扬@著增加到第三代的三倍(48GB)。

  “CoWoS_S”的改進(jìn)助推HPC系統(tǒng)演進(jìn)

  臺(tái)積電在今年(2021年)開(kāi)發(fā)的第5代“CoWoS_S”將Si中介層進(jìn)一步擴(kuò)大到2500mm2,這相當(dāng)于3個(gè)光罩,是第3代的兩倍大,安裝了8個(gè)HBM。Logic 的硅芯片再次成為小芯片,在總面積為1200mm2 的地方放置了兩個(gè)迷你芯片??砂惭b的 HBM 規(guī)格為“HBM2E”(HBM 2nd generation 的增強(qiáng)版)。

  通過(guò)使銅 (Cu) 布線比以前更厚,Si 中介層的重新布線層 (RDL) 將薄層電阻降低到不到一半。用 5 層銅線連接硅芯片。臺(tái)積電還重新設(shè)計(jì)了 TSV,以減少由于硅穿透孔 (TSV) 引起的高頻損耗。重新設(shè)計(jì)后,2GHz至14GHz高頻范圍內(nèi)的插入損耗(S21)從傳統(tǒng)的0.1dB以上降低到0.05dB以上。此外,通過(guò)將具有深槽的高容量電容器“eDTC(嵌入式深溝槽電容器)”裝入 Si 中介層,臺(tái)積電進(jìn)一步穩(wěn)定了電源系統(tǒng)。eDTC 的電容密度為 300nF/mm2。在100MHz至2GHz的頻率范圍內(nèi),配電網(wǎng)絡(luò) (PDN) 的阻抗已通過(guò)eDTC降低到35%以下。

  微信截圖_20230411143530.png

  支持第5代“CoWoS_S”(傳統(tǒng)“CoWoS”)的基本技術(shù)

  下一代(第6代)“CoWoS_S”計(jì)劃于2023年開(kāi)發(fā)。Si中介層的尺寸更大,有四個(gè)掩模版。通過(guò)簡(jiǎn)單的計(jì)算,它達(dá)到約3400mm2 (約58.6mm見(jiàn)方)。邏輯部分配備了兩個(gè)或更多帶有小芯片的迷你芯片,內(nèi)存部分配備了12個(gè)HBM。相應(yīng)的HBM規(guī)范似乎是“HBM3”。

 微信截圖_20230411143556.png

  硅中介層將處理器處理性能提升 2.5 倍

  高性能計(jì)算(HPC)的封裝技術(shù)“CoWoS(Chip on Wafer on Substrate)”首次出現(xiàn)在10年前(2011年)。正如前文所說(shuō),在過(guò)去十年里,我們不斷擴(kuò)大集成規(guī)模,提升每一代的性能,并為“CoWoS”開(kāi)發(fā)了衍生產(chǎn)品,目前主流產(chǎn)品的名稱已更改為“CoWoS_S”?!癬S”表示將硅(Si)基板用于中間基板(中介層)。

  除了高密度連接之外,硅中介層在緩解封裝基板(樹(shù)脂基板)和硅芯片(邏輯芯片、存儲(chǔ)器芯片等)之間發(fā)生的熱變形方面也扮演著重要的角色。因?yàn)闊崾д鏁?huì)導(dǎo)致電路操作延遲。

  在一個(gè)活動(dòng)上,臺(tái)積電展示了倒裝芯片連接封裝和 CoWoS 封裝與7nm代 CMOS 邏輯的 CPI(每條指令的時(shí)鐘數(shù))的比較結(jié)果。如果在倒裝芯片連接到封裝板(樹(shù)脂板)的700 mm 2 SoC(片上系統(tǒng))芯片上將 CPI 設(shè)置為“1”,則采用 CoWoS_S 技術(shù)封裝的 840mm2 SoC 芯片的 CPI短至“0.4”。成為。這意味著指令處理性能提高了 2.5 倍。

  微信截圖_20230411143615.png

  混合寬帶存儲(chǔ)器“HBM”和SoC的“CoWoS_S”的標(biāo)準(zhǔn)化配置和布局

  “CoWoS_S”的特點(diǎn)是混合了寬帶內(nèi)存模塊“HBM(High Bandwidth Memory)”和大規(guī)模SoC的高性能子系統(tǒng)。通過(guò)Si中介層連接HBM和SoC,實(shí)現(xiàn)了寬帶內(nèi)存訪問(wèn)。

  “HBM”的規(guī)格對(duì)于每一代都有共同的標(biāo)準(zhǔn)。產(chǎn)品的傳播始于第二代“HBM2”。下一代是HBM2的增強(qiáng)版“HBM2E”。下一代是“HBM3”,容量越來(lái)越大,帶寬越來(lái)越寬。

  此外,“CoWoS_S”中安裝的HBM數(shù)量將增加,Si中介層面積將增加,SoC制造技術(shù)將小型化。SoC 的形式將從單芯片變?yōu)樾⌒酒?,再到SoIC(集成芯片系統(tǒng))。構(gòu)成“CoWoS_S”的元素技術(shù)將會(huì)增加并變得更加復(fù)雜。

 微信截圖_20230411143705.png

  因此,臺(tái)積電提供具有標(biāo)準(zhǔn)化配置和布局的“CoWoS_S STAR(標(biāo)準(zhǔn)架構(gòu))”,以便作為客戶的半導(dǎo)體供應(yīng)商可以快速開(kāi)發(fā)采用“CoWoS_S”的子系統(tǒng)??墒褂脤?duì)應(yīng)于 HBM2 的“STAR 1.0”和對(duì)應(yīng)于 HBM2E 的“STAR 2.0”。

 微信截圖_20230411143725.png

  標(biāo)準(zhǔn)化的是硅中介層的最大尺寸、HBM 的數(shù)量和硅芯片的布局??蛻艨梢詮娜N基本規(guī)格中進(jìn)行選擇:最大配置、中間配置和最小配置。

  最大配置是硅中介層,其曝光面積相當(dāng)于掩模版的兩倍。SoC(或ASIC)布置在中央,三個(gè)HBM分別放置在其左右兩側(cè)。

  中間配置的曝光面積相當(dāng)于硅中介層最大尺寸的掩模版的 1.5 倍。SoC布局在中央,左右兩側(cè)分別放置了兩個(gè)HBM。

  最小配置是硅中介層的最大尺寸,即相當(dāng)于光罩1.3倍的曝光面積。兩個(gè) HBM 沿 SoC(或 ASIC)的側(cè)面放置。

  HBM2兼容“STAR 1.0”和HBM2E兼容“STAR 2.0”從最大配置到最小配置的標(biāo)準(zhǔn)規(guī)格相同。似乎他們有意識(shí)地在“STAR 2.0”中重用“STAR 1.0”的開(kāi)發(fā)資源。

  臺(tái)積電先進(jìn)制程和封裝的更多細(xì)節(jié)

  臺(tái)積電院士兼副總裁 LC Lu 在之前的一個(gè)短短 26 分鐘演講內(nèi)用數(shù)十張幻燈片談到了實(shí)現(xiàn)系統(tǒng)創(chuàng)新。

  臺(tái)積電是全球排名第一的半導(dǎo)體代工企業(yè),他們的開(kāi)放式創(chuàng)新平臺(tái) (OIP) 活動(dòng)很受歡迎,參加人數(shù)也很多,因?yàn)樗峁┑墓に嚰夹g(shù)和 IP 對(duì)許多半導(dǎo)體設(shè)計(jì)領(lǐng)域都非常有吸引力。臺(tái)積電技術(shù)路線圖顯示了到 2025 年的 FinFET 和 Nanosheet 計(jì)劃的時(shí)間表。

  微信截圖_20230411143802.png

  從 N3 開(kāi)始,出現(xiàn)了一種名為FinFlex的新產(chǎn)品,它使用設(shè)計(jì)技術(shù)協(xié)同優(yōu)化 (DTCO),有望為節(jié)能和高性能等細(xì)分市場(chǎng)改進(jìn)功率、性能和面積 (PPA)。借助 FinFlex 方法,設(shè)計(jì)人員可以根據(jù)其設(shè)計(jì)目標(biāo)從三種晶體管配置中進(jìn)行選擇:

  3-2 fin blocks,用于高性能

  2-2 fin,高效性能

  2-1 fin,功率最低,密度最佳

  工藝節(jié)點(diǎn) N16 到 N3 中使用的fin選擇的歷史如下所示:

  微信截圖_20230411143828.png

  EDA 供應(yīng)商 Synopsys、Cadence、Siemens EDA 和 ANSYS 已經(jīng)更新了他們的工具以支持 FinFlex,并且在單個(gè) SoC 中,您甚至可以混合使用fin block選項(xiàng)。沿著時(shí)序關(guān)鍵路徑,您可以使用高fin單元,而非關(guān)鍵路徑單元可以是低fin。作為進(jìn)程縮放優(yōu)勢(shì)的示例,Lu 展示了一個(gè) ARM Cortex-A72 CPU,在 N7 中實(shí)現(xiàn),具有 2 個(gè)fin,N5 具有 2 個(gè)fin,最后是 N3E 具有 2-1 個(gè)fin:

  微信截圖_20230411143855.png

  N3E 的 IP 單元來(lái)自多家供應(yīng)商:TSMC、Synopsys、Silicon Creations、Analog Bits、eMemory、Cadence、Alphawave、GUC、Credo。IP 準(zhǔn)備狀態(tài)分為三種狀態(tài):硅報(bào)告準(zhǔn)備就緒、硅前設(shè)計(jì)套件準(zhǔn)備就緒和開(kāi)發(fā)中。

  微信截圖_20230411143918.png

  在 TSMC,他們的模擬 IP 使用結(jié)構(gòu)化程度更高的規(guī)則布局,這會(huì)產(chǎn)生更高的產(chǎn)量,并讓 EDA 工具自動(dòng)化模擬流程以提高生產(chǎn)力。TSMC 模擬單元具有均勻的多晶硅和氧化物密度,有助于提高良率。他們的模擬遷移流程、自動(dòng)晶體管大小調(diào)整和匹配驅(qū)動(dòng)的布局布線支持使用 Cadence 和 Synopsys 工具實(shí)現(xiàn)設(shè)計(jì)流程自動(dòng)化。

  微信截圖_20230411143939.png

  模擬單元可以通過(guò)以下步驟進(jìn)行移植:原理圖移植、電路優(yōu)化、自動(dòng)布局和自動(dòng)布線。例如,使用他們的模擬遷移流程將 VCO 單元從 N4 遷移到 N3E 需要 20 天,而手動(dòng)方法需要 50 天,快了大約 2.5 倍。

  臺(tái)積電需要考慮三種類型的封裝,分別是二維封裝(InFO_oS、InFO_PoP)2.5D封裝(CoWoS)和3D封裝(SoIC和InFO-3D)

  3DFabric 中有八種包裝選擇:

  微信截圖_20230411144004.png

  最近使用 SoIC 封裝的一個(gè)例子是 AMD EPYC 處理器,這是一種數(shù)據(jù)中心 CPU,它的互連密度比 2D 封裝提高了 200 倍,比傳統(tǒng) 3D 堆疊提高了 15 倍,CPU 性能提高了 50-80%。

  3D IC 設(shè)計(jì)復(fù)雜性通過(guò) 3Dblox 解決,這是一種使用通用語(yǔ)言實(shí)現(xiàn) EDA 工具互操作性的方法,涵蓋物理架構(gòu)和邏輯連接。四大 EDA 供應(yīng)商(Synopsys、Cadence、Siemens、Ansys)通過(guò)完成一系列五個(gè)測(cè)試用例,為 3Dblox 方法準(zhǔn)備了工具:CoWoS-S、InFO-3D、SoIC、CoWoS-L 1、CoWoS-L 2。

  臺(tái)積電通過(guò)與以下領(lǐng)域的供應(yīng)商合作創(chuàng)建了 3DFabric 聯(lián)盟:IP、EDA、設(shè)計(jì)中心聯(lián)盟 (DCA)、云、價(jià)值鏈聯(lián)盟 (VCA)、內(nèi)存、OSAT、基板、測(cè)試。對(duì)于內(nèi)存集成,臺(tái)積電與美光、三星內(nèi)存和 SK 海力士合作,以實(shí)現(xiàn) CoWoS 和 HBM 集成。EDA測(cè)試廠商包括:Cadence、西門子EDA和Synopsys。IC測(cè)試供應(yīng)商包括:Advantest和Teradyne。

  AMD、AWS 和 NVIDIA 等半導(dǎo)體設(shè)計(jì)公司正在使用 3DFabric 聯(lián)盟,隨著 2D、2.5D 和 3D 封裝的使用吸引了更多的產(chǎn)品創(chuàng)意,這個(gè)數(shù)字只會(huì)隨著時(shí)間的推移而增加。臺(tái)積電擁有世界一流的DTCO工程團(tuán)隊(duì),國(guó)際競(jìng)爭(zhēng)足以讓他們不斷創(chuàng)新新業(yè)務(wù)。數(shù)字、模擬和汽車細(xì)分市場(chǎng)將受益于臺(tái)積電在 FinFlex 上宣布的技術(shù)路線圖選擇。3D 芯片設(shè)計(jì)得到 3DFabric 聯(lián)盟中聚集的團(tuán)隊(duì)合作的支持。

 更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<

  

微信圖片_20210517164139.jpg

  

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。