最近,chiplet這個概念熱了起來,從DARPA的CHIPS項目到Intel的Foveros,都把chiplet看成是未來芯片的重要基礎技術。簡單來說,chiplet技術就是像搭積木一樣,把一些預先生產(chǎn)好的實現(xiàn)特定功能的芯片裸片(die)通過先進的集成技術(比如3D integration)集成封裝在一起形成一個系統(tǒng)芯片。而這些基本的裸片就是chiplet。從這個意義上來說,chiplet就是一個新的IP重用模式。未來,以chiplet模式集成的芯片會是一個“超級”異構系統(tǒng),可以為AI計算帶來更多的靈活性和新的機會。
chiplet模式簡介
chiplet的概念其實很簡單,就是硅片級別的重用。設計一個系統(tǒng)級芯片,以前的方法是從不同的IP供應商購買一些IP,軟核(代碼)或硬核(版圖),結合自研的模塊,集成為一個SoC,然后在某個芯片工藝節(jié)點上完成芯片設計和生產(chǎn)的完整流程。未來,對于某些IP,你可能不需要自己做設計和生產(chǎn)了,而只需要買別人實現(xiàn)好的硅片,然后在一個封裝里集成起來,形成一個SiP(System in Package)。所以chiplet也是一種IP,但它是以硅片的形式提供的。
chiplet的概念最早來自DARPA的CHIPS(Common Heterogeneous Integration and IP Reuse Strategies)項目。該項目試圖解決的主要問題如下“The monolithic nature of state-of-the-art SoCs is not always acceptable for DoD or other low-volume applications due to factors such as high initial prototype costs and requirements for alternative material sets. To enhance overall system flexibility and reduce design time for next-generation products, the Common Heterogeneous Integration and Intellectual Property (IP) Reuse Strategies (CHIPS) program seeks to establish a new paradigm in IP reuse.”。而它的愿景是:“The vision of CHIPS is an ecosystem of discrete modular, reusable IP blocks, which can be assembled into a system using existing and emerging integration technologies. Modularity and reusability of IP blocks will require electrical and physical interface standards to be widely adopted by the community supporting the CHIPS ecosystem. Therefore, the CHIPS program will develop the design tools and integration standards required to demonstrate modular integrated circuit (IC) designs that leverage the best of DoD and commercial designs and technologies.” 從這段描述來看chiplet可以說是一種新的芯片設計模式,要實現(xiàn)chiplet這種新的IP重用模式,首先要具備的技術基礎就是先進的芯片集成封裝技術。SiP的概念很早就有,把多個硅片封裝在一個硅片里也有很久的歷史了。但要實現(xiàn)chiplet這種高靈活度,高性能,低成本的硅片重用愿景,必須要先進的芯片集成技術,比如Intel最近提出的Foveros,3D集成技術。
source: Intelsource: Intel
3D集成技術使我們的芯片規(guī)??梢栽谌S空間發(fā)展,而不是傳統(tǒng)的限于二維空間。由于在二維空間里,摩爾定律已經(jīng)很難延續(xù),向三維發(fā)展也是一個自然的趨勢。此外,正如下圖所說的,這種3D集成技術除了提供更高的計算密度之外,還可以讓我們重新考慮系統(tǒng)架構(enabling a complete rethinking of system),這個也就是chiplet模式給我們帶來的各種新的靈活性,后面再詳細討論。
source: Intel
這里我們不詳細討論3D集成技術的細節(jié),根據(jù)目前的發(fā)展,在未來幾年,相關技術會越來越成熟,應該能夠為chiplet模式的普及做好準備。
AI chiplet的優(yōu)勢
總得來說,我個人認為chiplet模式對于AI硬件的長期發(fā)展會有非常正面的影響,主要體現(xiàn)在下面幾個方面。
第一,工藝選擇的靈活性
chiplet模式的最大優(yōu)勢之一就是一個系統(tǒng)里可以集成多個工藝節(jié)點的硅片(如下圖所示)。
source: Intel
這也是chiplet模式可能支持快速開發(fā),降低實現(xiàn)成本的一個重要因素。大家知道,在芯片設計中,對于不同目的和類型的電路,并不是最新的工藝就總是最合適的。在目前的單硅片系統(tǒng)里,系統(tǒng)只能在一個工藝節(jié)點上實現(xiàn)。而對于很多功能來說,使用成本高風險大的最新工藝即沒有必要又非常困難,比如一些專用加速功能和模擬設計。如果chiplet模式成立,那么大家在做系統(tǒng)設計的時候則有了更多的選擇。對于追求性能極限的模塊,比如高性能CPU,可以使用最新工藝。而特殊的功能模塊,比如存儲器,模擬接口和一些專用加速器,則可以按照需求選擇性價比最高的方案。
這一點對于AI芯片的發(fā)展是相當有利的。首先,AI加速本身就是一個DSA(專用領域架構),其架構本身就是專門為特定運算定制的,具有很高的效率,即使選擇差一兩代的工藝,也可以滿足很多情況的要求。但目前,大多數(shù)這個領域的初創(chuàng)公司,都面臨工藝選擇的困境。如果選擇先進工藝,可能一次投片就耗盡所有投資。如果不選,好像一下就輸在了起跑線。如果chiplet模式成為主流,大家的工藝選擇應該可以更加理性,工藝雖不是最新但性價比最好的chiplet會有更多機會。第二,對于很多可能大幅提升AI運算效率的新興技術,比如存內(nèi)計算,模擬計算(包括光計算),它們使用的器件往往只在相對較低的工藝節(jié)點比較成熟,和系統(tǒng)的其它部分怎么集成就是個大問題。chiplet模式也可以解決這個問題,則這些技術的開發(fā)商可以以chiplet IP的形式提供產(chǎn)品,和其它不同工藝的功能模塊集成在一起,而無需受限于Foundry工藝的進展。
第二,架構設計的靈活性
以chiplet構成的系統(tǒng)可以說是一個“超級”異構系統(tǒng),給傳統(tǒng)的異構SoC增加了新的維度,至少包括空間維度和工藝選擇的維度。首先,如前所述,先進的集成技術在3D空間的擴展可以極大提高芯片規(guī)模。這當然對AI算力的擴展和成本的降低有很大好處。第二,結合前述的工藝靈活性,我們可能在架構設計中有更合理的功能/工藝的權衡,有利于AI SoC或者AIoT芯片更好的適應應用場景的需求。第三,系統(tǒng)的架構設計,特別是功能模塊間的互聯(lián),有更多優(yōu)化的空間。在目前的AI芯片架構中,數(shù)據(jù)流動是主要瓶頸。HBM(也可以看成是一種chiplet)可以在一定程度上解決處理器和DRAM之間的數(shù)據(jù)流動問題,但價格還過于昂貴。對于云端AI加速,Host CPU和AI加速芯片之間,以及多片加速芯片之間的互聯(lián),目前主要通過PCIe,NvLink,或者直接用SerDes等等。如果是chiplet方式,則是硅片的互聯(lián),帶寬,延時和功耗都會有巨大的改善。另外,目前的片上網(wǎng)絡NoC是在一個硅片(2D)上的,而未來的NoC則擴展到硅片之間,特別是和Active Interposer結合,就可能成為一個3D網(wǎng)絡,其路由,拓撲以及QoS可以有更多優(yōu)化的空間。
第三,商業(yè)模式的靈活性
chiplet模式在傳統(tǒng)的IP供應商和芯片供應商之外,提供了一個新的選擇:chiplet硅片供應商。對于目前的AI芯片廠商來說,要么聚焦在AI加速部分,以IP形式或者外接硬件加速芯片的形式提供產(chǎn)品;要么走垂直領域,做集成AI加速功能的SoC。對于前者來說,chiplet可以提供一個新的產(chǎn)品形式,增加潛在的市場,或者拉長一代產(chǎn)品(工藝)的生命周期。對于一些硅實現(xiàn)能力比較強的廠商來說,也說不定未來會演變成專門做chiplet的供應商。對后者來說,可以直接集成合適AI chiplet而不是IP(還需要自己做芯片實現(xiàn)),大大節(jié)約項目開發(fā)的時間。
因此,可以預見,AI chiplet會成為AI硬件重用和集成的重要模式。
chiplet模式的挑戰(zhàn)
首先當然是集成技術的挑戰(zhàn)。chiplet模式的基礎還是先進的封裝技術,必須能夠做到低成本和高可靠性。這部分主要看foundry和封裝廠商。隨著先進工藝部署的速度減緩,封裝技術逐漸成為大家關注的重點。此外,集成技術的挑戰(zhàn)還來自集成標準?;氐紺HIPS項目,可以看出,該項目的重點就是是設計工具和集成標準。Intel的AIB(Advanced Interface Bus)就是一個硅片到硅片的互聯(lián)標準,如果未來能夠成為業(yè)界的標準(類似ARM的AMBA總線標準的作用),則chiplet的模式就可能更快的普及。還有,對于這種“超級”異構系統(tǒng),其更大的優(yōu)化空間也同時意味著架構優(yōu)化的難度也會大大增加。
除了集成技術之外,chiplet模式能否成功的另一個大問題是質(zhì)量保障。我們在選擇IP的時候,除了PPA之外,最重要的一個考量指標就是IP本身的質(zhì)量問題。IP本身有沒有bug,接入系統(tǒng)會不會帶來問題,有沒有在真正的硅片上驗證過等等。在目前的IP重用方法中,對IP的測試和驗證已經(jīng)有比較成熟的方法。但對于chiplet來說,這還是個需要探索的問題。雖然,相對傳統(tǒng)IP,chiplet是經(jīng)過硅驗證的產(chǎn)品,本身保證了物理實現(xiàn)的正確性。但它仍然有良率的問題,而且如果SiP中的一個硅片有問題,則整個系統(tǒng)都受影響,代價很高。因此,集成到SiP中的chiplet必須保證100%無故障。從這個問題延伸,還有集成后的SiP如何進行測試的問題。將多個chiplet封裝在一起后,每個chiplet能夠連接到的芯片管腳更為有限,有些chiplet可能完全無法直接從芯片外部管腳直接訪問,這也給芯片測試帶來的新的挑戰(zhàn)。
最后補充一點,還是那句話,有挑戰(zhàn)就有機會。個人認為,除了前面討論的chiplet模式對普及AI硬件的推動,它還會促進EDA工具的發(fā)展。不論是集成技術,還是質(zhì)量保障,很多chiplet模式的問題最終都需要EDA工具的改進來給出答案,需要EDA工具從架構探索,到芯片實現(xiàn),甚至到物理設計的全面支持。這也是CHIPS項目的一個重點是設計工具的原因。
?