據The Information報道,亞馬遜正在為其硬件網絡交換機開發(fā)定制的硅芯片。據說這些芯片可以幫助亞馬遜改善其內部基礎設施以及AWS,這是亞馬遜于2015年以3.5億美元收購以色列芯片制造公司Annapurna Labs的目的之一。
報道進一步指出,亞馬遜為其交換機構建芯片可以幫助其解決自身基礎架構中的瓶頸和問題,特別是如果他們還定制構建在其上運行的軟件時。亞馬遜已經建立了自己的交換機,但是它依靠Broadcom為其提供芯片支持。對于公司來說,完全控制這些機器是很有意義的,特別是考慮到其Web服務業(yè)務的重要性。The Information援引Amazon提供的機器學習軟件(目前運行在Annapurna芯片上)的話,他們甚至有可能通過新的交換機提供一些以前無法提供的服務。
報道指出,這顆芯片不是亞馬遜的第一個定制芯片。該公司此前曾與聯發(fā)科合作為其Echo智能揚聲器產品創(chuàng)建芯片,旨在使Alexa更快地做出響應。它還有被稱為Trainium的自定義機器學習芯片,該芯片將很快對AWS客戶開放。為此該公司還希望自己的芯片為其網絡的骨干提供支持,這是有道理的。
定制芯片設計也迅速成為大型科技公司的賭注。我們最近看到有報道稱,谷歌和微軟正在為其設備構建自定義處理器,而蘋果公司已經這樣做了多年,M1 Macs就是一個例子,當公司的產品同時控制兩個設備時,它們的性能可能會更高。硬件和軟件。盡管亞馬遜可能不是智能手機或PC領域的巨人,但它在云計算中卻是一個巨人,這似乎是亞馬遜著力于使新芯片投入使用的地方。
延伸閱讀:思科芯片外售,與博通正面開戰(zhàn)
如果我們從同一個供應商處購買ASIC,軟件、計算,存儲或網絡設備,這是毫無問題的。但是,如果這是唯一的選擇,那就有問題了。這正是超大規(guī)模開發(fā)者和云構建者在交換機業(yè)務上進行長期斗爭的原因,這在Facebook上體現得最淋漓盡致。
因此,我們看到了商業(yè)硅ASIC供應商的興起,首先是交換機,然后是路由器,還有那些可以負擔如此大投資的超大規(guī)模生產者和云構建者的自有網絡操作系統(tǒng)的興起。
實際上,考慮到規(guī)模和網絡的復雜性,他們別無選擇,只能進行此類投資并創(chuàng)建商業(yè)交換機和路由器供應商無法提供的NOS。在它們的背后,我們看到了一堆便攜式NOS,其中一些是開源的,有些不是開源的,它們可以跨越多個交換機和路由器ASIC,并且,其中一些芯片甚至都不是來Broadcom……
在商用芯片供應商和未與任何特定交換機或路由器制造商結盟的備用NOS興起的二十年后,路由先驅和交換巨頭Cisco Systems于2019年12月推出了Silicon One Q100路由,從而在市場上占有一席之地。據思科研究員和Silicon One系列ASIC的架構師Rakesh Chopra稱,該芯片已經在Cisco 8000系列路由器中實現了商業(yè)化。到目前為止,Rakesh Chopra認為這是Cisco本身唯一基于Silicon One Chippery的產品。
但是,Chopra不能說的是,hyperscalers和云構建者等其他人是否正在Silicon One的產品線上構建自己的交換機和路由器,該產品線在2020年10月得到了擴展,而今天已經得到進一步擴展。
在進入擴展的Silicon One系列之前,我們想做一個有趣的觀察。交換機或路由器(比數據中心中的任何其他類型的設備更多)一直是黑匣子。網絡設備的硬件和軟件組件就像受保護的國家秘密一樣,在市場上專有且與眾不同,而客戶真正獲得的是以給定速度以特定形狀因子收集的一組端口,并在軟件中實現了一組API和功能。
雖然最大的客戶都可以使用SDK,還可以通過開放平臺來實現更大的延展性和針對特定需求的定制,但對我們而言,有趣的是,芯片本身仍然基本上是一個黑匣子,這與我們都熟悉的商用CPU芯片甚至與那些實際上只會由其專有供應商在特定機器上使用的CPU芯片完全不同。交換機和路由器ASIC自己是數據中心的最后堡壘。您很幸運地找到了用于蝕刻它們的工藝技術,并獲得了Broadcom,Innovium,Intel,Marvell,Nvidia和現在的Cisco所擁有的SERDES速度和SERDES數量。您很少會看到框圖,甚至很少會看到。
如您所料,我們認為情況應該有所改變。但是,直到做到這一點,我們才能獲得封裝照片以及一些基本的提要和速度,并且在今天將三款新的ASIC加入生產線之后,思科的Silicon One系列看起來像這樣:
在過去的十五個月里,思科推出了在網絡中扮演九種不同角色的交換機和路由器ASIC,這是與Broadcom和其他供應商及其交換機和路由器制造聯盟合作的一個很好的開始,思科為此在過去十年里付出了很多努力。
我們在他們于2019年12月發(fā)布的Q100路由芯片方面做得不好,我們也忽略了他們2020年10月發(fā)布的公告,當時思科推出了三款額外的路由芯片和三款交換芯片,它們都基于相同的Silicon一種架構。現在,我們想對思科的芯片進行深入的解讀。
為了達到這個目的,我們與Chopra一起度過了一段時間。自從將近七年前構思以來,他就一直密切參與Silicon One的工作。Chopra于1997年從Rensselaer Polytechnic Institute獲得了計算機工程學士學位,此后一直在Cisco工作,最初是一名硬件工程師,后來獲得了晉升。
“從Silicon One的角度來看,我們開始像獨立的硅公司一樣運作,” Chopra告訴The Next Platform?!霸诖斯嬉约叭ツ?0月的公告中,我們沒有宣布任何使用這些芯片的Cisco產品。我們是思科內部的獨立機構,我們的章程是發(fā)展Silicon One和替代業(yè)務模型的業(yè)務。
當我們與外部客戶進行討論時,我們將進行一次標準的ROI討論,考察我們?yōu)槟橙朔招枰ㄙM多少精力,以及我們將產生多少交易量和多少收入。在此基礎上,我們將決定是否執(zhí)行此操作?!?/p>
尚不清楚可能會有多少hyperscalers、云構建者和開關OEM/ODM制造商使用或考慮使用Silicon One ASIC。但是所有人都在談論它。從思科首席執(zhí)行官查克·羅賓斯(Chuck Robbins)幾周前的討論中可以看到,思科付出了多年的努力來重新投入到超大規(guī)模生產者,云計算構建者以及其他方面。正如思科所稱的那樣,“網絡級”服務提供商和電信運營商正在獲得回報。Robbins表示,在前四個季度中,對網絡縮放器的銷售額平均占服務提供商總銷售額的21%,在2021年1月這一季度達到25%。一些客戶購買原始的Silicon One ASIC,一些客戶購買整個Cisco 8000路由器。
Silicon One架構的秘訣在于其名稱,體現在它具有一個單一的,統(tǒng)一的架構,該架構既涵蓋交換和路由,又包含所有設備的所有功能,這與公司在使用Broadcom、Intel、Marvell或Nvidia的多種產品時必須應對的平衡方法不同。因為各個芯片系列的功能集并不總是相同的——對于Broadcom的“ Trident”和“ Tomahawk”交換芯片以及“ Jericho”路由器芯片,即使軟件相似,但他們有不同的定價方式。
Chopra解釋說:“ Silicon One的構建方式與行業(yè)中的其他任何技術都根本不同?!?,“內存結構的工作方式,處理引擎的工作方式使我們能夠做以前完全不可能的事情。
因此,如果您查看市場上的其他芯片,例如在路由市場中,它們是由兩個流水線階段組成的,它們有兩個階段用于專用結構接口。我們擁有一個完全可擴展的架構,其中可以包含許多可以隨技術節(jié)點線性擴展的切片。我們可以完全共享我們的所有內存,而不必復制內存狀態(tài)。就構建路由和交換芯片而言,這是一個非常根本的轉變。
我們已經奠定了基礎,現在我們有了這樣的基礎結構,我們對這些新的芯片之一所做的所有工作就是調整切片的數量,調整各種tables的比例,調整內存,然后再制造它。這就是為什么您看到這些設備如此之快的原因。因為所有這些設備實際上在架構上都是相同的。我們只是更改了切片的數量。它們都運行相同的P4轉發(fā)代碼,并且運行相同的SDK。我們根據是要追隨網絡規(guī)模市場還是路由市場來調整一些規(guī)模。我們調整數據包緩沖區(qū)的大小或添加外部緩沖區(qū)。但是,這些功能在功能上都是相同的,因此,如果您使用其中一個,則可以立即使用其他任何一個。沒有必要進行再教育。
相同的ASIC可以用于固定端口設備,例如機架頂部常見的1U和2U交換機,分解的葉形/旋轉式機箱,其中一些ASIC用作結構元件,有些用作線路線卡,或者在固定的設備中使用。模塊化交換機,它以硬編碼方式實現線卡上的ASIC與結構上的ASIC之間的連接。
在上圖中,于2019年12月推出的Q100芯片的總路由能力為10.8 Tb / sec,聚焦的也是路由市場。2020年10月,思科增加了三款新的路由芯片,其中Q200的運行速度為12.8 Tb /秒,Q201的運行速度為6.4 Tb /秒,Q202的運行速度為3.2 Tb /秒。他們還增加了相同速度的交換芯片Q200L,Q201L和Q202L,從而使Silicon One設備的總數增加到了七個。
但是,思科做到了這一點,Chopra并未表示。與競爭對手相比,Silicon One芯片具有更高的性能和更低的功耗。我們不知道思科將與哪些供應商的芯片進行比較,但是很有趣的是看到它們被貼上標簽,并且也與思科的前幾代路由器芯片進行了比較。無論如何,我們的想法是這些是代表性的比較:
使用Q200芯片的Cisco Silicon One設置可以在1U機箱中以400 Gb /秒的速度提供32個端口,而其他兩個端口則需要2U或3U機箱。并查看功耗:
Chopra表示,Q200的390瓦熱封殼(thermal envelope)”非常保守“,在現場可能會低很多,重要的是,將比使用Q200的光收發(fā)器將鉤子拉入交換機的功率低。重要的是這個總數是開關ASIC功率加上光功率。
與競爭產品相比,思科產品在每個機架單位的端口密度上升且每個端口的功耗下降。這就可以使超級擴展程序和云構建者以及電信公司和服務提供商中的同行充分理解。
這使我們了解了今天添加的三個新芯片。首先,有一個25.6 Tb / sec的交換機ASIC,即G100,它與Broadcom和Nvidia在總交換容量方面的能力相匹配。另外還有8 Tb / sec的路由ASIC,Q211和8 Tb / sec交換ASIC,即Q211L,許多歐洲的webscale公司已要求Cisco提供以匹配其設備中當前ASIC的總帶寬。大概這將使他們能夠做一個盒子來替換盒子,而不必重新構造或重新布線他們的網絡。
綜上所述,Chopra表示,Silicon One在數據中心的交換和路由,服務提供商和Webscaler以及不同的外形尺寸都具有相當好的覆蓋范圍:
看到超擴展程序和云構建器的功能將很有趣。他們中的一些人擺脫了思科的支持已經花了十年的時間。現在,他們有機會將其軟件遷移到Cisco芯片,并在整個數據中心以及整個數據中心范圍內統(tǒng)一其ASIC,或者至少使Cisco與Broadcom和其他新貴抗衡。