芯片,過(guò)往認(rèn)為是電子設(shè)備中最復(fù)雜的元件。隨著科技的日新月異,定制化芯片的需求越來(lái)越高,這也導(dǎo)致了許多大企業(yè)紛紛自研自己的芯片,除了能夠降低成本之外,也能夠最大化性能。這些公司當(dāng)中包括了谷歌、亞馬遜、蘋果以及特斯拉等。
谷歌
2021年8月5日,谷歌 在推特上公布了關(guān)于其新一代 Pixel 手機(jī)的信息,并首次放出了關(guān)于首代 谷歌自研芯片——Tensor 芯片的很多資料。
谷歌CEO Sundar Pichai將 Tensor 芯片稱為迄今為止在 Pixel 領(lǐng)域最大的創(chuàng)新。谷歌將Tensor 芯片對(duì)標(biāo)其對(duì)手蘋果旗下的A系列芯片。
谷歌認(rèn)為,如今安卓手機(jī)已經(jīng)跨過(guò)了手機(jī)綜合性能不足的門檻,下一代手機(jī)需要的并非更強(qiáng)的性能、更大的運(yùn)存,想要繼續(xù)改善如今智能手機(jī)的使用體驗(yàn),則需要借助各種深度學(xué)習(xí)技術(shù)、針對(duì)使用場(chǎng)景優(yōu)化的協(xié)處理器來(lái)完成。
谷歌為手機(jī)設(shè)計(jì)芯片,開(kāi)始讓安卓陣營(yíng)手機(jī)芯片的巨頭捏了一把冷汗,股價(jià)在谷歌發(fā)布Tensor 芯片后應(yīng)聲下跌,例如高通。
谷歌將過(guò)往發(fā)布的各種協(xié)處理器全部整合進(jìn)Tensor 芯片。在谷歌的計(jì)劃里,自研芯片其中一個(gè)重要目的就是進(jìn)一步推動(dòng)谷歌旗下各種 人工智能、機(jī)器學(xué)習(xí)技術(shù),借助算力更強(qiáng)大的移動(dòng)端硬件優(yōu)化普通用戶的實(shí)際使用,進(jìn)一步推動(dòng) AI 的實(shí)用化。
相比于其他芯片,Tensor 芯片最大的區(qū)別在于加入了谷歌針對(duì)移動(dòng)設(shè)備定制的 TPU 處理單元。張量處理單元(Tensor Processing Unit,TPU),是谷歌開(kāi)發(fā)的專用集成電路(ASIC),專門用于加速機(jī)器學(xué)習(xí)。比如,谷歌 Tensor 芯片的性能比高通的驍龍 888+ 強(qiáng)一些,雖然功耗高,但是其AI 性能3 倍于 888+。
手機(jī)攝影涉及了機(jī)器學(xué)習(xí),例如在黑暗的情況里,手機(jī)利用機(jī)器學(xué)習(xí)來(lái)自動(dòng)調(diào)色,不會(huì)讓我們拍照“黑黑一片”,提高照片的質(zhì)量。根據(jù)谷歌的介紹,Tensor 芯片將進(jìn)一步加強(qiáng)Pixel系列手機(jī)的拍照功能。
過(guò)往許多安卓手機(jī)有著一些缺點(diǎn),例如在拍照處理照片的過(guò)程中其他在后臺(tái)運(yùn)行的應(yīng)用進(jìn)程被“殺掉”或是感受到明顯卡頓。而隨著Tensor 芯片的加入,谷歌稱 Pixel 6 將會(huì)給手機(jī)攝影領(lǐng)域帶來(lái)全新體驗(yàn)。谷歌進(jìn)一步表示,Pixel 手機(jī)未來(lái)借助更強(qiáng)算力能拓展的更多使用場(chǎng)景,比如把因?yàn)榭焖僖苿?dòng)導(dǎo)致模糊的人像照片“搶救”回來(lái),以及讓視頻在不同的光線環(huán)境下保持最自然的白平衡等。
谷歌 Silicon 團(tuán)隊(duì)高級(jí)主管Monika Gupta表示:“對(duì)于谷歌來(lái)說(shuō),我們希望把 AI 運(yùn)用在生活的方方面面,甚至園區(qū)餐廳的菜單也可能是由 AI 根據(jù)我們的喜好來(lái)設(shè)計(jì)。我們不想生產(chǎn)傳統(tǒng)意義上的智能手機(jī),谷歌想要 AI 和機(jī)器學(xué)習(xí)處理能力大增的設(shè)備,但市面上的處理器并不滿足谷歌的需求,更強(qiáng)的AI 是谷歌選擇自研芯片的初衷?!?/p>
The Verge實(shí)測(cè)Pixel 6以及 iPhone 12 Pro Max拍照性能對(duì)比認(rèn)為,Pixel 6沒(méi)有太多過(guò)度銳化痕跡。可以說(shuō)谷歌正在依靠著Tensor 芯片追趕者蘋果。
亞馬遜
亞馬遜除了是一家電商巨頭之外,也是云計(jì)算領(lǐng)域的巨頭(AWS)。亞馬遜正在積極自研云計(jì)算芯片。2021年12月21日,亞馬遜云發(fā)布了通用服務(wù)器芯片Graviton 3、機(jī)器學(xué)習(xí)云端芯片Trainium以及固態(tài)硬盤,并提供相關(guān)云計(jì)算應(yīng)用。實(shí)際上,亞馬遜早在2015年就收購(gòu)了以色列芯片公司Annapurna Labs,布局自研芯片。
Graviton 芯片主要應(yīng)用在服務(wù)器、云服務(wù)、高性能計(jì)算、機(jī)器學(xué)習(xí)等領(lǐng)域。許多 AWS 服務(wù),包括 Amazon Aurora、Amazon ElastiCache、Amazon EMR、AWS Lambda 和 AWS Fargate,都使用Graviton 芯片。而許多企業(yè)包括Epic Games、DIRECTV、Intuit、Lyft 和 Formula 1 等都有采用亞馬遜的Graviton 芯片來(lái)進(jìn)行計(jì)算。
通用服務(wù)器芯片Graviton 3,采用Arm架構(gòu)。Graviton3的計(jì)算性能是 Graviton2是 1.25倍,如果特別專注在科學(xué)領(lǐng)域(尤其是機(jī)器學(xué)習(xí))、加密領(lǐng)域等使用浮點(diǎn)運(yùn)算的話,Graviton 3性能最快可達(dá)2倍。Graviton 3采用5納米制程。
Graviton第一代處理器發(fā)布于2018年11月,定位為云原生芯片,對(duì)云端基礎(chǔ)架構(gòu)進(jìn)行了針對(duì)性優(yōu)化。Graviton處理器的推廣也幫助Arm架構(gòu)蠶食英特爾處理器的市場(chǎng)份額。雖然Arm架構(gòu)在智能手機(jī)市場(chǎng)呼風(fēng)喚雨,但服務(wù)器領(lǐng)域則是英特爾的天下。2021年9月10日,IDC發(fā)布的《全球服務(wù)器季度跟蹤報(bào)告》顯示,x86服務(wù)器產(chǎn)生的收入在2021年第二季度增長(zhǎng)2.2%,達(dá)到214億美元,占全球服務(wù)器收入的90.3%,x86服務(wù)器市場(chǎng)芯片基本為英特爾所有。
Trainium 芯片是亞馬遜AWS 設(shè)計(jì)的第二款定制機(jī)器學(xué)習(xí)訓(xùn)練芯片,可為在云中訓(xùn)練深度學(xué)習(xí)模型提供最佳性價(jià)比。Trainium 芯片專門針對(duì)圖像分類、語(yǔ)義搜索、翻譯、語(yǔ)音識(shí)別、自然語(yǔ)言處理和推薦引擎等應(yīng)用程序的深度學(xué)習(xí)訓(xùn)練工作負(fù)載進(jìn)行了優(yōu)化。而隨著機(jī)器學(xué)習(xí)使用的加速,迫切需要提高性能并降低推理和訓(xùn)練驅(qū)動(dòng)的基礎(chǔ)設(shè)施成本。AWS 推出了 Inferentia芯片,這種定制芯片可以在云中以最低的成本為客戶提供高性能的機(jī)器學(xué)習(xí)推理。
亞馬遜表示,借助 Trainium 和 Inferentia,客戶可以獲得最佳的機(jī)器學(xué)習(xí)性價(jià)比,從擴(kuò)展訓(xùn)練工作負(fù)載到通過(guò)高性能推理加速生產(chǎn)中的深度學(xué)習(xí)工作負(fù)載,讓所有客戶都可以使用機(jī)器學(xué)習(xí)的全部功能。
云化是企業(yè)接下來(lái)將要面對(duì)的一個(gè)大趨勢(shì)。許多企業(yè)不是已經(jīng)云化,就是在云化的路上。企業(yè)對(duì)于云計(jì)算的需求也會(huì)持續(xù)增加。定制化,專門為云計(jì)算服務(wù)的芯片自然也就會(huì)有相應(yīng)的需求。亞馬遜積極布局相關(guān)芯片的設(shè)計(jì)也是看好未來(lái)云計(jì)算在此方面的發(fā)展。
蘋果
2020 年 11 月 11 日,蘋果通過(guò)線上發(fā)布會(huì)正式發(fā)布全新搭載自研 M1 芯片以及搭載 M1 新品的三款 Mac 產(chǎn)品。M1 芯片主要專為Mac打造,采用 5nm 工藝制造,集成多達(dá) 160 億個(gè)晶體管,而且是一顆完整的 SoC,集成所有相關(guān)模塊,并采用蘋果自創(chuàng)的封裝方式。
根據(jù)蘋果的資料顯示,M1 可以在 10W 功耗下提供兩倍于如今市場(chǎng)上最新筆記本芯片的性能,能效比則高達(dá)三倍。而搭載了M1 芯片的Mac電腦能夠?qū)崿F(xiàn)最高 3.5 倍的 CPU 提速,最高提 5 倍的 GPU 提速和最高 9 倍的機(jī)器學(xué)習(xí)提升。與此同時(shí),其續(xù)航比上代也有著大幅提升。
縱觀蘋果的產(chǎn)品發(fā)展史,蘋果一直堅(jiān)持的產(chǎn)品戰(zhàn)略都是軟硬一體,除了對(duì)于供應(yīng)鏈有很高的要求之外,蘋果也希望產(chǎn)品所有的零件都是自己設(shè)計(jì),這樣一來(lái)就不會(huì)有零部件被其他公司卡脖子的問(wèn)題。英特爾此前的“擠牙膏”行為引起了蘋果的不滿,除了硬件跟不上軟件之外,蘋果也無(wú)法定制化筆記本電腦,讓自身產(chǎn)品性能達(dá)到極致。因此研發(fā)了M1芯片以擺脫英特爾在筆記本電腦處理器的卡脖子。
蘋果自研出M1芯片除了可在筆記本電腦領(lǐng)域擁有更多話語(yǔ)權(quán)之外,蘋果旗下的Mac 的使用體驗(yàn)將和 iPhone、iPad 更加協(xié)同,因?yàn)樗械奶O果應(yīng)用都采用 ARM 架構(gòu),而 iPhone 的應(yīng)用將能夠與 Mac 兼容。蘋果自身也能夠根據(jù)產(chǎn)品迭代周期來(lái)持續(xù)更新芯片技術(shù),不必跟隨英特爾的腳步。而對(duì)于用戶來(lái)說(shuō),除了體驗(yàn)的升級(jí)之外,Mac 系列產(chǎn)品將比以往的售價(jià)要低許多,因芯片處理器由蘋果自家研發(fā)。
根據(jù)蘋果官方的資料,M1芯片的性能超過(guò)英特爾過(guò)往的芯片處理器,且性能增加了但能耗沒(méi)有增加。蘋果硬件技術(shù)高級(jí)副總裁Johny Srouji表示,這是蘋果制造過(guò)的最強(qiáng)大的芯片。與最新的8核PC筆記本電腦芯片相比,M1 Pro在同等功耗水平下的中央處理器性能可高達(dá)1.7倍,達(dá)到其峰值水平性能的功耗則少了70%。
特斯拉
2021年8月19日,特斯拉在帕羅奧圖總部召開(kāi)AI日,這是特斯拉的第三場(chǎng)技術(shù)發(fā)布會(huì)。在過(guò)去兩場(chǎng)技術(shù)發(fā)布會(huì)上,特斯拉發(fā)布了包括首枚車企自主研發(fā)自動(dòng)駕駛芯片F(xiàn)SD 芯片、算力達(dá)到144 TOPS的Autopilot HW 3.0、無(wú)極耳電池、大體積自研電池、無(wú)鈷電池等。
在此次技術(shù)發(fā)布會(huì)上,特斯拉發(fā)布了自研的D1芯片、特斯拉Bot機(jī)器人、全新自動(dòng)駕駛模擬程序等多項(xiàng)與人工智能相關(guān)的新技術(shù)。
此前在2021年6月19日舉辦的CVPR 2021(人工智能學(xué)術(shù)頂級(jí)會(huì)議)現(xiàn)場(chǎng),特斯拉展示過(guò)名為Dojo的超級(jí)計(jì)算機(jī)的相關(guān)性能。根據(jù)當(dāng)時(shí)披露,Dojo采用5760個(gè)英偉達(dá)的A100 GPU,總算力達(dá)1.8EFLOPS,讀寫速度高達(dá)1.6TBps,被認(rèn)為會(huì)超越全球排名第一的超級(jí)計(jì)算機(jī)富岳。
世界超級(jí)計(jì)算機(jī)排名
值得注意的是,特斯拉在AI日進(jìn)一步宣布Dojo將采用特斯拉自研訓(xùn)練CPU—— D1芯片。特斯拉Autopilot(特斯拉自動(dòng)駕駛程序)的工程主管Milan Kovac上臺(tái)展示了D1芯片。
D1芯片基于7nm工藝,包括500億個(gè)晶體管數(shù)量,內(nèi)建354個(gè)訓(xùn)練節(jié)點(diǎn),僅內(nèi)部的電路就長(zhǎng)達(dá)17.7公里,算力高達(dá)362TFLOPs,功耗僅400W。Milan Kovac表示,這可能是市面上最強(qiáng)的芯片,Dojo未來(lái)一段時(shí)間僅專注于訓(xùn)練特斯拉的自動(dòng)駕駛汽車程序。
此外,D1芯片未來(lái)會(huì)成為Autopilot 3.0版硬件基礎(chǔ),目前特斯拉車型上搭載的是Autopilot 2.5版硬件。全新硬件系統(tǒng)將實(shí)現(xiàn)大幅性能提升,為日后特斯拉車型升級(jí)更高階的自動(dòng)駕駛系統(tǒng)提供了足夠強(qiáng)大的計(jì)算能力保障。
根據(jù)特斯拉的描述,D1芯片主要作用是處理來(lái)自攝像頭、超聲波傳感器以及雷達(dá)的數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)分析最終給出車輛控制決策。其中,處理來(lái)自攝像頭的圖像數(shù)據(jù)消耗計(jì)算能力最多。如今特斯拉的自動(dòng)駕駛系統(tǒng)/方案是一種較為依賴攝像頭數(shù)據(jù)的系統(tǒng),所以提升芯片計(jì)算能力對(duì)于提升特斯拉自動(dòng)駕駛系統(tǒng)的性能是至關(guān)重要的。
Dojo D1芯片則有望進(jìn)一步加速特斯拉自動(dòng)駕駛系統(tǒng)的發(fā)展。在AI日上,特斯拉繼續(xù)傳達(dá)其視覺(jué)系自動(dòng)駕駛技術(shù)路線的決心。Autopilot軟件主管Ashok Elluswamy在發(fā)布會(huì)上表示,特斯拉自動(dòng)標(biāo)記技術(shù),強(qiáng)調(diào)道路上有太多物體需要標(biāo)記,利用標(biāo)記的物體來(lái)重現(xiàn)道路上的場(chǎng)景。而這背后則是需要龐大的算力。D1芯片將會(huì)幫助特斯拉持續(xù)推進(jìn)其視覺(jué)方案的落地以及成熟化。