《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 業(yè)界動態(tài) > 為什么還用A76 ? 麒麟990 詳細解析

為什么還用A76 ? 麒麟990 詳細解析

2019-09-15
關(guān)鍵詞: A76 麒麟990

  昨天,華為在德國柏林和北京同時發(fā)布最新一代旗艦芯片麒麟990系列,包括麒麟990和麒麟990 5G兩款芯片。兩款芯片在性能與能效、AI智慧算力及ISP拍攝能力等方面進行全方位升級。這標(biāo)志著,華為在5G和端側(cè)AI兩大領(lǐng)域同時實現(xiàn)了全球引領(lǐng)。

640.webp (16).jpg

  兩款SoC:麒麟990(4G)和麒麟990 5G

  隨著我們進入5G時代,現(xiàn)在市場上出現(xiàn)了分差,很多區(qū)域還沒有準備好5G,因此迫切更換到5G手機的需求不是特別大。所以4G手機將會和5G手機共存一段時間。華為不是為這兩個市場提供單一解決方案,而是首次將其戰(zhàn)略與兩種版本的麒麟990分開。

  這些版本將正式稱為麒麟990和麒麟990 5G。兩個麒麟芯片組和標(biāo)準基本級基本相同。相同的核心配置,相同的相機支持,相同的內(nèi)存,相同的存儲。但是,在調(diào)制解調(diào)器之外的一些關(guān)鍵領(lǐng)域,存在差異,例如NPU性能和核心頻率。我們稍后會討論這些問題。但值得強調(diào)的是,麒麟990 5G版本是如何展望未來的。

  現(xiàn)在高通、三星每家公司都宣布了自己的分立式5G調(diào)制解調(diào)器,這意味著我們有一個帶有4G的標(biāo)準處理芯片,然后還需要外掛一片5G支持芯片。這樣做及增大了成本又增加了線路板的面積。

  因此如果要獲得最佳性能,5G芯片應(yīng)集成在同一硅片上,在5G模式下實現(xiàn)更高的效率,以換取芯片面積和設(shè)計復(fù)雜性。

  華為是第一家為智能手機市場做到這一點的公司。

640.webp (15).jpg

  Kirin 990 5G是一種真正的統(tǒng)一設(shè)計,支持SA和NSA架構(gòu)上的Sub-6 GHz 5G網(wǎng)絡(luò)。為了控制芯片尺寸,華為正在使用臺積電最新的7nm+制造工藝和EUV,這有助于為芯片進入的各種器件實現(xiàn)更小的芯片尺寸。

  到目前為止,無論是高通還是三星都沒有統(tǒng)一的接近商業(yè)化的旗艦芯片設(shè)計。(雖然早前聯(lián)發(fā)科近日也推出了集成5G SOC,但是首部搭載該款芯片的手機要到明年推出)。

  麒麟990系列詳情

  這次麒麟 990 5G 挑戰(zhàn)了芯片工藝物理極限,在一顆指甲大小的芯片上集成了 103 億晶體管,是目前晶體管數(shù)最多、功能最完整、復(fù)雜度最高的 5G SoC。與此前的麒麟980相比晶體管增加44億個。

640.webp (14).jpg

  由于采用了TSMC的7FF+和EUV,這使得芯片面積并沒有增加太多。

  麒麟980 5G芯片面積僅100平方毫米(4G版本80億晶體管,面積90平方毫米),麒麟980(TSMC 7納米,69億晶體管)為74.13平方毫米而麒麟970(TSMC 10納米,55億晶體管)則達到了96.72平方毫米。可見7FF+工藝的帶來的芯片面積減小相當(dāng)?shù)目捎^。

640.webp (13).jpg

  CPU

  兩個SoC的核心配置相同 - 兩個高頻A76內(nèi)核,兩個中頻A76內(nèi)核和四個更高效的A55內(nèi)核。它們分為各自的功率和頻率域,可根據(jù)工作負載提供更好的靈活性。然而,基于7和7+過程之間的差異,990 5G和990 4G的頻率會略有不同。

  對于高速緩存,所有四個A76內(nèi)核都具有512kB L2,而A55內(nèi)核各為128 kB。

  從技術(shù)上講,華為將A76內(nèi)核稱為“基于A76”,因為對緩存系統(tǒng)中的內(nèi)核進行了一些增強,以改善內(nèi)存延遲。華為不會說它的“SmartCache”實現(xiàn)有助于GPU,也可以幫助CPU和NPU。我們認為這基本上是DynamiQ DSU之上的下一級緩存,類似于高通和三星的實施。

640.webp (12).jpg

  這里有一個側(cè)面說明:我們原本預(yù)計華為將在今年早些時候宣布推出采用Arm最新A77核心的全新麒麟。盡管作為Arm合作伙伴的優(yōu)先成員,該公司的技術(shù)團隊向我們解釋了兩件事:首先,兩年前核心決策是針對這款芯片做出的,但除此之外,他們沒有看到臺積電的A77預(yù)期頻率。7nm工藝。

640.webp (11).jpg

  華為表示,雖然A77達到了更高的峰值性能,但A77和A76在7nm上的功率效率實際上是相同的,但是由于A76在7nm上的體驗更好,他們能夠?qū)⒑诵念l率推得更高。據(jù)報道,其他擁有A77產(chǎn)品的公司在其他晶圓廠采用類似的工藝技術(shù)時,只能達到2.2 GHz。據(jù)說A77很可能會在未來的產(chǎn)品中出現(xiàn),最有可能的是當(dāng)5nm變得更加廣泛可用。

  此外關(guān)于LPDDR5支持的話題,華為表示LPDDR5仍然是一項昂貴的技術(shù),正在考慮未來的產(chǎn)品中使用。

  GPU

  提高核心,降低主頻。麒麟990 采用了16核Mali-G76實現(xiàn),高于麒麟980中的10核Mali-G76。

640.webp (10).jpg

640.webp (9).jpg

  部分原因是芯片尺寸增加:華為認為更低的電壓,更低的頻率但更寬的GPU將提供更好的芯片整體。

  隨著我們從10核750 MHz設(shè)計轉(zhuǎn)向16核700 MHz設(shè)計,GPU的性能有所提升。

  NPU

  除了實現(xiàn)了內(nèi)置5G調(diào)制解調(diào)器,麒麟990最大的變化將是NPU。

  在麒麟970和麒麟980 中,華為直接采用了寒武紀公司提供的NPU許可。隨著麒麟810以及最新的990的問世,已經(jīng)完全轉(zhuǎn)向了采用華為自研達芬奇架構(gòu)的NPU。

640.webp (8).jpg

  在AI+5G的全新賽道,麒麟990 5G將再度引領(lǐng)AI潮流。麒麟990 5G是首款采用華為自研達芬奇架構(gòu)NPU的旗艦級芯片,創(chuàng)新設(shè)計NPU雙大核+NPU微核計算架構(gòu),NPU大核展現(xiàn)卓越性能與能效,微核NPU實現(xiàn)超低功耗。達芬奇架構(gòu)是華為在2018年推出的全新自研AI計算架構(gòu),基于其靈活可裁剪的特性,華為面向全場景推出昇騰(Ascend)系列芯片,可用于小到幾十毫瓦,大到幾百瓦的訓(xùn)練場景,橫跨全場景提供最優(yōu)算力,而此次麒麟990 5G搭載的正是面向智能手機場景的Ascend Lite和Ascend Tiny。

  在雙大核NPU(Ascend Lite*2)加持下,麒麟990 5G實現(xiàn)業(yè)界最強AI算力,與業(yè)界其他旗艦AI芯片相比,性能優(yōu)勢高達6倍,能效優(yōu)勢高達8倍,持續(xù)刷新端側(cè)AI的算力高點。無論是在業(yè)界典型的中載神經(jīng)網(wǎng)絡(luò)模型ResNet50(用于檢測、分割和識別),還是在移動端更流行的輕載神經(jīng)網(wǎng)絡(luò)模型MobilenetV1(用于分類、檢測、嵌入和分割)下,麒麟990 5G的FP16和int8性能和能效均達到業(yè)界最佳水平。業(yè)界首發(fā)NPU微核(Ascend Tiny)賦能超低功耗應(yīng)用,在人臉識別的應(yīng)用場景下,NPU微核比大核能效最高可提升24倍,讓AI運算更省電。

  在990 5G和990 4G之間也存在差異。除了調(diào)制解調(diào)器,GPU和制造工藝之外,芯片尺寸差異的一個原因是990 5G的NPU內(nèi)核數(shù)量是其兩倍。990 5G將擁有兩個“大”NPU核心,同時支持雙ML流程以及Tiny Core NPU。相比之下,990 4G只有一個“大”NPU核心,加上微核NPU。

  這意味著我們可能會看到Kirin 990 4G設(shè)備可能無法實現(xiàn)的某些功能。

  巴龍調(diào)制解調(diào)器

640.webp (7).jpg

640.webp (6).jpg

  除了是第一款集成智能手機5G設(shè)計外,最終華為并未提供有關(guān)新5G調(diào)制解調(diào)器或4G設(shè)計更新的詳細信息。據(jù)稱,麒麟990 5G是第一款商用的支持NSA和SA架構(gòu)的全頻調(diào)頻調(diào)制解調(diào)器。

  峰值速度將高達2.3 Gbps下載和1.25 Gbps上傳,額外的基于ML的波束成形技術(shù)有助于在高速旅行期間支持更快的速度。對于弱信號區(qū)域,該設(shè)計還允許同時連接到5G和4G。我們確認該公司仍在使用Tensilica DSP,技術(shù)團隊表示盡管存在國際問題,但Tensilica的許可仍然有效。

640.webp (5).jpg

  麒麟990 (5G)的性能

640.webp (4).jpg

  圖中所示從Kirin 980到Kirin 990 5G的單線程性能增加了9%,主要是通過更高的主頻來實現(xiàn)。多線程性能整體上漲10%。然而,與去年相比,中端A76核心的電源效率提高了35%,華為預(yù)計大多數(shù)非要求性能相關(guān)的工作負載都要在這些中間核上運行。(華為表示高性能內(nèi)核的效率比上一代高出12%,較小的內(nèi)核的效率提高了15%。

640.webp (3).jpg

  GPU方面,麒麟芯片始終追求更好的用戶體驗。針對GPU在運行重載游戲、播放高清視頻等高負載場景下容易出現(xiàn)的發(fā)熱、掉幀、卡頓等問題,麒麟990 5G搭載16核Mali-G76 GPU,與業(yè)界主流旗艦芯片相比,圖形處理性能高6%,能效優(yōu)20%,實現(xiàn)業(yè)界領(lǐng)先的性能與能效。全新系統(tǒng)級Smart Cache分流,支持智能分配DDR數(shù)據(jù),在重載游戲等大帶寬場景下帶寬較上一代最高可節(jié)省15%,功耗可降低12%,進一步提升GPU能效。

640.webp (2).jpg

  余承東在現(xiàn)場表示,在雙大核NPU加持下,麒麟990 5G實現(xiàn)業(yè)界最強AI算力,與業(yè)界其他旗艦AI芯片相比,性能優(yōu)勢高達6倍,能效優(yōu)勢高達8倍,持續(xù)刷新端側(cè)AI的算力高點。無論是在業(yè)界典型的中載神經(jīng)網(wǎng)絡(luò)模型ResNet50(用于檢測、分割和識別),還是在移動端更流行的輕載神經(jīng)網(wǎng)絡(luò)模型MobilenetV1(用于分類、檢測、嵌入和分割)下,麒麟990 5G的FP16和int8性能和能效均達到業(yè)界最佳水平。業(yè)界首發(fā)NPU微核(Ascend Tiny)賦能超低功耗應(yīng)用,在人臉識別的應(yīng)用場景下,NPU微核比大核能效最高可提升24倍,讓AI運算更省電。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。