《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > 國內(nèi)首款存算一體大算力芯片,瞄準(zhǔn)智能駕駛!

國內(nèi)首款存算一體大算力芯片,瞄準(zhǔn)智能駕駛!

2023-05-16
作者: 杜芹
來源:半導(dǎo)體行業(yè)觀察

  用存算一體創(chuàng)新架構(gòu),重構(gòu)智能駕駛芯片。后摩智能是國產(chǎn)AI大算力智駕芯片領(lǐng)域跑出的一匹黑馬。

  ChatGPT等人工智能應(yīng)用的爆火再次引發(fā)了行業(yè)對(duì)大算力的需求。未來的計(jì)算系統(tǒng)相比現(xiàn)在的芯片,至少需要有1000倍甚至更高的效率提升才能滿足無處不在的萬物智能。AI芯片是AI算力的“心臟”,而高性能的AI芯片需要先進(jìn)的制程技術(shù)來實(shí)現(xiàn)更小的晶體管、更高的集成度和更低的功耗。隨著摩爾定律在逼近極限,如果繼續(xù)依靠先進(jìn)工藝的底層技術(shù)創(chuàng)新,沿這個(gè)方向走下去,能否達(dá)到未來所需的算力提升?不好說。但無論如何,行業(yè)正在為之努力。

  與此同時(shí),行業(yè)內(nèi)也有人在另辟蹊徑,利用底層架構(gòu)創(chuàng)新來實(shí)現(xiàn)算力的提升。近幾年來,存算一體在作為一項(xiàng)有望突破算力瓶頸的先進(jìn)技術(shù),正在被國內(nèi)外越來越多企業(yè)選擇。存算一體這種創(chuàng)新的架構(gòu),通過將部分或全部的計(jì)算移到存儲(chǔ)中,把計(jì)算單元和存儲(chǔ)單元集成在同一個(gè)芯片,在存儲(chǔ)單元內(nèi)完成運(yùn)算,減少數(shù)據(jù)來回搬運(yùn)造成的數(shù)據(jù)傳輸延遲、損耗等問題,以此來突破芯片性能瓶頸及提升能效比。

  而在存算一體大算力這一領(lǐng)域,國內(nèi)芯片企業(yè)走在了前列。

  從0到1,國內(nèi)首款存算一體大算力芯片正式量產(chǎn)

  2023年5月10日,后摩智能正式發(fā)布首款存算一體智駕芯片——鴻途H30。僅用12nm工藝制程,該芯片的物理算力實(shí)現(xiàn)了高達(dá)256TOPS,在Int8全精度的計(jì)算提供下,計(jì)算延時(shí)只有1.5ns,能效比為30-150 TOPS/W,比業(yè)界同等精度計(jì)算條件下的水平提高了3倍以上。250TOPS可以說是目前國內(nèi)效率最高的大算力智能駕駛芯片!35W的典型功耗也令人震驚。這就是存算一體架構(gòu)技術(shù)的魅力。

  除了大算力和低功耗之外,它還具有全精度、車規(guī)級(jí)、可量產(chǎn)、通用性的特性。而透過這些突破性技術(shù)表現(xiàn),我們也嗅到了后摩智能濃濃的技術(shù)創(chuàng)新實(shí)力。

  首先是存算一體電路結(jié)構(gòu)的設(shè)計(jì),后摩智能采用的是基于SRAM存儲(chǔ)介質(zhì)的存算一體架構(gòu),將定制化的乘加電路和傳統(tǒng)的SRAM Bit Cell電路完全融合在一起。下圖中右圖是存算一體電路的架構(gòu)圖,淺色部分是傳統(tǒng)的SRAM電路,深色部分是一些定制化的電路結(jié)構(gòu),包括乘法器、加法數(shù)、累加器等,做到數(shù)據(jù)讀取出來之后馬上可以在原地參與計(jì)算。

  其次,H30芯片采用的是后摩智能自研的AI處理器架構(gòu)—IPU(Intelligence Processing Unit)。目前該IPU架構(gòu)規(guī)劃有三代:第一代是天樞架構(gòu),面向智能駕駛;第二代是天璇架構(gòu),它可以應(yīng)用于更多的場(chǎng)景;第三代是天璣架構(gòu),將面向通用人工智能。H30芯片采用的是第一代天樞架構(gòu)IPU。

  解決了存和算的問題,在數(shù)據(jù)的傳輸方面:1)后摩智能專門設(shè)計(jì)了專用的數(shù)據(jù)傳輸總線,它能把各個(gè)Tile和各個(gè)IPU核連接起來,在它們之間建立高速的、直接的數(shù)據(jù)傳輸通道。2)在AI計(jì)算里,數(shù)據(jù)復(fù)用是一個(gè)非常重要的特性,因此,后摩智能為此設(shè)計(jì)了獨(dú)特的多波機(jī)制,避免了數(shù)據(jù)重復(fù)的讀取和傳輸。

  通過存算電路底層技術(shù)的創(chuàng)新加上AI處理器架構(gòu)的創(chuàng)新,再加上出色的工程實(shí)現(xiàn)能力,最終鴻途H30實(shí)現(xiàn)了多項(xiàng)芯片性能指標(biāo)的突破。與某國際巨頭芯片對(duì)比,在工藝落后一代的情況下,進(jìn)行完全相同的測(cè)試,H30芯片的功耗減少了50%以上,性能卻有2倍以上的提升。

  為了幫助客戶更好的落地,后摩智能同步推出了基于鴻途 H30芯片打造的智能駕駛硬件平臺(tái)——力馭(Sailing,寓意早日揚(yáng)帆起航)。僅依靠一顆H30芯片,力馭平臺(tái)的CPU算力高達(dá)200 Kdmips,AI算力高 256Tops,足夠支撐智能駕駛所有的傳感器。而且力馭平臺(tái)的功耗僅為85W,可采用更加靈活的散熱方式,實(shí)現(xiàn)更低成本的便捷部署。

  基于鴻途H30芯片后摩智能自主研發(fā)了一款軟件開發(fā)工具鏈—后摩大道,支持 PyTorch、TensorFlow、ONNX等主流開源框架,編程兼容CUDA前端語法,同時(shí)支持SIMD和SIMT 兩種編程模型,兼顧運(yùn)行效率和開發(fā)效率,進(jìn)一步實(shí)現(xiàn)了鴻途?H30 的高效、易用。

  目前后摩智能的鴻途H30芯片將于6月份開始給Alpha客戶送測(cè)。同時(shí),后摩智能的第二代產(chǎn)品鴻途H50 已經(jīng)在全力研發(fā)中,將于2024年推出,支持客戶 2025年的量產(chǎn)車型。

  存算一體技術(shù)優(yōu)勢(shì)已然顯現(xiàn)

  當(dāng)下,在各國都在爭(zhēng)搶加速進(jìn)入人工智能時(shí)代的時(shí)間節(jié)點(diǎn)下,算力是AI技術(shù)角逐的源動(dòng)力。然而持續(xù)緊張的地緣關(guān)系,國內(nèi)在先進(jìn)工藝采用方面的掣肘,使得國產(chǎn)算力的提速面對(duì)著多方面的難題,不僅是算力的需求,功耗也是行業(yè)所面臨的挑戰(zhàn)。此次后摩智能率先在存算一體大算力芯片上的突破,可以說用實(shí)際產(chǎn)品證明了存算一體技術(shù)的優(yōu)勢(shì)和潛力。

  計(jì)算效率高,工藝依賴度低:我們可以看到,后摩智能鴻途H30芯片,所采用的12nm的工藝并不是最先進(jìn)的,但卻能達(dá)到超過200TOPS的算力。縱觀全球AI芯片的算力發(fā)展情況,基于傳統(tǒng)路徑的芯片在算力提升方面需要很大程度上依賴先進(jìn)工藝,行業(yè)內(nèi)達(dá)到200TOPS算力的AI芯片一般的工藝都要7nm甚至更先進(jìn)才行,如英偉達(dá)的Orin芯片和國內(nèi)的一些200TOPS左右算力的芯片等大多都是在7nm。更甚之,英偉達(dá)的Thor可以實(shí)現(xiàn)1000T以上的算力,但是工藝要采用4nm。

  與某國際巨頭的8nm智駕領(lǐng)域的某款旗艦芯片,以Resnet50網(wǎng)絡(luò)為例,后摩智能H30的性能在等于1的配置條件下,可以達(dá)到8700幀每秒;如果把它設(shè)成8,可以突破1萬幀,達(dá)到10300幀每秒的性能。整體來說后摩H30芯片的性能可以達(dá)到友商的2倍以上。

  微信截圖_20230516111259.png

  低成本:因?yàn)閷?duì)工藝的依賴性不高,所以可以實(shí)現(xiàn)低成本,更加普惠。后摩智能聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁信曉旭在發(fā)布會(huì)上透露到:“H30芯片在成本上會(huì)非常非常有競(jìng)爭(zhēng)力?!?/p>

  更低的能耗:由于數(shù)據(jù)傳輸?shù)母咝裕嫠阋惑w芯片在計(jì)算過程中需要消耗更少的能量,從而可以實(shí)現(xiàn)更低的功耗,也更符合可持續(xù)和低碳環(huán)保的理念。

  計(jì)算延時(shí)低:由于存儲(chǔ)和計(jì)算任務(wù)在同一芯片內(nèi)部完成,存算一體架構(gòu)芯片能夠更快地完成數(shù)據(jù)的讀寫和處理,從而提高數(shù)據(jù)處理的效率。例如,相比業(yè)界用5nm工藝的存算一體芯片,后摩智能的鴻途H30芯片在Int8全精度的計(jì)算提供下,計(jì)算延時(shí)只有1.5ns,降低了70%。

  支持大規(guī)模并行計(jì)算:存算一體架構(gòu)芯片能夠支持大規(guī)模并行計(jì)算,從而更好地滿足人工智能、邊緣計(jì)算、高性能計(jì)算等應(yīng)用的需求。

  我們也可以看到,后摩智能的鴻途H30存算一體大算力芯片落地的第一站是智能駕駛。單從市場(chǎng)應(yīng)用場(chǎng)景來看,存算一體架構(gòu)的芯片也顯現(xiàn)出多個(gè)優(yōu)勢(shì):

  1:存算一體架構(gòu)芯片的高效數(shù)據(jù)傳輸和計(jì)算能力可以幫助實(shí)現(xiàn)高效的圖像處理;

  2:智能駕駛的安全性是行業(yè)密切關(guān)注的一大問題,而存算一體架構(gòu)的芯片可以將敏感數(shù)據(jù)存儲(chǔ)在同一芯片中,從而減少了數(shù)據(jù)傳輸?shù)娘L(fēng)險(xiǎn),提高了數(shù)據(jù)的安全性;

  3:智能駕駛需要支持多種算法和模型,包括神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等。存算一體芯片可以根據(jù)不同的算法和模型進(jìn)行靈活配置,從而實(shí)現(xiàn)更高效的計(jì)算和存儲(chǔ)。在這方面,鴻途H30芯片可以支持經(jīng)典的基礎(chǔ)網(wǎng)絡(luò)Resnet50,包括BEV網(wǎng)絡(luò)模型以及廣泛應(yīng)用于高階輔助駕駛領(lǐng)域的 Pointpillar網(wǎng)絡(luò)模型。

  后摩智能創(chuàng)始人吳強(qiáng)也表示,從技術(shù)和產(chǎn)品需求匹配的角度來看,存算一體帶來的技術(shù)和產(chǎn)品的優(yōu)勢(shì),和智能駕駛的關(guān)鍵需求是天然吻合的。其原因主要有兩方面:一方面是算力功耗的需求;另一方面從終局的角度來看,智能駕駛的終局是要代替人,實(shí)現(xiàn)無人駕駛。所以智能駕駛芯片一定要無限接近人腦的效率。而存算一體技術(shù)正是一個(gè)比傳統(tǒng)架構(gòu)更接近人腦的計(jì)算形式,它也能夠達(dá)到比傳統(tǒng)架構(gòu)高許多的計(jì)算效率。

  從1到100,存算一體技術(shù)將走向更多應(yīng)用

  對(duì)于市場(chǎng)空間如此大的智能駕駛,如果后摩智能的鴻途H30芯片能夠真正走量并釋放出其優(yōu)勢(shì)。那么,這將不僅為國產(chǎn)智能駕駛領(lǐng)域的客戶們提供一個(gè)差異化的新選擇,也將為存算一體架構(gòu)的芯片的大規(guī)模發(fā)展奠定良好的基礎(chǔ)。許多機(jī)構(gòu)都預(yù)測(cè)2023年將是存算一體大規(guī)模商業(yè)落地的元年,伴隨著此次鴻途H30芯片的量產(chǎn)發(fā)布,存算一體技術(shù)的商業(yè)化元年也即將正式開啟。

  作為一項(xiàng)通用技術(shù),存算一體技術(shù)可以根據(jù)不同領(lǐng)域和應(yīng)用場(chǎng)景進(jìn)行優(yōu)化和應(yīng)用。智能駕駛只是存算一體技術(shù)應(yīng)用的冰山一角,存算一體還有很大的應(yīng)用可能性和商業(yè)價(jià)值的潛力深埋于底下。比如人形機(jī)器人,服務(wù)機(jī)器人,以及對(duì)算力和能效有更高要求的場(chǎng)景如ChatGPT、云端推理等等都將是存算一體技術(shù)能夠發(fā)揮所長(zhǎng)的應(yīng)用。

  當(dāng)然,存算一體技術(shù)的更大商用化還需要產(chǎn)業(yè)界上下游的共同努力,讓存算一體技術(shù)的規(guī)?;瘧?yīng)用從1走向100。后摩智能聯(lián)合創(chuàng)始人兼研發(fā)副總裁陳亮在會(huì)上透露:“在不久的將來,我們會(huì)把我們的AI處理器硬件設(shè)計(jì)開源,大家可以去下載到我們的IPU設(shè)計(jì)資料,做PPA的評(píng)估和軟件算法的開發(fā),或者甚至將來用到自己的產(chǎn)品當(dāng)中去。我們希望有更多的人和組織能夠參與進(jìn)來,相信以大家的智慧可以更好的讓這個(gè)方向落地,大家可以共建生態(tài),最終讓整個(gè)產(chǎn)業(yè)鏈?zhǔn)芤?。?/p>

  寫在最后

  2020年11月成立,2022年5月驗(yàn)證芯片成功點(diǎn)亮,2023年5月量產(chǎn)芯片面世,對(duì)于存算一體新架構(gòu)+大算力這樣一項(xiàng)顛覆性技術(shù)而言,這個(gè)速度彰顯了后摩智能的產(chǎn)品落地能力。通過不斷突破技術(shù)瓶頸和持續(xù)的研發(fā)投入,后摩智能成功地將存算一體的概念應(yīng)用于大算力AI芯片,并實(shí)現(xiàn)了高性能計(jì)算與低能耗的平衡。后摩智能的存算一體AI芯片取名鴻途,寓意是有鴻鵠之志,但是又腳踏實(shí)地,走向漫漫征途。

  憑借這一芯片的落地,后摩智能迅速成長(zhǎng)為國產(chǎn)AI芯片行業(yè)的重要?jiǎng)?chuàng)新力量。而且在當(dāng)下大算力AI芯片發(fā)展遭遇瓶頸之際,作為國內(nèi)率先落地存算一體大算力AI芯片的公司,后摩智能用實(shí)打?qū)嵉漠a(chǎn)品,為我國發(fā)展高算力、低功耗和低成本的AI芯片注入新的發(fā)展動(dòng)能。

  更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<

微信圖片_20210517164139.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。