·全面的視覺平臺集成了新的CEVA-XM6 DSP內(nèi)核、硬件加速器、神經(jīng)網(wǎng)絡軟件框架、軟件庫和廣泛的算法支持
·推動實現(xiàn)面向大眾市場智能視覺應用的嵌入式神經(jīng)網(wǎng)絡
·面向自主駕駛、感應和躲避式無人機、虛擬和增強現(xiàn)實、智能監(jiān)控、智能手機、機器人等應用
專注于智能互聯(lián)設備的全球領先信號處理IP授權公司CEVA宣布推出一款基于DSP的全新產(chǎn)品,為低功耗嵌入式系統(tǒng)帶來深度學習和人工智能(AI)能力。這款全面的可擴展集成硬件和軟件IP平臺的核心是全新圖像和視覺DSP CEVA-XM6 ,使得開發(fā)人員能夠高效地利用神經(jīng)網(wǎng)絡和機器視覺能力,用于智能手機、無人駕駛車輛、監(jiān)控、機器人、無人機和其它帶有相機功能的智能器件。
與上一代CEVA-XM4智能視覺DSP相比,這個基于CEVA-XM6的新型視覺平臺的神經(jīng)網(wǎng)絡性能提高至八倍,所有計算機視覺內(nèi)核性能改善達到三倍。這個新型架構集成的關鍵增強功能包括新的矢量和標量處理單元,以及指令集、存儲帶寬和 DMA的大量增強功能。
這個新型視覺平臺進一步擴展了CEVA產(chǎn)品在實施神經(jīng)網(wǎng)絡時與采用GPU的主流架構相比的性能優(yōu)勢。與用于計算機視覺和深度學習的領先GPU嵌入式系統(tǒng)相比,CEVA最新的圖像和視覺平臺的性能每瓦特效率(performance-per-watt efficiency)提升25倍以上,用于AlexNet和GoogLeNet等卷積神經(jīng)網(wǎng)絡(CNN)的處理速度加快四倍。
CEVA視覺業(yè)務部副總裁兼總經(jīng)理Ilan Yona稱:“隨著計算機視覺和深度學習技術成為主流,我們需要在高功耗GPU引擎產(chǎn)生的深度神經(jīng)網(wǎng)絡和部署這些功率和性能受限的嵌入式應用之間架起橋梁,消除中間的鴻溝。我們的新型視覺平臺在這方面非常出色,為開發(fā)人員提供最全面的技術集,能夠快速應對這些嵌入式使用案例?!?/p>
這款視覺平臺集成了大量軟件和硬件IP,為在嵌入式系統(tǒng)中部署機器視覺和深度學習提供上市時間和功率優(yōu)勢。除CEVA-XM6 DSP本身之外,這平臺還包括CNN特定功能加速器和圖像去扭曲(針對所有類型的圖像變換)、CEVA受到廣泛贊譽的CDNN2神經(jīng)網(wǎng)絡軟件框架、OpenCV、OpenCL和OpenVX API、CEVA-CV計算機視覺庫,以及一組廣泛應用的優(yōu)化算法。
嵌入式視覺聯(lián)盟創(chuàng)立者Jeff Bier道:“各種終端產(chǎn)品的設計人員都渴望在其設計中集成視覺智能。通常,這些開發(fā)人員使用的視覺和深度學習算法要求以低成本、低功耗,并且可編程的方法提供極高的處理性能。我非常贊賞CEVA長期致力于提供滿足這些需求的處理器和軟件工具?!?/p>
技術特點
CEVA-XM6以強大的CEVA-XM4和CEVA-MM3101處理器為基礎,并已經(jīng)有了超過25個設計項目。它具備了一系列提供突破性神經(jīng)網(wǎng)絡性能和高級計算機視覺處理能力的架構創(chuàng)新和增強功能,包括:
·創(chuàng)新矢量處理單元(VPU)架構:確保95%以上的MAC利用率,是現(xiàn)今業(yè)界中無人能及的卓越水平
·增強并行分散 – 集中存儲負荷機制:進一步改善視覺算法性能,包括SLAM和深度映射。
·Sliding Window 2.0? :這個專利機制利用圖像處理的像素重疊,有助于在更廣泛的神經(jīng)網(wǎng)絡中實現(xiàn)更高的利用率,以及適應這些網(wǎng)絡日益增加的復雜性。
·選件32路SIMD矢量浮點單元,其中包括IEEE半精度標準(FP16)和重大的非線性運算增強。
·其它改進包括加速CNN性能的增強3D數(shù)據(jù)處理方案,與CEVA-XM4相比,控制代碼性能改進了50%,并具有進一步縮小代碼尺寸的新的可擴展單元及多核和系統(tǒng)集成支持。
除CEVA-XM6 DSP外,這種視覺平臺的其它關鍵部件包括:
·CDNN加速器:16位CDNN加速器具有512 MACs/cycle,確保提供業(yè)界最佳性能以處理目前最復雜的神經(jīng)網(wǎng)絡。CDNN加速器還用于釋放CEVA-XM6 DSP內(nèi)的256 MAC單元,允許并行運行其它計算機視覺任務。這種靈活的方法使得CDNN加速器配合CEVA-XM6的架構成為了支持新的圖像算法、網(wǎng)絡結構和改變快速演變的深度學習空間中的層類型的最佳選擇。
·圖像去扭曲加速器 :對于寬角攝像頭應用,比如360度攝像頭來說,圖像去扭曲加速器支持ARM幀緩沖壓縮(AFBC)協(xié)議,提供最佳系統(tǒng)互操作性。
·加速器認知補充軟件:在CEVA-XM6 DSP上運行,提供高效加速器利用率,使設計人員能夠進一步差異化其產(chǎn)品設計。
·CDNN2軟件框架:經(jīng)優(yōu)化及與CEVA-XM6和加速器協(xié)作,使得開發(fā)人員很容易利用此工具生成并將其專有神經(jīng)網(wǎng)絡移植到CEVA-XM6上,從而顯著加速利用最新最先進的網(wǎng)絡拓撲和層的性能,包括支持Caffe和Google的機器學習軟件庫TensorFlow。
·符合ISO 26262主動安全性的產(chǎn)品包:在汽車應用場合支持下一代ADAS和自主駕駛解決方案的需求。
CEVA的CDNN2軟件框架同時針對CEVA-XM6和CDNN加速器優(yōu)化,完全支持16位定點精度,確保運行在32位浮點環(huán)境中培訓的網(wǎng)絡時精度降低小于1%。這是神經(jīng)網(wǎng)絡從研發(fā)過渡到面向大批量汽車和消費者應用的高成本和功率效益解決方案的關鍵。
供貨
CEVA將于2016年第四季向主要客戶授權許可CEVA-XM6 DSP和視覺平臺組件,并且將于2017年第一季進行普通授權許可。