關(guān)鍵字:LTE DSP 多核SoC 浮點運算 MIMO
LTE概述
蜂窩網(wǎng)絡的數(shù)據(jù)使用正迅速成長,基礎(chǔ)設(shè)備廠商亦期待4G標準,以便為移動用戶提供更大的容量及更好的使用體驗。3GPP所開發(fā)的LTE已被許多運營商選擇為無線基站及手機的新一代解決方案。LTE是3GPP標準第8版UMTS的提升。LTE一般稱為4G標準,是目前無線傳輸數(shù)據(jù)的重大變革。
LTE采用OFDMA(正交頻分多址)技術(shù),而3G技術(shù)則采用CDMA(碼分多址)技術(shù),此一變革可透過多天線信號處理達到較高的頻譜效率,并為較寬譜頻帶寬提供更多支持。
在OFDMA中,快速傅立葉轉(zhuǎn)換(FFT)將可用頻寬分割成許多正交的較小頻寬??焖俑盗⑷~逆轉(zhuǎn)換(IFFT)可重建頻帶。FFT及IFFT是經(jīng)過詳加定義的算法,當其采樣數(shù)為2的乘冪時即可有效執(zhí)行。OFDM系統(tǒng)常見的FFT采樣數(shù)為512、1024及2048,較小的采樣則為128及256。支援的頻寬為5、10、15及20MHz。該技術(shù)的優(yōu)點之一是能簡易地適用于不同的頻寬。
LTE也能夠使用先進的多天線信號處理技術(shù)。其中兩項常用的技術(shù)為多入多出(MIMO)處理及波束成形。在MIMO中,系統(tǒng)發(fā)現(xiàn)從其中一個傳輸天線接收到的信號會與第二個天線接收到的信息有極大的差異,這在室內(nèi)或人口密集的大城市相當常見,因為收發(fā)器及接收器之間有相當多反射與多重路徑。在這樣的情況下,各個天線在相同頻率下會傳輸不同的信號,在經(jīng)由接收器信號處理即可復原。
LTE對于SoC架構(gòu)的影響
這些新的LTE特性顯現(xiàn)出基站必須以較短的延遲及較多的彈性支持較高的吞吐量。這對系統(tǒng)設(shè)計的許多層面形成極大的壓力。為了滿足這些需求,TI開發(fā)出全新的SoC架構(gòu),其中許多內(nèi)建的組件可滿足LTE蜂窩基站的需求(見圖1)。
圖1:德州儀器的多核SoC架構(gòu)。
TI全新的架構(gòu)采用先進的DSP核技術(shù),頻率高達1.2GHz,而且總處理能力達到256GMAC,遠高于當前市面的DSP(見圖2)。該內(nèi)核支持定點及浮點運算,其中的指令集完全與TI的TMS320C64x+ DSP指令集向下兼容。定點及浮點運作的處理速度均超過1GHz,顯示DSP領(lǐng)域出現(xiàn)真正的變化。開發(fā)人員將不再需要在定點的原始速率及浮點的精度之間抉擇,如今已可兩者兼得,因為TI全新的架構(gòu)支持在定點及浮點指令之間切換。
圖2:德州儀器全新的架構(gòu)采用先進的DSP內(nèi)核技術(shù),頻率速度高達1.2GHz。
MIMO處理涉及針對相同頻譜的信號進行數(shù)據(jù)譯碼。相較于此一程序的算法,由于典型N變量的N是未知數(shù),需要矩陣求逆法才能解決。將矩陣求逆引入處理鏈,對于定點處理器的性能深具影響。這是因為矩陣求逆容易受到精度限制的影響,導致16位及32位定點運作的性能不佳,甚至無法運作。程序設(shè)計人員一般都必須使用虛擬浮點法來達到所需的精度,同時嘗試保留足夠的處理能力來執(zhí)行系統(tǒng)。
TI全新的架構(gòu)針對業(yè)界最高速DSP引進原生浮點支持,可謂是一大突破。浮點處理器的速度一般比定點處理器慢,因此不適用于蜂窩基站這樣的高性能場合。結(jié)合原生浮點支持及領(lǐng)先業(yè)界的C64x+定點架構(gòu)后,TI帶來定點及浮點兩者的最高處理效能,進而對LTE系統(tǒng)發(fā)揮影響。程序設(shè)計人員可使用優(yōu)化的16位程序代碼,其中精度不是影響的因素,而且對于需要高精度的算法可達到IEEE浮點精度,例如MIMO均衡器。這使得LTE系統(tǒng)架構(gòu)的效率相當高,使得基站可達到最低的功耗、最高的效能及最大的輸出量。
浮點算法設(shè)計的另一項優(yōu)點是能夠簡易地開發(fā)和升級算法,并導入實際的系統(tǒng)中。通信系統(tǒng)的一般設(shè)計流程是先根據(jù)計算機模型開發(fā)算法,然后將其用于初始的系統(tǒng)部署。隨著部署的范圍及運用不斷擴大,工程人員需要收集實際數(shù)據(jù)提供給算法團隊,以供提升系統(tǒng)性能。這些全新的算法通常是以本身是浮點運作的MATLAB實現(xiàn)進行開發(fā)。其中的難題在于將這些浮點MATLAB算法轉(zhuǎn)換為定點DSP,同時維持算法及系統(tǒng)兩者的性能,因為不靈活的算法會用盡系統(tǒng)資源,而降低整體的基站性能。
如果涉及復雜的矩陣處理,將程序代碼從MATLAB導入實際系統(tǒng)通常需要幾周或幾星期的時間。透過TI全新架構(gòu)的原生浮點支持,便不需要進行這整個程序。透過使用浮點C語言程序代碼以及直接編譯于TI的DSP,即可從MATLAB導入程序代碼。
其重要性對于LTE系統(tǒng)的系統(tǒng)設(shè)計人員及程序設(shè)計人員來說,并非言過其實。隨著LTE演變?yōu)長TE-A及未來的標準,浮點很可能在未來變得更加重要,因為多天線信號處理的趨勢顯得日益復雜。
多核導航器
現(xiàn)今基站OEM面臨的最大問題之一是開發(fā)出適用于基站的軟件。大系統(tǒng)的軟件開發(fā)會耗費長久的人力投入時間。TI全新的架構(gòu)運用前幾代多核及基站系統(tǒng)開發(fā)的經(jīng)驗,推出使用簡便但功能強大的SoC。TI全新架構(gòu)的基礎(chǔ)組件是新的多核導航器(Multicore Navigator)。TI的多核導航器是能夠在SoC中無縫地移動數(shù)據(jù)的系統(tǒng)組件。
一旦經(jīng)過配置,TI的多核導航器即可處理封包傳輸、內(nèi)存配置、加速器觸發(fā)及多重目的地,任何DSP核都不會消耗單一周期。這能夠釋放算法系統(tǒng)層級處理所需的DSP資源,完全不會使數(shù)據(jù)移動停滯;以往數(shù)據(jù)移動需要多次中斷及環(huán)境轉(zhuǎn)換,導致系統(tǒng)性能降低。
舉例來說,在LTE系統(tǒng)中,行動數(shù)據(jù)封包會到達天線接口(支持OBSAI及CPRI標準的專屬高速接口)。這些封包會在經(jīng)過隊列后傳送到FFT協(xié)同處理器(LTE L1處理的第1個步驟)進行處理,然后經(jīng)過隊列后傳送到適當?shù)腄SP核進行下一個處理步驟,以上完全不需要任何CPU介入。同樣地,數(shù)據(jù)可以從多個天線及多個區(qū)塊同時傳達,并且自動且適當?shù)貍魉汀?shù)據(jù)可以在系統(tǒng)組件之間移動,完全不需要CPU介入,也不會造成不同核之間的競用。
隨著TI對于關(guān)鍵基站組件的了解加深,便從先前的系統(tǒng)設(shè)計組件改良推出多核導航器。多核導航器為封包化數(shù)據(jù)流提供極高的效率,相當適用于LTE與WiMAX等高速3G系統(tǒng)(HSPA)與4G系統(tǒng)的封包處理,另外也能夠提供個別處理隊列及數(shù)據(jù)串流的硬件機制,這表示同時進行的傳輸運作不會相互干擾。換句話說,個別DSP核不需要等候其它內(nèi)核完成處理,而能夠共享資源。
TeraNet2
數(shù)據(jù)經(jīng)過系統(tǒng)外送到天線或進行傳輸時,SoC架構(gòu)必須支持極高的外部及內(nèi)部數(shù)據(jù)速率。支持這些速率需要許多不同層級的多種專用加速及可編程軟件組件。
支持這些組件之間的數(shù)據(jù)移動是設(shè)計中的關(guān)鍵層面之一。TI的TeraNet2屬于SoC層級片上網(wǎng)絡的一部分,能夠在內(nèi)核、外圍、內(nèi)存及加速器等組件之間提供每秒2TB的高速數(shù)據(jù)傳輸速率。就系統(tǒng)層級而言,這表示所有組件能夠同時獨立執(zhí)行,完全不需要等候其它組件完成處理或數(shù)據(jù)傳輸。在如同LTE基站的高度優(yōu)化且復雜的系統(tǒng)中,這對于性能有極大的影響,系統(tǒng)開發(fā)人員得以完全發(fā)揮SoC的性能。
L2處理
使用MIMO不僅影響物理層處理,也影響L2調(diào)度,不過一般不需要極為復雜的算法。調(diào)度是基站決定各移動用戶或設(shè)備在每幀中能獲得多少無線頻寬的過程。在LTE中,每隔1毫秒便會根據(jù)下列因素完成決定:
1.用戶活動–語音、視頻、游戲等
2.服務計劃的類型
3.用戶位置–高或低信號區(qū)域
這些因素會影響調(diào)度器如何決定幀分配。
MIMO使得其中的復雜度增加,因為基站需要一次將完全相同的頻帶分配給多位用戶。若要這么做,基站必須根據(jù)從各個用戶所測得的數(shù)據(jù)進行計算,因此決定多少用戶可同時進行調(diào)度。這需要每毫秒針對各種可能的用戶組合進行矩陣求逆,對于實時定點處理引擎而言,這是相當繁復的作業(yè)。不良的調(diào)度效能會導致昂貴的頻譜使用欠佳,造成用戶無法順利處理作業(yè)。如同對于MIMO計算一般,TI全新架構(gòu)中不可或缺的浮點支持可大幅簡化及加速必要的處理,因為原生浮點支持十分有助于矩陣求逆。
多核共享內(nèi)存控制器
另一項重要多核功能改進之處是TI全新的多核共享內(nèi)存控制器。由于多核需要依序處理數(shù)據(jù),從外部內(nèi)存存取數(shù)據(jù)或在各內(nèi)核的本地內(nèi)存之間移動數(shù)據(jù),會使實際性能大幅降低。在TI全新的架構(gòu)中,多核共享內(nèi)存控制器能夠讓內(nèi)核有效存取共享內(nèi)存,就如同專用的本地內(nèi)存一般。如此便不需要進行任何數(shù)據(jù)傳輸,而且能夠使各內(nèi)核立即有效處理共享內(nèi)存中儲存的數(shù)據(jù)。
透過結(jié)合多核共享內(nèi)存控制器、多核導航器與TeraNet2,TI能提供高效率的系統(tǒng)層級設(shè)計,使客戶得以發(fā)揮絕佳的多核效用。
可擴展性
LTE使得無線數(shù)據(jù)速度及蜂窩網(wǎng)絡拓樸展現(xiàn)嶄新的境界。目前蜂窩網(wǎng)絡主要采用宏蜂窩(macrocell)小區(qū),極少采用微微蜂窩(picocell)及飛蜂窩(femtocell)小區(qū)。隨著數(shù)據(jù)使用持續(xù)大幅飆長,經(jīng)過提升的LTE頻譜效率也無法再支持傳統(tǒng)的大型網(wǎng)絡拓樸。
3GPP標準團隊注意到這一點,因此正開發(fā)在蜂窩網(wǎng)絡中加入微微蜂窩小區(qū)和飛蜂窩小區(qū)的簡化方法,以便形成由不同大小的蜂窩小區(qū)組成的異構(gòu)網(wǎng)絡,而不僅是由宏蜂窩小區(qū)組成的同構(gòu)網(wǎng)絡(見圖3)。對于需要在各種基站架構(gòu)運用研究及開發(fā)資源的系統(tǒng)設(shè)計人員而言,解決方案及架構(gòu)的可擴展性是異構(gòu)網(wǎng)絡中相當重要的部份。
圖3:宏蜂窩、微蜂窩、微微蜂窩及飛蜂窩小區(qū)交錯并協(xié)同工作將形成未來的異構(gòu)網(wǎng)絡。
透過多核導航器,TI全新的SoC架構(gòu)使得軟件重復使用及重新部署達到前所未有的層級。此一全新架構(gòu)也支持各設(shè)備中不同數(shù)量的處理組件,這些處理組件可能是L1、L2、L3及傳輸功能的核心或協(xié)處理加速器。由于設(shè)備制造商能夠通過異構(gòu)網(wǎng)絡的所有組件實現(xiàn)他們的系統(tǒng),因此彈性軟硬件設(shè)計的結(jié)合有助于縮短不同開發(fā)的上市時間、優(yōu)化硬件成本,以及降低工程成本。
其中的關(guān)鍵在于多核導航器采用多核的概念,使得各內(nèi)核能夠依據(jù)硬件獨立運作。因此,使用多核導航器開發(fā)的內(nèi)核、協(xié)處理器及外圍軟件三者的概念僅需要最低程度的修改,因為硬件可依據(jù)異構(gòu)網(wǎng)絡中不同類型基站的性能需求加以調(diào)整。
本文小結(jié)
蜂窩網(wǎng)絡的變化相當劇烈且深遠;流經(jīng)系統(tǒng)的數(shù)據(jù)量日益增加,營運商及基站制造商正不斷地努力趕上。器件級別的創(chuàng)新將有助于提供所需的工具來維持和提升基礎(chǔ)架構(gòu),以支持新一代無線設(shè)備,全新的SoC架構(gòu)正是TI引領(lǐng)創(chuàng)新4G技術(shù)的其中一例。