国产亚洲自在精品久久,快猫视频在线看,国产精品va在线观看不

基于多核DSP互聯(lián)架構(gòu)的SAR處理研究與設(shè)計(jì)

2016年電子技術(shù)應(yīng)用第1期

張強(qiáng)，馮仰松，郭朋

中航工業(yè)雷華電子技術(shù)研究所，江蘇無錫214063

摘要： 提出了一種基于多核DSP互聯(lián)架構(gòu)的SAR成像處理方案。首先，介紹了一種基于方位子塊插值的PFA實(shí)時(shí)成像算法。其次，研究了TI多核DSP TMS320C6678的處理性能，介紹了一種典型的RapidIO互聯(lián)架構(gòu)，并進(jìn)一步提出基于該架構(gòu)的SAR成像處理方案。最后，通過給出SAR成像結(jié)果并對(duì)比傳統(tǒng)解決方案，證明了該處理方案的有效性和先進(jìn)性。

關(guān)鍵詞： 多核DSP 互聯(lián)架構(gòu) RapidIO 合成孔徑雷達(dá) 極坐標(biāo)格式算法

中圖分類號(hào)： TN957.52
文獻(xiàn)標(biāo)識(shí)碼： A
DOI：10.16157/j.issn.0258-7998.2016.01.009
中文引用格式： 張強(qiáng)，馮仰松，郭朋. 基于多核DSP互聯(lián)架構(gòu)的SAR處理研究與設(shè)計(jì)[J].電子技術(shù)應(yīng)用，2016，42(1)：37-39，43.
英文引用格式： Zhang Qiang，F(xiàn)eng Yangsong，Guo Peng. Research and design of SAR imaging based on multi-core DSP interconnection architecture[J].Application of Electronic Technique，2016，42(1)：37-39，43.

Research and design of SAR imaging based on multi-core DSP interconnection architecture

Zhang Qiang，F(xiàn)eng Yangsong，Guo Peng

Avic Leihua Electronic Technology Research Institute，Wuxi 214063，China

Abstract： This paper proposes a SAR imaging solutions based on multi-core DSP interconnect architecture. First, a Polar Format Algorithm(PFA) based on sub-aperture azimuth interpolation is introduced. Then, research the processing performance of TI’s multi-core DSP TMS320C6678, introduces an interconnect architecture based on RapidIO and then proposes a SAR imaging solution. Finally, a SAR image is given. Comparison with traditional solution proves that the solution is effective and advanced.

Key words : multi-core DSP；interconnect architecture；RapidIO；SAR；PFA

0 引言

合成孔徑雷達(dá)（SAR）是一種具有全天候、全天時(shí)、遠(yuǎn)距離獲取地面信息能力的傳感器。SAR具有防區(qū)外探測(cè)能力，在國境偵察、戰(zhàn)場(chǎng)偵察和戰(zhàn)場(chǎng)精確打擊等應(yīng)用中發(fā)揮著重要的作用，具有極高的軍事價(jià)值^[1]。SAR成像在高分辨率及高測(cè)繪帶寬的指標(biāo)需求下，距離方位二維數(shù)據(jù)量龐大，并且算法復(fù)雜，因此對(duì)信號(hào)處理系統(tǒng)的數(shù)據(jù)傳輸和實(shí)時(shí)處理能力提出了很高的要求。

傳統(tǒng)的單核DSP架構(gòu)限于點(diǎn)對(duì)點(diǎn)的連接方式，只能形成固定的拓?fù)浣Y(jié)構(gòu)，而且單核DSP的處理能力有限，提高系統(tǒng)實(shí)時(shí)處理能力只能通過多DSP間并行加流水的方式，導(dǎo)致系統(tǒng)規(guī)模巨大。系統(tǒng)規(guī)模的增加會(huì)帶來如復(fù)雜性高、穩(wěn)定性差、散熱差、重量大等一系列問題，并且隨著系統(tǒng)指標(biāo)要求的提高，這種固定的拓?fù)浼軜?gòu)已經(jīng)接近極限。多核DSP架構(gòu)除了提高單個(gè)DSP的處理能力，減少系統(tǒng)DSP數(shù)量，還支持RapidIO等高速串行總線，不僅滿足了系統(tǒng)對(duì)數(shù)據(jù)吞吐量的需求，也提供了更靈活高效的互聯(lián)模式。

1 PFA成像處理算法

在聚束模式合成孔徑雷達(dá)中，由于天線波束始終指向固定的成像區(qū)域，因此產(chǎn)生了雷達(dá)相對(duì)于目標(biāo)區(qū)域的轉(zhuǎn)動(dòng)。極坐標(biāo)格式算法（Polar Format Algorithm，PFA）最早是作為一種有效的旋轉(zhuǎn)目標(biāo)成像方法提出的，很快該方法就被成功地應(yīng)用于聚束模式SAR成像中，并且大大地提高了聚束SAR的聚焦成像范圍^[2]。

PFA是一種經(jīng)典的聚束SAR成像算法，該算法采用極坐標(biāo)格式存儲(chǔ)數(shù)據(jù)，有效地解決了遠(yuǎn)離成像區(qū)中心散射點(diǎn)的越分辨單元走動(dòng)問題，極大地提高了聚束SAR的有效聚焦成像范圍。相比于其他算法，PFA算法具有簡單高效、計(jì)算量小、實(shí)時(shí)性好和易于運(yùn)動(dòng)補(bǔ)償?shù)葍?yōu)點(diǎn)，廣泛應(yīng)用于SAR實(shí)時(shí)成像領(lǐng)域^[3-4]。

本文采用PFA成像算法，流程如圖1所示。

上述PFA算法在插值處理時(shí)需要存儲(chǔ)大量數(shù)據(jù)，存儲(chǔ)容量增加的同時(shí)還導(dǎo)致了成像時(shí)延變大?；诜轿蛔訅K插值的PFA成像算法^[5]，將所有距離線的集合分割成若干互有重合的子集合，每個(gè)子集合作為一個(gè)子塊，分發(fā)到相應(yīng)的處理器進(jìn)行插值處理，減少了的存儲(chǔ)容量的要求，降低了成像延時(shí)。

2 TMS320C6678多核DSP處理模式與性能研究

2.1 多核DSP處理模式

TI推出新一代多核DSP TMS320C6678(C6678)，內(nèi)嵌8個(gè)核，核速率最大1.25 GHz，工業(yè)級(jí)芯片可達(dá)1 GHz，單核浮點(diǎn)運(yùn)算能力最高可達(dá)20 GFLOP。C6678處理能力提高的同時(shí)還具備了更強(qiáng)的IO能力，其中RapidIO最高支持20 GB/s傳輸，以太網(wǎng)最高支持1 GB/s傳輸。該DSP的內(nèi)存可分為本地內(nèi)存(LL2)、共享內(nèi)存(SL2)和片外內(nèi)存(DDR)。其中LL2為512 KB，SL2為4 MB，DDR可尋址8 GB空間^[6]。

常用的多核處理模式有兩種，即主從模式和數(shù)據(jù)流模式，如圖2所示。

(1)主從模式，即一個(gè)核做數(shù)據(jù)接收和分發(fā)，對(duì)其他核的處理進(jìn)行管理，即1+N的工作模式；

(2)數(shù)據(jù)流模式，即處理按照數(shù)據(jù)的傳輸串行執(zhí)行。

由于多核共享數(shù)據(jù)帶寬，數(shù)據(jù)流模式僅適用于核間傳輸數(shù)據(jù)量較小的情況，而SAR處理數(shù)據(jù)量較大，因此采用主從模式。

基于C6678的多核主從模式如圖3所示。由于緩存（cache）會(huì)占用一部分LL2的存儲(chǔ)空間，剩余部分容量較小，所以LL2僅用于存儲(chǔ)小數(shù)據(jù)量的常量；SL2用于保存各個(gè)核處理時(shí)使用的中間結(jié)果；DDR空間較大，可以存儲(chǔ)DSP的輸入、輸出以及數(shù)據(jù)轉(zhuǎn)角時(shí)需要存儲(chǔ)的大量數(shù)據(jù)。

主核首先將接收到的DSP輸入數(shù)據(jù)分配給相應(yīng)的從核，再根據(jù)不同的處理啟動(dòng)從核進(jìn)行相應(yīng)的子處理，然后等待所有從核處理完畢，最后匯總從核的輸出結(jié)果并發(fā)送給其他DSP。這種主從模式將DSP的處理與數(shù)據(jù)傳輸分離，簡化了DSP間的時(shí)序關(guān)系，提高了系統(tǒng)的穩(wěn)定性。

2.2 多核DSP處理性能研究

根據(jù)上述主從模式，以FFT運(yùn)算為例，測(cè)試C6678多核并行處理性能。如圖4所示，隨著并行核數(shù)的增加，F(xiàn)FT處理時(shí)間也有所增加，這是由于多核共享SL2的數(shù)據(jù)帶寬，從核并行處理時(shí)會(huì)產(chǎn)生競(jìng)爭(zhēng)，導(dǎo)致DSP并行處理能力下降。因此，多核并行處理能力并不隨著參與處理的從核數(shù)量的增加而線性增加。

根據(jù)PFA成像算法流程，以1+4主從模式（1個(gè)主核加4個(gè)從核）為例，測(cè)試了SAR處理中各子功能多核并行處理性能，并對(duì)比單核DSP TS201，結(jié)果如表1所示。由于兩種處理器的主頻、內(nèi)存總線寬度、優(yōu)化能力等都不盡相同，并且某些子功能不適于并行處理（如自聚焦迭代過程），C6678與TS201的處理能力并不是簡單的4倍關(guān)系。

2.3 維護(hù)cache一致性

上文給出的結(jié)果，是在DSP使能cache的前提下得出的。對(duì)C6678來說，每個(gè)核都可以在LL2中開辟cache空間，在使能cache的情況下，每個(gè)核對(duì)SL2的讀寫操作都是在cache中進(jìn)行的，這樣極大地提高了內(nèi)存讀寫效率。以4 096點(diǎn)FFT運(yùn)算為例，使能cache的情況下耗時(shí)為68 μs，非使能cache的情況下則高達(dá)600 μs。

但是使能cache會(huì)導(dǎo)致cache一致性問題，cache一致性問題是指在含有多個(gè)cache的并行系統(tǒng)中，數(shù)據(jù)的多個(gè)副本因?yàn)闆]有同步更新而造成的不一致問題。這時(shí)需要軟件來維護(hù)cache一致性，維護(hù)cache一致性的操作分為cache無效化和cache回寫。例如當(dāng)核A需要更新數(shù)據(jù)給核B時(shí)，核A首先要執(zhí)行cache回寫操作，使cache中的數(shù)據(jù)更新到內(nèi)存中去，核B在讀取核A更新的數(shù)據(jù)前要執(zhí)行cache無效化操作，以保證從cache讀取的數(shù)據(jù)和內(nèi)存中一致。除了多核間維護(hù)cache一致性外，核與外設(shè)（如SRIO、EDMA等）間也要維護(hù)cache一致性，因?yàn)橥庠O(shè)對(duì)內(nèi)存的讀寫操作是不經(jīng)過cache的。

3 基于RapidIO互聯(lián)SAR實(shí)時(shí)處理系統(tǒng)設(shè)計(jì)

提高DSP的處理能力只是保證系統(tǒng)實(shí)時(shí)性的一方面，在典型的嵌入式系統(tǒng)中，瓶頸往往在于系統(tǒng)級(jí)互聯(lián)，即各元件之間的通信速度。RapidIO互聯(lián)架構(gòu)消除了該瓶頸，它提供了一種高性能、分組交換的互聯(lián)技術(shù)。目前C6678支持最高20 GB/s的傳輸速率。

圖5所示為一個(gè)典型的多核DSP互聯(lián)架構(gòu)，板內(nèi)DSP通過交換設(shè)備（SW）互聯(lián)，板間又通過SW互聯(lián)，從而組成一個(gè)RapidIO互聯(lián)網(wǎng)絡(luò)。傳統(tǒng)的固定拓?fù)浼軜?gòu)由于通信鏈路單一，使得系統(tǒng)內(nèi)每個(gè)DSP都不可替代。而在這種互聯(lián)架構(gòu)中，DSP在系統(tǒng)內(nèi)的邏輯位置都是等效的，可以方便地實(shí)現(xiàn)系統(tǒng)的重構(gòu)。同時(shí)，該互聯(lián)架構(gòu)以4DSP板卡為最小單元，可根據(jù)系統(tǒng)的需求進(jìn)行擴(kuò)展。這種RapidIO互聯(lián)架構(gòu)使得軟件設(shè)計(jì)不再受限于固定的拓?fù)浣Y(jié)構(gòu)，具有很高的重構(gòu)性和擴(kuò)展性。

為了充分利用多核DSP的并行處理性能，每個(gè)子功能模塊需要盡可能地完成更多功能，這樣也減少了子功能模塊間即DSP間的數(shù)據(jù)傳輸，減少了流水級(jí)數(shù)，降低了系統(tǒng)的復(fù)雜度。

SAR處理時(shí)序如圖6所示，補(bǔ)償處理由于實(shí)時(shí)性要求高，需要4個(gè)DSP進(jìn)行輪轉(zhuǎn)處理，處理結(jié)果同樣輪轉(zhuǎn)發(fā)送到DSP_21、DSP_22和DSP_23 3個(gè)DSP進(jìn)行子塊插值和二維IFFT處理，DSP_21、DSP_22和DSP_23處理完畢后發(fā)送輸出結(jié)果給DSP_24，DSP_24接收到所有子塊結(jié)果后，產(chǎn)生復(fù)圖像進(jìn)行后續(xù)處理，最終產(chǎn)生圖像并輸出。

4 成像結(jié)果驗(yàn)證

圖7所示為該SAR成像處理系統(tǒng)的驗(yàn)證平臺(tái)，調(diào)試計(jì)算機(jī)通過以太網(wǎng)輸入試飛獲取的原始數(shù)據(jù)，經(jīng)過處理系統(tǒng)進(jìn)行SAR成像處理，成像結(jié)果如圖8所示，圖像分辨率為0.5 m。由圖可見，該圖像各個(gè)部位聚焦良好、細(xì)節(jié)清楚且層次豐富，驗(yàn)證了該成像系統(tǒng)的有效性。

傳統(tǒng)的單核DSP架構(gòu)，需要多達(dá)40個(gè)DSP才能勉強(qiáng)保證SAR成像處理的實(shí)時(shí)性，該多核DSP架構(gòu)僅使用8個(gè)DSP即可滿足需求，并且仍留有一定的余量（每個(gè)DSP僅使用5個(gè)核），相比之下，該多核DSP互聯(lián)架構(gòu)優(yōu)勢(shì)明顯。

5 結(jié) 論

本文介紹了一種適于工程實(shí)現(xiàn)的實(shí)時(shí)SAR成像處理算法，重點(diǎn)研究了多核DSP（C6678）的處理模式、處理性能，并詳細(xì)分析了多核DSP中cache一致性問題。根據(jù)研究結(jié)論，測(cè)試驗(yàn)證了SAR處理的子功能模塊。隨后，介紹了一種典型的RapidIO互聯(lián)架構(gòu)，設(shè)計(jì)并實(shí)現(xiàn)了基于該架構(gòu)的SAR成像處理系統(tǒng)。結(jié)果表明，該系統(tǒng)相對(duì)于傳統(tǒng)架構(gòu)具有高效性、重構(gòu)性和可擴(kuò)展性。

參考文獻(xiàn)

[1] 周峰，王琦，邢孟道，等.一種機(jī)載大斜視SAR運(yùn)動(dòng)補(bǔ)償方法[J].電子學(xué)報(bào)，2007(35)：463-468.

[2] 孫進(jìn)平.機(jī)載聚束模式合成孔徑雷達(dá)的成像算法研究[D].北京：北京航空航天大學(xué)，2001.

[3] 毛新華.PFA在SAR超高分辨率成像和SAR/GMTI中的應(yīng)用研究[D].南京：南京航空航天大學(xué)，2009.

[4] CARRARA W G，GOODMAN R S，et al.Spotlight synthetic aperture radar signal processing algorithms.Artech House，Boston，1995.

[5] 李愛波，姜明，何濤.一種基于改進(jìn)PFA算法的機(jī)載大斜視SAR實(shí)時(shí)信號(hào)處理系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)工程與應(yīng)用，2014.

[6] TMS320C6678 Multicore Fixed and Floating-Point Digital Signal Processor[J].USA：Texas，2011.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容