摘 要: 基于多片" title="多片">多片TS101S的并行處理" title="并行處理">并行處理自適應(yīng)波束形成" title="自適應(yīng)波束形成">自適應(yīng)波束形成系統(tǒng),給出了系統(tǒng)的算法、結(jié)構(gòu)及實驗結(jié)果。
關(guān)鍵詞: TS101S 自適應(yīng)波束形成 IQRD-SMI 多處理器系統(tǒng)
自適應(yīng)波束形成是利用現(xiàn)時的輸入信號和干擾矢量采用自適應(yīng)算法進(jìn)行處理,以達(dá)到通過有用信號或需要方向的信號且抑制干擾的目的。由于其可以在惡劣的敵方干擾和電磁兼容環(huán)境中提高雷達(dá)、通信等系統(tǒng)的抗干擾能力,所以被廣泛應(yīng)用于雷達(dá)、聲納和通信等多種軍事應(yīng)用和國民經(jīng)濟(jì)領(lǐng)域。當(dāng)前,自適應(yīng)波束形成通常采用數(shù)字方式在基帶實現(xiàn),即自適應(yīng)數(shù)字波束形成(ADBF)。ADBF與自適應(yīng)波束形成可視為同一技術(shù)。
ADBF技術(shù)要完成相當(dāng)復(fù)雜的運(yùn)算。為了實時實現(xiàn)該技術(shù),一方面要從算法本身提高ADBF系統(tǒng)的處理性能,另一方面需研制處理器結(jié)構(gòu)(特別是以Systolic和Wavefront為代表的高速并行處理機(jī)),以滿足高速、實時的需要。目前,隨著高性能通用DSP的迅猛發(fā)展并結(jié)合并行性能優(yōu)越的Systolic陣,采用通用DSP實現(xiàn)自適應(yīng)波束形成已成為一種趨勢。
本文描述了一種基于多片TS101S的并行處理自適應(yīng)波束形成系統(tǒng),討論了系統(tǒng)的算法、結(jié)構(gòu),給出了實驗結(jié)果。
1 IQRD-SMI自適應(yīng)波束形成算法
1.1 算法原理
自適應(yīng)陣處理系統(tǒng)" title="處理系統(tǒng)">處理系統(tǒng)(M陣元的均勻線陣),結(jié)構(gòu)如圖1所示。其中中虛線框內(nèi)為自適應(yīng)波束形成系統(tǒng),也是本文研究的部分。設(shè)Xn為n次采樣得到的n×M維輸入數(shù)據(jù)矩陣,即Xn=[xT(1),xT(2),L,xT(n)]T。其中:xT(i)=[x1(i) x2(i) ∧ xM(i)],i=1,2,……∧ n,表示在第i次快拍時各陣元上的數(shù)據(jù)。為了提高算法的并行性能,采用數(shù)據(jù)域ADBF算法,其典型代表是QR分解SMI(QRD-SMI)算法[1~3]。該算法避免了直接利用協(xié)方差矩陣Rxx求解線性方程,而是將Rxx分解,并利用Givens旋轉(zhuǎn)實現(xiàn)數(shù)據(jù)矩陣的QR分解,最終將自適應(yīng)權(quán)矢量w的求解問題轉(zhuǎn)化為如下三角線性方程組的求解問題。
1.2 Systolic陣結(jié)構(gòu)
圖2為IQRD-SMI算法的Systolic陣結(jié)構(gòu)(以三陣元為例),所有的并行處理系統(tǒng)可視為以處理器為節(jié)點的網(wǎng)絡(luò)。設(shè)計并行處理系統(tǒng)時必須考慮許多問題,其中處理器系統(tǒng)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)及節(jié)點處理器的選擇和設(shè)計最為重要。良好的專用并行處理系統(tǒng)應(yīng)該具有模塊化、流水處理、局域性等特點。圖2所示結(jié)構(gòu)可以很好地滿足實時/并行處理的要求。
該Systolic陣包含四種處理器單元。下三角矩陣B(即===)部分的bij單元儲存并更新====的各元素;中間向量z(n)中各zi單元用以產(chǎn)生系統(tǒng)進(jìn)行Givens旋轉(zhuǎn)更新所需的旋轉(zhuǎn)因子;中間向量v中各vi單元完成對vi的儲存和更新;最后,wi單元完成權(quán)向量的更新和輸出??梢钥吹剑撍惴捌銼ystolic陣避免了QR分解SMI算法需要的前后向回代過程,整個Systolic陣系統(tǒng)能高效并行地完成權(quán)向量的更新和提取,可以滿足實際雷達(dá)自適應(yīng)波束形成系統(tǒng)對實時性的要求。
為了減少處理器數(shù)目,通常采用線性陣列結(jié)構(gòu),把實際算法所采用的非線性陣映射為線性陣。本文所采用的映射方式如圖3所示。此映射方式有以下優(yōu)點:處理器單元(PE)數(shù)大大減少;數(shù)據(jù)傳遞關(guān)系簡單,數(shù)據(jù)均從第一個PE節(jié)點流入,內(nèi)部PE節(jié)點與外界無輸入輸出關(guān)系,單向流動,在最后一個PE節(jié)點以流水方式輸出;每一個節(jié)點只與相鄰的節(jié)點有數(shù)據(jù)交換。該種映射方式能方便地安排輸入/輸出接口、數(shù)據(jù)流和控制流,也有利于系統(tǒng)的擴(kuò)展和重構(gòu)。
2 多片TS101S實現(xiàn)方案
ADSP-TS101S是ADI公司于2001年底推出的新一代高性能數(shù)字信號處理器,主頻300MHz,片內(nèi)存儲器6Mbit。它是由ADSP-2106x/2116x系列發(fā)展起來的一款極高性能的靜態(tài)超標(biāo)量處理器,專為大的信號處理任務(wù)和通信結(jié)構(gòu)進(jìn)行了優(yōu)化。TS101S靜態(tài)超標(biāo)量結(jié)構(gòu)使DSP每周期能夠執(zhí)行多達(dá)4條指令、24個16位定點運(yùn)算和6個浮點運(yùn)算。其優(yōu)越的運(yùn)算處理性能使得采用通用DSP實時地實現(xiàn)ADBF成為可能。
筆者研制的含有4片TS101S的多處理器實驗系統(tǒng)如圖4。系統(tǒng)為鏈路口耦合流水線方式多處理器系統(tǒng),因為TS101S鏈路口傳輸數(shù)據(jù)率與外部總線相當(dāng),同時鏈路口耦合方式具有片間通信簡單、能實現(xiàn)無縫連接、各DSP程序可以獨(dú)立設(shè)計、PCB板設(shè)計容易等優(yōu)點。片間數(shù)據(jù)傳送采用鏈路口鏈?zhǔn)紻MA方式,鏈?zhǔn)紻MA在完成一次DMA傳輸后,能自動對DMA參數(shù)寄存器載入新值,實現(xiàn)自動初始化(無需處理器核干預(yù)),開始下一次傳輸。片間通信采用鏈?zhǔn)紻MA中斷方式,中斷在整個鏈序列結(jié)束后產(chǎn)生。板上還接一32MB的SDRAM和4Mbit的Flash,它們都掛接在各DSP的外部總線上。四片DSP的JTAG口連在一起通過仿真器與計算機(jī)通信,ADBF模擬用的數(shù)據(jù)、系數(shù)因子及DSP程序利用仿真器(系統(tǒng)采用ADI公司的ADDS-HPPCI-ICE仿真器)通過JTAG口下載到各DSP上。處理數(shù)據(jù)的流向依次為:DSPA→DSPB→DSPC→DSPD,最后在DSPD完成波束形成,在任務(wù)分配上應(yīng)注意各DSP均勻分配。軟件平臺使用VisualDSP++3.5。
并行處理機(jī)的基本性能取決于組成并行處理機(jī)的要素:處理單元、并行處理機(jī)網(wǎng)絡(luò)結(jié)構(gòu)、并行算法程序和任務(wù)分配方法。實驗方案對上述要素均有較好的把握。
3 實驗結(jié)果
實驗?zāi)P蜑椋?陣元,均勻線陣(ULA),陣元間距為λ/2。為了測試算法和DSP實現(xiàn)系統(tǒng)方案的性能,按照采樣數(shù)滿足基本數(shù)2M(16次)的條件分析系統(tǒng)對單干擾和雙干擾的實驗性能。當(dāng)采樣數(shù)增大時,使得協(xié)方差矩陣的估計越充分,干擾抑制深度進(jìn)一步加深,并且旁瓣性能逐步改善。為了改善波束旁瓣性能,均采用了對角加載" title="加載">加載技術(shù)(實驗過程未采用操縱矢量加窗)。本文做了大量的實驗,實驗結(jié)果與計算機(jī)仿真一致。
圖5為單干擾源實驗結(jié)果。自適應(yīng)陣的瞄準(zhǔn)方向為30°,信號噪聲比(SNR)為20dB;干擾噪聲比(INR)為40dB,到來角為0°。30dB加載??梢钥吹教幚硐到y(tǒng)在干擾方向產(chǎn)生了相當(dāng)深的零點,其零深約為-60dB。
圖6為雙干擾源實驗結(jié)果。自適應(yīng)陣的瞄準(zhǔn)方向為20°,信號噪聲比(SNR)為30dB;干擾1:干擾噪聲比為80dB(強(qiáng)干擾),到來角為0°;干擾2:干擾噪聲比為20dB(弱干擾),到來角為-20°。60dB加載??梢钥吹教幚硐到y(tǒng)在兩個干擾方向均產(chǎn)生了相當(dāng)深的零點,一個零深約為-70dB(對強(qiáng)干擾),另一個約為-30dB(對弱干擾)。其中對弱干擾的抑制沒有強(qiáng)干擾的明顯,原因在于對角加載的影響。理論證明:對角加載在改善波束旁瓣性能的同時,對弱干擾的抑制有所降低,在加載時加載值應(yīng)合理選擇。
對于雙干擾,實際測得系統(tǒng)的響應(yīng)時間為10ms。這只是采用四片TS101S并行處理的結(jié)果,如果采用更多片TS101S,則響應(yīng)時間會更短。這對于大多數(shù)實際雷達(dá)干擾環(huán)境來說,可以保證干擾抑制系統(tǒng)的實時性。
為了實時地完成自適應(yīng)波束形成,必須采用并行性能優(yōu)越的自適應(yīng)波束形成算法和高性能的處理器及多處理器并行處理技術(shù)。本文給出了一種并行性能較好的數(shù)據(jù)域自適應(yīng)波束形成算法——MQRD-SMI算法,研究了算法原理,并重點討論了其Systolic陣結(jié)構(gòu)及該算法基于多TS101S的并行實現(xiàn)方案,獲得了較滿意的實驗結(jié)果。采用更多片以及更高性能的DSP進(jìn)行并行處理,可獲得更高的速度,本文的設(shè)計思路仍然適用。
參考文獻(xiàn)
1 龔耀寰.自適應(yīng)濾波——時域自適應(yīng)濾波和智能天線.北京:電子工業(yè)出版社,2003
2 Teitelbaum K.A.Flexible processor for a digital adaptive array radar.IEEE Trans Systems Magazine,May 1991,AES:18~22
3 Rader C M.VLSI Systolic arrays for adaptive nulling.IEEE Singal Processing Magazine,1996
4 Analog Devices Inc.ADSP-TS101 TigerSHARC Processor Hardware Reference.USA,2004
5 劉書明,蘇 濤,羅軍輝.TigerSHARC DSP 應(yīng)用系統(tǒng)設(shè)計.北京:電子工業(yè)出版社,2004