《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計(jì) > 設(shè)計(jì)應(yīng)用 > 基于FPGA的SoC原型驗(yàn)證的設(shè)計(jì)與實(shí)現(xiàn)
基于FPGA的SoC原型驗(yàn)證的設(shè)計(jì)與實(shí)現(xiàn)
摘要: 本文主要論述了FPGA基原型驗(yàn)證的實(shí)現(xiàn)方法,并且針對ARM1136為內(nèi)核的SoC,如何快速而有效地搭建一個(gè)原型驗(yàn)證平臺(tái)做了詳細(xì)的論述,最后還以UART為例來說明一種簡單、可重用性好、靈活性強(qiáng)的測試程序架構(gòu)。
Abstract:
Key words :
  0 引言

  隨著SoC設(shè)計(jì)規(guī)模的與日俱增,其功能日趨復(fù)雜,芯片的驗(yàn)證階段占據(jù)了整個(gè)芯片開發(fā)的大部分時(shí)間。為了縮短驗(yàn)證時(shí)間,在傳統(tǒng)的仿真驗(yàn)證的基礎(chǔ)上涌現(xiàn)了許多新的驗(yàn)證手段,如SDV(Software Driven verification)、BFM(Bus Function Model)等,以及基于FPGA的原型驗(yàn)證技術(shù)。

  因FPGA工藝及技術(shù)的發(fā)展,其速度、容量和密度都大大增加,功耗和成本在不斷的降低,使得基于FPGA的原型驗(yàn)證得到廣泛的應(yīng)用。基于FPGA的原型驗(yàn)證可以比軟件仿真速度高出4~6個(gè)數(shù)量級,而且還可以提高流片成功率,并為軟件開發(fā)提供了硬件平臺(tái),加速了軟件的開發(fā)速度。

  本文主要論述了FPGA基原型驗(yàn)證的實(shí)現(xiàn)方法,并且針對ARM1136為內(nèi)核的SoC,如何快速而有效地搭建一個(gè)原型驗(yàn)證平臺(tái)做了詳細(xì)的論述,最后還以UART為例來說明一種簡單、可重用性好、靈活性強(qiáng)的測試程序架構(gòu)。

  1 基于ARM1136的SoC設(shè)計(jì)

  本文驗(yàn)證的SoC芯片是定位于手持視頻播放設(shè)備、衛(wèi)星導(dǎo)航產(chǎn)品的高性能應(yīng)用處理器,采用了ARM1136作為內(nèi)核,ARM11在提供超高性能的同時(shí),還能保證功耗、面積的有效性。

  同時(shí)在這個(gè)架構(gòu)中還采用了ARM公司的AMBA(Advanced Microcontroller Bus Architecture)總線,它是一組針對基于ARM核的片上系統(tǒng)之間通信而設(shè)計(jì)的標(biāo)準(zhǔn)協(xié)議。在設(shè)計(jì)中,對于一些處理數(shù)據(jù)和通訊速度要求較高的設(shè)備掛在AHB總線上,而那些對總線性能要求不高的設(shè)備掛在APB總線上。

  為了能夠提高一些設(shè)備間的數(shù)據(jù)傳輸速度,該設(shè)計(jì)加入了DMA,其支持存儲(chǔ)器存儲(chǔ)器、存儲(chǔ)器到外設(shè)、外設(shè)到存儲(chǔ)的傳輸。

  基于ARM11設(shè)計(jì)的SoC系統(tǒng)構(gòu)架如圖1所示,這個(gè)系統(tǒng)還包括了USB控制器、LCD控制器、圖像處理單元GPU、視頻處理單元VPU、GPS、I2S、通用異步串口UART、同步串口SPI、TIMER、PWM、實(shí)時(shí)時(shí)鐘(RTC)、I2C總線和功耗管理單元(PMU)等。

a.JPG

  2 FPGA原型驗(yàn)證平臺(tái)的快速搭建

  FPGA的發(fā)展為SoC的原型驗(yàn)證提供了巨大的發(fā)揮空間,面對復(fù)雜的SoC系統(tǒng),傳統(tǒng)的一些驗(yàn)證方法和單一的驗(yàn)證技術(shù)已經(jīng)不能滿足設(shè)計(jì)的要求。本文所設(shè)計(jì)的平臺(tái)不僅能加快開發(fā)速度,提高流片成功率,而且還具有低錯(cuò)誤率、快速和簡易的特點(diǎn),因此特別適合用于RTL代碼更改頻繁的設(shè)計(jì)中。

  2.1 FPGA原型驗(yàn)證平臺(tái)的硬件環(huán)境設(shè)計(jì)

  FPGA原型驗(yàn)證平臺(tái)的硬件設(shè)計(jì)應(yīng)該考慮FPGA的邏緝資源、應(yīng)用資源、擴(kuò)展能力、PCB信號質(zhì)量、調(diào)試難度、組態(tài)和成本等方面的因素。本原型系統(tǒng)設(shè)計(jì)的FPGA開發(fā)板采用的是Terasic公司的DE3開發(fā)板,其FPGA芯片是StratixIII EP3SL340,擴(kuò)展板是根據(jù)SoC整體驗(yàn)證方案而設(shè)計(jì)的PCB板。FPGA原型驗(yàn)證平臺(tái)的硬件架構(gòu)如圖2所示,為了使FPGA的調(diào)試性能增強(qiáng),該平臺(tái)加入了ICE在線調(diào)試器,它可以讓驗(yàn)證人員和軟件開發(fā)人員觀察到ARM內(nèi)核和設(shè)計(jì)中各個(gè)寄存器的狀態(tài)信息,并且可以進(jìn)行單步運(yùn)行、在線調(diào)試等。

b.JPG

  2.2 FPGA原型驗(yàn)證平臺(tái)的軟件環(huán)境設(shè)計(jì)

  SoC芯片采用的是ASIC工藝流程,ASIC和FPGA在實(shí)現(xiàn)結(jié)構(gòu)上是不同的,AISC通常使用綜合工具將RTL級代碼映射到芯片制造廠提供的標(biāo)準(zhǔn)單元上。這些標(biāo)準(zhǔn)單元包括完成邏輯功能的與非門、非門、或非門等基本門單元和完成存儲(chǔ)功能的各類觸發(fā)器、鎖存器,以及其它的宏單元。而FPGA器件為了實(shí)現(xiàn)可編程功能,通常使用查找表結(jié)構(gòu)實(shí)現(xiàn)電路的邏輯功能。本文原型設(shè)計(jì)流程如圖3所示,在圖示中僅是將部分模塊列出,如PMU和GPIO。

c.JPG

  2.2.1 設(shè)計(jì)代碼的轉(zhuǎn)換

  雖然FPGA和ASIC所用資源和實(shí)現(xiàn)方式不同,但在進(jìn)行原型設(shè)計(jì)中需要遵循的一個(gè)原則就是“尊重原設(shè)計(jì)”。在FPGA現(xiàn)有資源情況下實(shí)現(xiàn)SoC時(shí),盡可能地少改動(dòng)原SoC設(shè)計(jì),在此基礎(chǔ)上需要對原設(shè)計(jì)做如下轉(zhuǎn)換:

  (1)存儲(chǔ)模塊。存儲(chǔ)單元是必須進(jìn)行代碼轉(zhuǎn)換的,ASIC中的存儲(chǔ)單元通常用代工廠所提供的Memory Compiler來定制。如果直接將ASIC代碼中的存儲(chǔ)單元作為FPGA的輸入,通常綜合器是綜合不出來的,即使能綜合出來,也要花費(fèi)很長時(shí)間,并且資源消耗多、性能不好。而FPGA廠商一般提供經(jīng)過驗(yàn)證并優(yōu)化的存儲(chǔ)單元,因此存儲(chǔ)單元要進(jìn)行代碼轉(zhuǎn)換。在設(shè)計(jì)里用FPGA的RAM宏單元來替換ESRAM,SoC芯片里面的DDR PHY是模擬的模塊,此要替換成Altera公司的PHY的IP核。

  (2)時(shí)鐘和門控。數(shù)字電路中,時(shí)鐘是整個(gè)電路最重要、最特殊的信號。在ASIC中,用布局布線工具來放置時(shí)鐘樹,利用代工廠提供的PLL進(jìn)行時(shí)鐘設(shè)計(jì)。而FPGA中通常已經(jīng)配置一定數(shù)量的PLL宏單元,并有針對時(shí)鐘優(yōu)化的全局時(shí)鐘網(wǎng)絡(luò),一般是經(jīng)過FPGA的特定全局時(shí)鐘管腳進(jìn)入FPGA內(nèi)部,后經(jīng)過全局時(shí)鐘BUF適配到全局時(shí)鐘網(wǎng)絡(luò),這樣的時(shí)鐘網(wǎng)絡(luò)可以保證相同的時(shí)鐘沿到達(dá)芯片內(nèi)部每一個(gè)觸發(fā)器的延遲時(shí)間差異可以忽略不計(jì),因此時(shí)鐘單元需要采用FPGA的PLL宏單元和專門的時(shí)鐘布線資源來替換。

  為了減少功耗,SoC設(shè)計(jì)中使用了門控時(shí)鐘(clockgating),如圖4所示,對于FPGA來說這種門控時(shí)鐘容易產(chǎn)生毛刺,導(dǎo)致數(shù)據(jù)不正確,所以在FPGA設(shè)計(jì)中要使用時(shí)鐘使能寄存器代替門控時(shí)鐘。

d.JPG

  2.2.2 設(shè)計(jì)綜合

  綜合是將較高級抽象層次的描述轉(zhuǎn)換成較低層次描述,在這里就是把HDL程序轉(zhuǎn)化成標(biāo)準(zhǔn)的門級結(jié)構(gòu)網(wǎng)表。本設(shè)計(jì)采用的EDA工具是Sy-nopsys公司的Synplify,將SoC的各個(gè)模塊分別進(jìn)行綜合,綜合時(shí)要加約束文件和Altera公司的相應(yīng)器件的庫文件,產(chǎn)生一個(gè)FPGA網(wǎng)表文件。

  2.2.3 等價(jià)性檢查

  形式驗(yàn)證(Formal Verification)主要用來在覆蓋所有可能輸入情況下,檢查是否與給定的規(guī)范一致。等價(jià)性檢查(equivalence check-ing)是形式驗(yàn)證中的一部分,它主要是檢查兩個(gè)門級網(wǎng)表(gate-level netlisf)之間是否一致,保證網(wǎng)表處理后不會(huì)改變電路的功能,或者檢查RTL和門級網(wǎng)表之間是否一致,保證網(wǎng)表能正確地實(shí)現(xiàn)RTL代碼所描述的功能,或者檢查RTL間是否一致,保證兩種RTL描述邏輯一致。這種方法主要是用來尋找實(shí)現(xiàn)(Implementation Design)中的缺陷,而不是設(shè)計(jì)中的缺陷。由于芯片開發(fā)中,設(shè)計(jì)代碼將不斷的更改,都需要

  更新FPGA的鏡像文件,這樣在頻繁的鏡像制作過程中,可能會(huì)因?yàn)榄h(huán)境和設(shè)計(jì)的更改引出許多實(shí)現(xiàn)過程中的錯(cuò)誤,而本文為了減少這些錯(cuò)誤,采用的Synopsys公司的Formality工具,主要用于檢查網(wǎng)標(biāo)和RTL間是否一致,把RTL設(shè)計(jì)作為Reference Design,而把網(wǎng)標(biāo)作為Imple-mentation Design,在進(jìn)行等價(jià)性檢查時(shí)要加入Altera器件綜合過程中需要的相關(guān)庫文件。

  2.2.4 設(shè)計(jì)整合和布局布線

  把多個(gè)設(shè)計(jì)文件轉(zhuǎn)換合并到一個(gè)設(shè)計(jì)庫文件中,并把整合后的設(shè)計(jì)輸入到Altera公司的QuartuslI工具,將綜合過的網(wǎng)表中的邏輯門映射到FPGA的內(nèi)部資源中,如ALUT等。

  布局是指從映射取出定義的邏輯和輸入輸出塊,并把它們分配到FPGA內(nèi)部的物理位置,布線是指利用自動(dòng)布線軟件使用布線資源選擇路徑試著完成所有的邏輯連接。

  2.2.5 時(shí)序分析

  在設(shè)計(jì)實(shí)現(xiàn)過程中,在映射后需要對一個(gè)設(shè)計(jì)的實(shí)際功能塊的延時(shí)和估計(jì)的布線延時(shí)進(jìn)行時(shí)序分析。而在布局布線后,也要對實(shí)際布局布線的功能塊延時(shí)和實(shí)際布線延時(shí)進(jìn)行時(shí)序分析。時(shí)序分析不僅可以檢查出我們代碼設(shè)計(jì)中的時(shí)序問題,還可以檢查出由于布局布線產(chǎn)生的時(shí)序問題。在本設(shè)計(jì)中用Altera公司的TimeQuest來進(jìn)行時(shí)序分析,通過對原型設(shè)計(jì)增加時(shí)序約束,提高了工作主頻和減少了關(guān)鍵路徑的延時(shí)。在設(shè)計(jì)中經(jīng)常存在時(shí)序違約的情況,這時(shí)需要查看違約的關(guān)鍵路徑,然后查找原因,進(jìn)行修改后再進(jìn)行時(shí)序分析,重復(fù)整個(gè)過程直到滿足要求。

  2.2.6 鏡像文件的生成和下載配置

  QuartusII經(jīng)過整合、布局布線等一系列操作后,最終會(huì)生成一個(gè)配置FPGA的位流文件(.sof洛式),然后利用QuartusII的Programmer工具,通過USB Blaster下載到FPGA,此時(shí)FPGA實(shí)現(xiàn)了原SoC設(shè)計(jì)的功能,原型驗(yàn)證環(huán)境搭建完成。

  3 FPGA原型驗(yàn)證測試激勵(lì)的設(shè)計(jì)

  測試程序在FPGA基原型驗(yàn)證中起至關(guān)重要的作用,現(xiàn)在的SoC設(shè)計(jì)很多都采用IP復(fù)用的方式,本文所設(shè)計(jì)出的測試程序有可重用性好、功能覆蓋率高和調(diào)試簡易等特點(diǎn)。

  測試程序的基本框架如圖5所示,具體模塊的測試程序只需要根據(jù)框架所提供的接口進(jìn)行編寫相應(yīng)的測試程序即可,代碼主要由以下四部分組成:

  (1)系統(tǒng)啟動(dòng)部分。主要包含系統(tǒng)的異常向量表和系統(tǒng)啟動(dòng)后設(shè)置ARM內(nèi)核的配置程序,如各種模式下的堆棧設(shè)置、開啟或關(guān)閉FIR和IRQ、設(shè)定中斷向量表等,在Boot_gfd.s中提供了跳到測試程序的接口。

  (2)模塊測試部分。在此部分根據(jù)各個(gè)模塊的功能,編寫相應(yīng)的測試函數(shù),系統(tǒng)在執(zhí)行時(shí)會(huì)調(diào)用這些函數(shù),完成我們各個(gè)模塊的功能測試。

  (3)頭文件部分。為了方便代碼的編寫和理解,在tyoedef.h文件中對系統(tǒng)的數(shù)據(jù)類型做了重新定義并包含了部分公用函數(shù)的宏定義。一個(gè)SoC系統(tǒng)中擁有大量的寄存器,在本設(shè)計(jì)中用Register.h文件來存放這些寄存器地址的宏定義。

  (4)Scatter文件部分。scatter文件是用來描述刪連接器生成映像文件時(shí)需要的地址映射信息和加載域信息。

e.JPG

  下面以UART模塊為例,在此框架下根據(jù)其接口編寫相應(yīng)的測試程序。

  驗(yàn)證計(jì)劃:通過待驗(yàn)UART與PC進(jìn)行通信來驗(yàn)證其功能是否正確,主要驗(yàn)證的功能點(diǎn)有:1)寄存器讀寫;2)三種工作模式普通模式、自流控模式、LoopBack模式;3)奇偶校驗(yàn);4)波特率;5)FIFO觸發(fā)級。

  測試程序:根據(jù)上邊的功能點(diǎn)可以劃分兩個(gè)測試的基本的函數(shù),一個(gè)是寄存器讀寫的測試函數(shù)UART_RWTst(),還有一個(gè)就是UART工作配置函數(shù)UART_Config(),這個(gè)函數(shù)提供一個(gè)接口,通過這個(gè)接口可以配置UART的工作模式、奇偶校驗(yàn)方式、波特率大小、FIFO觸發(fā)級。在更高層的測試應(yīng)用程序中調(diào)用配置程序,變化配置參數(shù),使其與PC進(jìn)行收發(fā)數(shù)據(jù),然后查看或比對數(shù)據(jù),判別其功能是否正確。測試程序文件結(jié)構(gòu)如圖5所示。

  驗(yàn)證結(jié)果:當(dāng)待驗(yàn)UART向PC發(fā)送數(shù)據(jù)時(shí),在PC的超級終端會(huì)顯示這些數(shù)據(jù),UART功能驗(yàn)證結(jié)果可通過觀測或數(shù)據(jù)比對來判斷,如圖6所示。

f.JPG

  4 結(jié)論

  同樣的測試激勵(lì)程序在此原型平臺(tái)的執(zhí)行速度要比SDV(Software driven verification)平臺(tái)快4~6個(gè)數(shù)量級。本驗(yàn)證平臺(tái)的搭建過程中對其進(jìn)行了形式驗(yàn)證和時(shí)序分析,大大減少了在原型設(shè)計(jì)中由于FPGA實(shí)現(xiàn)而導(dǎo)致的錯(cuò)誤。本平臺(tái)的軟件測試程序具有接口簡單、易調(diào)試、可重用性好等特點(diǎn),筆者在此原型平臺(tái)下完成了部分模塊的驗(yàn)證,有效地提高了驗(yàn)證效率,縮短了項(xiàng)目的開發(fā)周期,加大了流片成功率。

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。