《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 嵌入式DS80C320單片機(jī)軟核設(shè)計(jì)與實(shí)現(xiàn)
嵌入式DS80C320單片機(jī)軟核設(shè)計(jì)與實(shí)現(xiàn)
摘要: 在如今的快速嵌入式系統(tǒng)設(shè)計(jì)中,目前比較流行的方案是在FPGA內(nèi)集成應(yīng)用軟件或是軟IP平臺(tái),以簡化工序、加速產(chǎn)品面市日程。為此,很多公司推出了自己的開發(fā)平臺(tái)以及相關(guān)CPU的IP核,常見的為兩種:一種是通用型CPU;還有就是專用型的,常見的為51系列單片機(jī)的CPU核。
Abstract:
Key words :

   1 引言

  在如今的快速嵌入式系統(tǒng)設(shè)計(jì)中,目前比較流行的方案是在FPGA內(nèi)集成應(yīng)用軟件或是軟IP平臺(tái),以簡化工序、加速產(chǎn)品面市日程。為此,很多公司推出了自己的開發(fā)平臺(tái)以及相關(guān)CPU的IP核,常見的為兩種:一種是通用型CPU,如xilinx和altera公司的32位以及64位通用CPU核;還有就是專用型的,常見的為51系列單片機(jī)的CPU核,但是目前關(guān)于單片機(jī)的軟核基本上都是8051的,其他的品種很少。而且8051的速度不是很快,在有些快速的控制場合(如利用單片機(jī)來作為usb2.0的控制部件)顯得速度不足,比較著名的actel公司推出的Core8051,運(yùn)行頻率也只在40 MHz左右。本文介紹了一個(gè)非常高速DS80C320單片機(jī)軟核的設(shè)計(jì)。

  DS80C320單片機(jī)是DALLAS公司推出的一款基于51框架的高性能單片機(jī)。

  它有如下一些優(yōu)點(diǎn):

 ?、。哂信c51系列完全一致的指令系統(tǒng),能充分兼容所有基于51系列開發(fā)的程序;

 ?、?,具有比8051更加齊全的外設(shè)。相比8051單片機(jī),DS80C320增加了定時(shí)器2以及一個(gè)增強(qiáng)型串口等;

 ?、?,具有比8051更好的效率;DS80C320的一個(gè)指令周期是4個(gè)CLK,8051則是12個(gè),這個(gè)區(qū)別尤其是在處理簡單指令的時(shí)候優(yōu)勢明顯,例如單周期指令的處理,DS80C320只需要4個(gè)CLK,而8051需要12個(gè),據(jù)DALLAS公司的統(tǒng)計(jì)表明,在相同時(shí)鐘頻率下,DS80C320每條指令的執(zhí)行速度是8051的1.5~3倍,對于典型的應(yīng)用程序來說,執(zhí)行速度也是8051的2.5倍左右。

 ?、?,其讀取指令的方式比8051更加適合IP核的特點(diǎn);將單片機(jī)內(nèi)部ROM去掉,完全從外部讀取指令,這種特點(diǎn)作為軟核是很適合的,首先是結(jié)構(gòu)簡單,有利于指令讀取的流水設(shè)計(jì),其次可以突破內(nèi)部ROM大小的限制,最后,作為FPGA設(shè)計(jì)的特點(diǎn),即使8051的設(shè)計(jì),內(nèi)部ROM塊也是放在FPGA芯片的ROM資源里面,與其這樣,還不如直接放到外面更加簡化時(shí)序與結(jié)構(gòu);

 

  2 總體結(jié)構(gòu)劃分

  如圖所示為DS80C320軟核的總體功能圖:

  DS80C320功能框圖

  圖1 DS80C320功能框圖

 

  本IP核的設(shè)計(jì)主要按照指令執(zhí)行的流程來安排功能塊,并通過數(shù)據(jù)總線來傳遞數(shù)據(jù);虛線里面的為CPU核心;首先是ROM模塊,DS80C320并沒有內(nèi)部ROM,所以該模塊功能主要是分析從P端口讀取過來的指令,并通過查找指令的長度以及周期數(shù)目,從而計(jì)算出相關(guān)控制信號發(fā)送給CPU控制模塊以便控制指令的讀??;同時(shí),如果指令為LCALL或者ACALL,則可以分析出子程序入口地址并報(bào)送PC模塊,引導(dǎo)PC正確跳轉(zhuǎn);在ROM模塊分析指令的同時(shí),譯碼器DECODER也在進(jìn)行譯碼的動(dòng)作,它將根據(jù)指令的8位數(shù)據(jù)分析出三個(gè)重要的參數(shù):ALU的動(dòng)作類型,該指令的操作數(shù)據(jù)來源以及讀取方式,該指令結(jié)果的存放位置以及存放方式;第一個(gè)參數(shù)送給ALU模塊,其余兩個(gè)送到CPU控制模塊;CPU控制模塊CPU_CON是整個(gè)CPU的核心部分,主要完成兩個(gè)作用:ALU執(zhí)行前的讀取數(shù)據(jù)控制,以及ALU執(zhí)行完成之后回寫數(shù)據(jù)控制;該模塊同時(shí)也控制著整個(gè)CPU的時(shí)序,監(jiān)視其他模塊的執(zhí)行情況;ALU則主要是完成計(jì)算工作;INteR模塊則是中斷系統(tǒng)的控制模塊,其功能主要完成對各個(gè)中斷源所提交的中斷請求的有效判斷以及排序,產(chǎn)生中斷標(biāo)志并且將判斷結(jié)果以及中斷入口地址編碼提交給ROM模塊,以指示程序跳轉(zhuǎn),同時(shí)還需要負(fù)責(zé)在中斷完成之后清除中斷標(biāo)志以及恢復(fù)中斷之前的中斷等級; DS80C320有三個(gè)定時(shí)器和2個(gè)串行口,其中定時(shí)器2和串行口如果不需要的話可以裁減;至于其他的模塊或者寄存器則在CPU控制模塊的控制下通過數(shù)據(jù)總線交換數(shù)據(jù);可見,本設(shè)計(jì)的思路是以CPU_CON控制整個(gè)CPU的執(zhí)行以及時(shí)序,以INTER控制整個(gè)中斷系統(tǒng),其他寄存器則以數(shù)據(jù)總線來完成數(shù)據(jù)的交換,均勻的分布在數(shù)據(jù)總線的兩側(cè),結(jié)構(gòu)清晰簡單,規(guī)則化的設(shè)計(jì)也有利于提高速度,以及方便裁減。

  3 一些設(shè)計(jì)特點(diǎn)

  3.1時(shí)序設(shè)計(jì)

  在DS80C320單片機(jī)的資料里面只有外部接口的時(shí)序介紹,對于內(nèi)部的信號執(zhí)行則沒有說明,因此需要重新規(guī)劃,本軟核對DS80C320的時(shí)序進(jìn)行了詳細(xì)的分析,按照黑盒子的思想,加入了流水線的技巧,對其時(shí)序的設(shè)計(jì)如下:

  對于普通指令的執(zhí)行過程,內(nèi)部時(shí)序劃分如下:

 

  DS80C320內(nèi)部時(shí)序圖

  圖2 DS80C320內(nèi)部時(shí)序圖

  這是一條單字節(jié)單周期指令的執(zhí)行過程,在C1的上升沿開始譯碼以及查找本指令的長度周期表,同時(shí),數(shù)據(jù)總線上面是正在回寫的上一條指令的結(jié)果;到了C2的上升沿,數(shù)據(jù)總線和地址總線的控制權(quán)就回到了本條指令的手里,這個(gè)時(shí)候地址總線用來發(fā)送需要讀取的數(shù)據(jù)的地址,數(shù)據(jù)總線則做好從發(fā)送數(shù)據(jù)到接收數(shù)據(jù)的準(zhǔn)備,這個(gè)動(dòng)作由CPU控制模塊完成;然后在C3的上升沿,被選中模塊根據(jù)地址總線和控制總線讀出相關(guān)數(shù)據(jù)并送入數(shù)據(jù)總線,在這以后的一個(gè)時(shí)鐘長度的時(shí)間里面,ALU接到了數(shù)據(jù),然后在C4的上升沿,開始執(zhí)行數(shù)據(jù)處理,同時(shí),CPU控制模塊再次改變地址總線和控制總線的內(nèi)容,并發(fā)布寫信號,提示開始被選中讀數(shù)的模塊放棄對數(shù)據(jù)總線的控制權(quán),以及被選中的存儲(chǔ)結(jié)果的模塊分析寫入類型,作好接收數(shù)據(jù)的準(zhǔn)備,ALU在計(jì)算完成之后就將結(jié)果放到數(shù)據(jù)總線,等待下一個(gè)周期的C1開始將結(jié)果寫入相關(guān)位置;總之,本設(shè)計(jì)充分利用了數(shù)據(jù)總線的資源和流水設(shè)計(jì)的技巧,將本來需要6個(gè)時(shí)序的操作簡化為4個(gè)就完成了,時(shí)序緊湊,速度快;同時(shí)采用了分布式處理的思想,大大簡化了CPU控制模塊的功能,只發(fā)布控制信號,具體哪個(gè)模塊需要執(zhí)行什么功能由該模塊自行根據(jù)控制信號來判斷,有利于避免由于局部功能太過集中而造成的芯片局部過熱的問題;

  3.2指令長度周期表的設(shè)計(jì)

  指令長度表主要是用來控制取指令,以及辨別指令代碼和指令參數(shù);而指令周期表則主要是用來控制指令執(zhí)行的時(shí)間,這兩個(gè)表可以簡化對指令執(zhí)行的控制。一般這個(gè)過程由ROM模塊根據(jù)已經(jīng)讀取的指令來查表,然后根據(jù)查表的結(jié)果和時(shí)序情況來處理分析,產(chǎn)生一系列控制信號,并發(fā)送給CPU控制模塊,這樣做的好處主要是避免CPU控制模塊與指令以及數(shù)據(jù)打交道,減少其輸入輸出端口數(shù)目;指令長度周期表的設(shè)計(jì)是和讀取方式息息相關(guān)的,本設(shè)計(jì)使用自己單獨(dú)構(gòu)建的表,并且一分為二,處理方式是為:index={lsb_3, ir[7:4]},其中l(wèi)sb_3的含義為:對于指令的低三位(ir(2 downto 0)) 規(guī)則為:8-F=》7,6-7=》6,0-5不變化。兩個(gè)表使用相同的讀取方式,這樣既可以簡化結(jié)構(gòu),將查找空間降低為7位,又可以提高查找速度;

  3.3 PC異動(dòng)編碼的作用

  在單片機(jī)內(nèi)部,PC是需要不停變化的,不僅所有的跳轉(zhuǎn)類指令都需要改變PC的內(nèi)容,而且中斷類指令還需要完成PC的出棧以及入棧操作;因此,有些模型里面對PC的處理異常復(fù)雜,基本上是對每條指令詳細(xì)規(guī)定PC的變化;本設(shè)計(jì)在這方面的處理采用了編碼的技巧來提高速度;首先分析編碼的可能性,雖然很多指令可以改變PC的內(nèi)容,但是對于PC來說,除了正常的加1操作,其它的變化方式只有如下幾種:

 

  PC變化編碼表

 

  其中pmem1和pmem2為指令參數(shù),來自于ROM模塊;PC_OUT為堆棧中的PC內(nèi)容。

  剩下的難題就是由誰來發(fā)出這個(gè)編碼,對于所有的跳轉(zhuǎn)類指令以及中斷類指令,每條指令的跳轉(zhuǎn)條件是不相同的,需要一一判斷,本設(shè)計(jì)就巧妙的利用了ALU模塊來處理這個(gè)編碼,ALU模塊計(jì)算的時(shí)候也是需要對操作進(jìn)行判斷的,因此,只要添加一小段代碼就可以讓其完成發(fā)送編碼的功能;PC編碼的方式大大簡化了PC模塊的操作,使得程序更加規(guī)整;

  3.4 雙向P端口的模擬

  這里主要是P0和P2雙向端口的模擬;對于典型的單片機(jī),其P端口一般都是雙向的,但是對于FPGA設(shè)計(jì)來說,以現(xiàn)在的芯片結(jié)構(gòu),在FPGA芯片里面實(shí)現(xiàn)真正的雙向是不可能的,因此,作為軟核來說,雙向的模擬就一定要處理好;常用的解決辦法有這么幾種:一種是直接將雙向端口改成兩個(gè)單向的端口,這樣對于軟核來說使用更加方便,本設(shè)計(jì)也提供了這種方式供選擇,但是這樣就與標(biāo)準(zhǔn)的單片機(jī)不相同了,因此,本設(shè)計(jì)也提供了一種模擬的雙向口,根據(jù)FPGA設(shè)計(jì)的特點(diǎn),改變信號線的方向必須有個(gè)切換的過程,這樣就只好仔細(xì)的來分析指令時(shí)序,看看能不能在P端口使用的間隙來處理這個(gè)切換過程;首先是分析指令是否需要使用P端口,比較重要的控制信號有譯碼器發(fā)送的RD_LATCH信號,用來區(qū)分指令是否需要使用P端口,還有來自于CPU_CON的控制總線信息,用來告知P端口需要完成的具體功能;如果需要使用P端口的復(fù)用功能,則由相關(guān)的需要使用P端口的模塊(如串行口模塊)發(fā)送請求指令;然后P端口分析所有的使用請求,根據(jù)不同的使用方式來安排不同的使用情況;如果需要雙向切換,則根據(jù)時(shí)序以及指令特點(diǎn)來處理,從而順利完成雙向的切換過程。

 

  4 綜合與驗(yàn)證

 

  使用Altera公司的Quartus II 4.2軟件來綜合,使用Nios Development Board,Cyclone Edit開發(fā)板來進(jìn)行板上驗(yàn)證;綜合結(jié)果如下:

 

  軟核綜合結(jié)果

 

  其中,前一個(gè)版本是沒有內(nèi)部串行口的版本;時(shí)序仿真驗(yàn)證的結(jié)果表明,在上述頻率下該系統(tǒng)可以穩(wěn)定的工作;理論上換算成8051的主頻為:83*2.5=207.5M,這基本上可以適應(yīng)絕大部分需要單片機(jī)控制的場合了;仿真測試主要使用了modelsim SE5.8以及quartus4.2的VWF文件測試;板上波形觀測主要使用Agilent公司的 1673G 邏輯分析儀;同時(shí)充分利用了開發(fā)板的資源進(jìn)行了大量的系統(tǒng)級測試;將程序下載到芯片里面,使用邏輯分析觀測到部分指令的執(zhí)行波形為:

  中斷指令波形圖

  圖3 中斷指令波形圖

 

  這是一條中斷返回指令的波形圖,指令代碼為32H,主要觀測PC的變化,PC在這條指令之后從3FH又變化為中斷發(fā)生前的地址25H。

  5 結(jié)束語

  本設(shè)計(jì)具有速度快,可裁減,具有良好的可重用性和可移植性,完全兼容DS80C320單片機(jī)接口,以及方便使用等優(yōu)點(diǎn)。尤其是專門構(gòu)造的內(nèi)部框架以及時(shí)序分配,使得其高速性能在目前的51系列軟核里面基本上是最前列的。因此,可以很方便的應(yīng)用于需要單片機(jī)軟核的FPGA設(shè)計(jì)以及嵌入式系統(tǒng)設(shè)計(jì)之中。

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。