TMS320C61416 EMIF總線下雙FPGA加載設(shè)計
基于SRAM結(jié)構(gòu)的FPGA容量大,可重復(fù)操作,應(yīng)用相當(dāng)廣泛;但其結(jié)構(gòu)類似于SRAM,掉電后數(shù)據(jù)丟失,因此每次上電時都需重新加載。目前實(shí)現(xiàn)加載的方法通常有兩種:一種是用專用Cable通過JTAG口進(jìn)行數(shù)據(jù)加載,另一種是外掛與該FPGA廠商配套的PROM芯片。前者需要在PC機(jī)上運(yùn)行專用的加載軟件,直接下載到FPGA片內(nèi),所以掉電數(shù)據(jù)仍然會丟失,只適用于FPGA調(diào)試階段而不能應(yīng)用于工業(yè)現(xiàn)場的數(shù)據(jù)加載。后者雖然可以解決數(shù)據(jù)丟失問題,但這種專用芯片成本較高,供貨周期也較長(一般大于2個月),使FPGA產(chǎn)品的開發(fā)時間受到很大約束。因此希望找到一種更簡便實(shí)用的FPGA芯片數(shù)據(jù)加載方法。根據(jù)FPGA芯片加載時序分析,本文提出了采用通過市面上常見的Flash ROM芯片替代專用PROM的方式,通過DSP的外部高速總線進(jìn)行FPGA加載;既節(jié)約了系統(tǒng)成本,也能達(dá)到FPGA上電迅速加載的目的;特別適用于在FPGA調(diào)試后期,待固化程序的階段。下面以兩片Xilinx公司Virtex-4系列XC4VLX60芯片為例,詳細(xì)介紹采用TI公司的TMS320C61416 DSP控制FPGA芯片數(shù)據(jù)加載的軟硬件設(shè)計。
1 Xilinx FPGA配置原理
Virtex-4系列的FPGA芯片外部配置引腳MODE PIN(M0、M1、M2),有5種配置模式,如表1所列。
FPGA在Slave SelectMAP方式下,共用了表2所列的15個配置引腳。
1.1 配置流程
FPGA加載時序如圖1所示。各配置信號必須滿足其時序關(guān)系,否則配置工作無法正常完成。
圖1中,Slave SelelctMAP加載主要包括以下3個步驟:
?、賳雍统跏蓟?。FPGA上電正常后,通過PROG_B引腳低脈沖進(jìn)行FPGA異步復(fù)位,使得FPGA內(nèi)部邏輯清零。其次PROG_B上拉高,停止外部復(fù)位,INIT_B引腳會在TPOR時間段內(nèi)自動產(chǎn)生一個由低到高的跳變,指示FPGA內(nèi)部初始化完成,可以進(jìn)行數(shù)據(jù)下載;同時FPGA在INIT_B的上升沿采樣其模式引腳MODE PIN,決定其模式配置。
?、诒忍亓骷虞d。INIT_B信號變高后,不需要額外的等待時間,Virtex器件就可以立即開始數(shù)據(jù)的配置。比特流數(shù)據(jù)在外部CCLK信號上升沿按字節(jié)方式置入。該過程包括同步初始化字、器件ID號校驗(yàn)、加載配置數(shù)據(jù)幀、CRC校驗(yàn)4個部分。
?、跾TARTUP啟動。在成功校驗(yàn)CRC碼位后,比特流命令使得FPGA進(jìn)入STARTUP狀態(tài)。它是由8相狀態(tài)機(jī)實(shí)現(xiàn)的。中間包括等待DCM鎖相、DCI匹配等幾個狀態(tài),最后FPGA釋放外部DONE引腳,對外輸出高阻態(tài),由外部上拉高,指示FPGA加載成功。
1.2 文件生成
ISE生成數(shù)據(jù)文件主要有3種:BIT文件,由二進(jìn)制格式進(jìn)行表征邏輯設(shè)計,包括文件頭和配置數(shù)據(jù),主要用于JTAG下載電纜模式;MCS文件,為外部PROM燒寫生成的下載文件,ASCII碼,與前者不同的是它含有在PROM中的數(shù)據(jù)地址和校驗(yàn)值;BIN文件格式,由二進(jìn)制表示,完全由配置數(shù)據(jù)組成,不需要作其他的提取和進(jìn)制轉(zhuǎn)換,只是配置前的Byte-Swapped是在CPLD中實(shí)現(xiàn)的。本設(shè)計采用的是BIN文件格式。
2 硬件實(shí)現(xiàn)
系統(tǒng)采用2片Xilinx Virtex-4系列的600萬門的FPGA XC4VLX60。主MCU是TI公司高性能定點(diǎn)處理器TMS320C6416,對外有2個EMIF總線接口,分別是64位寬EMIFA和16位寬EMIFB。EMIFB上掛有8位8MB的Flash和16位CPLD:Flash做2片F(xiàn)PGA的BIN文件保存,之前由仿真器燒寫;CPLD用于2片F(xiàn)PGA地址譯碼和DSP與FPGA配置部分的邏輯接口。整個數(shù)據(jù)流程是在DSP上電啟動后,Bootloader自行引導(dǎo)用戶程序運(yùn)行。該程序負(fù)責(zé)由EMIFB總線搬移Flash空間中BIN文件,通過CPLD分別對2片F(xiàn)PGA進(jìn)行配置加載。硬件系統(tǒng)拓?fù)鋱D如圖2所示。
3 軟件設(shè)計
軟件包括3部分:引導(dǎo)Bootloader代碼,加載FPGA用戶程序以及接口部分的CPLD Verilog代碼。
3.1 DSP Bootloader
本系統(tǒng)中目標(biāo)板處于FPGA調(diào)試后期,需要固化其加載程序。整板上電后,要求脫離仿真器自行加載FPGA,因此這里采用DSP的EMIF BooT方式。它是由DSP上電復(fù)位后,以默認(rèn)ROM時序通過EDMA自行搬移BCE1的ROM空間前1 KB內(nèi)容到片內(nèi),在其0x0地址開始運(yùn)行。
一般由C編寫的程序代碼長度都遠(yuǎn)大于1 KB,如果只是純粹由DSP搬移Flash前1 KB空間,這樣便會丟失數(shù)據(jù),程序無法正常運(yùn)行。這里采用由匯編語言寫的一個兩次搬移的Bootloader程序,來引導(dǎo)較大的用戶程序。使用匯編語言是因?yàn)槠浯a效率高,代碼長度短(本系統(tǒng)中只有256字節(jié))。兩次搬移是因?yàn)榈谝淮蜠SP自行搬移后的Bootloader會占用片內(nèi)的0x0地址前1 KB空間,與下一步的用戶程序0x0地址拷貝沖突(中斷向量表必須放在0x0地址,否則會丟失中斷跳轉(zhuǎn)的絕對地址),且運(yùn)行中的Bootloader不能覆蓋自身。所以把拷貝用戶程序的那部分代碼放在片內(nèi)較底端運(yùn)行,騰出了用戶空間的0x0地址。最后整體拷貝結(jié)束后,Bootloader再跳轉(zhuǎn)到用戶程序入口地址c_int00運(yùn)行。
3.2 用戶程序和CPLD程序
本系統(tǒng)中2片F(xiàn)PGA加載的原理一樣。為避免繁瑣,這里以1片F(xiàn)PGA_A為例來作介紹。
CPLD在系統(tǒng)中負(fù)責(zé)2項工作。
?、儆成銬SP端Flash分頁寄存器:控制Flash的高3位地址線,分8頁,每頁1 MB空間。
?、谟成銬SP端2片F(xiàn)PGA的加載寄存器:
a.配置寄存器FpgaA(B)_config_Reg[8:O]。負(fù)責(zé)配置數(shù)據(jù)和時鐘,高8位為Byte-Swapped前的數(shù)據(jù)位,輸出到配置引腳時進(jìn)行字節(jié)交換,最低位為CCLK位。
b.控制寄存器FpgaA(B)_Prog_Reg[2:O]。負(fù)責(zé)外部控制引腳,分別為CS_B、RDWR_B和PROG_B。
c.狀態(tài)寄存器FpgaA(B)_State_Reg[2:0]。負(fù)責(zé)回讀配置中的握手信號,分別為BUSY、DONE和INIT_B。
由Bootloader引導(dǎo)的用戶程序由C語言開發(fā),在CCS下調(diào)試通過。它主要實(shí)現(xiàn)Flash翻頁,把之前燒寫在Flash中的BIN文件,通過上述CPLD中3個加載寄存器對FPGA進(jìn)行上電配置。具體流程如圖3所示。
當(dāng)前FPGA配置時鐘CCLK是在用戶程序中通過DSP寫命令產(chǎn)生的,即寫FpgaA(B)_Config_Reg的CCLK位高低電平;同時8位配置數(shù)據(jù)也連續(xù)寫2次,由CPLD鎖存到FPGA總線上,便能充分保證圖1中該有效數(shù)據(jù)在CCLK上升沿上被鎖。
以下是CPLD中動態(tài)加載部分的Verilog代碼:
//FPGA控制寄存器(DSP只寫)
結(jié) 語
該系統(tǒng)已成功用于某公司一款軟件無線電平臺中,通過反復(fù)軟硬件調(diào)試,現(xiàn)已投放市場。此外,由于該系統(tǒng)中的DSP芯片TMS320C6416自帶PCI橋,因此該平臺設(shè)計有與主機(jī)通信的CPCI接口,支持32位的PCI總線帶寬,最大數(shù)據(jù)吞吐率能達(dá)到133 MB/s。所以,此平臺不僅可以實(shí)現(xiàn)上述提到的上電Flash自行加載FPGA的目的,還可在其配置完以后通過主機(jī)端對FPGA實(shí)現(xiàn)動態(tài)加載,充分滿足了軟件無線電中可重構(gòu)化、實(shí)時靈活的指導(dǎo)思想。
評論