基于DSP的圖象采集與處理系統(tǒng)的設計
4 系統(tǒng)軟件設計
本文引用地址:http://www.ex-cimer.com/article/85729.htm4.1 DSP的軟件開發(fā)
TMS320C6000軟件開發(fā)的一切過程都可在CCS集成環(huán)境下進行,包括項目的建立、源代碼的編輯以及程序的編譯和調試。圖4所示是TMS320C6000的軟件開發(fā)流程圖。其中黑體部分是開發(fā)C代碼的常規(guī)流程,其它功能可用于輔助和加速軟件開發(fā)過程。
該CCS能對用戶開發(fā)的源代碼進行優(yōu)化。目的是縮短代碼長度并提高代碼執(zhí)行效率。其中,C優(yōu)化器對C源代碼進行優(yōu)化,所進行的優(yōu)化包括針對C代碼的一般優(yōu)化和針對C6000的優(yōu)化,如重新安排語句和表達式、把變量分配給寄存器、打開循環(huán)和模塊級優(yōu)化(把若干個文件組成1個模塊進行優(yōu)化)等。C優(yōu)化器完成的最重要的優(yōu)化處理是軟件流水(software pipeline)。軟件流水是專門針對循環(huán)代碼的一種優(yōu)化技術,利用軟件流水可以生成非常緊湊的循環(huán)代碼,這也是C6000的C編譯器能夠達到較高編譯效率的主要原因。
匯編優(yōu)化器是C6000代碼產生工具內極具特色的一部分。它在DSP業(yè)界首創(chuàng)了對線性匯編代碼自動進行優(yōu)化的技術。線性匯編語言是為簡化C6000匯編語言程序的開發(fā)而設計的,它不是獨立的編程語言。它可用用戶編寫的線性匯編代碼作為輸入,同時產生一個標準匯編代碼作為輸出。與C6000的標準匯編語言相比,采用線性匯編不需要考慮并行指令安排、指令延遲和寄存器,而由匯編優(yōu)化器自動完成,其所產生的代碼效率可以達到人工編寫代碼效率的95%-100%,同時還可以降低編程工作量,縮短開發(fā)周期。
C6000程序的調試和仿真有兩種模式:軟件仿真和硬件仿真。軟件仿真時,其程序的執(zhí)行完全靠主機上的仿真軟件模擬,程序單步或者運行的結果都是仿真軟件“計算”出來的。而硬件仿真需要目標板。仿真程序利用開發(fā)系統(tǒng)將代碼下載到DSP,程序是在芯片上直接運行的。仿真軟件只是把運行結果讀出來顯示。軟件仿真無需目標板就可以開始軟件編程,但仿真速度較慢,而且無法仿真某些外設的功能。硬件仿真的優(yōu)點是仿真速度快,仿真結果與實際結果一致。
4.2 系統(tǒng)的上電引導
C6711的引導裝載方式有三種:一是無引導,二是ROM/FLASH引導,三是主機引導。本設計采用FLASH引導。根據DSK開發(fā)板上EMIF與FIASH硬件電路連接設計的引導程序如圖5所示。
(1)FLASH存儲器的擦除
擦除FLASH存儲器的關鍵源代碼如下:
至此FLASH內部地址已經映射到C6711的CE1空間,其開始地址為 0X90000000H,因此其FLASH_ADR1,FLSH_ADR2的定義如下:
#define FLASH_ADR1 0X90000555
#define FLASH_ADR2 0X900002AA
(2)匯編源代碼文件
本引導代碼的主要功能是將用戶程序段從FLASH復制到DSP內部RAM中。然后再跳轉到程序的入口處開始執(zhí)行主程序。這里采用的是EDMA快速實現DSP存儲空間數據搬移的方式?;贓DMA傳輸參數的設置方法如表1所列。其核心引導程序如下:
啟動EDMA復制主程序段:CPU可以通過寫事件置位寄存器(ESR)啟動一個EDMA通道,ESR中某一位寫1時,將強行觸發(fā)對應的事件。程序如下:
(3)鏈接命令文件
系統(tǒng)中的鏈接命令文件(boot.cmd)如下:
VEC,PMEM代表內部RAM的兩個存儲空間,而CEVEC,CEPMEM代表FLASH內的兩塊存儲空間,對目標文件中各段的加載地址和運行地址可在SECTIONS段實現:
引導裝載是設計DSP系統(tǒng)所必需的過程。本設計采用EDMA方式來實現程序的快速搬移,故可在自制的PCB板上正確地實現脫機運行。
(4)對DSP寄存器的設置
只有對相應的寄存器實現EMIF初始化,DSP才能訪問外部存儲器的數據,其源代碼如下:
5 結束語
本文介紹了為了在線線圈直徑的測量而開發(fā)線陣CCD圖像采集和處理設備的具體方法,該系統(tǒng)利用TI公司的高性能浮點DSP-TMS320C6711實現了對dalsa公司的Piranha2 P2—2x Camera輸出數據的采集與處理。給出了一種通用的實時圖像處理系統(tǒng),并詳細討論了系統(tǒng)的具體結構。在該系統(tǒng)中運行一些基本的圖像處理(銳化,平滑,邊緣檢測)和壓縮算法(JPEG,H.263),都能達到實時處理的目的。但在實際應用中,由于要求進行連續(xù)采集與處理,最好能采用多個DSP并行工作方式。若物體的運動速度更快或圖像處理更復雜時,還應采用性能更強的DSP(如TI的64X系列DSP或采用多個DSP并行處理)。另外,在DSP與USB通訊設計中引人FPGA可使系統(tǒng)的設計更加靈活,同時也可為系統(tǒng)以后的擴展提供方便。
評論