基于VxWorks的多DSP系統的多任務程序設計
近年來,計算機產品的應用領域越來越廣,數字信號處理器的發(fā)展表現得尤為明顯。DSP芯片制造商和DSP板開發(fā)商利用自身的優(yōu)勢不斷開發(fā)出多DSP結構的產品來滿足這種需求。通常的DSP設備是與嵌入式系統相結合,來實時地完成某一特定任務。隨著信號采集速度和處理速度的要求越來越高,許多領域都需要進行多處理器運算,其中包括醫(yī)學、圖像處理、軍事、工業(yè)控制、電信等許多領域。多處理器系統可以根據所需實現的功能和處理器的性能來調節(jié)處理結點的數目,使系統達到最佳的性能價格比。
實際上,只有從芯片開始仔細設計,才能方便地實現多處理器系統的調節(jié)功能。這里選用的是AD公司新出品的SHARC級處理器ADSP21160。
ADSP21160具有很大的片內存儲區(qū)、多重內部總線結構、獨立的I/O子系統;具有構造多處理器系統的所有特點,能夠真正支持處理器數目的可調節(jié)功能,十分適合組成高性能浮點的多DSP系統。
VxWorks是目前世界上用戶數量最大的實時操作系統。這使它除了具有優(yōu)越的技術性能之外,還具有豐富的應用軟件支持、良好的技術服務和可靠的系統穩(wěn)定性。由于它具有以上優(yōu)點,本系統中選用了VxWorks作為MVME167的操作系統。
一、ADSP21160的特點
ADSP21160 是AD公司采用超級哈佛結構的一種新產品。21160的匯編代碼與2106x兼容,處理器具有SIMD(單指令流多數據流)功能;而2106x只具有SISD(單指令流單數據流)功能。為了充分利用這種新的功能,一些指令做了一些改變。ADSP21160包括1個100/150MHz的運算核、雙端片內SRAM、1個支持多處理器的集成在片內的I/O處理器和多重內部總線以消除I/O瓶頸。
ADSP21160的匯編源代碼與2106x兼容。SIMD計算結構:2個32bit的計算單元,其中每一個單元包括乘法器、ALU、移位寄存器及寄存器文件。具有完備的與外圍設備接口功能。包括獨立的I/O處理器、4Mbit 的片內雙端SRAM、可直接連接的多處理器特性及端口(串口、連接口、外總線及JTAG)。
ADSP21160包括2個運算處理單元,具有SIMD功能。處理單元指的是PEX和PEY。PEX始終是有效的,而PEY的有效是通過設置MODE1寄存器中的PEYEN位來實現的。當PEY模式有效時,同一條指令在2個處理器單元中都得到執(zhí)行,但每一個處理器單元中的操作數不同。
SIMD模式在存儲區(qū)和處理器單元之間的數據傳輸也是很有作用的。當使用SIMD模式,通過加倍數據帶寬來保證處理器單元的操作。在SIMD模式,當使用DAGs來傳輸數據時,存儲區(qū)每次訪問所傳輸的是兩個數據值。
ADSP21160包括4Mbit的片內SRAM,分為兩塊,每一塊2Mbit??梢远x為不同字長的指令和數據存儲。每一個存儲塊的雙端口結構可以使存儲塊獨立地被運算核處理和I/O處理器訪問。21160的存儲區(qū)最大可以容納128K的32bit數據,或256K的16bit數據,或85K的48bit指令,或其他混合字長的數據,但總和最大為4Mbit。所有存儲區(qū)可以16、32、48、64bit字長的字訪問。 外端口支持處理器與片外存儲器及外設的接口,片外的4G地址空間屬于21160的統一地址空間。
外端口支持同步、異步及同步BURST訪問。DMA控制器的操作相對處理器運算核是獨立和不可見的,即DMA操作可與執(zhí)行指令同時進行。DMA傳輸可以在內部存儲區(qū)與外部存儲區(qū)、外圍設備或主機之間進行。21160共有14個DMA通道,其中:連接口(linkport)占6個;串口占4個;外端口(external port)占4個。21160可以通過DMA傳輸來下載程序,外圍異步設備也可以通過DMA請求/應答線來控制2個DMA通道。
21160具有許多特點支持多DSP系統。外端口與連接口支持多處理器系統的直接連接,外端口支持統一的地址空間,允許DSP之間互相訪問。片內具有分布式總線仲裁邏輯,最多支持6片21160和主機連接。外端口的最大數據傳輸率為400MB/s,廣播寫信號可以同時發(fā)送到各片21160。6個連接口提供了另一種方法實現多處理器之間的通信。連接口的最高傳輸速率為600MB/s。
整個系統基于VME總線。VME總線系統作為最早的國際通用開放式總線,自1981年起,經歷了近20年的發(fā)展。其影響不斷擴大,功能不斷完善,現已成為性能最好、應用最廣的國際總線標準之一。
根據設計要求,采用了4片ADSP21160。片外共享內存SRAM可以被主機和各片DSP直接訪問;EPROM用來存放初始化程序和各片DSP要運行的程序,在系統上電后這些程序被下載到各片DSP中;LEDs用來顯示插件的狀態(tài),如reset、normal等。每一片都有1個連接口連到插件的前面板,這樣前端采集來的數據就可以很方便地傳輸到多DSP上,而且也使數據的傳輸模式更加靈活。
連接口(linkport)是SHARC系列DSP芯片的一個特點。ADSP21160共有6個8bit連接口提供額外的I/O服務。在100MHz時鐘下運行時,每個連接口可達100MB/s。連接口尤其適合多處理器間點到點的連接。連接口可以獨立地同時操作,通過連接口的數據封裝成48/32bit字長后,可以從片內存儲區(qū)直接被運算核讀取或DMA傳輸。每一個連接口有它自己的雙緩沖I/O寄存器,數據傳輸可編程,硬件由時鐘/應答握手線控制。4片DSP使用連接口實現DSP間兩兩互連。
21160的主機接口可以很方便地與標準微處理器總線(16/32bit)相連,幾乎不需要額外硬件。主機通過21160的外端口對其進行訪問,存儲區(qū)地址映射為統一的地址空間。4個DMA通道可以用于主機接口,代碼和數據傳輸的軟件開銷很小,主處理器通過HBR、HBG和REDY信號線與21160進行通信,主機可以對片內存儲區(qū)進行直接讀寫。
二、開發(fā)環(huán)境Tornado
VxWorks的開發(fā)環(huán)境是WindRiver公司提供的Tornado。Tornado采用主機-目標機開發(fā)方式,主機系統可采用運行Sun Solaris、HP-UX以及Win95/NT的工作站或個人計算機,VxWorks則運行在Intel x86、MC68K、PowerPC或SPARC等處理器上。Tornado支持各種主機-目標機連接方式,如以太網、串行線、在線仿真器和ROM仿真器。
Tornado的體系結構使得許多強有力的開發(fā)工具可以用于各種目標機系統和各種主機-目標機連接方式下,而不受制于目標機的資源和通信機制。同時VxWorks具有良好的可剪裁性。因此它適用于各種嵌入式環(huán)境的開發(fā),小到資源極其有限的個人手持式設備如PDA(Personal Digital Assistant);大到多處理機系統,如VME系統。
Tornado可提供一個直觀的、可視化的、用戶可擴充的開發(fā)環(huán)境,極大縮短了開發(fā)周期。同時,由于Tornado是一個完全的開放系統,使得集成第三方開發(fā)工具變得十分容易。
主機與目標機之間的通信是通過運行各自處理器上的代理進程來完成的,使主機上的開發(fā)工具和目標機的操作系統可以完全脫離相互連接的方式。
為了擺脫主機-目標機通信帶寬和目標機資源的限制,Tornado將傳統的目標機方的工具遷移到主機上,如shell、loader和符號表等。這樣,系統不再需要額外的時間和帶寬在主機和目標機之間交換信息,降低了對連接帶寬的需求,也避免了目標機的資源(如內存)被工具或符號表大量占用,使得應用程序擁有更多的系統資源。同時這種遷移也使得各種主機開發(fā)工具獨立于目標機存在,從而使同一主機平臺上的工具可以用于所有的目標機系統。
作為一個應用軟件開發(fā)環(huán)境,Tornado提供了友好的可視化開發(fā)界面、交叉編譯環(huán)境、源碼級調試工具、目標機命令解釋器和目標機狀態(tài)監(jiān)視器等多種應用工具,為應用軟件開發(fā)提供了一個高效而可靠的平臺。
三、程序設計
我們選用的DSP開發(fā)工具是AD公司提供的VisualDSP。這是一個集成開發(fā)環(huán)境,支持對SHARC系列DSP芯片的開發(fā)。實時操作系統VxWorks的開發(fā)工具是WindRiver公司的Tornado集成開發(fā)工具。VisualDSP可以C語言或匯編語言編寫的DSP代碼,最新版本的VisualDSP還支持C++。它還有1個優(yōu)點,就是可以編譯多片DSP的源代碼,并產生下載文件,這就可以很方便地進行多DSP系統的軟件模擬。
ADSP21160陣列的設計結構使它既可以構成單指令流多數據流(SIMD)的并行處理機,也可以構成多指令流單數據流(MISD)或多指令流多數據流(MIMD)的流水線處理機,視用戶的要求而定。這兩種并行方案的選擇,簡單來說就是選擇分割數據流還是分割處理工序。SIMD方案的原理如圖1所示。
以下介紹我們實驗室承擔的水聲信號處理系統。本系統以VME總線為系統開發(fā)平臺,前端調理模件、模數轉換模件和前端控制模件等為VME插件,采用SHARC級DSP芯片陣列完成聲納信號實時處理,基于嵌入式實時操作系統VxWorks及X窗口系統的中央控制和顯示。
圖2是4片DSP的任務分配圖。從前端采集來的信號,經波束形成和復解調,再經過窄帶濾波后的信號分為兩路,一路送去進行幅度檢波,一路做頻域處理。幅度檢波就是對復信號求模,根據信號幅度判決有無目標存在。頻域處理分兩種情況:當發(fā)射信號為單頻脈沖時,進行功率譜估計,然后根據多普勒頻移估計目標速度;當發(fā)射信號為雙曲調頻信號時,進行相關處理。
聲納綜合數據處理主要包括主動聲納信號處理和被動聲納信號處理。其中,主動聲納信號處理又根據發(fā)射信號的不同,分為非相干處理、相干處理、功率譜處理。聲納綜合數據處理主要完成:目標自動檢測、目標參數測定和動目標跟蹤。
四、操作流水線
操作流水線是模塊內數據計算與I/O的流水線,物理上表現為CPU與I/O端口的DMA之間的并行。在前端處理中由于數據率高,通信開銷很大。以通信任務最為繁重的復解調和多普勒補償模塊為例,輸入數據率為2Mw/s,輸出數據率為4Mw/s,高速連接口LinkPort最高速率為100Mw/s,如果采用串行傳輸的話,通信時間就將占用60%以上的處理時間,計算時間顯然嚴重不足。所以必須采用并行執(zhí)行,流程圖如圖3所示。這也是一種異步流水線方式,每次傳送和計算完成都須要設置標志以通知下一操作。
結束語
在VxWorks實時操作系統下,4片ADSP21160上的程序已經通過模擬輸入和系統測試。采用SHARC DSP 陣列能夠很好地完成聲納信號實時處理,每一片DSP至少有10%的計算裕量,基本達到設計要求。
linux操作系統文章專題:linux操作系統詳解(linux不再難懂)c語言相關文章:c語言教程
c++相關文章:c++教程
評論