基于VxWorks實時操作系統(tǒng)的多任務(wù)程序設(shè)計
摘要:多DSP信號處理板廣泛地運用于工業(yè)、軍事、通信和醫(yī)療等許多方面。本文介紹一種基于VxWorks實時操作系統(tǒng)的ADSP21160的多DSP板設(shè)計,以及該板在數(shù)字式聲納的實時信號處理系統(tǒng)中的應(yīng)用,并介紹在VxWorks實時操作系統(tǒng)下的軟件算法仿真和實現(xiàn)。
本文引用地址:http://www.ex-cimer.com/article/248801.htm關(guān)鍵詞:多DSP陣列 聲納系統(tǒng)
VxWorks 近年來,計算機產(chǎn)品的應(yīng)用領(lǐng)域越來越廣,數(shù)字信號處理器的發(fā)展表現(xiàn)得尤為明顯。DSP芯片制造商和DSP板開發(fā)商利用自身的優(yōu)勢不斷開發(fā)出多DSP結(jié)構(gòu)的產(chǎn)品來滿足這種需求。通常的DSP設(shè)備是與嵌入式系統(tǒng)相結(jié)合,來實時地完成某一特定任務(wù)。隨著信號采集速度和處理速度的要求越來越高,許多領(lǐng)域都需要進行多處理器運算,其中包括醫(yī)學(xué)、圖像處理、軍事、工業(yè)控制、電信等許多領(lǐng)域。多處理器系統(tǒng)可以根據(jù)所需實現(xiàn)的功能和處理器的性能來調(diào)節(jié)處理結(jié)點的數(shù)目,使系統(tǒng)達到最佳的性能價格比。實際上,只有從芯片開始仔細設(shè)計,才能方便地實現(xiàn)多處理器系統(tǒng)的調(diào)節(jié)功能。這里選用的是AD公司新出品的SHARC級處理器ADSP21160。
ADSP21160具有很大的片內(nèi)存儲區(qū)、多重內(nèi)部總線結(jié)構(gòu)、獨立的I/O子系統(tǒng);具有構(gòu)造多處理器系統(tǒng)的所有特點,能夠真正支持處理器數(shù)目的可調(diào)節(jié)功能,十分適合組成高性能浮點的多DSP系統(tǒng)。 VxWorks是目前世界上用戶數(shù)量最大的實時操作系統(tǒng)。這使它除了具有優(yōu)越的技術(shù)性能之外,還具有豐富的應(yīng)用軟件支持、良好的技術(shù)服務(wù)和可靠的系統(tǒng)穩(wěn)定性。由于它具有以上優(yōu)點,本系統(tǒng)中選用了VxWorks作為MVME167的操作系統(tǒng)。
一、ADSP21160的特點
ADSP21160 是AD公司采用超級哈佛結(jié)構(gòu)的一種新產(chǎn)品。21160的匯編代碼與2106x兼容,處理器具有SIMD(單指令流多數(shù)據(jù)流)功能;而2106x只具有 SISD(單指令流單數(shù)據(jù)流)功能。為了充分利用這種新的功能,一些指令做了一些改變。ADSP21160包括1個100/150MHz的運算核、雙端片內(nèi)SRAM、1個支持多處理器的集成在片內(nèi)的I/O處理器和多重內(nèi)部總線以消除I/O瓶頸。
ADSP21160的匯編源代碼與2106x兼容。SIMD計算結(jié)構(gòu):2個32bit的計算單元,其中每一個單元包括乘法器、ALU、移位寄存器及寄存器文件。具有完備的與外圍設(shè)備接口功能。包括獨立的I/O處理器、4Mbit 的片內(nèi)雙端SRAM、可直接連接的多處理器特性及端口(串口、連接口、外總線及JTAG)。 ADSP21160包括2個運算處理單元,具有SIMD功能。處理單元指的是PEX和PEY。PEX始終是有效的,而PEY的有效是通過設(shè)置 MODE1寄存器中的PEYEN位來實現(xiàn)的。當(dāng)PEY模式有效時,同一條指令在2個處理器單元中都得到執(zhí)行,但每一個處理器單元中的操作數(shù)不同。 SIMD模式在存儲區(qū)和處理器單元之間的數(shù)據(jù)傳輸也是很有作用的。當(dāng)使用SIMD模式,通過加倍數(shù)據(jù)帶寬來保證處理器單元的操作。在SIMD模式,當(dāng)使用 DAGs來傳輸數(shù)據(jù)時,存儲區(qū)每次訪問所傳輸?shù)氖莾蓚€數(shù)據(jù)值。 ADSP21160包括4Mbit的片內(nèi)SRAM,分為兩塊,每一塊2Mbit??梢远x為不同字長的指令和數(shù)據(jù)存儲。每一個存儲塊的雙端口結(jié)構(gòu)可以使存儲塊獨立地被運算核處理和I/O處理器訪問。21160的存儲區(qū)最大可以容納128K的32bit數(shù)據(jù),或256K的16bit數(shù)據(jù),或85K的 48bit指令,或其他混合字長的數(shù)據(jù),但總和最大為4Mbit。所有存儲區(qū)可以16、32、48、64bit字長的字訪問。 外端口支持處理器與片外存儲器及外設(shè)的接口,片外的4G地址空間屬于21160的統(tǒng)一地址空間。 外端口支持同步、異步及同步BURST訪問。DMA控制器的操作相對處理器運算核是獨立和不可見的,即DMA操作可與執(zhí)行指令同時進行。DMA傳輸可以在內(nèi)部存儲區(qū)與外部存儲區(qū)、外圍設(shè)備或主機之間進行。21160共有14個DMA通道,其中:連接口(linkport)占6個;串口占4個;外端口 (external port)占4個。21160可以通過DMA傳輸來下載程序,外圍異步設(shè)備也可以通過DMA請求/應(yīng)答線來控制2個DMA通道。 21160具有許多特點支持多DSP系統(tǒng)。外端口與連接口支持多處理器系統(tǒng)的直接連接,外端口支持統(tǒng)一的地址空間,允許DSP之間互相訪問。片內(nèi)具有分布式總線仲裁邏輯,最多支持6片21160和主機連接。外端口的最大數(shù)據(jù)傳輸率為400MB/s,廣播寫信號可以同時發(fā)送到各片21160。6個連接口提供了另一種方法實現(xiàn)多處理器之間的通信。連接口的最高傳輸速率為600MB/s。
整個系統(tǒng)基于VME總線。VME總線系統(tǒng)作為最早的國際通用開放式總線,自1981年起,經(jīng)歷了近20年的發(fā)展。其影響不斷擴大,功能不斷完善,現(xiàn)已成為性能最好、應(yīng)用最廣的國際總線標(biāo)準之一。 根據(jù)設(shè)計要求,采用了4片ADSP21160。片外共享內(nèi)存SRAM可以被主機和各片DSP直接訪問;EPROM用來存放初始化程序和各片DSP要運行的程序,在系統(tǒng)上電后這些程序被下載到各片DSP中;LEDs用來顯示插件的狀態(tài),如reset、normal等。每一片都有1個連接口連到插件的前面板,這樣前端采集來的數(shù)據(jù)就可以很方便地傳輸?shù)蕉郉SP上,而且也使數(shù)據(jù)的傳輸模式更加靈活。 連接口(linkport)是SHARC系列DSP芯片的一個特點。ADSP21160共有6個8bit連接口提供額外的I/O服務(wù)。在100MHz 時鐘下運行時,每個連接口可達100MB/s。連接口尤其適合多處理器間點到點的連接。連接口可以獨立地同時操作,通過連接口的數(shù)據(jù)封裝成48 /32bit字長后,可以從片內(nèi)存儲區(qū)直接被運算核讀取或DMA傳輸。每一個連接口有它自己的雙緩沖I/O寄存器,數(shù)據(jù)傳輸可編程,硬件由時鐘/應(yīng)答握手線控制。4片DSP使用連接口實現(xiàn)DSP間兩兩互連。 21160的主機接口可以很方便地與標(biāo)準微處理器總線(16/32bit)相連,幾乎不需要額外硬件。主機通過21160的外端口對其進行訪問,存儲區(qū)地址映射為統(tǒng)一的地址空間。4個DMA通道可以用于主機接口,代碼和數(shù)據(jù)傳輸?shù)能浖_銷很小,主處理器通過HBR、HBG和REDY信號線與21160 進行通信,主機可以對片內(nèi)存儲區(qū)進行直接讀寫。
二、開發(fā)環(huán)境Tornado
VxWorks的開發(fā)環(huán)境是WindRiver公司提供的Tornado。Tornado采用主機-目標(biāo)機開發(fā)方式,主機系統(tǒng)可采用運行Sun Solaris、HP-UX以及Win95/NT的工作站或個人計算機,VxWorks則運行在Intel x86、MC68K、PowerPC或SPARC等處理器上。Tornado支持各種主機-目標(biāo)機連接方式,如以太網(wǎng)、串行線、在線仿真器和ROM仿真器。 Tornado的體系結(jié)構(gòu)使得許多強有力的開發(fā)工具可以用于各種目標(biāo)機系統(tǒng)和各種主機-目標(biāo)機連接方式下,而不受制于目標(biāo)機的資源和通信機制。同時 VxWorks具有良好的可剪裁性。因此它適用于各種嵌入式環(huán)境的開發(fā),小到資源極其有限的個人手持式設(shè)備如PDA(Personal Digital Assistant);大到多處理機系統(tǒng),如VME系統(tǒng)。 Tornado可提供一個直觀的、可視化的、用戶可擴充的開發(fā)環(huán)境,極大縮短了開發(fā)周期。同時,由于Tornado是一個完全的開放系統(tǒng),使得集成第三方開發(fā)工具變得十分容易。 主機與目標(biāo)機之間的通信是通過運行各自處理器上的代理進程來完成的,使主機上的開發(fā)工具和目標(biāo)機的操作系統(tǒng)可以完全脫離相互連接的方式。 為了擺脫主機-目標(biāo)機通信帶寬和目標(biāo)機資源的限制,Tornado將傳統(tǒng)的目標(biāo)機方的工具遷移到主機上,如shell、loader和符號表等。這樣,系統(tǒng)不再需要額外的時間和帶寬在主機和目標(biāo)機之間交換信息,降低了對連接帶寬的需求,
也避免了目標(biāo)機的資源(如內(nèi)存)被工具或符號表大量占用,使得應(yīng)用程序擁有更多的系統(tǒng)資源。同時這種遷移也使得各種主機開發(fā)工具獨立于目標(biāo)機存在,從而使同一主機平臺上的工具可以用于所有的目標(biāo)機系統(tǒng)。 作為一個應(yīng)用軟件開發(fā)環(huán)境,Tornado提供了友好的可視化開發(fā)界面、交叉編譯環(huán)境、源碼級調(diào)試工具、目標(biāo)機命令解釋器和目標(biāo)機狀態(tài)監(jiān)視器等多種應(yīng)用工具,為應(yīng)用軟件開發(fā)提供了一個高效而可靠的平臺。
三、程序設(shè)計
我們選用的DSP開發(fā)工具是AD公司提供的VisualDSP。這是一個集成開發(fā)環(huán)境,支持對SHARC系列DSP芯片的開發(fā)。實時操作系統(tǒng) VxWorks的開發(fā)工具是WindRiver公司的Tornado集成開發(fā)工具。VisualDSP可以C語言或匯編語言編寫的DSP代碼,最新版本的 VisualDSP還支持C++。它還有1個優(yōu)點,就是可以編譯多片DSP的源代碼,并產(chǎn)生下載文件,這就可以很方便地進行多DSP系統(tǒng)的軟件模擬。 ADSP21160陣列的設(shè)計結(jié)構(gòu)使它既可以構(gòu)成單指令流多數(shù)據(jù)流(SIMD)的并行處理機,也可以構(gòu)成多指令流單數(shù)據(jù)流(MISD)或多指令流多數(shù)據(jù)流(MIMD)的流水線處理機,視用戶的要求而定。這兩種并行方案的選擇,簡單來說就是選擇分割數(shù)據(jù)流還是分割處理工序。SIMD方案的原理如圖1所示。 以下介紹我們實驗室承擔(dān)的水聲信號處理系統(tǒng)。本系統(tǒng)以VME總線為系統(tǒng)開發(fā)平臺,前端調(diào)理模件、模數(shù)轉(zhuǎn)換模件和前端控制模件等為VME插件,采用 SHARC級DSP芯片陣列完成聲納信號實時處理,基于嵌入式實時操作系統(tǒng)VxWorks及X窗口系統(tǒng)的中央控制和顯示。 圖2是4片DSP的任務(wù)分配圖。從前端采集來的信號,經(jīng)波束形成和復(fù)解調(diào),再經(jīng)過窄帶濾波后的信號分為兩路,一路送去進行幅度檢波,一路做頻域處理。幅度檢波就是對復(fù)信號求模,根據(jù)信號幅度判決有無目標(biāo)存在。頻域處理分兩種情況:當(dāng)發(fā)射信號為單頻脈沖時,進行功率譜估計,然后根據(jù)多普勒頻移估計目標(biāo)速度;當(dāng)發(fā)射信號為雙曲調(diào)頻信號時,進行相關(guān)處理。 聲納綜合數(shù)據(jù)處理主要包括主動聲納信號處理和被動聲納信號處理。其中,主動聲納信號處理又根據(jù)發(fā)射信號的不同,分為非相干處理、相干處理、功率譜處理。聲納綜合數(shù)據(jù)處理主要完成:目標(biāo)自動檢測、目標(biāo)參數(shù)測定和動目標(biāo)跟蹤。 四、操作流水線 操作流水線是模塊內(nèi)數(shù)據(jù)計算與I/O的流水線,物理上表現(xiàn)為CPU與I/O端口的DMA之間的并行。在前端處理中由于數(shù)據(jù)率高,通信開銷很大。以通信任務(wù)最為繁重的復(fù)解調(diào)和多普勒補償模塊為例,輸入數(shù)據(jù)率為2Mw/s,輸出數(shù)據(jù)率為4Mw/s,高速連接口LinkPort最高速率為100Mw/s,如果采用串行傳輸?shù)脑挘ㄐ艜r間就將占用60%以上的處理時間,計算時間顯然嚴重不足。所以必須采用并行執(zhí)行,流程圖如圖3所示。這也是一種異步流水線方式,每次傳送和計算完成都須要設(shè)置標(biāo)志以通知下一操作。
結(jié)束語
在VxWorks實時操作系統(tǒng)下,4片ADSP21160上的程序已經(jīng)通過模擬輸入和系統(tǒng)測試。采用SHARC DSP 陣列能夠很好地完成聲納信號實時處理,每一片DSP至少有10%的計算裕量,基本達到設(shè)計要求。
c++相關(guān)文章:c++教程
評論