一種基于DSP的并行信號處理系統(tǒng)的設(shè)計

作者：時間：2012-11-12 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

自數(shù)字計算機問世以來，計算機的處理能力已經(jīng)增長了100 k倍以上。然而，現(xiàn)有性能最高的計算機的計算能力仍遠(yuǎn)遠(yuǎn)不能滿足人類對計算速度無止境的追求。

本文引用地址：http://www.ex-cimer.com/article/257226.htm

在科學(xué)計算、地質(zhì)分析、氣象預(yù)測、仿真模擬、圖像處理以及實時信號處理領(lǐng)域，對計算機處理速度的要求尤為迫切。隨著半導(dǎo)體技術(shù)的迅速發(fā)展，采用超大規(guī)模集成電路設(shè)計的處理單元功能越來越強，然而單處理器性能的提高受到了諸多限制。因此，滿足對運算速度的巨大需求目前只能通過并行處理技術(shù)來實現(xiàn)。

1 概述

　　本文中設(shè)計了一種并行信號處理系統(tǒng)，其主要特點是：

（1）具有強大的處理能力，可以完成多種信號處理模式。

　?。?）信號處理功能通過大量信號處理芯片（DSP）的并行計算完成。

　?。?）信號處理功能的改變通過軟件實現(xiàn)。

　　圖1所示的是動目標(biāo)檢測雷達(dá)信號處理機的主要組成部分，虛線中的處理模塊是本文要完成的工作。

2 幅相計算、CFAR檢測、M/N檢測

2.1 幅相計算

　　幅相計算指從復(fù)數(shù)據(jù)計算其幅度和相位，假使：

2.2 CFAR檢測和M/N檢測

　　雷達(dá)信號的檢測總是在干擾背景上進(jìn)行的，為了在強干擾中提取信號，不僅要求有一定的信噪比，而且必須有恒虛警處理設(shè)備，恒虛警處理的目的是保持信號檢測時的虛警率恒定，這樣才能使處理機不致因虛警太多而過載。

（1）單元平均恒虛警（CFAR）檢測器

　　已經(jīng)知道，在低分辨率的脈沖雷達(dá)中，海浪和雨雪等分布雜波可以看作很多獨立照射單元回波的迭加，因而雜波包絡(luò)的分布服從瑞利分布，如果檢測背景中存在此類雜波，檢測門限可以通過計算雜波的均值得到，但是由于雜波在空間分布的未知性，求雜波均值只能從被檢測目標(biāo)鄰近單元來獲得，這就是比較常用的單元平均CFAR檢測器。為了減少這類檢測器在雜波邊緣內(nèi)側(cè)虛警顯著增大問題，一般采用其改進(jìn)電路—兩側(cè)單元平均選大電路，如圖2所示。在被檢測單元的兩邊，為了防止目標(biāo)本身對門限值的影響各空出了一個保護單元。

（2）二維CFAR檢測器

　　當(dāng)雷達(dá)工作于FFT方式時，CFAR檢測器的輸入數(shù)據(jù)包括距離和頻率2個變量，所以需要采用二維CFAR，如圖3所示。除0# 濾波器輸出送雜波圖處理外，其他多卜勒濾波器輸出各接一個單元平均CFAR檢測器。各CFAR檢測的結(jié)果合起來作為目標(biāo)判斷。

（3）M/N檢測

　　M/N檢測在CFAR檢測后進(jìn)行，其中，N為積累脈沖數(shù)，M為小于N的值。我們設(shè)定M/N檢測的準(zhǔn)則為2/3，即相同距離門的信號在3個脈沖重復(fù)周期里至少2次過門限判定有目標(biāo)。

　　2.3 雜波圖

　　雜波圖技術(shù)就是將雷達(dá)周圍的二維平面分成許多方位距離單元，把方位距離單元的接收信號存入一個存儲器中，每個存儲單元對應(yīng)一個方位距離單元，并且隨著天線的掃描，每個單元存儲的信號進(jìn)行遞推更新：

　　其中：K是一個小于1的因子，xn和yn分別代表輸入、輸出。

　　所以天線多圈掃描以后，雜波圖中存貯的是相應(yīng)方位距離單元的雜波均值。檢測門限H根據(jù)式

（5）計算，如果被檢測信號xn大于門限H，我們就判為有目標(biāo)，否則就判無目標(biāo)。

　　H=Cyn(5)

　　其中：C為一個門限乘子，C的大小決定著檢測概率的虛警概率。

　　3 系統(tǒng)的設(shè)計

　　并行處理的目的是通過采用多個處理單元同時對任務(wù)處理來減少任務(wù)的執(zhí)行時間，如何能以最短的時間完成任務(wù)成為并行處理機設(shè)計者最關(guān)心的問題，對這一問題的反映表現(xiàn)在處理機的2個基本性能指標(biāo)：加速比和并行效率。而并行處理機的這2個基本性能決定于組成并行處理機的3個要素：處理單元、并行處理機網(wǎng)絡(luò)結(jié)構(gòu)、并行算法程序和任務(wù)分配方法。三者之間緊密聯(lián)系，互相依賴。

　　3.1 處理單元的選擇

　　處理單元的性能可以說是決定處理機性能最基本的因素，高性能的處理單元可以提高系統(tǒng)性能、減少系統(tǒng)體積和功耗、降低結(jié)構(gòu)復(fù)雜性和提高軟件可維護性。處理單元按應(yīng)用范圍大致可分為中央處理單元、專用ASIC芯片、FPGA/EPLD、數(shù)字信號處理器。在實時數(shù)字信號處理應(yīng)用上，DSP仍具備明顯優(yōu)勢。

　　在并行處理中，更強調(diào)DSP是否具有適于構(gòu)成并行處理機的特殊功能，如高速通信口的通信能力、共享存貯器的接口功能等。TMS320C40和ADSP21060在結(jié)構(gòu)功能上有很多相似之處，相比較而言，綜合性能較好地并行DSP是ADSP21060，他的運算速度、數(shù)據(jù)吞吐能力、片內(nèi)存貯器容量都遠(yuǎn)優(yōu)于TMS320C40，相對于其他類型DSP。他的突出特點是：FFT速度快、片內(nèi)存貯器容量大，很好地共享存貯器接口。各種兼容型號ADSP2106X的選擇余地也較大，他還與最新推出的ADSP21160代碼兼容，結(jié)構(gòu)與接口形式也類似。

　　3.2 并行處理機互聯(lián)結(jié)構(gòu)

　　并行處理機互聯(lián)網(wǎng)絡(luò)的主要功能是為各處理單元提供數(shù)據(jù)交換的通路并負(fù)責(zé)子任務(wù)傳送和控制調(diào)度信號的傳遞。處理單元之間的網(wǎng)絡(luò)結(jié)構(gòu)大致可分成2類：

　　(1)共享總線（共享存貯器）系統(tǒng)，稱為緊耦合式并行系統(tǒng)。

　　(2)處理單元有各自獨立的數(shù)據(jù)存貯器而通過通信口相連的分布式并行系統(tǒng)，又稱松耦合式系統(tǒng)。緊耦合式的共享總線系統(tǒng)在處理單元個數(shù)較少的情況下，以其無需數(shù)據(jù)通信而能獲得較高的加速比。當(dāng)處理單元個數(shù)很多時，共享總線將造成頻繁的總線沖突和等待，而且共享總線結(jié)構(gòu)的可擴充性和靈活性不及分布式系統(tǒng)，不適于大規(guī)模并行處理系統(tǒng)，可重構(gòu)能力和容錯能力都遠(yuǎn)不如分布式系統(tǒng)。

　　通用并行DSP的通信口速度在30~60 MHz，這為在處理單元數(shù)目很多的大規(guī)模并行處理采用分布式系統(tǒng)設(shè)計創(chuàng)造了條件。TMS320C40或ADSP21060提供的多達(dá)6個高速通信口的總通信能力與其指令速度或平均運算能力相當(dāng)，而同時TMS320C40或ADSP21060都提供了共享數(shù)據(jù)總線的接口，TMS320C40有2套獨立的總線，其中一套可以用于和其他TMS320C40共享數(shù)據(jù)，而ADSP21060的片內(nèi)具有共享總線仲裁邏輯，可以在無需添加外部控制電路的情況下，將不多于6個ADSP21060直接相連。

　　以上分析表明，分布式并行系統(tǒng)更適合于大規(guī)模并行系統(tǒng)，而共享總線式系統(tǒng)在小規(guī)模的并行處理機上可以得到較高的性能。以ADSP21060為例，當(dāng)處理單元小于5時共享總線系統(tǒng)的效率較高；反之，分布式并行系統(tǒng)將更好。

　　3.3 并行算法、任務(wù)分配和軟件編程

　　并行算法的好壞主要以其并行度高低來衡量，并行算法和并行程序的設(shè)計復(fù)雜度遠(yuǎn)大于傳統(tǒng)的串行算法和串行程序設(shè)計，他更多地依賴于處理機結(jié)構(gòu)，現(xiàn)有的并行算法遠(yuǎn)不能滿足并行處理的需要，而且目前還缺乏一種有效的并行開發(fā)系統(tǒng)和并行設(shè)計語言，但對于雷達(dá)信號處理這一領(lǐng)域來說，信號處理任務(wù)的類型基本上是確定的，這就縮小了設(shè)計者的設(shè)計范圍，從而大大減少了程序設(shè)計的難度。

　　采用上文所述的并行DSP作為處理單元構(gòu)成的信號處理機將是完全可編程和軟件可重載的，根據(jù)需要可以對不同并行子模塊重新進(jìn)行功能定義。算法軟件以標(biāo)準(zhǔn)模塊存放在DSP的RAM或ROM中，當(dāng)處理單元的功能改變時，可調(diào)用相應(yīng)的軟件模塊。

　　任務(wù)分配和調(diào)度仍是并行處理系統(tǒng)設(shè)計的一個難題，至今尚無實用的任務(wù)自動分配方法，而任務(wù)分配所帶來的成本又太高。根據(jù)雷達(dá)信號處理固有的特點，可以將其定義成帶有輸入?yún)?shù)的軟件模塊，每個模塊隨著其輸入?yún)?shù)的不同，其輸出參數(shù)如運算時間、數(shù)據(jù)通信時間、數(shù)據(jù)通信路徑都將不同。

　　采用數(shù)據(jù)流全驅(qū)動的方式是將處理過程中的全部數(shù)據(jù)分割成一定大小的數(shù)據(jù)包，在每個數(shù)據(jù)包中，除了實際數(shù)據(jù)還包括有如下信息：數(shù)據(jù)包長度、處理方式、數(shù)據(jù)描述、校驗碼。處理方式中含有足夠的處理信息，用于指示DSP或子模塊如何處理此包數(shù)據(jù)，即選擇多普勒濾波、MTI、CFAR等。數(shù)據(jù)描述信息詳細(xì)地給出了此包數(shù)據(jù)的特點，包括距離門起止號、多普勒號、通道號等。DSP接收到一個數(shù)據(jù)包后，如果此包數(shù)據(jù)的處理相對于其他數(shù)據(jù)包是獨立的，他就立即進(jìn)行處理，否則等待其他包數(shù)據(jù)到齊或者向其他DSP轉(zhuǎn)發(fā)。

　　4 系統(tǒng)的實現(xiàn)

　　首先估計一下單元平均恒虛警檢測的運算量：整個距離（最大120 km,7 MHz采樣率）數(shù)據(jù)量為5.6 k個復(fù)數(shù)，1片ADSP2106X處理需要的時間大約是3.6 ms，由于相干處理周期為1 ms，因而我們在距離上分成4段，分別用4片ADSP2106X處理，這樣還有0.1 ms的空閑時間。這里為了每片DSP處理數(shù)據(jù)方便，需要每段處理相互獨立，因此段間要有重疊，以保證每一段CFAR的左右單元平均可以獨立進(jìn)行。

　?。?）對于恒虛警檢測的處理來說，只有2種工作方式：MTI和MTD，分別對應(yīng)單元平均恒虛警檢測和二維恒虛警檢測。

　?。?）系統(tǒng)內(nèi)各部分均采用數(shù)據(jù)流方式驅(qū)動，數(shù)據(jù)包的格式為：先是4個字的模式控制字，然后是實際數(shù)據(jù)。每一種工作方式及相應(yīng)參數(shù)由每一數(shù)據(jù)包前面的模式控制字給出，對應(yīng)于模式控制字中的工作方式及參數(shù)等各共用部分，我們在所有運算單元中對其進(jìn)行解釋，以便轉(zhuǎn)入相應(yīng)的子程序。

　　（3）系統(tǒng)初始化方式有兩種，一種是EPROM加載方式，此方式有利于在整個系統(tǒng)調(diào)試或固定雷達(dá)工作方式后，脫開計算機進(jìn)行。另一種加載方式就是通過計算機接口以Link口加載方式進(jìn)行加載。為了使用時調(diào)整雷達(dá)信號處理方式，采用計算機加載方式。

　　4.1 系統(tǒng)硬件

　　根據(jù)運算量和恒虛警檢測所需的存儲量，估計出設(shè)備量為5片DSP，如圖4所示。

　　由于雷達(dá)信號處理流水進(jìn)行的特點，可以按處理流程將整個系統(tǒng)劃分成若干功能塊，所以擬采用分布式并行處理系統(tǒng)。分布式并行處理系統(tǒng)由標(biāo)準(zhǔn)的并行子模塊構(gòu)成，恒虛警檢測子模塊由4個單元構(gòu)成，M/N檢測匯總子模塊為1個單元，并行子模塊之間由高速通信口相連，每對通信口間數(shù)據(jù)傳輸速率可達(dá)40 Mb/s。所有DSP都有通信口通過電路板插座連接到外部，利用數(shù)據(jù)流格式和相應(yīng)的軟件配置在鄰近電路板間建立數(shù)據(jù)通路，這樣減少了電路板間信號耦合。

　　4.2軟件處理及實現(xiàn)分析

　　程序部分完成：CFAR、幅相計算、M/N檢測等功能，需要5片DSP。

　　整個距離分4段，分別在4片DSP中進(jìn)行CFAR、幅相計算等處理。段間有重疊，以保證每一段CFAR的左右單元平均可以獨立進(jìn)行。最后將4段的結(jié)果在下一片DSP進(jìn)行合并、M/N檢測，把目標(biāo)信息后送。

　　(1)CFAR，幅相計算

　　雜波圖恒虛警檢測的主要功能是利用相應(yīng)方位的雜波圖輸出作為門限，對零號濾波器各距離單元進(jìn)行檢測。其他濾波器輸出采用單元平均CFAR處理方法對每個距離單元進(jìn)行檢測，同一個距離門的N-1個多卜勒通道檢測結(jié)果選大作為CFAR檢測結(jié)果，并與雜波圖檢測輸出經(jīng)或門后作為最終檢測結(jié)果。檢測結(jié)果有目標(biāo)輸出時，保留其幅值、相位信息。

　　程序流程分別從LINKX接收各自段的數(shù)據(jù)，先對數(shù)據(jù)作CFAR處理，檢測到目標(biāo)后，保存對應(yīng)距離/多普勒單元信息，等到所有數(shù)據(jù)都處理完后，把結(jié)果通過LINKX送往下一級，主程序流程如圖5所示。

　　其中IRQ0是相干處理周期的起始信號，模式字的有效性通過校驗碼實現(xiàn)，高速通信口LINKX工作在DMA方式。

　　輸入與輸出的數(shù)據(jù)格式輸入數(shù)據(jù)先是4個字的模式，接著是實、虛部交替的復(fù)數(shù)，個數(shù)同模式有關(guān)，每個復(fù)數(shù)對應(yīng)一個距離/多普勒單元。CFAR檢測結(jié)果格式，先是以4個字的模式，逐個字地檢測到目標(biāo)的個數(shù)，接著是各目標(biāo)單元信息。

　　由于這一級在最不利的32點FFT情況下存儲量大約為90 k個復(fù)數(shù)，所以DSP芯片選取了內(nèi)存較大的ADSP21060。

　　(2)匯總與M/N檢測

　　這一級的匯總?cè)蝿?wù)是把4段的CFAR檢測結(jié)果合并到一起，只要把各段中各個目標(biāo)單元依據(jù)距離門的位置加以修整，然后搬到另一處緩沖區(qū)即可。這時目標(biāo)信息排列的順序是按距離門號依次遞增的，先搬整個距離段上距離門號最小的第1段，再搬第2，3，4段。

　　M/N檢測在相干處理周期間進(jìn)行，其準(zhǔn)則是相鄰3個相干處理周期內(nèi)至少有2次在同一個距離門上檢測到目標(biāo)，確認(rèn)為相對應(yīng)距離單元上有目標(biāo)輸出，這時保留相應(yīng)單元上最新的幅值作為檢測結(jié)果。

　　程序流程如圖6所示。分別從LINK2，LINK3，LINK1，LINK5接收4個距離段上的檢測結(jié)果，把4段的結(jié)果合并在一起，形成整個距離段完整的結(jié)果。然后和以前2次檢測的結(jié)果進(jìn)行M/N檢測，最后把M/N檢測的結(jié)果通過LINK0發(fā)往接口板。

四段的輸入數(shù)據(jù)格式相同先是4個字的模式，逐個字地檢測到目標(biāo)的個數(shù)，接著是各目標(biāo)單元信息。存儲量不大，選取了內(nèi)存較小的ADSP21062。

4.3 運算量、內(nèi)存、通訊資源占用情況

　　在CFAR檢測中，包括零多卜勒通道各距離門利用相應(yīng)波位的雜波圖作為門限進(jìn)行檢測，剩余濾波器在距離上的單元平均恒虛警檢測。其運算量主要集中在單元平均恒虛警中，這里除了第1個距離單元兩端各項需經(jīng)L個數(shù)據(jù)平均外，在第2個距離門后的其余距離單元檢測時，前后各L個數(shù)平均只需加上1個新移進(jìn)的值，減去移出的值即可，這樣對每個距離門檢測來說只需約8條指令。匯總部分運算量不大。由于匯總要處理前一級眾多DSP芯片數(shù)據(jù)，因此此處數(shù)據(jù)通信充分利用互連網(wǎng)絡(luò)的各通訊支路進(jìn)行數(shù)據(jù)轉(zhuǎn)發(fā)，其前一級運算部分在緩存及時間上要給此部分留有一定余量。

　　CFAR一級在32點MTD模式下存儲壓力較大，因此采取了以下措施：輸入/輸出以及中間結(jié)果都是短字定點格式，在開始CFAR檢測前要先轉(zhuǎn)換成長字的浮點格式進(jìn)行各種運算，最后把CFAR結(jié)果經(jīng)過定浮點轉(zhuǎn)換作為16 B定點格式保存下來，其余部分的運算也需要先把CFAR結(jié)果轉(zhuǎn)換成32 B浮點格式，不過是在所調(diào)用的子程序內(nèi)部完成的。作為運算的中間結(jié)果，目標(biāo)單元幅值的存儲使用了循環(huán)尋址方式，因為一批數(shù)據(jù)在一邊被進(jìn)行處理的同時一邊會被新來的數(shù)據(jù)覆蓋掉，這一過程是以距離門的順序進(jìn)行的，而CFAR檢測也是沿著距離門滑動的，在對第18號距離門檢測時，第0號距離門的數(shù)據(jù)就沒有任何用途了，這樣就可以把第18號距離門的幅值存到第0號距離門的位置。同樣地第19號距離門的幅值也可以存到第1號距離門的位置，從而構(gòu)成了循環(huán)尋址存儲方式。其他一些中間結(jié)果也采用了這種存儲方式，有效地節(jié)省了內(nèi)存資源。

　　CFAR一級包括單元平均恒虛警檢測和幅相計算2部分，運算量主要集中在前一部分，占90%左右，到后面的數(shù)據(jù)量已經(jīng)大大減少了。匯總一級的運算量主要集中在M/N檢測部分，但總的運算量不大。

5 結(jié)語

　　本文討論了一種恒虛警檢測的并行處理系統(tǒng)的設(shè)計，選取通用并行DSP作為核心處理單元，通過高速數(shù)據(jù)通信口構(gòu)成了松耦合的分布式并行系統(tǒng)，在處理單元數(shù)目較多的情況下獲得了很高的性能。結(jié)合雷達(dá)信號處理的特點對任務(wù)進(jìn)行分配，運用數(shù)據(jù)流驅(qū)動方式增強了信號處理系統(tǒng)的通用性和易維護性，整個系統(tǒng)具有良好的可編程、可擴展和升級能力。

新聞中心

一種基于DSP的并行信號處理系統(tǒng)的設(shè)計

評論

相關(guān)推薦

技術(shù)專區(qū)