基于PCI Express總線的R-D算法實時成像系統(tǒng)設計
R-D算法是SAR成像中應用最廣的一種算法,因其具有原理直觀、實現(xiàn)方便等優(yōu)點在實際中有廣泛的應用。R-D算法的基本特點是運動補償、參數(shù)估計比較靈活,距離向處理和方位向處理分開,運算既是并發(fā)的、又是流水的,同時他又具有SAR成像本身的大運算量、大存儲量等特點,故R-D SAR信號處理機在系統(tǒng)結(jié)構上有其自身的特點。本文在分析R-D SAR信號處理特點的基礎上探討R-D SAR成像系統(tǒng)的設計,整個系統(tǒng)利用當前流行的PCI Express總線進行數(shù)據(jù)通信,提高了數(shù)據(jù)傳輸能力。
本文引用地址:http://www.ex-cimer.com/article/84921.htm1 R-D算法流程及特點
距離-多普勒成像雷達雖然有多種參數(shù)估計方法,各自的成像算法又有很大的差異,但基本運算和算法流程差別不大,如圖1所示。
其中,(2)~(6)表示成像處理。在(2)中一般采用dechirp或者匹配濾波的方法。如果采用dechirp方法,要生成一幅8 192×8 192點的圖像,需要在距離向處理中進行8 192次8 192點FFT運算;而同樣大小的圖像如果采用匹配濾波的方法則需要16 383×8 192點FFT運算,這還沒有包括運動補償和乘以解調(diào)頻函數(shù)(dechirp方法)或乘以脈壓匹配函數(shù)(匹配濾波方法)中的乘法運算。圖中(3)就是專門進行距離向處理所必需的參數(shù)估計、運動補償因子計算以及解調(diào)頻函數(shù)或脈壓匹配函數(shù)的計算。這個過程往往需要用到預處理完成后的部分數(shù)據(jù)甚至全部數(shù)據(jù),有時還要用到中間結(jié)果的部分數(shù)據(jù)甚至全部數(shù)據(jù)。完成距離向處理后,為了在方位向處理時數(shù)據(jù)能夠在存儲器中按方位向連續(xù)存放以加快存取速度,要將數(shù)據(jù)轉(zhuǎn)置(4)(這里原始數(shù)據(jù)按距離向連續(xù)存放)。方位向處理與距離向處理類似,但方位壓縮(5)一般采用匹配濾波的方法,因為方位回波的帶寬比較寬。而這期間也要由(6)來專門估計方位向參數(shù),計算相位校正函數(shù)和方位向脈壓匹配函數(shù)。
由此總結(jié)R-D SAR成像雷達信號處理的特點如下:
巨大的存儲量 顯然,僅存一幅8 192×8 192點復圖像所需要的存儲量約為512 MB,如果乒乓工作,那么處理器的存儲能力需要超過1 GB,顯然應該用SDRAM。
巨大的運算量因距離向和方位向都要進行脈沖壓縮,故運算量非常大。以8 192×8 192點圖像為例,若兩個方向都采用匹配濾波方法,一共需要進行32 768次8 192點FFT運算;若采用基2方法,僅FFT運算就需要1 280萬次復數(shù)乘法,3 432萬次復數(shù)加法。設合成孔徑時間是5 s,則在一個合成孔徑時間內(nèi)算出一幅圖像要求處理器的有效運算能力在10億FLOPS以上,因此必須采用多處理器結(jié)構。
處理的并發(fā)性和流水性 原始數(shù)據(jù)一般是以回波到達順序進入信號處理機,這樣在距離向處理時可采用流水方式進行,流水線以子孔徑為單位分級。方位向的參數(shù)估計往往需要整個孔徑長度的方位回波,所以方位向處理要等到在整個孔徑上完成距離向處理后才開始并發(fā)執(zhí)行。因此不僅要考慮整體的流水操作,還要考慮距離向處理和方位向處理的差異。 巨大的通信數(shù)據(jù)率 在進行參數(shù)估計和計算校正函數(shù)以及匹配函數(shù)時往往要用到數(shù)據(jù)的部分或全部樣本,由于運算集中在計算FFT上,處理器能夠花費在參數(shù)估計上的時間已非常有限,讀取數(shù)據(jù)的時間就更少了,這就要求在處理器的各模塊之間有良好的拓撲結(jié)構和很高的數(shù)據(jù)傳輸速率。
2 PCI Express總線技術
2.1 PCI Express總線簡介
在基于PCI總線的PC世界或工控領域里,隨著網(wǎng)絡流量的不斷提高,PCI和PCI-X的多點并行架構的瓶頸越來越突出,而PCI Express架構具有更高的性能,可以突破此類瓶頸的限制。PCI Express架構采用串行輸入/輸出結(jié)構,每條通道在每個方向上的發(fā)送和接收數(shù)據(jù)速率高達2.5 Gb/s,最新的PCI Express 2.0的數(shù)據(jù)速率更是高達5 Gb/s,具有更好的可擴展性,可提供更高的帶寬。由于PCI和PCI-X總線采用共享多點并行總線架構,所以當總線中的插槽和設備數(shù)量增加時,有限的總線資源會被多個設備共享,于是帶寬就會相應的下降。PCI和PCI-X采用平行的、多點下傳的連接架構,很容易產(chǎn)生串擾現(xiàn)象,此外所有的信號線必須完全等長,否則無法將信號同步傳到另一端,而會產(chǎn)生信號扭曲。這些問題讓PCI的時鐘頻率難以提升,電壓也難以下降,造成速度提升上的發(fā)展限制。而PCI Express采用序列的、點對點的連接架構,收發(fā)數(shù)據(jù)差分傳輸,可以避免信號不同步并且減少干擾。PCIExpress帶寬隨著通道數(shù)的增加而增加,如表1所示。
PCI Express是全新第三代I/O串行總線標準,其性能超越了以前的PCI標準。但是PCI、PCI-X與PCI Express仍將在未來的一段時間內(nèi)共存。PCI Express可提供專用的、高性能的、可擴展的帶寬總線和卓越的以太網(wǎng)性能,其功能遠遠超越了PCI和PCI-X的共享多點架構。從軟件上看,采用PCI-Express架構可以兼容所有為PCI設備編寫的軟件。
在雷達信號處理系統(tǒng)設計中,要突破帶寬的限制,PCIExpress總線是一個不錯的選擇。在PCI Express點到點的結(jié)構中,每個設備都有一個專用連接而不必共享帶寬。一種典型的通過PCI Express互連的信號處理架構就是每個設備都與一個系統(tǒng)控制模塊相連。值得注意的足,系統(tǒng)控制模塊必須具備對串行數(shù)據(jù)進行交換的能力。
2.2 支持PCI Express總線的MicroTCA機箱
在工控機箱領域,MicroTCA充分采納和沿用了AT-CA的各項優(yōu)點,把ATCA的AMC模塊(Advanced Mez-zanine Card)作為系統(tǒng)的基本配置單元,具有更小的體積、更緊湊的結(jié)構和相對較低的系統(tǒng)成本,所以采用MicroT-CA架構的機箱是一個好的選擇。
MicroTCA是一個完全模塊化的系統(tǒng)平臺,主要包括AMC模塊、MCH模塊、電源模塊、高速背板、機箱和風扇等,其結(jié)構如圖2所示。
AMC是MicroTCA的基本功能模塊,他有6種標準尺寸,這里采用148.8 mm*13.88 mm*181.5 mm的標準。用AMC可以實現(xiàn)數(shù)據(jù)處理、數(shù)據(jù)存儲、數(shù)據(jù)通信和數(shù)據(jù)I/O功能。與CPCI系統(tǒng)的PMC模塊相比,AMC在結(jié)構、功能、性能、互連方式和擴展能力等方面都有很大優(yōu)勢。MCH(MicroTCA Controller & Hub)是MicroTCA的系統(tǒng)控制、管理和數(shù)據(jù)交換模塊。每個MCH可以對12個AMC提供數(shù)據(jù)交換和管理功能,每個系統(tǒng)最多可有4個MCH通過更新通道互連實現(xiàn)多達48個AMC的數(shù)據(jù)交換和管理。每個AMC最多有21個可配置的高速數(shù)據(jù)接口,每個MCH最多有60個可配置的高速數(shù)據(jù)接口,這些接口通過MicroTCA背板及MCH的交換網(wǎng)絡實現(xiàn)高速數(shù)據(jù)通信。
MicroTCA擁有標準化的功能模塊、可配置的業(yè)務類型、可擴展的背板傳輸帶寬、緊湊的物理結(jié)構、靈活的應用方式、梯級化的可靠性設計、較低的開發(fā)和應用成本、較少的產(chǎn)品開發(fā)時間、更長的產(chǎn)品生命周期?;谶@些先進特性,MicroTCA必將得到廣泛的應用。
綜合上述優(yōu)點,我們采用具有MicroTCA架構的提供標準PCI Express總線的工控機。ELMA公司的MicroTCA 7U系統(tǒng)平臺符合PICMG規(guī)范,提供標準的PCI Express插槽,支持單寬、雙寬,半高、全高的AMC模塊,采用風冷的冷卻方式,具有高級的EMC屏蔽和靈活的組合方式,是我們雷達成像處理系統(tǒng)所需標準機箱的一個不錯的選擇。機箱的底板采用ELMA公司的14槽MicroTCA背板,他符合MicroTCA.0 R1.0標準規(guī)范,具有12個AMC模塊、1個電源模塊、1個MCH模塊,單槽數(shù)據(jù)帶寬可達40 Gb/s,具有高速串行連接器,支持6.25 Gb/s的傳輸率,此外還有標準的系統(tǒng)管理接口。底板的主要功能是給采集/存儲板卡及信號處理板卡提供標準的PCI Express插槽,給板卡供電的同時可以實現(xiàn)主機與板卡間的通信以及板卡間的相互通信。
評論