內(nèi)容可導(dǎo)址存儲器的FPGA設(shè)計與應(yīng)用
摘要:內(nèi)容可尋址存儲器(CAM)是一種快速匹配存儲器件,在通信、雷達(dá)等許多領(lǐng)域有著廣泛的應(yīng)用。在介紹CAM基本原理的基礎(chǔ)上,提出了以兩類新型FPGA實現(xiàn)CAM的設(shè)計方法。例舉了一種基于CAM實現(xiàn)關(guān)聯(lián)比較器及其在雷達(dá)截獲系統(tǒng)信號處理領(lǐng)域的重要作用。
本文引用地址:http://www.ex-cimer.com/article/226434.htm關(guān)鍵詞:FPGA 內(nèi)容可尋址存儲器(CAM) APEX系列 VIRTEX系列 關(guān)聯(lián)比較器
內(nèi)容可尋址存儲器(CAM)是一種新型的存儲器,它的高速、并行、易擴(kuò)展和實現(xiàn)的靈活性使它一出現(xiàn)就得到人們的重視。CAM基于內(nèi)容尋址,通過硬件電路實現(xiàn)快速匹配。CAM的并行處理特性使得它在數(shù)據(jù)分選領(lǐng)域倍受青睞,被廣泛應(yīng)用于以太網(wǎng)網(wǎng)址搜尋、數(shù)據(jù)壓縮、模式識別、高速緩存、高速數(shù)據(jù)處理、數(shù)據(jù)安全和數(shù)據(jù)加密等。另外,CAM的出現(xiàn)也為軍用信號處理(尤其是雷達(dá)截獲系統(tǒng)信號處理)提供了新的思路。但是,由于CAM的實現(xiàn)是以犧牲硬件資源為代價的,常規(guī)的FPGA器件只能實現(xiàn)很小規(guī)模的CAM。因此,以前的CAM都是專用器件且規(guī)模較小,使用靈活性較低。隨著FPGA器件門數(shù)的增加和結(jié)構(gòu)的改進(jìn)以及IP庫的不斷豐富,基于FPGA的CAM實現(xiàn)已成為可能。尤其是1999年底和2000底初,Altera公司和Xilinx公司相繼推出了APEX和VIRTEX系列超大規(guī)模FPGA,使得利用FPGA實現(xiàn)大規(guī)模CAM的時機(jī)趨于成熟。
1 CAM的基本原理
CAM是一種專門為快速查找數(shù)據(jù)地址而設(shè)計的存儲器。CAM通過把輸入數(shù)據(jù)與其內(nèi)所存數(shù)據(jù)相比較,能快速確定輸入數(shù)據(jù)是否與其內(nèi)部某個數(shù)據(jù)或某幾個數(shù)據(jù)相匹配。CAM的數(shù)據(jù)尋址方式因應(yīng)用要求不同而不同,最快方式不僅需要一個時鐘周期便可完成對所有數(shù)據(jù)的尋址。
與RAM一樣,CAM也是采取陣列式數(shù)據(jù)存儲。其數(shù)據(jù)的寫入方式與RAM差不多,但CAM的數(shù)據(jù)讀取方式卻與RAM不同。在RAM中,輸入的是數(shù)據(jù)地址,輸出的是數(shù)據(jù);而在CAM中,輸入的是所要查詢的數(shù)據(jù),輸出的是數(shù)據(jù)地址和匹配標(biāo)志(Match)。若匹配(即數(shù)據(jù)搜尋到),則輸出數(shù)據(jù)地址。在RAM中,RAM的存儲容量由地址線寬度確定。例如,10bit寬地址總線的RAM存儲容量為2 10=1024個字節(jié),CAM卻沒有這個限制,因此它不是采用傳統(tǒng)的通過地址讀取數(shù)據(jù)的方式。如若從1024個字節(jié)中查詢某一數(shù)據(jù),輸入數(shù)據(jù)寬度為8bit,數(shù)據(jù)存在則輸出匹配標(biāo)志和10bit寬的數(shù)據(jù)地址。因此CAM不是采用傳統(tǒng)的地址線模式讀取數(shù)據(jù),存儲空間可以很容易地擴(kuò)展,輸入數(shù)據(jù)線寬度只由需查詢的數(shù)據(jù)位數(shù)決定。圖1為數(shù)據(jù)讀取模式下的RAM和CAM的比較。
顯然,CAM的數(shù)據(jù)查詢速度遠(yuǎn)遠(yuǎn)高于RAM。因此,CAM大量應(yīng)用于需要高速數(shù)據(jù)處理的系統(tǒng)之中。CAM的出現(xiàn)加快了一些系統(tǒng)和技術(shù)的應(yīng)用,如大型數(shù)據(jù)庫管理、數(shù)據(jù)鏈接、模式識別等在圖像識別、語音識別中的應(yīng)用。CAM的核心為存儲單元陣列和存儲單元與輸入數(shù)據(jù)之間的比較器。不同的應(yīng)用對CAM的速度、密度有不同的要求,而且CAM實現(xiàn)途徑也是多樣的。
2 用APEX系列FPGA實現(xiàn)CAM
APEX系列FPGA是Altera公司最新推出的高檔FPGA芯片,APEX系列真正實現(xiàn)了單片機(jī)的系統(tǒng)級綜合。在多心線結(jié)構(gòu)的支持下,APEX芯片既具有以往PLD的優(yōu)點,又對這些優(yōu)點有所擴(kuò)展,并且在復(fù)雜系統(tǒng)的設(shè)計和應(yīng)用中表現(xiàn)出極大的靈活性和高效性。
APEX芯片內(nèi)含多達(dá)250萬個邏輯門,能夠單芯片實現(xiàn)諸如鎖相倍頻環(huán)之類的復(fù)雜系統(tǒng)。它擁有64bit的數(shù)據(jù)線寬度和66MHz的總線頻率,數(shù)據(jù)處理速度達(dá)620Mbit/s。2.5V供電的APEX采用0.22微米工藝,1.8V供電的APEX芯片則采用更先進(jìn)的0.18微米工藝。
APEX芯片主要由三大部分組成:LUT、Product Term和Memory。這三大部分綜合到一個芯片中,不但節(jié)省了應(yīng)用系統(tǒng)所占空間,而且使復(fù)雜系統(tǒng)的設(shè)計和實現(xiàn)變得簡單可靠,系統(tǒng)執(zhí)行效能也大大提高。ESB(Embedded System Block)是APEX芯片的核心,它可以用業(yè)構(gòu)成APEX芯片的各種控制部件。
通常,許多需要快速數(shù)據(jù)尋址的系統(tǒng)使用分立的CAM,這不僅會延長開發(fā)周期、占用印制板空間,而且也會因片內(nèi)、外的時延而降低系統(tǒng)效能。APEX芯片則較好地解決了這個問題,它內(nèi)含嵌入式CAM,把分立式CAM 20ns的時延降低至4ns以下。與采用分立式CAM的系統(tǒng)相比較,采用APEX芯片系統(tǒng),則效率成倍提高。對中小型系統(tǒng)來說,APEX芯片無疑是系統(tǒng)優(yōu)的最佳選擇。
APEX芯片可用ESB直接構(gòu)成CAM,實現(xiàn)高速數(shù)據(jù)尋址。還可用多個ESB擴(kuò)展CAM的容量和數(shù)據(jù)寬度。在APEX20KE芯片中,每一ESB可配置成大小為32word×32bit的CAM,如圖2所示。
3 用VIRTEX系列FPGA實現(xiàn)CAM
APEX提供了一個規(guī)范的CAM基本器件,可通過級聯(lián)和位擴(kuò)展來實現(xiàn)更大規(guī)模的CAM,但實現(xiàn)方式還是不夠靈活。而Xilinx公司開發(fā)的Foundation系列軟件和VIRTEX系列FPGA為CAM的應(yīng)用提供了優(yōu)越的軟硬件條件,且VIRTEX最大的優(yōu)點是沒有為CAM提供固定的模式。它設(shè)計的靈活性,使CAM能在不同條件下、不同領(lǐng)域內(nèi),以不同方式實現(xiàn),達(dá)到最優(yōu)化?;赩IRTEX的CAM的實現(xiàn)主要有三種途徑:用SRL16E的實現(xiàn);用Block SelectRAM實現(xiàn);用Distributed SelectRAM實現(xiàn);用Distributed SelectRAM的實現(xiàn)。
3.1 用SRL 16E實現(xiàn)CAM
在這種模式下,設(shè)計的基本模塊為SRL16E移位寄存器。SRL16E為VIRTEX庫的基本模塊,用戶可以使用SRL16E和其它基本模塊設(shè)計出不同字寬和字深的CAM來。
用SRL16E實現(xiàn)的8-bit的CAM如圖3所示。初始化時,已知參數(shù)與4位遞減計數(shù)器依次相比較,得到16bit比較值(含1個“1”,15個“0”),經(jīng)過16個時鐘周期,依次存入SRL16E移位寄存器。寄存器帶有4位地址端,可對移位寄存器的16bit數(shù)據(jù)位實現(xiàn)尋址。CAM工作時,數(shù)據(jù)直接輸入寄存器的地址端,若此數(shù)據(jù)與初始化時參數(shù)相一致,則輸出“1”,否則輸出“0”。
3.2 用Block SelectRAM實現(xiàn)CAM
除了用SRL16E實現(xiàn)CAM外,利用VIRTEX芯片內(nèi)可編程資源Block SelectRAM也是實現(xiàn)CAM的途徑之一。一個Block SelectRAM可配置成一個CAM16Word×8bit的CAM基本模塊,且有獨立的讀寫雙通道,這得益于Block SelectRAM的雙口特性。Block SelectRAM是真正具有獨立雙通道的存儲器,它的每個通道擁有各自的時鐘和控制信號,A口和B口可獨立配置成4096Word×1bit或256Word×16bit RAM模式?;綛lock SelectRAM的CAM 設(shè)計正是利用了Block SelectRAM內(nèi)部地址映射的靈活性。
如圖4所示,Block SelectRAM的A口和B口其有共同的存儲單元(4096bit),但可以具有各自的地址映射表,A口配置成4096Word×1bit模式,B口配置成256Word×16bit模式。在這種配置形式下,A口可以以地址線寬為12bit、存儲單元容量為1bit的方式寫入數(shù)據(jù),而B口則可以以地址線寬為8bit、存儲單元容量為16bit的方式讀取數(shù)據(jù)。
CAM16×8的A口為數(shù)據(jù)寫入口,數(shù)據(jù)輸入帶寬為8bit,地址線寬為4bit。Data_write[7:0]也可由它的譯碼值形式唯一地表示,Data_write[7:0]經(jīng)譯碼成256bit,存入Addr[3:0]所指的地址單元。
CAM16×8的B口為數(shù)據(jù)讀出口,匹配數(shù)據(jù)直接輸入B口的地址端,數(shù)據(jù)讀取只需一個時鐘周期,輸出字寬16bit的匹配結(jié)果。
Distributed SelectRAM也是實現(xiàn)CAM的途徑之一。與Block SelectRAM類似,VIRTEX芯片內(nèi)部還一種由LUT配置而成的Distrbuted SelectRAM,這兩種存儲器都可用來形成CAM。
每個LUT(Look-Up Table)可配置成一片16Word×1bit RAM,每片RAM可以位尋址。16bit寬數(shù)據(jù)寫入時,分散寫入16片RAM。數(shù)據(jù)讀取時,地址端由一遞增計數(shù)器產(chǎn)生4位地址,從RAM讀出數(shù)據(jù)與查詢數(shù)據(jù)逐個比特相比較。最多經(jīng)過16個時鐘周期,便可完成與整個存儲數(shù)據(jù)相比較,得到匹配結(jié)果。
4 基本CAM的關(guān)聯(lián)比較器的實現(xiàn)及應(yīng)用
國外研究表明,關(guān)聯(lián)比較器(Coherent Processor,簡稱CP)技術(shù)對高密度信號環(huán)境下的脈沖列去交錯有著積極和重要的意義。由于器件方面的限制,國內(nèi)相關(guān)領(lǐng)域的研究一直停留于理論分析層面,僅有極少數(shù)系統(tǒng)采用了一些小規(guī)模的并行比較器件。
CP與CAM的主要區(qū)別是:CP是實現(xiàn)范圍比較,而CAM是精確單值匹配。在基于CAM的CP設(shè)計實踐中,我們結(jié)合復(fù)雜信號環(huán)境的具體應(yīng)用背景和上述CAM設(shè)計方法,探索了兩種可能的途徑:(1)CAM和RAM結(jié)合實現(xiàn)結(jié)構(gòu)靈活的CP:(2)從CAM內(nèi)部結(jié)構(gòu)和原理出發(fā),對CAM進(jìn)行適當(dāng)改造,使得CAM具備范圍匹配功能。
第一種途徑是通過研究許多CAM的應(yīng)用實例而受到啟發(fā)的。例如,IP地址到以太網(wǎng)地址的映射是由CAM和RAM相結(jié)合完成的,首先將IP輸入CAM,得到匹配標(biāo)志和匹配地址,然后將匹配地址作為RAM的輸入,從RAM中讀取相應(yīng)的以太網(wǎng)地址,完成地址映射過程。還有IP路由表、高速緩存等應(yīng)用的基本原理也是如此。相應(yīng)地,在脈沖去交錯應(yīng)用中,若將脈沖參數(shù)范圍內(nèi)的每一個值都作為CAM中的一項,將得到的匹配輸出的地址作為預(yù)先存儲的RAM表項的輸入,即可實現(xiàn)CP的功能。如圖5所示,設(shè)輻射源M的頻率參數(shù)范圍是011111100b≤RF≤011111111b,則輻射源M在CAM中占用4個存儲單元n~n+3,在RAM內(nèi)n~n+3地址的存儲內(nèi)容均初始化為M。當(dāng)輸入頻率值落入輻射源參數(shù)范圍時,便可由關(guān)聯(lián)比較器直接得到所屬的輻射源類型M。這種設(shè)計方法利用外部RAM實現(xiàn)了組合邏輯功能。
上述兩種實現(xiàn)途徑實現(xiàn)上都是通過耗費(fèi)更多的硬件資源來達(dá)到范圍匹配的目的。當(dāng)參數(shù)范圍較大時,硬件資源的需求會急劇增加,導(dǎo)致CAM深度的下降。若我們將上述兩種途徑與中值比較的原理結(jié)合起來,即用合理截取有效位數(shù)的方法來充分表示參數(shù)范圍特點,則可以獲得預(yù)期的效果。
我們利用Xilinx公司的Foundation系列軟件和XCV100PQ240(10萬門)FPGA芯片設(shè)計了一種基于CAM的脈沖去交錯專用器件,考慮到軍用信號處理領(lǐng)域?qū)μ幚硭俣鹊膰?yán)格要求,設(shè)計采用了VIRTEX的第二種實現(xiàn)方法:用Block SelectRAM資源實現(xiàn)CAM。通過功能仿真和時序仿真驗證了處理器的功能,并基于我們設(shè)計高性能可編程信號處理背板[4]進(jìn)行了半實物仿真分析,初步驗證了處理復(fù)雜信號處理能力。
高度并行性是CAM的基本特性。隨著FPGA技術(shù)的不斷進(jìn)步,CAM實現(xiàn)的規(guī)模和速度將會更大的進(jìn)步,基于FPGA的CAM實現(xiàn)將在數(shù)據(jù)壓縮、模式識別、高速緩存、高速數(shù)據(jù)處理、數(shù)據(jù)安全和數(shù)據(jù)加密以及軍用信號處理等各種不同的應(yīng)用領(lǐng)域中迸發(fā)出勃勃微生機(jī)。
評論