撥開(kāi)迷霧:FPGA用做數(shù)字信號(hào)處理應(yīng)用?
在2004年加入賽靈思公司之前,與大多數(shù)人的觀點(diǎn)一樣,我也認(rèn)為FPGA“非常適用于原型設(shè)計(jì),但對(duì)于批量DSP系統(tǒng)應(yīng)用來(lái)說(shuō),成本太高,功耗太大。”,我原來(lái)一直認(rèn)為,F(xiàn)PGA在成本和功效方面無(wú)法滿足今天采用DSP系統(tǒng)架構(gòu)完成的那些設(shè)計(jì)的預(yù)算要求。然而,沒(méi)過(guò)多久,我源于“DSP視角”的看法就被大大地并且不可逆轉(zhuǎn)地改變了。
本文引用地址:http://www.ex-cimer.com/article/81074.htm今天針對(duì)DSP優(yōu)化的高性能FPGA已經(jīng)在DSP領(lǐng)域扮演著重要的角色。DSP領(lǐng)域的設(shè)計(jì)工程師逐漸發(fā)現(xiàn)他們所處的環(huán)境變化十分迅速,標(biāo)準(zhǔn)快速演化并且不斷融合,上市周期越來(lái)越短,設(shè)計(jì)工作受到經(jīng)濟(jì)和技術(shù)上的約束增多,但設(shè)計(jì)一旦成功獲得的回報(bào)也很巨大。
由于在性能和靈活性方面的完美組合,F(xiàn)PGA在DSP領(lǐng)域的應(yīng)用越來(lái)越普遍(參看圖1)。諸如通信、多媒體和國(guó)防行業(yè)等高增長(zhǎng)的市場(chǎng)都非常需要高性能的DSP技術(shù)。這些市場(chǎng)的特點(diǎn)在于始終處于連續(xù)的變化之中,不斷變化的標(biāo)準(zhǔn)、市場(chǎng)需求、客戶需求以及競(jìng)爭(zhēng)態(tài)勢(shì)。要跟上市場(chǎng)變化,企業(yè)就需要一種強(qiáng)大且靈活的處理器---FPGA就是這種特別適合的技術(shù)。
圖 1.DSP技術(shù)對(duì)比。摘自“FPGAs for DSP,第二版” © 2007 Berkeley Design Technology, Inc.瀏覽www.BDTI.com了解更多信息。
DSP市場(chǎng)研究機(jī)構(gòu)Forward Concepts最近在題為“DSP戰(zhàn)略”的報(bào)告中,該機(jī)構(gòu)分析師Will Strauss預(yù)測(cè):未來(lái)五年內(nèi),可重配置DSP(99%是FPGA)市場(chǎng)增長(zhǎng)速度將超過(guò)DSP整體市場(chǎng)中的任何其它部分。Strauss還指出:FPGA經(jīng)常被用來(lái)分流承擔(dān)大量計(jì)算任務(wù),幫助提高傳統(tǒng)DSP芯片的能力。換句話來(lái)說(shuō),F(xiàn)PGA并非替代DSP。相反的是,功能和性能都不斷增強(qiáng)的FPGA為DSP技術(shù)開(kāi)拓了新市場(chǎng)。
將DSP性能提升到極限
推動(dòng)DSP應(yīng)用對(duì)FPGA需求的最重要因素之一就是傳統(tǒng)處理器性能增長(zhǎng)放緩。盡管在摩爾定律的推動(dòng)下,處理器的制造工藝不斷向更小節(jié)點(diǎn)發(fā)展,但僅僅簡(jiǎn)單地通過(guò)減小工藝節(jié)點(diǎn)來(lái)大幅提高DSP和GPP的性能變得越來(lái)越困難。
與此同時(shí),由于通信系統(tǒng)將數(shù)據(jù)傳輸效率不斷推向香農(nóng)定理(參見(jiàn)圖2))的上限,算法的復(fù)雜性以更快的速度提高。Turbo編碼和MIMO系統(tǒng)等先進(jìn)技術(shù)已經(jīng)非常接受香農(nóng)定律的理論極限,成本就是極高的計(jì)算復(fù)雜性。 這就導(dǎo)致了算法性能要求和處理器性能之間的差距越來(lái)越大。因此,設(shè)計(jì)人員必須尋找新的設(shè)計(jì)解決方案(如DSP),在固定結(jié)構(gòu)處理器之外選擇FPGA。
圖 2.FPGA填補(bǔ)算法復(fù)雜性和固定架構(gòu)處理器效率造成的性能差距
FPGA滿足性能挑戰(zhàn)
FPGA 的DSP性能領(lǐng)先的關(guān)鍵是其內(nèi)在的并行機(jī)制,即利用并行架構(gòu)實(shí)現(xiàn)DSP功能的功能。這一并行機(jī)制使得FPGA特別適用于完成像濾波這樣的重復(fù)性DSP任務(wù)。因此,對(duì)于高度并行執(zhí)行DSP任務(wù)來(lái)說(shuō),F(xiàn)PGA性能遠(yuǎn)超通用DSP處理器的串行執(zhí)行架構(gòu)。
例如,傳統(tǒng)DSP處理器每個(gè)時(shí)鐘周期最多可完成8個(gè)MAC操作。要執(zhí)行一個(gè)256抽頭的濾波器,傳統(tǒng)DSP處理器需要在1 GHz時(shí)鐘下執(zhí)行 32個(gè)時(shí)鐘周期,才能達(dá)到31.25 MSPS的采樣處理性能。與此相對(duì)比,有512個(gè)并行XtremeDSP邏輯片的賽靈思Virtex-4 SX55在500 MHz時(shí)鐘下可達(dá)到500 MSPS的性能。(參看圖3)因此在時(shí)鐘慢一倍的情況下,F(xiàn)PGA提供的性能高了一個(gè)量級(jí)還多。
圖 3.并行實(shí)現(xiàn)的濾波器性能比傳統(tǒng)DSP串行實(shí)現(xiàn)時(shí)的性能高了一個(gè)量級(jí)。
顯然,實(shí)際應(yīng)用不會(huì)僅僅涉及濾波,因此這一例子有點(diǎn)簡(jiǎn)單了。然而,獨(dú)立的基準(zhǔn)測(cè)試表明,即使在實(shí)際工作負(fù)載下,F(xiàn)PGA也有很大的性能優(yōu)勢(shì)。
成本和功效
當(dāng)然,性能并非一切:對(duì)幾乎所有DSP應(yīng)用來(lái)說(shuō),成本和功率也是考慮的關(guān)鍵因素。許多設(shè)計(jì)人員仍然有這樣的錯(cuò)誤印象,認(rèn)為采用FPGA的成本要幾千美元。實(shí)際上,在摩爾定律的推動(dòng)下,F(xiàn)PGA的成本已經(jīng)大大降低,比如,2000年時(shí),百萬(wàn)系統(tǒng)門(mén)器件的成本為350美元,而采用90nm工藝后,成本還不到9美元。今天, FPGA產(chǎn)品已經(jīng)進(jìn)入了65nm工藝,十多種65nm 產(chǎn)品已經(jīng)上市并有幾種已經(jīng)量產(chǎn),而45nm工藝的設(shè)計(jì)工作也已在進(jìn)行中。因此,實(shí)際上FPGA現(xiàn)在已經(jīng)成為領(lǐng)先半導(dǎo)體生產(chǎn)技術(shù)的重要推動(dòng)力 – FPGA成為每個(gè)新的工藝結(jié)點(diǎn)生產(chǎn)的首批器件之一。因此,F(xiàn)PGA將會(huì)繼續(xù)在摩爾定律的推動(dòng)下進(jìn)一步降低成本,提高性能。
許多設(shè)計(jì)人員還認(rèn)為FPGA是功耗大戶。實(shí)際上,F(xiàn)PGA能夠做到非常高的功效。U.C. Berkeley教授Bob Broderson在其58分鐘的教學(xué)視頻中充分表明了這一點(diǎn):“利用重配置實(shí)現(xiàn)通用低功耗超級(jí)計(jì)算”(“GeneralPurpose, Low Power Supercomputing Using Reconfiguration”)。在視頻教程中,Broderson教授利用國(guó)際半導(dǎo)體電路大會(huì)上獲得的芯片數(shù)據(jù)回顧了并行機(jī)制和功耗之間的相關(guān)性。如圖4所示,他的結(jié)論給出明確的強(qiáng)有力信息:FPGA同時(shí)在性能和功率效率方面領(lǐng)先于DSP。(這一點(diǎn)在BDIT 2007年1月11日的DesignLine文章中進(jìn)一步得到了證實(shí):“FPGA與DSP:有關(guān)問(wèn)題的重新審視”(FPGAs vs. DSPs: A look at the unanswered questions))
圖 4.FPGA的能源效率比通用DSP更好
近幾年來(lái),F(xiàn)PGA供應(yīng)商始終將功耗做為優(yōu)先考慮的問(wèn)題來(lái)抓,并在65nm工藝結(jié)點(diǎn)的創(chuàng)新功率優(yōu)化技術(shù)方面投入了大量資金。事實(shí)上,一些最新的FPGA采用了與手機(jī)芯片一樣的制造工藝。
然而, DSP性能的范圍、功耗和成本要求非常寬泛,高性能DSP市場(chǎng)也需要一個(gè)DSP平臺(tái)系列來(lái)滿足如此廣泛的要求,單單靠一種器件無(wú)法滿足高端應(yīng)用的極高性能要求以及大批量應(yīng)用對(duì)價(jià)格和功率的要求。
FPGA平臺(tái)多元化
幾年前,F(xiàn)PGA供應(yīng)商就開(kāi)始為高性能應(yīng)用提供DSP增強(qiáng)的FPGA。賽靈思公司的Virtex-DSP系列就是此類FPGA中的典型例子。今天,F(xiàn)PGA供應(yīng)商正在推出新的低成本FPGA系列產(chǎn)品來(lái)擴(kuò)充產(chǎn)品線。例如,賽靈思公司剛剛推出了Spartan-DSP系列。
做為兩種產(chǎn)品組合中新增加的成員,Virtex-5 SXT 和Spartan-3A DSP平臺(tái)瞄準(zhǔn)不同的應(yīng)用。Virtex-5 SXT平臺(tái)有三種器件可供選擇,主要面向要求超高DSP帶寬和更低系統(tǒng)成本的下一代無(wú)線、國(guó)防和多媒體視頻應(yīng)用。這些FPGA器件在550MHz時(shí)鐘下提供了超過(guò)350 GMAC/s(即每秒3500億乘法累積運(yùn)算)的性能。65-nm Virtex-5 SXT則集中于高性能,值得一提的是比此前的90nm產(chǎn)品消耗的動(dòng)態(tài)功耗低35%。
Spartan-3A DSP是賽靈思產(chǎn)品線中的最新成員,也是第一款DSP優(yōu)化的Spartan FPGA.Virtex-5 SXT主要集中于性能,而Spartan-3A DSP則致力于價(jià)格、性能和功耗的平衡。Spartan-3A DSP平臺(tái)以低于30美元的批量生產(chǎn)起價(jià)提供了超過(guò)30 GMAC/s的性能和高達(dá)2,200 Mbps的存儲(chǔ)器帶寬。這一突破性的性能價(jià)格比使其可用于以下應(yīng)用:?jiǎn)瓮ǖ牢⑿⌒?pico-cell)無(wú)線基站中的數(shù)字前端(DFE)和基帶解決方案、軍用移動(dòng)軟件無(wú)線電(SDR)、超聲系統(tǒng)、高分辨率視頻和智能IP相機(jī)。
如圖5所示,DSP或高端FPGA無(wú)法滿足很多此類應(yīng)用的需要。因此Spartan-3A DSP這樣的新器件為DSP技術(shù)打開(kāi)了新市場(chǎng)。
圖 5.Spartan-DSP系列了填補(bǔ)DSP和高端FPGA之間的鴻溝。
前景展望
隨著FPGA供應(yīng)商對(duì)DSP應(yīng)用關(guān)注的加大,其面向DSP的產(chǎn)品已經(jīng)不僅僅是提供FPGA器件。例如,賽靈思公司于2000年啟動(dòng)了“XtremeDSP”計(jì)劃,旨在為通信、多媒體和國(guó)防行業(yè)提供應(yīng)用優(yōu)化的DSP解決方案。XtremeDSP方案包括:
不斷擴(kuò)展為DSP設(shè)計(jì)提供的高性能器件產(chǎn)品線
提供開(kāi)發(fā)板和開(kāi)發(fā)套件、參考設(shè)計(jì)和知識(shí)產(chǎn)權(quán)(IP)
推出用于不同DSP系統(tǒng)設(shè)計(jì)的方法和設(shè)計(jì)開(kāi)發(fā)工具
提供相關(guān)的可編程邏輯、連接功能和嵌入式處理功能
建立提供培訓(xùn)和支持的業(yè)界和大學(xué)戰(zhàn)略合作伙伴關(guān)系
DSP設(shè)計(jì)工具充分發(fā)揮FPGA威力
開(kāi)發(fā)工具特別關(guān)鍵,因此沒(méi)有強(qiáng)大的開(kāi)發(fā)工具就無(wú)法充分發(fā)揮FPGA的潛力。對(duì)于FPGA工具和設(shè)計(jì)方法來(lái)說(shuō),需要關(guān)注三類不同的設(shè)計(jì)人員群體:系統(tǒng)設(shè)計(jì)師、DSP工程師以及FPGA/硬件工程師。每一類設(shè)計(jì)人員有不同的職責(zé)分工,從而對(duì)他們所使用的特定設(shè)計(jì)環(huán)境提出了要求。系統(tǒng)設(shè)計(jì)師必須快速確定如何在選擇的處理資源條件下最好地劃分不同的系統(tǒng)級(jí)功能。他們關(guān)注的重點(diǎn)是選擇適當(dāng)?shù)腇PGA產(chǎn)品來(lái)滿足產(chǎn)品性能和吞吐能力要求,同時(shí)滿足尺寸、成本和功耗方面的預(yù)算。 DSP工程師更關(guān)注DSP算法的創(chuàng)建和改進(jìn)。他們通常不熟悉硬件設(shè)計(jì)細(xì)節(jié),要依賴工具將細(xì)節(jié)抽象掉,這樣他們才能夠更專注于更高層的設(shè)計(jì)探索和驗(yàn)證。 硬件工程師通常采用VHDL 或 Verilog來(lái)從設(shè)計(jì)中獲得最高的性能。他們通過(guò)需要在同一設(shè)計(jì)環(huán)境中與更高層功能模塊以及自己的寄存器傳輸級(jí)(RTL)設(shè)計(jì)協(xié)同工作的能力,并且可以運(yùn)行測(cè)試基準(zhǔn)進(jìn)行功能和性能驗(yàn)證。
現(xiàn)代FPGA設(shè)計(jì)工具可滿足所有三類設(shè)計(jì)群體的要求,在單個(gè)設(shè)計(jì)環(huán)境中提供了系統(tǒng)建模、算法開(kāi)發(fā)和試驗(yàn)、測(cè)試基準(zhǔn)向量自動(dòng)生成、設(shè)計(jì)驗(yàn)證和調(diào)試、以及HDL生成和仿真等功能。無(wú)論設(shè)計(jì)人員使用C/C++、MATLAB、Simulink、HDL還是他們的任意組合,當(dāng)今的FPGA設(shè)計(jì)工具(包括EDA合作伙伴提供的第三方工具)都能夠支持他們快速高效地充分發(fā)揮FPGA的所有潛力。
總結(jié)
在當(dāng)今要求最苛刻的數(shù)字信號(hào)處理(DSP)系統(tǒng)設(shè)計(jì)和開(kāi)發(fā)中, FPGA扮演著越來(lái)越重要的角色,這一點(diǎn)并非偶然。經(jīng)過(guò)二十多年的研究和工程努力,以及與數(shù)百DSP客戶的密切合作,賽靈思FPGA已經(jīng)演化為無(wú)與倫比的高價(jià)值DSP解決方案平臺(tái),在性能、靈活性、上市時(shí)間以及產(chǎn)品壽命方面都提升到了極高水平,同時(shí)還大大降低了總體系統(tǒng)成本和功耗。
因此,如果您是從事高性能DSP系統(tǒng)相關(guān)工作的設(shè)計(jì)師,就需要問(wèn)一下自己,“我的DSP解決方案視野里是否包括FPGA?”如果您的DSP設(shè)計(jì)正面臨性能壓力,需要降低功耗和成本,或者要加快速度趕上進(jìn)度,可能我們可以好好談?wù)劇?/p>
評(píng)論