利用Xilinx UltraScale架構(gòu)大幅提升生產(chǎn)力
賽靈思UltraScale架構(gòu)的增強功能結(jié)合Vivado設(shè)計套件的省時工具能幫助您更快打造出色系統(tǒng)。
本文引用地址:http://www.ex-cimer.com/article/201610/308396.htm許多市場和應(yīng)用都對系統(tǒng)帶寬和處理功能需求顯著增長。無論是有線或無線通信、數(shù)字視頻還是圖像處理,更高的數(shù)據(jù)吞吐量要求都實現(xiàn)相同的結(jié)果,那就是所有系統(tǒng)組件的流量和要求都在提升。通過并行和串行I/O到達片上的數(shù)據(jù)也越來越多。數(shù)據(jù)必須經(jīng)過緩存,然后再次以DDR存儲器形式通過并行I/O或以串行存儲器標準(如混合內(nèi)存立方體(HMC)和MoSys 帶寬引擎)形式再次通過串行I/O。數(shù)據(jù)從并行和串行I/O返回后,在傳送到下個目的地之前必須在邏輯和DSP中進行處理。
由于諸多原因,系統(tǒng)處理要求越來越復(fù)雜。以更高數(shù)據(jù)速率傳輸?shù)母髷?shù)據(jù)包要求并行數(shù)據(jù)總線更寬,而且頻率更高。為高效處理數(shù)據(jù),往往要在單一器件上構(gòu)建整個系統(tǒng),從而避免因兩個FPGA之間發(fā)送大量數(shù)據(jù)引起的相關(guān)時延遲和功耗問題。因此需求更密集的具有更多功能的FPGA。重要的是,在提升高功能FPGA利用率的同時,必須保持能以最高性能運行,以避免器件填充時性能下降。
讓復(fù)雜的高容量器件實現(xiàn)高利用率聽起來可能對設(shè)計人員來說是一項很艱巨的任務(wù)。賽靈思提供了大量解決方案,旨在縮短設(shè)計時間,讓設(shè)計人員集中精力實現(xiàn)產(chǎn)品差異化,從而從市場中脫穎而出。
結(jié)合使用高性能并行SelectIO和高速串行收發(fā)器連接功能,可在UltraScale FPGA之間實現(xiàn)數(shù)據(jù)傳輸。
ULTRASCALE架構(gòu)
為了解決普遍存在的市場難題,賽靈思近期推出了UltraScale™架構(gòu)(如圖1所示),可提供前所未有的系統(tǒng)集成度、高性能和出色的功能。賽靈思用這款全新架構(gòu)創(chuàng)建了兩款高性能FPGA系列產(chǎn)品。賽靈思 Virtex® UltraScale與Kintex® UltraScale系列相結(jié)合,能滿足多種不同系統(tǒng)要求,著重通過大量技術(shù)創(chuàng)新與進步降低總功耗。UltraScale技術(shù)共享大量構(gòu)建塊,能提供可擴展的架構(gòu),并針對多種不同的市場需求精心優(yōu)化。
增加系統(tǒng)帶寬
在進行任何信號處理或數(shù)據(jù)操作之前,數(shù)據(jù)首先要到達目的地。目前已有大量串行和并行協(xié)議和標準專門滿足目標應(yīng)用的特定需求。大多數(shù)標準的一個共同宗旨就是提升整體數(shù)據(jù)吞吐量,從而支持大量信息以越來越高的速數(shù)據(jù)速率進行系統(tǒng)傳輸。
圖1 –UltraScale架構(gòu)的主要優(yōu)勢在于速度和帶寬。
圖2 – UltraScale架構(gòu)能處理大量數(shù)據(jù)。
結(jié)合使用高性能并行SelectIO和高速串行收發(fā)器連接功能,可在UltraScale FPGA之間實現(xiàn)數(shù)據(jù)傳輸。I/O模塊通過靈活的I/O標準和電壓支持可實現(xiàn)先進的存儲器接口和網(wǎng)絡(luò)協(xié)議。UltraScale架構(gòu)中的不同串行收發(fā)器數(shù)據(jù)傳輸速率高達16.3 Gbps,能提供主流串行協(xié)議所需的所有性能,最高支持32.75 Gbps,能滿足25G+背板設(shè)計的要求,相對于前一代收發(fā)器而言能大幅降低單位比特的功耗。UltraS-cale FPGA中的所有收發(fā)器都支持PCI Express® Gen3和Gen4所需的數(shù)據(jù)速率,而PCI Express的集成塊則支持基于UltraScale架構(gòu)的FPGA,最高能支持x8 Gen3端點和Root Port設(shè)計。
數(shù)據(jù)時鐘功能與緩沖
所有同步系統(tǒng)都要依靠一個或多個時鐘信號來實現(xiàn)電路同步。系統(tǒng)性能提升要求以更大器件容量提高時鐘頻率,并要求改進時鐘靈活性,降低總時鐘功耗。
UltraScale架構(gòu)采用功能強大的經(jīng)過重新架構(gòu)設(shè)計的時鐘管理電路系統(tǒng),包括時鐘綜合、緩沖和路由組件,能提供功能強大的框架,滿足設(shè)計要求。時鐘網(wǎng)絡(luò)支持FPGA中極為靈活的時鐘分布,從而能最大限度地減少與時鐘信號相關(guān)的偏移、功耗和延遲。此外,時鐘管理技術(shù)緊密結(jié)合專用存儲器接口電路系統(tǒng),可支持DDR4等高性能外部存儲器。時鐘細分和新型門控時鐘粒度技術(shù)相對于現(xiàn)有的FPGA而言能進一步加強對時鐘功耗的控制。
相對于前一代FPGA以及同類競爭性FPGA,全局功能時鐘緩沖器數(shù)量的大幅增加有助于顯著提升設(shè)計人員的生產(chǎn)力。此前,全局緩沖器的使用要非常節(jié)省,F(xiàn)PGA中心只有32個全局時鐘緩沖器。UltraScale架構(gòu)能在架構(gòu)中自由分布全局功能時鐘緩沖器,從而在需要時就能提供資源,不用再那么節(jié)省了。此外,賽靈思相對于前一代FPGA而言大幅簡化了時鐘緩沖器類型,且保留了所有時鐘切換、時鐘分頻和時鐘使能功能,從而獲得大量靈活的高功能時鐘緩沖器,能在需要時提供全部功能。
數(shù)據(jù)的存儲、處理和路由
任何系統(tǒng)的關(guān)鍵都在于其處理、操作和轉(zhuǎn)換接收到的數(shù)據(jù)的能力(如圖2所示)。系統(tǒng)復(fù)雜性的提升,要求將通用架構(gòu)與更專業(yè)的功能(專門針對具體類型的數(shù)據(jù)處理)相結(jié)合。
如今的FPGA架構(gòu)集成眾多組件:含有六輸入查詢表(LUT)和觸發(fā)器的可配置邏輯塊(CLB)、帶27x18乘法器的DSP Slice、帶內(nèi)置FIFO和ECC支持的36Kb Block RAM等。這些資源通過大量的高性能、低時延互聯(lián)緊密連接在一起。
除了邏輯功能之外,CLB還提供移位寄存器、乘法器和進位邏輯功能,并能配置LUT為分布式存儲器來配合高功能可配置Block RAM。DSP Slice(包括全新的96位寬XOR功能、更寬的27位預(yù)加法器和30位輸入)執(zhí)行大量獨立功能,其中包括乘法累加、乘法加法和模式檢測等。除了器件互聯(lián)之外,在采用第二代SSI 3DIC技術(shù)支持的器件中,信號可采用專用低時延接口模塊在超級邏輯區(qū)域之間傳輸。這種整合的路由資源能方便地支持下一代數(shù)據(jù)總線寬度,從而讓器件利用率達到90%以上。
圖3 – UltraScale器件為業(yè)界領(lǐng)先的科技添加常用功能。
簡化設(shè)計挑戰(zhàn)
UltraScale架構(gòu)帶來的架構(gòu)增強功能可幫助設(shè)計人員在相同區(qū)域打包更多設(shè)計方案,但同時器件尺寸也在增大。,其結(jié)果就是單器件能載入更多設(shè)計,這是一大優(yōu)勢,但也給設(shè)計團隊帶來了巨大壓力,必須快速實現(xiàn)指定設(shè)計,從而讓最終產(chǎn)品盡可能快的上市。利用UltraScale架構(gòu)和協(xié)同優(yōu)化的Vivado®設(shè)計套件,賽靈思能夠打造出多個省時、生產(chǎn)力更高的解決方案。
集成核心功能
高度靈活的可編程性這一極具價值的功能與諸多事情一樣,要想有所得就要付出代價。利用可編程資源構(gòu)建的功能可能比專門針對該功能的模塊尺寸更大,甚至可能速度更慢。當然,F(xiàn)PGA本質(zhì)上明顯的優(yōu)勢就是具有可編程性,但賽靈思FPGA實現(xiàn)了專門功能、集成IP的
適當平衡,能幫助用戶快實現(xiàn)常用功能(圖3)。UltraScale架構(gòu)包含針對常見通信協(xié)議的集成模塊。Kintex UltraScale和Virtex UltraScale器件中包含針對PCI Express、100G Ethernet和150G Interlaken的多個集成模塊,且都經(jīng)過全面測試和驗證,能確保實現(xiàn)功能。
除了通信協(xié)議之外,每個I/O Bank都包含一個可編程存儲器PHY,能用存儲器接口生成器(MIG)工具進行配置。這充分說明了根據(jù)需要進行集成的特性。存儲器PHY和一些控制邏輯可創(chuàng)建為可編程專用函數(shù),但存儲器接口的數(shù)字部分用器件架構(gòu)構(gòu)建,針對不同模式提供所有必需的定制與支持,而這則是專門電路所難以實現(xiàn)的。
在器件架構(gòu)中有大量其它模塊,專門設(shè)計用于執(zhí)行特定功能,同時保持可編程性。設(shè)計人員能以不同深度和廣度來配置這些模塊存儲器,以級聯(lián)成更大型的低功耗陣列。DSP Slice具有許多模式,能讓用戶根據(jù)所選功能訪問模塊的不同組件。因此除了門和寄存器之外,UltraScale架構(gòu)上能實現(xiàn)大量豐富的功能。
可定制、可重復(fù)的IP能提高生產(chǎn)力
每個設(shè)計都包含許多不同架構(gòu)構(gòu)建塊,相互連接構(gòu)成系統(tǒng)。行業(yè)內(nèi)有些功能已經(jīng)非常完備了,從經(jīng)濟性角度講完全可以將它們做成專用的固定功能模塊。然而,最佳設(shè)計方法是采用可編程邏輯構(gòu)建功能,并經(jīng)過驗證,隨時按需重用。這種IP概念已經(jīng)存在了很多代,但賽靈思近期推出了一些生產(chǎn)力增強特性(圖4)。
圖4 – Vivado工具加速復(fù)雜設(shè)計的創(chuàng)建和實現(xiàn)。
即插即用IP
2012年,賽靈思采用ARM®AMBA® AXI4接口作為即插即用IP的標準接口。采用統(tǒng)一的標準接口相比過去能大幅簡化IP集成,將多種不同接口整合到一個,設(shè)計人員也不必去掌握多種不同的接口。UltraScale架構(gòu)繼續(xù)受益于AXI4互聯(lián)的靈活性和可擴展性,從而幫助設(shè)計人員實現(xiàn)最快的產(chǎn)品上市進程,同時采用AXI4-Lite和AXI4-Stream等不同AXI4互聯(lián)協(xié)議優(yōu)化IP性能、面積和功耗。
Vivado IP Packager和IP Catalog采用IP-XACT標準(該標準最初由SPIRIT聯(lián)盟作為工具流程中封裝、集成和重用IP的標準結(jié)構(gòu)推出)。IP-XACT現(xiàn)已獲得IEEE的批準(IEEE1685-2009)。Vivado IP Packager采用在本地或共享驅(qū)動器上可擴展IP Catalog中提供的約束、測試平臺和文檔來創(chuàng)建設(shè)計。采用Vivado IP Catalog,用戶能夠?qū)⒆约旱腎P、賽靈思的IP以及第三方IP無縫集成在一起,從而確保設(shè)計團隊輕松一致地分享所有IP。
VIVADO IP INTEGRATOR
Vivado IP Integrator(Vivado IPI)(圖5)是以IP為中心的設(shè)計流程,可加速系統(tǒng)集成進度,更輕松快捷地將不同組成部分組建成系統(tǒng)。利用交互式圖形用戶界面,IPI提供IP接口的智能自動連接、一鍵式IP子系統(tǒng)生成和強大的調(diào)試功能,可幫助設(shè)計人員輕松快捷地連接其IP Catalog中的任何乃至全部IP。這種功能使得設(shè)計人員能快速組裝復(fù)雜系統(tǒng),包括來自多種來源的設(shè)計資源——一些免費的、一些購買的、一些內(nèi)部創(chuàng)建的——并且能清楚掌握所有構(gòu)建塊都能得到正確配置。從概念到調(diào)試從未如此神速。
簡而言之,UltraScale架構(gòu)在許多關(guān)鍵方面進行了架構(gòu)創(chuàng)新,能成功滿足下一代高性能設(shè)計的嚴格要求。像UltraScale這樣,能確保使用系統(tǒng)頻率越來越高的寬數(shù)據(jù)總線來實現(xiàn)設(shè)計,是成功開展設(shè)計工作的必要組成部分。不過,隨著器件尺寸和復(fù)雜度的提升,幫助設(shè)計人員不斷提高生產(chǎn)力變得至關(guān)重要。賽靈思提供集成塊和預(yù)驗證IP組合,能為設(shè)計人員帶來加快實現(xiàn)出色解決方案所需的全部工具。
圖5 – 在IP Integrator中構(gòu)建設(shè)計方案和連接IP塊一樣簡單。
評論