28nm高端FPGA如何實現(xiàn)功耗和性能的平衡?
實現(xiàn)功耗監(jiān)控設(shè)計流程
從工具的角度看,必須同時考慮功耗和性能。以太高的功耗滿足性能要求,或者功耗較低但是沒有達到性能目標,這都是不可使用的設(shè)計。因此,Quartus II軟件還必須能夠在性能和功耗上很好地達到均衡。在沒有用戶干預的情況下,工具會自動只在需要的地方使用高速塊,盡可能降低功耗泄漏以滿足性能要求,同時使得所有其他塊進入低功耗狀態(tài)以減小泄漏。此外,還采取了以下降低功耗的措施:
Ÿ 邏輯、RAM 分析、重新規(guī)劃,以降低動態(tài)功耗
Ÿ 群布局減小了走線長度,降低了動態(tài)布線功耗
Ÿ 優(yōu)化布局以減小時鐘功耗以及非關(guān)鍵通路信號布線功耗
建模是重要的步驟,因為它保證了功耗模型的正確性,不是最差也不是最樂觀。公司可以選擇保守、激進或者正確的方式。最終,最適合設(shè)計人員的唯一選項是正確地建模。保守選擇導致了估算的功耗在市場上看起來并不具有競爭優(yōu)勢。激進的選擇導致最終功耗與工具估算的功耗不具有可比性。做到正確的選擇盡可能接近硅片實際測量的功耗,同時滿足了供應商和客戶的要求。
在制造過程中降低功耗,提高性能
提高制造能力,大批量交付器件是提高產(chǎn)量、嚴格工藝的關(guān)鍵。Altera早期以標準功耗指標發(fā)售器件,以幫助前沿的客戶滿足早期原型開發(fā)和生產(chǎn)進度要求,然后,嚴格曲線指標,盡快實現(xiàn)利益,以幫助這些用戶滿足其產(chǎn)品進度和功效目標。Altera采用這一嚴格的工藝來交付低靜態(tài)功耗的新L(低功耗)器件。
如圖3示,減小工藝變化使得靜態(tài)功耗降低了35%,從而降低了總功耗。由于結(jié)溫增大和漏電增加是一種指數(shù)函數(shù)關(guān)系,因此,這一方法在較高結(jié)溫時極大地降低了功耗,滿足了當今很多系統(tǒng)設(shè)計的要求。
圖3 工藝降低了靜態(tài)功耗
在28HP制造工藝降低功耗的結(jié)果非常顯著,因此,Altera立即將其應用于獨具優(yōu)勢的FPGA上,在產(chǎn)品代碼中標以“L”。這種突出顯示的訂購碼旨在將產(chǎn)品立即應用于對功耗敏感的設(shè)計中,然后,在所有28 nm產(chǎn)品中繼續(xù)發(fā)揮同樣的工藝優(yōu)勢。
在FPGA 設(shè)計中使功耗和性能達到均衡
設(shè)計人員能夠使用高端器件,當這些工具具備了各種低功耗功能以及支持功耗預知的情況下,設(shè)計人員自己會確定怎樣均衡其每一設(shè)計的性能和功耗。他們從選擇正確的FPGA系列開始。當需要最佳性能或者最大容量時,選用Stratix V FPGA。在Stratix V系列中,可用的型號包括沒有收發(fā)器的器件、有收發(fā)器的器件,以及重點是DSP應用的器件。
選擇好器件后,在FPGA設(shè)計過程中,可以使用幾種設(shè)計方法來降低功耗,包括,邏輯和RAM時鐘通道以及部分重新配置等。
即使采用了最佳設(shè)計方法、模型和軟件,也只有提供了輸入后才能進行功耗估算。大部分設(shè)計人員熟悉基本動態(tài)功耗方程:CV2F X (觸發(fā)率)。設(shè)計工具計算電容(C),已知電壓(V)和頻率(F)是已知的,但是不知道設(shè)計的觸發(fā)率。確定觸發(fā)率的最佳方法是運行代表實際系統(tǒng)使用情況的仿真,得到.vcd文件后,使用PowerPlay功耗分析器工具。次優(yōu)的方法是為I/O建立合適的觸發(fā)率,根據(jù)得到的估算,使用 PowerPlay功耗分析器來產(chǎn)生內(nèi)部觸發(fā)率。第三好的方法是使用早期功耗估算器 (EPE),使用以前相似設(shè)計的觸發(fā)率。最不精確的方法是以默認觸發(fā)率使用EPE。功耗估算的精度與默認觸發(fā)率和設(shè)計實際觸發(fā)率之間的差值相關(guān)。 Altera建議使用 PowerPlay功耗分析器,通過矢量獲得最佳功耗估算。
設(shè)計實例
設(shè)計過程中一個重要的早期步驟是,為Stratix V FPGA下載最新的EPE,選擇器件 (功耗指標最低的L器件),為設(shè)計輸入信息。與競爭產(chǎn)品相比,Altera的L器件既有動態(tài)功耗優(yōu)勢,又具有總功耗和性能優(yōu)勢。
下面的例子包括競爭對手以前分析的兩個設(shè)計,使用14.2 XPE和Quartus II 12.0SP2 EPE進行了更新,以及一個使用VCC(內(nèi)核)電源的新例子,針對Altera的雙100G轉(zhuǎn)發(fā)器設(shè)計進行了測量和預測。
100GbE OTU4轉(zhuǎn)發(fā)器實例
在這個例子中,運行時用戶相關(guān)的結(jié)溫是100℃,使用了最大工藝指標?;诟偁帉κ职灼性O(shè)定的資源使用情況,表3供了I/O和收發(fā)器數(shù)據(jù),表4提供了輸入到XPE (14.2)和 EPE (12.0 SP2)中的信息。
表3 100GbE OTU4 轉(zhuǎn)發(fā)器 I/O 和收發(fā)器信息
表4 100GbE OTU4轉(zhuǎn)發(fā)器資源使用情況
圖4對比了獲得的新L器件結(jié)果和以前報告的結(jié)果,表明,與Virtex-7 FPGA相比,Stratix V FPGA降低了功耗,同時提高了性能。
圖4 使用L器件,更新后的100GbE OTU4轉(zhuǎn)發(fā)器功耗對比
評論