<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 模擬技術(shù) > 設(shè)計應(yīng)用 > 基于FPGA的高速流水線浮點乘法器設(shè)計與實現(xiàn)

基于FPGA的高速流水線浮點乘法器設(shè)計與實現(xiàn)

作者：時間：2011-12-12 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

1 引言

本文引用地址：http://www.ex-cimer.com/article/187109.htm

　　在數(shù)字化飛速發(fā)展的今天，人們對微處理器的性能要求也越來越高。作為衡量微處理器性能的主要標(biāo)準(zhǔn)，主頻和乘法器運行一次乘法的周期息息相關(guān)。因此，為了進一步提高微處理器性能，開發(fā)高速高精度的乘法器勢在必行。同時由于基于IEEE754 標(biāo)準(zhǔn)的浮點運算具有動態(tài)范圍大，可實現(xiàn)高精度，運算規(guī)律較定點運算更為簡捷等特點，浮點運算單元的設(shè)計研究已獲得廣泛的重視。本文介紹了 32 位浮點乘法器的設(shè)計，采用了基4 布思算法，改進的4：2 壓縮器及布思編碼算法，并結(jié)合FPGA自身特點，使用流水線設(shè)計技術(shù)，在實現(xiàn)高速浮點乘法的同時，也使是系統(tǒng)具有了高穩(wěn)定性、規(guī)則的結(jié)構(gòu)、易于FPGA 實現(xiàn)及ASIC 的HardCopy 等特點。

　　2 運算規(guī)則及系統(tǒng)結(jié)構(gòu)

　　2.1 浮點數(shù)的表示規(guī)則

　　本設(shè)計采用單精度IEEE754 格式【2】。設(shè)參與運算的兩個數(shù)A、B 均為單精度浮點數(shù)，即：

　　

　　2.2 浮點乘法器的硬件系統(tǒng)結(jié)構(gòu)

　　本設(shè)計用于專用浮點FFT 處理器，因此對運算速度有較高要求。為了保證浮點乘法器可以穩(wěn)定運行在80M 以下，本設(shè)計采用了流水線技術(shù)。流水線技術(shù)可提高同步電路的運行速度，加大數(shù)據(jù)吞吐量。而FPGA 的內(nèi)部結(jié)構(gòu)特點很適合在其中采用流水線設(shè)計，并且只需要極少或者根本不需要額外的成本。綜上所述，根據(jù)系統(tǒng)分割，本設(shè)計將采用5 級流水處理，圖1 為浮點乘法器的硬件結(jié)構(gòu)圖。

　　

　　3 主要模塊設(shè)計與仿真

　　3.1 指數(shù)處理模塊（E_Adder）設(shè)計

　　32位浮點數(shù)格式如文獻【2】中定義。由前述可知，浮點乘法的主要過程是兩個尾數(shù)相乘，同時并行處理指數(shù)相加及溢出檢測。對于32位的浮點乘法器而言，其指數(shù)為8位，因而本設(shè)計采用帶進位輸出的8位超前進位加法器完成指數(shù)相加、去偏移等操作，具體過程如下。

　　E_Adder 模塊負責(zé)完成浮點乘法器運算中指數(shù)域的求和運算，如下式所示：

　　

　　其中，E［8］為MSB 位產(chǎn)生的進位。Bias=127 是IEEE754 標(biāo)準(zhǔn)中定義的指數(shù)偏移值。 Normalization 完成規(guī)格化操作，因為指數(shù)求和結(jié)果與尾數(shù)相乘結(jié)果有關(guān)。在本次設(shè)計中，通過選擇的方法，幾乎可以在Normalization 標(biāo)志產(chǎn)生后立刻獲得積的指數(shù)部分，使E_Adder 不處于關(guān)鍵路徑。

　　本設(shè)計收集三級進位信號，配合尾數(shù)相乘單元的 Normalization 信號，對計算結(jié)果進行規(guī)格化處理，并決定是否輸出無窮大、無窮小或正常值。

　　根據(jù) E_Adder 的時序仿真視圖，可看出設(shè)計完全符合應(yīng)用需求。

　　3.2 改進的Booth 編碼器設(shè)計

　　由于整個乘法器的延遲主要決定于相加的部分積個數(shù)，因此必須減少部分積的數(shù)目才能進而縮短整個乘法器的運算延遲。本設(shè)計采用基4 布思編碼器，使得部分積減少到13 個，并對傳統(tǒng)的編碼方案進行改進。編碼算法如表1 所示。

　　

　　由于 FPGA 具有豐富的與、或門資源，使得該方法在保證速度和準(zhǔn)確性的前提下，充分利用了FPGA 內(nèi)部資源，節(jié)省了面積，同時符合低功耗的要求。

　　3.3 部分積產(chǎn)生與壓縮結(jié)構(gòu)設(shè)計

　　3.3.1 部分積產(chǎn)生結(jié)構(gòu)

　　根據(jù)布思編碼器輸出結(jié)果，部分積產(chǎn)生遵循以下公式【4】：

　　

　　其中，PPi 為部分積；Ai 為被乘數(shù)。經(jīng)過隱藏位和符號位的擴展后，26 位的被乘數(shù)尾數(shù)將產(chǎn) 生13 個部分積。在浮點乘法器中，尾數(shù)運算采用的是二進制補碼運算。因此，當(dāng)NEG=1 時要在部分積的最低位加1，因為PPi 只完成了取反操作。而為了加強設(shè)計的并行性，部分積最低位加1 操作在部分積壓縮結(jié)構(gòu)中實現(xiàn)。另外，為了完成有符號數(shù)相加，需對部分積的符號位進行擴展，其結(jié)果如圖4 所示。13 個部分積中，除第一個部分積是29 位以外，其余部分積擴展為32 位。其中，第一個部分積包括3 位符號擴展位“SSS”，第2 至13 個部分積的符號擴展位為“SS”，加一操作位為“NN”，遵循如下公式：

　　

　　其中，i 為部分積的行數(shù)，sign（i）為第i 行部分積的符號。

　　3.3.2 部分積壓縮結(jié)構(gòu)

　　本設(shè)計混合使用 4：2 壓縮器、3：2 壓縮器、全加器和半加器，實現(xiàn)了13 個部分積的快速壓縮，并保證了精度。本文部分積壓縮結(jié)構(gòu)的劃分如圖2 所示。

　　

　　圖 2 中，虛線給出了傳統(tǒng)部分積的壓縮劃分，而實線描述的是本文采用的部分積壓縮結(jié) 構(gòu)劃分，這樣的劃分有利于簡化第二級的壓縮結(jié)構(gòu)，從而在保證速度的基礎(chǔ)上，節(jié)省FPGA 內(nèi)部資源。從圖2 中可看出，有些位不必計算，因為這些位是由Booth 編碼時引入的乘數(shù)尾數(shù)的符號位產(chǎn)生的，48 位足以表達運算結(jié)果。

　　3.3.3 改進的4：2 壓縮器

　　本設(shè)計采用廣泛使用的 4：2 壓縮器，并針對FPGA 內(nèi)部資源特點，對其進行了改進。如圖3 所示。傳統(tǒng)的 4：2 壓縮器即兩個全加器級聯(lián)，共需要四個異或門和8 個與非門。而改進的4： 2 壓縮器需要四個異或門和兩個選擇器（MUX）。8 個與非門需要36 個晶體管，而兩個MUX 需要20 個晶體管。同時，F(xiàn)PGA 內(nèi)部集成了大量的異或門和選擇器資源，這種設(shè)計方法也是對FPGA 的一個充分利用。

　　

　　由于壓縮部分積需要大量的4：2 壓縮器，所以改進的電路能在一定程度上減小版圖的面積，也為該乘法器的ASIC 后端設(shè)計帶來了優(yōu)勢。另外，改進的壓縮器的4 個輸入到輸出S 的延時相同，都是3 級XOR 門延時。

　　4 32 位浮點乘法器的實現(xiàn)與仿真

　　圖 4 顯示了本設(shè)計的FPGA 時序仿真結(jié)果，時序仿真環(huán)境為Quartus II 7.0，目標(biāo)芯片為 Cyclone 系列的EP1C6Q240C8，功能仿真環(huán)境為Modelsim 6.0b。整個設(shè)計采用VHDL 語言進行結(jié)構(gòu)描述，綜合策略為面積優(yōu)先。由仿真視圖可看出，該浮點乘法器可穩(wěn)定運行在80M 及以下頻率，在延時5 個周期后，以后每一個周期可穩(wěn)定輸出一級乘法運算結(jié)果，實現(xiàn)了高吞吐量。如果采用全定制進行后端版圖布局布線，乘法器的性能將更加優(yōu)越。

　　

　　5 結(jié)語

　　本文作者創(chuàng)新點：針對FPGA 器件內(nèi)部資源特性，獨創(chuàng)地提出了一種適合FPGA 實現(xiàn) 的5 級流水高速浮點乘法器。該乘法器支持IEEE754 標(biāo)準(zhǔn)32 位單精度浮點數(shù)，采用了基4 布思算法、改進的布思編碼器、部份積壓縮結(jié)構(gòu)等組件，從而在保證高速的前提下，縮小了硬件規(guī)模，使得該乘法器的設(shè)計適合工程應(yīng)用及科學(xué)計算，并易于ASIC 的后端版圖實現(xiàn)。該設(shè)計已使用在筆者設(shè)計的浮點FFT 處理器中，取得了良好效果。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： FPGA 流水線 浮點 乘法器設(shè)計

評論

相關(guān)推薦

FPGA是實現(xiàn)敏捷、安全的工業(yè)4.0發(fā)展的關(guān)鍵

嵌入式系統(tǒng) FPGA 工業(yè)4.0 Lattice 萊迪思 | 2024-05-06

用C/C++語言開發(fā)大規(guī)模FPGA [轉(zhuǎn)載于www.fpga.com.cn]

xiaohua | 2002-09-24

用于浮點變換的增益可編程緩沖放大器

設(shè)計方案用于浮點變換增益可編程緩沖放大器 | 2009-09-18

iCE40 LP/HX系列FPGA：萊迪思的創(chuàng)新可編程解決方案

嵌入式系統(tǒng) iCE40 LP/HX FPGA 萊迪思可編程解決方案 | 2024-06-07

采用創(chuàng)新的FPGA 器件來實現(xiàn)更經(jīng)濟且更高能效的大模型推理解決方案

嵌入式系統(tǒng) Achronix FPGA | 2024-06-18

基于FPGA的數(shù)字信號處理--什么是定點數(shù)？

嵌入式系統(tǒng) FPGA 數(shù)字信號定點數(shù) | 2024-05-11

FPGA比單片機厲害嗎？

嵌入式系統(tǒng) FPGA 單片機 | 2024-06-13

基于FPGA的可編程數(shù)字濾波器系統(tǒng)

資源下載 Max FPGA 可編程數(shù)字濾波器 | 2007-12-14

ALTERA的PCI_IP Core問答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

3-DES算法的FPGA高速實現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

Altera公司cyclone系列FPGA-1C6電路圖

設(shè)計方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

LabVIEW FPGA 模塊簡介

視頻 NI LabVIEW FPGA | 2009-04-01

Altera的FPGA下載常見問題經(jīng)驗小結(jié)

資源下載 Altera FPGA 常見問題經(jīng)驗 | 2007-12-13

LabVIEW 8.20技術(shù)資料大全簡介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

實時的噪聲源定位系統(tǒng)

視頻 NI LabVIEW FPGA | 2009-03-25

萊迪思推出全新安全控制FPGA系列產(chǎn)品，具備先進的加密敏捷性和硬件可信根

嵌入式系統(tǒng) 萊迪思安全控制 FPGA 加密敏捷性硬件可信根 | 2024-06-27

9種單片機常用的軟件架構(gòu)

嵌入式系統(tǒng) PCB FPGA 架構(gòu) | 2024-05-21

流水線的流水性能 (3)

Naiqa | 2002-11-20

用于浮點交換的增益可編程緩沖放大電路

設(shè)計方案用于浮點交換增益可編程緩沖放大 | 2009-07-06

高速ADC與內(nèi)置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

怎樣在55里面實現(xiàn)浮點算法

cchz | 2004-10-13

利用強大的軟件設(shè)計工具為FPGA開發(fā)者賦能

嵌入式系統(tǒng) 軟件設(shè)計工具 FPGA 萊迪思 | 2024-07-17

s3c2410+fpga 做視頻無線傳輸

herbertwj | 2004-08-15

流水線和Data abort的問題

Copperhead | 2004-11-09

FPGA如何同DDR3存儲器進行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

國產(chǎn)28納米FPGA流片

嵌入式系統(tǒng) FPGA EDA 芯片 | 2024-05-31

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實現(xiàn)創(chuàng)新

視頻 Altera FPGA ASIC | 2009-07-13

用于浮點變換的增益可編程緩沖放大器電路圖

設(shè)計方案用于浮點變換增益可編程緩沖放大器電路圖 | 2010-08-31

用于浮點變換的增益可變成緩沖放大器(OPA676)

設(shè)計方案用于浮點變換增益變成緩沖放大器 OPA676 | 2009-07-06

Achronix FPGA增加對Bluespec提供的基于Linux的RISC-V軟處理器的支持，以實現(xiàn)可擴展數(shù)據(jù)處理

嵌入式系統(tǒng) Achronix FPGA Bluespec RISC-V 軟處理器 | 2024-04-15

焦點

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();