<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 震驚！FPGA運(yùn)算單元可支持高算力浮點(diǎn)

震驚！FPGA運(yùn)算單元可支持高算力浮點(diǎn)

—— Achronix創(chuàng)新的機(jī)器學(xué)習(xí)處理器（MLP）突破傳統(tǒng)FPGA運(yùn)算瓶頸 - -

作者：Achronix資深現(xiàn)場應(yīng)用工程師,楊宇時(shí)間：2020-03-03 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

隨著機(jī)器學(xué)習(xí)（Machine Learning）領(lǐng)域越來越多地使用現(xiàn)場可編程門陣列（FPGA）來進(jìn)行推理（inference）加速，而傳統(tǒng)FPGA只支持定點(diǎn)運(yùn)算的瓶頸越發(fā)凸顯。 Achronix為了解決這一大困境，創(chuàng)新地設(shè)計(jì)了機(jī)器學(xué)習(xí)處理器（MLP）單元，不僅支持浮點(diǎn)的乘加運(yùn)算，還可以支持對多種定浮點(diǎn)數(shù)格式進(jìn)行拆分。

本文引用地址：http://www.ex-cimer.com/article/202003/410540.htm

MLP全稱Machine Learning Processing單元，是由一組至多32個(gè)乘法器的陣列，以及一個(gè)加法樹、累加器、還有四舍五入rounding/飽和saturation/歸一化normalize功能塊。同時(shí)還包括2個(gè)緩存，分別是一個(gè)BRAM72k和LRAM2k，用于獨(dú)立或結(jié)合乘法器使用。MLP支持定點(diǎn)模式和浮點(diǎn)模式，對應(yīng)下面圖1和圖2。

考慮到運(yùn)算能耗和準(zhǔn)確度的折衷，目前機(jī)器學(xué)習(xí)引擎中最常使用的運(yùn)算格式是FP16和INT8，而Tensor Flow支持的BF16則是通過降低精度，來獲得更大數(shù)值空間。下面的表1是MLP支持的最大位寬的浮點(diǎn)格式，表2說明了各自的取值范圍。

而且這似乎也成為未來的一種趨勢。目前已經(jīng)有不少研究表明，更小位寬的浮點(diǎn)或整型可以在保證正確率的同時(shí)，還可以減少大量的計(jì)算量。因此，為了順應(yīng)這一潮流，MLP還支持將大位寬乘法單元拆分成多個(gè)小位寬乘法，包括整數(shù)和浮點(diǎn)數(shù)。詳見下表3。

值得注意的是，這里的bfloat16即Brain Float格式，而block float為塊浮點(diǎn)算法，即當(dāng)應(yīng)用Block Float16及更低位寬塊浮點(diǎn)格式時(shí)，指數(shù)位寬不變，小數(shù)位縮減到了16bit以內(nèi)，因此浮點(diǎn)加法位寬變小，并且不需要使用浮點(diǎn)乘法單元，而是整數(shù)乘法和加法樹即可，MLP的架構(gòu)可以使這些格式下的算力倍增。

表3是Speedster7t系列1500器件所支持的典型格式下的算力對比，可以看到，單片F(xiàn)PGA的浮點(diǎn)算力最高可達(dá)到123TOPS。

下圖3是MLP中FP24/FP16乘加單元的簡化結(jié)構(gòu)圖，即一個(gè)MLP支持FP24/FP16的A*B+C*D，或者A*B，C*D。

而以下的圖4則是塊浮點(diǎn)乘加單元結(jié)構(gòu)。

這里考慮浮點(diǎn)數(shù)序列塊，浮點(diǎn)數(shù)序列塊，各序列塊內(nèi)均擁有相同的指數(shù)ea和eb。則（如下圖）

不難看出，乘法單元的個(gè)數(shù)取決于尾數(shù)（即整數(shù)）位寬。

圖1 定點(diǎn)模式下的MLP框圖

圖2 浮點(diǎn)模式下的MLP框圖

圖3 MLP中FP24/FP16乘加單元的簡化結(jié)構(gòu)圖

圖 4 塊浮點(diǎn)乘加單元結(jié)構(gòu)

Format	FP Size	FP Exponent Size	Precision	MLP Name	Alternative Names
fp24	24	8	16	FP24
fp16	16	5	11	FP16	binary 16,half precision
bf16	16	8	8	BFLOAT16	bfloat 15.(brain float) Not to be confused with block floating point.

表1 MLP支持的最大位寬的浮點(diǎn)格式

Format	Bias	Exp for inf	Minimum Positive	Maximum Positive
fp24	127	255	2^(-126)	2¹²⁸ - 2¹¹²
fp16	15	31	2^(-14)	2¹⁶ - 2⁵=65504
bf16	127	255	2^(-126)	2¹²⁸ - 2¹²⁰

表2 不同運(yùn)算格式的取值范圍

Data Type	Matissa Size	Exponent	Multipliers /MLP	MLP Perf. (GOPS)
int 3	3	n/a	32	12,2880
int 4	4	n/a	32	12,2880
int 6	6	n/a	16	6,1440
int 8	8	n/a	16	6,1440
int 16	16	n/a	4	1,5360
bfloat 16	8+hidden bit	8	2	7680
fp 16	12+hidden bit	5	2	7680
block float 3	3	up to 8	32	12,2880
block float 4	4	up to 8	32	12,2880
block float 6	6	up to 8	16	6,1440
block float 8	8	up to 8	16	6,1440
block float 12	12	up to 8	4	1,5360
block float 16	16	up to 8	4	1,5360
fp 24（8e）	15+hidden bit	8	2	7680

表3 Achronix的Speedster7t系列1500器件支持的典型格式的算力對比

（四位數(shù)一個(gè)逗號(hào)是為了方便讀數(shù)字，四位數(shù)加一個(gè)小數(shù)點(diǎn)即使萬）

int size	mult per block	mult per MLP	int format
3、4	16	32	signed magnitude
6、7、8	8	16	signed magnitude
16	2	4	2's complement

表4 MLP中乘法單元的個(gè)數(shù)與整數(shù)位寬的關(guān)系

如需了解更多產(chǎn)品細(xì)節(jié)，請?jiān)L問Achronix網(wǎng)站以獲取產(chǎn)品資料，謝謝閱讀！Achronix官網(wǎng)：www.achronix.com。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： MLP 運(yùn)算

評(píng)論

相關(guān)推薦

關(guān)于TI的TMSC6201運(yùn)算量的估算

麥莎就是我 | 2005-09-13

定點(diǎn)運(yùn)算理論及應(yīng)用

資源下載定點(diǎn) 運(yùn)算理論及應(yīng)用 | 2010-03-27

4位的加法運(yùn)算、減法運(yùn)算電路

設(shè)計(jì)方案加法運(yùn)算減法電路 | 2009-07-06

廣義函數(shù)

資源下載廣義函數(shù) 函數(shù)空間線性泛函收斂性極限運(yùn)算 | 2009-06-12

震驚！FPGA運(yùn)算單元可支持高算力浮點(diǎn)

嵌入式系統(tǒng) MLP 運(yùn)算 | 2020-03-03

關(guān)于商用空調(diào)顯示板功能紊亂失效研究與應(yīng)用

光電顯示芯片運(yùn)算設(shè)計(jì) 202103 | 2021-04-21

使用多功能運(yùn)算IC的向量運(yùn)算電路

模擬技術(shù) 多功能 IC的運(yùn)算向量 | 2018-09-11

使用半加器和全加器的4位加法運(yùn)算電路

設(shè)計(jì)方案使用半加全加加法運(yùn)算電路 | 2009-07-06

運(yùn)算放大器主要參數(shù)有哪些

模擬技術(shù) 運(yùn)算放大器 | 2013-11-13

什么原因毀掉了運(yùn)算放大器

模擬技術(shù) 運(yùn)算放大器 | 2013-11-16

輸出功率大的運(yùn)算放大器

模擬技術(shù) 輸出功率運(yùn)算放大器 | 2013-11-15

實(shí)測！AlexNet卷積核在FPGA占90%資源仍跑750MHz 算力達(dá)288萬張圖像/秒

智能計(jì)算 MLP FPGA | 2020-04-25

使用全加器的4位加法運(yùn)算電路

設(shè)計(jì)方案使用全加加法運(yùn)算電路 | 2009-07-06

光二極管運(yùn)算放大器T形反饋電路-直接反饋電路-差分放大器電路

模擬技術(shù) 光二極管運(yùn)算放大器 T形反饋 | 2013-11-28

MCU加、減、乘、除法

資源下載 MCU 運(yùn)算 | 2007-08-18

上海超級(jí)計(jì)算中心擴(kuò)容每秒運(yùn)算3840億次

liujt_ic | 2003-04-04

穩(wěn)壓用運(yùn)算放大器基本電路

設(shè)計(jì)方案穩(wěn)壓運(yùn)算放大器基本電路 | 2009-07-06

夏宇聞著作《從算法設(shè)計(jì)到硬線邏輯的實(shí)現(xiàn)》運(yùn)算和數(shù)據(jù)流動(dòng)控制邏輯

資源下載運(yùn)算數(shù)據(jù)流動(dòng) 控制數(shù)字邏輯電路同步 Verilog DHL | 2009-03-16

家用醫(yī)療電子設(shè)備設(shè)計(jì)指南

醫(yī)療電子信號(hào)濾波功率存儲(chǔ)閃存運(yùn)算封裝 | 2017-06-07

世界最小生物計(jì)算機(jī)問世運(yùn)算速度330萬億次/秒

liujt_ic | 2003-03-03

信號(hào)與系統(tǒng)——信號(hào)運(yùn)算

資源下載信號(hào)與系統(tǒng) 運(yùn)算階躍信號(hào) 沖激信號(hào) | 2009-06-12

Microchip推出三個(gè)新型運(yùn)算放大器系列

hpnet | 2003-07-30

運(yùn)算放大器構(gòu)成的延遲電路

模擬技術(shù) 運(yùn)算放大器延遲電路 | 2013-11-14

采用運(yùn)算放大器改變輸入量電路

設(shè)計(jì)方案采用運(yùn)算放大器改變輸入電路 | 2009-07-06

[求助]這個(gè)運(yùn)算如何用vhdl實(shí)現(xiàn)?。?/a>

fulucky | 2005-05-26

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();