<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 消費(fèi)電子 > 設(shè)計(jì)應(yīng)用 > CNN模型壓縮與加速算法綜述

CNN模型壓縮與加速算法綜述

作者：時(shí)間：2018-07-25 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

XNOR-Net中一個(gè)典型的卷積單元如圖6所示，與傳統(tǒng)單元不同，各模塊的順序有了調(diào)整。為了減少二值化帶來的精度損失，對(duì)輸入數(shù)據(jù)首先進(jìn)行BN歸一化處理，BinActiv層用于對(duì)輸入做二值化，接著進(jìn)行二值化的卷積操作，最后進(jìn)行pooling。

本文引用地址：http://www.ex-cimer.com/article/201807/383798.htm

圖5 BWN訓(xùn)練過程

圖6 傳統(tǒng)卷積單元與XNOR-Net卷積單元對(duì)比

3.3 實(shí)驗(yàn)結(jié)果

表5 ImageNet上二值網(wǎng)絡(luò)與AlexNet結(jié)果對(duì)比

與ALexNet相比，BWN網(wǎng)絡(luò)能夠達(dá)到精度基本不變甚至略好，XNOR-Net由于對(duì)輸入也做了二值化，性能稍降。

四、Distilling

Distilling算法是Hinton等人在論文Distilling the Knowledge in a Neural Network中提出的一種類似網(wǎng)絡(luò)遷移的學(xué)習(xí)算法。

4.1 基本思想

Distilling直譯過來即蒸餾，其基本思想是通過一個(gè)性能好的大網(wǎng)絡(luò)來教小網(wǎng)絡(luò)學(xué)習(xí)，從而使得小網(wǎng)絡(luò)能夠具備跟大網(wǎng)絡(luò)一樣的性能，但蒸餾后的小網(wǎng)絡(luò)參數(shù)規(guī)模遠(yuǎn)遠(yuǎn)小于原始大網(wǎng)絡(luò)，從而達(dá)到壓縮網(wǎng)絡(luò)的目的。

其中，訓(xùn)練小模型(distilled model)的目標(biāo)函數(shù)由兩部分組成

1) 與大模型(cumbersome model)的softmax輸出的交叉熵(cross entropy)，稱為軟目標(biāo)(soft target)。其中，softmax的計(jì)算加入了超參數(shù)溫度T，用以控制輸出，計(jì)算公式變?yōu)?/p>

溫度T越大，輸出的分布越緩和，概率zi/T越小，熵越大，但若T過大，會(huì)導(dǎo)致較大熵引起的不確定性增加，增加了不可區(qū)分性。

至于為何要以soft target來計(jì)算損失，作者認(rèn)為，在分類問題中，真值(groundtruth)是一個(gè)確定性的，即one-hot vector。以手寫數(shù)字分類來說，對(duì)于一個(gè)數(shù)字3，它的label是3的概率是1，而是其他數(shù)值的概率是0，而對(duì)于soft target，它能表征label是3的概率，假如這個(gè)數(shù)字寫的像5，還可以給出label是5的一定概率，從而提供更多信息，如

數(shù)字	0	1	2	3	4	5	6	7	8	9
真值	0	0	0	1	0	0	0	0	0	0
軟目標(biāo)	0	0	0	0.95	0	0.048	0.002	0	0	0

2)與真值(groundtruth)的交叉熵(T=1)

訓(xùn)練的損失為上述兩項(xiàng)損失的加權(quán)和，通常第二項(xiàng)要小很多。

4.2 實(shí)驗(yàn)結(jié)果

作者給出了在語音識(shí)別上的實(shí)驗(yàn)結(jié)果對(duì)比，如下表

表6 蒸餾模型與原始模型精度對(duì)比[8]

上表顯示，蒸餾后的模型的精確度和單字錯(cuò)誤率和用于產(chǎn)生軟目標(biāo)的10個(gè)模型的性能相當(dāng)，小模型成功地學(xué)到了大模型的識(shí)別能力。

4.3 速度考量

Distilling的提出原先并非針對(duì)網(wǎng)絡(luò)加速，而最終計(jì)算的效率仍然取決于蒸餾模型的計(jì)算規(guī)模，但理論上蒸餾后的小模型相對(duì)原始大模型的計(jì)算速度在一定程度上會(huì)有提升，但速度提升的比例和性能維持的權(quán)衡是一個(gè)值得研究的方向。

五、MobileNet

MobileNet是由Google提出的針對(duì)移動(dòng)端部署的輕量級(jí)網(wǎng)絡(luò)架構(gòu)?？紤]到移動(dòng)端計(jì)算資源受限以及速度要求嚴(yán)苛，MobileNet引入了傳統(tǒng)網(wǎng)絡(luò)中原先采用的group思想，即限制濾波器的卷積計(jì)算只針對(duì)特定的group中的輸入，從而大大降低了卷積計(jì)算量，提升了移動(dòng)端前向計(jì)算的速度。

5.1 卷積分解

MobileNet借鑒factorized convolution的思想，將普通卷積操作分成兩部分：

Depthwise Convolution

每個(gè)卷積核濾波器只針對(duì)特定的輸入通道進(jìn)行卷積操作，如下圖所示，其中M是輸入通道數(shù)，DK是卷積核尺寸：

圖7 Depthwise Convolution

Depthwise convolution的計(jì)算復(fù)雜度為 DKDKMDFDF，其中DF是卷積層輸出的特征圖的大小。

Pointwise Convolution

采用1x1大小的卷積核將depthwise convolution層的多通道輸出進(jìn)行結(jié)合，如下圖，其中N是輸出通道數(shù)：

圖8 Pointwise Convolution[

Pointwise Convolution的計(jì)算復(fù)雜度為 MNDFDF

上面兩步合稱depthwise separable convolution

標(biāo)準(zhǔn)卷積操作的計(jì)算復(fù)雜度為DKDKMNDFDF

因此，通過將標(biāo)準(zhǔn)卷積分解成兩層卷積操作，可以計(jì)算出理論上的計(jì)算效率提升比例：

對(duì)于3x3尺寸的卷積核來說，depthwise separable convolution在理論上能帶來約8～9倍的效率提升。

5.2 模型架構(gòu)

圖9 普通卷積單元與MobileNet 卷積單元對(duì)比

MobileNet的卷積單元如上圖所示，每個(gè)卷積操作后都接著一個(gè)BN操作和ReLU操作。在MobileNet中，由于3x3卷積核只應(yīng)用在depthwise convolution中，因此95%的計(jì)算量都集中在pointwise convolution 中的1x1卷積中。而對(duì)于caffe等采用矩陣運(yùn)算GEMM實(shí)現(xiàn)卷積的深度學(xué)習(xí)框架，1x1卷積無需進(jìn)行im2col操作，因此可以直接利用矩陣運(yùn)算加速庫進(jìn)行快速計(jì)算，從而提升了計(jì)算效率。

5.3 實(shí)驗(yàn)結(jié)果

表7 MobileNet與主流大模型在ImageNet上精度對(duì)比

上表顯示，MobileNet在保證精度不變的同時(shí)，能夠有效地減少計(jì)算操作次數(shù)和參數(shù)量，使得在移動(dòng)端實(shí)時(shí)前向計(jì)算成為可能。

六、ShuffleNet

ShuffleNet是Face++今年提出了一篇用于移動(dòng)端前向部署的網(wǎng)絡(luò)架構(gòu)。ShuffleNet基于MobileNet的group思想，將卷積操作限制到特定的輸入通道。而與之不同的是，ShuffleNet將輸入的group進(jìn)行打散，從而保證每個(gè)卷積核的感受野能夠分散到不同group的輸入中，增加了模型的學(xué)習(xí)能力。

6.1 設(shè)計(jì)思想

我們知道，卷積中的group操作能夠大大減少卷積操作的計(jì)算次數(shù)，而這一改動(dòng)帶來了速度增益和性能維持在MobileNet等文章中也得到了驗(yàn)證。然而group操作所帶來的另一個(gè)問題是：特定的濾波器僅對(duì)特定通道的輸入進(jìn)行作用，這就阻礙了通道之間的信息流傳遞，group數(shù)量越多，可以編碼的信息就越豐富，但每個(gè)group的輸入通道數(shù)量減少，因此可能造成單個(gè)卷積濾波器的退化，在一定程度上削弱了網(wǎng)絡(luò)了表達(dá)能力。

6.2 網(wǎng)絡(luò)架構(gòu)

在此篇工作中，網(wǎng)絡(luò)架構(gòu)的設(shè)計(jì)主要有以下幾個(gè)創(chuàng)新點(diǎn)：

提出了一個(gè)類似于ResNet的BottleNeck單元

借鑒ResNet的旁路分支思想，ShuffleNet也引入了類似的網(wǎng)絡(luò)單元。不同的是，在stride=2的單元中，用concat操作代替了add操作，用average pooling代替了1x1stride=2的卷積操作，有效地減少了計(jì)算量和參數(shù)。單元結(jié)構(gòu)如圖10所示。

提出將1x1卷積采用group操作會(huì)得到更好的分類性能

在MobileNet中提過，1x1卷積的操作占據(jù)了約95%的計(jì)算量，所以作者將1x1也更改為group卷積，使得相比MobileNet的計(jì)算量大大減少。

提出了核心的shuffle操作將不同group中的通道進(jìn)行打散，從而保證不同輸入通道之間的信息傳遞。

ShuffleNet的shuffle操作如圖11所示。

圖10 ShuffleNet網(wǎng)絡(luò)單元

圖11 不同group間的shuffle操作

6.3 實(shí)驗(yàn)結(jié)果

表8 ShuffleNet與MobileNet在ImageNet上精度對(duì)比

上表顯示，相對(duì)于MobileNet，ShuffleNet的前向計(jì)算量不僅有效地得到了減少，而且分類錯(cuò)誤率也有明顯提升，驗(yàn)證了網(wǎng)絡(luò)的可行性。

6.4 速度考量

作者在ARM平臺(tái)上對(duì)網(wǎng)絡(luò)效率進(jìn)行了驗(yàn)證，鑒于內(nèi)存讀取和線程調(diào)度等因素，作者發(fā)現(xiàn)理論上4x的速度提升對(duì)應(yīng)實(shí)際部署中約2.6x。作者給出了與原始AlexNet的速度對(duì)比，如下表。

表9 ShuffleNet與AlexNet在ARM平臺(tái)上速度對(duì)比 [10]

結(jié)束語

近幾年來，除了學(xué)術(shù)界涌現(xiàn)的諸多CNN模型加速工作，工業(yè)界各大公司也推出了自己的移動(dòng)端前向計(jì)算框架，如Google的Tensorflow、Facebook的caffe2以及蘋果今年剛推出的CoreML。相信結(jié)合不斷迭代優(yōu)化的網(wǎng)絡(luò)架構(gòu)和不斷發(fā)展的硬件計(jì)算加速技術(shù)，未來深度學(xué)習(xí)在移動(dòng)端的部署將不會(huì)是一個(gè)難題。

上一頁 1 2 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 計(jì)算機(jī)

評(píng)論

相關(guān)推薦

采用TC620溫度傳感器的計(jì)算機(jī)機(jī)房溫控電路

設(shè)計(jì)方案采用 TC620 溫度傳感器計(jì)算機(jī) 機(jī)房溫控 | 2009-07-06

BIOS是什么？

嵌入式系統(tǒng) BIOS 計(jì)算機(jī) | 2024-03-11

第四講網(wǎng)絡(luò)數(shù)據(jù)獲取和顯示

視頻 Android 計(jì)算機(jī) | 2012-07-18

電腦串口、并口連接線大全

資源下載計(jì)算機(jī) 串口并口連接線 | 2008-01-06

很好的一篇入門文章，特別推薦(老站轉(zhuǎn))

amine | 2002-05-28

DK04監(jiān)控模塊與計(jì)算機(jī)通信接口電路

設(shè)計(jì)方案監(jiān)控模塊計(jì)算機(jī) 通信接口 | 2009-07-06

利用計(jì)算機(jī)并口和MAX7221驅(qū)動(dòng)LED程序

資源下載計(jì)算機(jī) 并口 LED驅(qū)動(dòng) MAX7221 | 2007-02-09

世界工控技術(shù)市場的現(xiàn)狀和未來

hpnet | 2002-07-23

由智能化遠(yuǎn)程熱風(fēng)扇控制器ADT7460構(gòu)成的計(jì)算機(jī)的散熱控制電路

設(shè)計(jì)方案智能化遠(yuǎn)程風(fēng)扇控制器 ADT7460 構(gòu)成計(jì)算機(jī) 散 | 2009-07-06

計(jì)算機(jī)音頻工作站總論--音頻工作站與硬盤錄音機(jī)同類比較(轉(zhuǎn)載）

hpnet | 2002-05-15

我國計(jì)算產(chǎn)業(yè)規(guī)模達(dá) 2.6 萬億元，近六年出貨超 2091 萬臺(tái)通用服務(wù)器、82 萬臺(tái) AI 服務(wù)器

智能計(jì)算計(jì)算機(jī) 智能計(jì)算服務(wù)器 | 2023-09-18

為下一代計(jì)算機(jī)處理器選擇互連監(jiān)控解決方案

嵌入式系統(tǒng) 計(jì)算機(jī) 處理器互連監(jiān)控 | 2022-12-22

突破二進(jìn)制量子計(jì)算機(jī)問世：超越“0”和“1”

國際視野量子計(jì)算機(jī) 二進(jìn)制計(jì)算機(jī) | 2022-07-25

帶大家了解二進(jìn)制

模擬技術(shù) 編程計(jì)算機(jī) | 2022-12-09

第二講 Hello World

視頻 Android 計(jì)算機(jī) | 2012-07-18

帶光隔離的計(jì)算機(jī)彩燈控制器

資源下載計(jì)算機(jī) 計(jì)算機(jī)彩燈控制器 | 2007-12-25

模擬大腦突觸的液體電路如何實(shí)現(xiàn)計(jì)算機(jī)的邏輯運(yùn)算

電路計(jì)算機(jī) 邏輯運(yùn)算 | 2024-04-18

網(wǎng)絡(luò)常見的9大命令，非常實(shí)用！

網(wǎng)絡(luò) 計(jì)算機(jī) 主機(jī) IP 網(wǎng)卡 | 2023-08-09

谷歌云計(jì)算部門再裁員，至少100名員工受影響

國際視野谷歌計(jì)算機(jī) 國際 | 2024-06-04

科學(xué)家們用人腦組織構(gòu)建了一臺(tái)功能性計(jì)算機(jī)

智能計(jì)算腦組織，計(jì)算機(jī)，芯片 | 2023-12-15

計(jì)算機(jī)麥克風(fēng)電路圖

設(shè)計(jì)方案計(jì)算機(jī) 麥克風(fēng) 電路圖 | 2009-07-06

計(jì)算機(jī)通訊在計(jì)量管理中的應(yīng)用

hpnet | 2002-07-18

干貨｜必看的單片機(jī)知識(shí)

單片機(jī) 計(jì)算機(jī) 存儲(chǔ)器微處理器仿真器 | 2023-11-29

TL5001構(gòu)成計(jì)算機(jī)LCD顯示器的高壓電源的應(yīng)用電路

設(shè)計(jì)方案 TL5001 構(gòu)成計(jì)算機(jī) 顯示器高壓電源應(yīng)用電路 | 2009-07-06

我國設(shè)立計(jì)算機(jī)創(chuàng)新獎(jiǎng)勵(lì)基金

hpnet | 2002-05-17

第一講安卓應(yīng)用開發(fā)介紹

視頻 Android 計(jì)算機(jī) | 2012-07-18

人機(jī)接口與協(xié)議自適應(yīng)

資源下載計(jì)算機(jī) 普適網(wǎng)絡(luò)協(xié)議接口自適應(yīng) | 2008-01-06

利用計(jì)算機(jī)設(shè)計(jì)單片開關(guān)電源講座(1)

資源下載計(jì)算機(jī) 電源單片開關(guān)電源 | 2007-02-09

第五講用戶界面改進(jìn)

視頻 Android 計(jì)算機(jī) | 2012-07-18

第三講用戶界面基礎(chǔ)

視頻 Android 計(jì)算機(jī) | 2012-07-18

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();