<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 手機與無線通信 > 設計應用 > 基于GPU的AES算法實現(xiàn)

基于GPU的AES算法實現(xiàn)

作者：時間：2011-06-14 來源：網(wǎng)絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

收藏

GPU和內(nèi)存的數(shù)據(jù)交換是一筆很大的開銷，因此從整體上減小這部分的開銷是優(yōu)化的關鍵。從GPU執(zhí)行的特點來看，每個線程都獨自從內(nèi)存中讀取一個分組長度的數(shù)據(jù)塊，加密完成后寫回到內(nèi)存中。這樣，每加密一個分組長度都要讀寫一次內(nèi)存，整體IO效率低。根據(jù)程序的局部性原理，如果一次讀入相鄰的多個分組，IO效率會大大提高。在前面的GPU程序中，我們是在一個線程里加密一個分組?，F(xiàn)在我們一次讀取多個分組進行加密。這樣從整體上提高了IO效率。鑒于線程處理器還可以進行并行操作，我們還可以使用流數(shù)據(jù)類型，進一步提高并行度。
改進的算法如下：
brook：：Streamint>*datastream；
datastream．read(Block[m][n])；
AESEncrypt_CPU_Simple(dtatastream)；
Datastream．write(Block[m][n])；
改進后，每個線程一次讀取n個相鄰的分組進行加密。

4 實驗設計
實驗采用的CPU是GeForce 9800 GTX+，軟件使用GUDA2．1，是在WmdowsXP操作系統(tǒng)下運行的。
CPU對AES算法的加速結果如圖1所示。從圖中可以看出，當數(shù)據(jù)量較小時(小于100kB)，GPU上的運行性能要低于CPU，這是因為GPU的特點是適合用作高密度數(shù)據(jù)的并行計算，而當數(shù)據(jù)量較小時并無法充分利用到GPU的計算資源，而且從主機向設備傳輸輸入數(shù)據(jù)和由設備向主機返回數(shù)據(jù)又會占用一定的開銷，因此對于小數(shù)據(jù)量的處理并不適合使用GPU。隨著數(shù)據(jù)量的增加，GPU運算的性能就會明顯高于CPU。當數(shù)據(jù)量大于1MB時，GPU具有將近兩倍的加速倍數(shù)，之后加速倍數(shù)就基本穩(wěn)定下來，達到飽和，這是因為當數(shù)據(jù)量已經(jīng)足夠多，充分利用了GPU的計算資源。由于GPU的計算能力遠遠高于它訪問設備內(nèi)存的帶寬以及主機與設備之間的數(shù)據(jù)傳輸帶寬，在應用中這些數(shù)據(jù)傳輸?shù)拈_銷會成為限制GPU運算整體性能的瓶頸，需要對GPU進行優(yōu)化，才能充分開發(fā)出GPU的計算優(yōu)勢。
圖1 GPU對AES算法的加速效果

本文引用地址：http://www.ex-cimer.com/article/156187.htm

對實驗結果進行優(yōu)化。通過優(yōu)化，可以提高超過兩倍的加速效果，在數(shù)據(jù)量大時，優(yōu)化結果更為明顯，如圖2所示。

5 結論
本文介紹了在GPU上實現(xiàn)AES加密算法的方法。首先介紹了AES算法，然后對CUDA中的GPU結構和CUDA編程模型進行了深入的研究。最后在GPU和CPU平臺上對設計進行了實驗對比，取得了理想的加速效果。其實在大多數(shù)應用情況下，目前計算機顯卡配置的GPU運算潛能并沒有完全釋放出來，本文介紹的加密方法是GPU通用計算具體應用的一個體現(xiàn)。雖然目前以CUDA為代表的GPU仍然存在精度不高，程序編寫限制較多的缺點，但隨著并行流處理概念的進一步發(fā)展，GPU通用計算技術將在各個領域發(fā)揮更大的作用。

上一頁 1 2 3 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： 實現(xiàn) 算法 AES GPU 基于

評論

相關推薦

基于VxWorks的多DSP系統(tǒng)的多任務程序設計(老站轉(zhuǎn))

amine | 2002-05-28

SHIPT算法擠壓了外包工人如何對雇主進行審計

智能計算 SHIPT 算法算法管理 | 2024-07-04

大嘴業(yè)話：A12真的能改變競爭格局么？

視頻 ARM A12 GPU | 2013-06-21

vxworks下bsp制作教程(老站轉(zhuǎn))

amine | 2002-05-28

基于MSP430F133的電子鎮(zhèn)流器綜合測試儀

設計方案基于 MSP430F133 電子鎮(zhèn)流器綜合測試儀 | 2009-07-06

仿真器概念及實現(xiàn)技術

jackwang | 2002-05-14

PID算法

資源下載 PID 算法誤差 | 2007-02-16

GPU的形態(tài)已徹底改變，英偉達GTC大會發(fā)布的到底是什么

視頻英偉達 GPU Blackwell AI GTC | 2024-03-26

消息稱臺積電代工英特爾下代 AI HPC 用 GPU 芯片 Falcon Shores

EDA/PCB 臺積電英特爾 AI HPC GPU 芯片 Falcon Shores | 2024-07-17

打破NVIDIA壟斷！英國公司實現(xiàn)CUDA軟件在AMD GPU上無縫運行

智能計算 NVIDIA CUDA軟件 AMD GPU | 2024-07-22

《E點冷知識》：引發(fā)AI行業(yè)大地震的CUDA究竟有多強大

視頻英偉達 GPU CUDA AI | 2024-03-26

基于運放的差動放大器

設計方案基于運放差動放大器 | 2009-07-06

利用PIC12C508單片機來實現(xiàn)加密狗技術[轉(zhuǎn)帖]

hpnet | 2002-05-19

模擬電路PWM的實現(xiàn)

設計方案模擬電路實現(xiàn) | 2009-07-06

Intel 收購 NVDIA 意欲何為

視頻 Intel NVDIA CPU GPU 移動處理 | 2012-12-26

[轉(zhuǎn)帖]us/os就緒表的維護算法分析

amine | 2002-05-17

消息稱英偉達曾向臺積電詢問建設廠外 CoWoS 先進封裝專線可能，遭拒絕

EDA/PCB 英偉達 GPU 封裝工藝臺積電 | 2024-07-23

嵌入式開發(fā)者都該了解的十大算法

嵌入式開發(fā)者算法 | 2024-07-16

數(shù)字PID控制算法之一

資源下載 PID PID控制算法 | 2007-12-28

FOPLP導入AI GPU 估2027年量產(chǎn)

EDA/PCB FOPLP AI GPU 臺積電 | 2024-07-04

中國科學院院士：CPU、GPU架構上國人沒貢獻很遺憾應加強創(chuàng)新

嵌入式系統(tǒng) CPU GPU 架構 | 2024-07-12

加密算法之MD5算法

資源下載加密算法加密算法 MD5算法 | 2007-02-16

基于RC電路的一次性濾波器

設計方案基于電路一次性濾波器 | 2009-07-06

什么是 DLSS，值得嗎？

智能計算 DLSS gpu NVIDIA | 2024-07-17

高通新中端芯片驍龍7s Gen 3曝光：采用Adreno 810 GPU，下月發(fā)布

EDA/PCB 高通中端芯片驍龍7s Gen 3 Adreno 810 GPU | 2024-07-23

CRC算法原理及C語言實現(xiàn)

資源下載 CRC 算法 C語言 | 2007-02-16

基于D類功放專用驅(qū)動芯片驅(qū)動的高保真純正弦波逆變器1

設計方案基于功放專用驅(qū)動芯片高保真正弦波逆變器 | 2009-07-06

簡單實用的單片機CRC 快速算法

資源下載 CRC 算法單片機 | 2007-02-16

目標完全替代閉源驅(qū)動，英偉達宣布全面轉(zhuǎn)向開源 GPU 內(nèi)核模塊

嵌入式系統(tǒng) 閉源驅(qū)動英偉達開源 GPU 內(nèi)核模塊 Linux | 2024-07-22

焦點

推薦視頻

技術專區(qū)

關閉

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();