<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應用 > 嵌入式開發(fā)技巧：利用編程技術(shù)發(fā)揮多內(nèi)核架構(gòu)優(yōu)勢

嵌入式開發(fā)技巧：利用編程技術(shù)發(fā)揮多內(nèi)核架構(gòu)優(yōu)勢

作者：時間：2016-09-12 來源：網(wǎng)絡

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

另一種并行編程架構(gòu)，CUDA和OpenCL(開放計算語言)，則完全匹配GPU方法(使用與主處理器分開的存儲器)。這意味著數(shù)據(jù)在能被操作之前必須從一個地方移動到另一個地方。C編程語言有一定擴展，但也有限制。例如，它是自由遞歸的，不支持函數(shù)指針。其中一些限制源自SIMT方法。

許多應用程序使用CUDA，但與傳統(tǒng)SMP平臺相比，性能增益有很大的變化，從2倍到100倍不等。造成這種變化的原因是，線程以32為組運行時的效率最高。分支不影響性能，前提是32線程組在同一分支內(nèi)。

像GPU這樣的專用處理器，其采用的方案是同時提供圖形和多內(nèi)核處理。另外一種方案是使用許多傳統(tǒng)內(nèi)核，如Intel的Larrabee(圖5)。Larrabee使用專門針對矢量處理優(yōu)化過的x86兼容內(nèi)核。

從某種角度看，Larrabee有點類似于IBM的Cell處理器。Larrabee內(nèi)核只有32KB的一級緩存和256KB的二級緩存可以訪問。如果數(shù)據(jù)不在緩存中，必須從內(nèi)存控制器或系統(tǒng)中的另一個緩存中申請，然后數(shù)據(jù)被放進內(nèi)核的緩存中，再由應用程序繼續(xù)處理。

環(huán)形總線用于內(nèi)核和控制器之間的通信。IBM的Cell單元互連總線(EIB)也是一種環(huán)形總線，連接著 SPE和內(nèi)存控制器以及外設(shè)接口。從編程角度看，Larabee的緩存和Cell的SRAM有很大的差異。誠然，對編程人員來說，Larrabee看起來更像是一組連貫緩存的x86處理器。由于其GPU定位，編程人員可以充分利用它對DirectX和OpenGL的支持。

多內(nèi)核聯(lián)網(wǎng)

多內(nèi)核芯片也是網(wǎng)絡基礎(chǔ)設(shè)施中的常見元件。處理10Gps的網(wǎng)絡對多內(nèi)核芯片來說本身就是很大的挑戰(zhàn)。分析和處理來自線速網(wǎng)絡連接的數(shù)據(jù)需要大量的處理資源。

Netronome的NFP-3200網(wǎng)絡流量處理器包含40個1.4GHz的內(nèi)核，每個內(nèi)核可以運行8個線程，因此1個芯片總共可提供320個基于硬件的線程。這個數(shù)量級與GPU相同，但這些處理器主要用于數(shù)據(jù)包處理。

與IBM的Cell一樣，NFP-3200也有一個主CPU型控制器，而且是一個ARM11內(nèi)核。NFP-3200的40個內(nèi)核也叫做微引擎，兼容 Intel的IXP28xx架構(gòu)，主要用于網(wǎng)絡處理。這種兼容性很重要，因為大量代碼是針對這種架構(gòu)開發(fā)的。較老的芯片具有較少的內(nèi)核，因此在某種意義上 NFP-3200提供的是相同解決方案。

當然，為解決問題而簡單地采用更多的內(nèi)核只是其中一種措施。Netronome作了大量改進，例如支持TCP任務卸載的增強型微模塊?；ミB速度也更高了，內(nèi)核之間的運行速度高達44Gbps。

Netronome芯片擁有大量的專用處理器，其中包括了用于處理各種安全協(xié)議的加密系統(tǒng)。Netronome的PCI Express接口支持x86處理器經(jīng)常使用的I/O虛擬化功能。它能被移動到NFP-3200旁邊，而不是被另外一條網(wǎng)絡鏈路隔開。

與其它多內(nèi)核芯片相比，編程NFP-3200通常沒有太大問題，因為針對IXP28xx系列有大量現(xiàn)成代碼。另外，Netronome提供庫，這使得網(wǎng)絡處理應用程序的創(chuàng)建更像是模塊的堆疊。

Cavium的Octeon II是一種更傳統(tǒng)的SMP多內(nèi)核設(shè)計，有2到6個64位 MIPS64內(nèi)核，它們通過一個交叉開關(guān)相連。與Netronome芯片一樣，Octeon II是針對網(wǎng)絡和存儲設(shè)備設(shè)計的。

Octeon II還有一個RAID 5/6加速器以及用于數(shù)據(jù)包檢查的正則表達式超有限時序機(HFA)。編程Octeon II與編程大多數(shù)SMP系統(tǒng)相仿。Octeon II可以運行諸如Linux的操作系統(tǒng)。

其它多內(nèi)核架構(gòu)

采用更激進的多內(nèi)核架構(gòu)會增加編程事務，但它能為開發(fā)人員開啟利用新架構(gòu)的機會。IntellaSys的SeaFORTH 40C18就屬于這種類型(圖6)。它本身的編程語言是VentrueForth，指令長度實際上是5位，4個指令可以壓縮為單個18位的字(一個指令只有3位長)。40C18有40個內(nèi)核，它們有相同的處理單元，并且都有64個字的RAM和64個字的ROM。

與具有更多存儲空間的芯片(如Intel的Larrabee或IBM的Cell)相比，對40C18進行編程顯然有很大的區(qū)別。40C18內(nèi)核的功耗不到9mW，而其它兩種芯片在沒有大散熱器或風扇的情況下都無法正常工作。40C18設(shè)計用于嵌入式甚至移動應用。

對大多數(shù)開發(fā)人員來說，對40C18進行編程將是不同的體驗，這不僅因為Forth是編程語言。每個內(nèi)核的小內(nèi)存容量和矩陣互連改變了程序設(shè)計方法。內(nèi)核通常運行將數(shù)據(jù)傳送到一個或多個相鄰內(nèi)核的小型函數(shù)，因此協(xié)同編程將是大勢所趨。

即使外部存儲器訪問也要求三個內(nèi)核一起工作，當有許多內(nèi)核可以一起工作時這種方法很管用。40C18還有一種獨特的能力，它能將4個指令組成的小程序用一個字發(fā)送給相鄰內(nèi)核執(zhí)行，因此就有足夠的空間執(zhí)行塊傳送。

XMOS公司的XS1-G4是一種基于32位整數(shù)Xcores的有趣混合產(chǎn)品。每個Xcore可以處理大量不同的線程，同時還有一個基于硬件的事件系統(tǒng)幫助XMOS的軟外設(shè)。與40C18一樣，XS1-G4可以在I/O端口上等待。區(qū)別是XS1-G4處理多個線程，而IntellaSys芯片處理單個線程。

開發(fā)人員可以使用C語言的擴展版本XC發(fā)揮XMOS硬件的最大功效。C語言擴展提供了到硬件支持的快捷路徑，其中也包括 Xlinks。Xlinks連接芯片中的4個內(nèi)核，并提供4個片外鏈路，因此可以連接多個芯片。芯片內(nèi)部使用一個開關(guān)用于Xlink連接，但硬件和軟件為處理器間通信提供統(tǒng)一接口。

每個內(nèi)核有64KB的內(nèi)存，這個容量比40C18大，但比本文提到的一些更高性能的芯片的內(nèi)存容量小。同樣，對大部分應用代碼來說這個容量是足夠用的，并且允許使用更傳統(tǒng)的線程方法進行編程。針對XMOS芯片的大部分編程工作很可能用傳統(tǒng)的C或C++完成，而不是用XC，后者更傾向用于通信和外設(shè)處理。

XS1-G4不會向雙精度浮點GPU或其它高端系統(tǒng)提出挑戰(zhàn)，但它的整數(shù)和定點DSP支持使得它適用于其它許多音頻和視頻處理功能。鏈接好的XMOS芯片早已在內(nèi)部用來驅(qū)動多個大屏幕LCD。

多內(nèi)核架構(gòu)還將繼續(xù)保持高速發(fā)展。高效地對這些內(nèi)核進行編程和選擇合適的產(chǎn)品并不容易，但它會變得越來越普及，即使是對嵌入式開發(fā)人員而言。傳統(tǒng)應用程序?qū)⒉粩嗟匾浦驳狡ヅ洮F(xiàn)有主機的架構(gòu)上。當應用程序被重新設(shè)計或從頭創(chuàng)建時，也許會有更好的方案產(chǎn)生。

上一頁 1 2 3 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 嵌入式開發(fā) 編程技術(shù) 內(nèi)核架構(gòu)

評論

相關(guān)推薦

CodeWarrior 使用教程

資源下載 CodeWarrior Development Studio CodeWarrior 嵌入式開發(fā) | 2007-02-09

利用GOOP編程技術(shù)的大規(guī)模系統(tǒng)集成與自動歐洲戰(zhàn)斗機的前熔斷絲測試

測試測量 GOOP 編程技術(shù) 大規(guī)模測試 | 2018-09-12

嵌入式開發(fā)的轉(zhuǎn)變將如何影響未來計算

嵌入式系統(tǒng) 嵌入式開發(fā) arm | 2024-01-02

7大嵌入式開發(fā)技巧，你知道嗎？

嵌入式系統(tǒng) 嵌入式開發(fā) ROM | 2017-11-23

詳解嵌入式開發(fā)中DSP與FPGA的關(guān)系

嵌入式系統(tǒng) 嵌入式開發(fā) FPGA DSP | 2018-08-03

ARM編程技術(shù)(1)

資源下載嵌入式 ARM 編程技術(shù) | 2007-02-28

ARM720的bootloader代碼[編程技術(shù)]

資源下載編程技術(shù) ARM720 bootloader代碼 | 2007-02-28

嵌入式系統(tǒng)開發(fā)面臨的問題與集成開發(fā)環(huán)境的應用

資源下載嵌入式系統(tǒng) 嵌入式開發(fā) 問題集成開發(fā)環(huán)境應用 | 2007-02-28

英飛凌發(fā)布ModusToolbox? 3.1，加速嵌入式開發(fā)

嵌入式系統(tǒng) 英飛凌 ModusToolbox 嵌入式開發(fā) | 2023-06-19

【推薦入門視頻】基于ARM的嵌入式開發(fā)

資源下載 ARM ARM 嵌入式開發(fā) | 2007-12-21

申請

mzc2013 | 2013-09-27

新建“嵌入式開發(fā)”QQ群，群號：19097554

華山一派 | 2005-12-30

LABVIEW for ARM

Veiko | 2014-07-23

嵌入式開發(fā)技巧：利用編程技術(shù)發(fā)揮多內(nèi)核架構(gòu)優(yōu)勢

嵌入式系統(tǒng) 嵌入式開發(fā) 編程技術(shù) 內(nèi)核架構(gòu) | 2016-09-12

新建“嵌入式開發(fā)”QQ群，群號：19097554

華山一派 | 2005-08-24

煤礦井下綜合自動化系統(tǒng)中的應用

嵌入式系統(tǒng) 嵌入式新聞嵌入式資料嵌入式培訓嵌入式linux 嵌入式系統(tǒng) 嵌入式開發(fā) 嵌入式 | 2014-04-06

如何選擇更適合你的ARM Cortex內(nèi)核？

嵌入式系統(tǒng) ARM Cortex 嵌入式開發(fā) | 2017-10-21

alert(1)

Qidi | 2016-07-22

嵌入式開發(fā)：2022年5大嵌入式GUI趨勢

嵌入式系統(tǒng) 嵌入式開發(fā) | 2022-11-28

軟件Overlay：程序編寫與調(diào)試

嵌入式系統(tǒng) 嵌入式新聞嵌入式資料嵌入式培訓嵌入式linux 嵌入式系統(tǒng) 嵌入式開發(fā) 嵌入式 | 2014-01-20

焦點

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();