<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 一種面向云架構(gòu)的高性能網(wǎng)絡(luò)接口實現(xiàn)技術(shù)

一種面向云架構(gòu)的高性能網(wǎng)絡(luò)接口實現(xiàn)技術(shù)

作者：時間：2015-03-02 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

　　1. 2.2內(nèi)存訪問效率

本文引用地址：http://www.ex-cimer.com/article/270287.htm

　　在絕大多數(shù)情況下，應(yīng)用程序并不直接通過物理內(nèi)存地址來訪問內(nèi)存，而是采用虛擬地址，當(dāng)CPU收到內(nèi)存訪問指令時會先把虛擬地址轉(zhuǎn)換成實際的物理地址，然后進行內(nèi)存的訪問操作。這種方式已經(jīng)被普遍接受，甚至被稱作是IT時代最杰出的發(fā)明之一，但是這種非直接內(nèi)存訪問方式并不是沒有代價的，地址的翻譯需要通過頁表來完成，頁表通常情況下是儲存在內(nèi)存當(dāng)中的，訪問速度很慢，為了解決這個問題，大部分系統(tǒng)都采用了TLB(Tralaslation Lookaside Buffer)的方式，最近觸發(fā)的一些地址翻譯結(jié)果都會保存在TLB中，TLB實際上使用的是CPU的緩存(cache)，訪問速度非?？欤欢鴆ache容量小，只有最近訪問的一部分頁表項能保存下來，因此出現(xiàn)了“TLB Miss”;當(dāng)CPU發(fā)現(xiàn)當(dāng)前虛擬地址無法在TLB里面找到相對應(yīng)的表項時，就引入了一個TLB Miss，此時CPU需要回到內(nèi)存當(dāng)中的頁表進行查找，性能會顯著降低。因此當(dāng)程序需要進行頻繁的內(nèi)存操作時，需要盡量減少TLBMiss的次數(shù)。當(dāng)前系統(tǒng)定義的頁面大小一般是4k字節(jié)，當(dāng)應(yīng)用程序使用比如2G這樣的大內(nèi)存時，總共需要50多萬個頁表項，這個數(shù)目是相當(dāng)龐大的，同時因為只有一小部分的表項能夠裝載在TLB中，因此TLB Miss的幾率也很大。另外，一般情況下程序的虛擬內(nèi)存空間都是連續(xù)的，但其對應(yīng)的物理內(nèi)存空間卻不一定是連續(xù)的，這樣會導(dǎo)致一次虛擬內(nèi)存尋址操作可能需要進行多次物理內(nèi)存尋址操作才能完成，這也會成倍地增加內(nèi)存訪問消耗的時間。

　　1.3多核親和力

　　多核系統(tǒng)對提高系統(tǒng)的性能有很大的幫助，當(dāng)前大部分系統(tǒng)的調(diào)度算法會把當(dāng)前的任務(wù)放到最空閑的核上執(zhí)行，這樣的好處是能夠增加CPU資源的利用率，但因為每個CPU核心都有自己獨立的寄存器和cache，當(dāng)任務(wù)從一個核心遷移到另一個核心時，會引發(fā)大量的核問切換開銷，比如上下文切換，cache miss等等。另外，對于使用NUMA(Non-Uniform Memory Access)架構(gòu)的系統(tǒng)而言，核間切換的開銷會更大，在SMP(Svmmetric Multiprocessing)架構(gòu)下，所有核心是通過共享接口訪問內(nèi)存的，因此每個核心訪問內(nèi)存的速度是一樣的，但在NUMA架構(gòu)下，核心對內(nèi)存的訪問分為本地訪問和遠(yuǎn)程訪問。核心訪問本地內(nèi)存的速度要比訪問遠(yuǎn)端內(nèi)存的速度快很多，當(dāng)任務(wù)從核心A切換到核心B的時候，如果它仍然使用之前在A上分配的內(nèi)存，那么其內(nèi)存訪問模式會從本地模式切換成遠(yuǎn)程模式，從而引起內(nèi)存訪問速度的下降。

　　1.4共享隊列的訪問

　　當(dāng)把數(shù)據(jù)包從一個任務(wù)傳遞到另外一個任務(wù)的時候，需要用到共享隊列。通常情況下，在訪問共享隊列的時候會用到Mutex鎖來保證訪問的一致性。當(dāng)應(yīng)用程序申請Mutex鎖失敗之后會陷入內(nèi)核態(tài)中睡眠，當(dāng)鎖可用之后再從內(nèi)核態(tài)切換到用戶態(tài)執(zhí)行，這里也引入了上下文切換的開銷，而且當(dāng)數(shù)據(jù)流量很大的時候，相應(yīng)的開銷也會非常大。為了消除這類開銷，業(yè)界也提出了一些改進的方法，比如自旋鎖(spinlock)，自旋鎖一直在用戶態(tài)運行，不會陷入內(nèi)核態(tài)中，因此也不會產(chǎn)生上下文切換的開銷，但是它還是存在一些弊端：一方面可能造成死鎖，如果一個線程拿到鎖之后被意外銷毀，其它等待此鎖的線程會發(fā)生死鎖;另一方面，當(dāng)共享隊列和線程數(shù)量猛增時，鎖的數(shù)量也會同時增加，對鎖的管理會給系統(tǒng)帶來很大的負(fù)擔(dān)。

　　2 HPNI實現(xiàn)原理

　　2.1傳統(tǒng)網(wǎng)絡(luò)接口實現(xiàn)模式的不足

　　從上述分析可以得出傳統(tǒng)網(wǎng)絡(luò)接口的實現(xiàn)主要有以下幾點不足：

　　(1)上下文切換開銷太多，這些開銷主要是由中斷、系統(tǒng)調(diào)用、鎖以及核間切換引入;

　　(2)內(nèi)存拷貝的開銷太多;

　　(3)內(nèi)存訪問效率不高，缺乏相應(yīng)的優(yōu)化;

　　(4)采用帶鎖共享隊列進行數(shù)據(jù)共享，引入額外開銷;

　　(5)收發(fā)包操作必須經(jīng)過Linux內(nèi)核單線程完成，無法擴展成多核多線程模式從而提高性能。

　　2. 2 HPNI的原理

　　針對上述不足，提出了一種新型的網(wǎng)絡(luò)接口實現(xiàn)模式，如圖3所示。

　　

　　圖3 HPNI網(wǎng)絡(luò)接口實現(xiàn)

上一頁 1 2 3 4 5 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 網(wǎng)絡(luò)接口 FPGA

評論

相關(guān)推薦

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

基于FPGA的數(shù)字信號處理--什么是定點數(shù)？

嵌入式系統(tǒng) FPGA 數(shù)字信號定點數(shù) | 2024-05-11

用C/C++語言開發(fā)大規(guī)模FPGA [轉(zhuǎn)載于www.fpga.com.cn]

xiaohua | 2002-09-24

Altera公司cyclone系列FPGA-1C6電路圖

設(shè)計方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

萊迪思推出全新安全控制FPGA系列產(chǎn)品，具備先進的加密敏捷性和硬件可信根

嵌入式系統(tǒng) 萊迪思安全控制 FPGA 加密敏捷性硬件可信根 | 2024-06-27

iCE40 LP/HX系列FPGA：萊迪思的創(chuàng)新可編程解決方案

嵌入式系統(tǒng) iCE40 LP/HX FPGA 萊迪思可編程解決方案 | 2024-06-07

基于FPGA的鎖相環(huán)位同步提取電路

設(shè)計方案電子電路圖，F(xiàn)PGA 鎖相環(huán) | 2012-07-27

采用創(chuàng)新的FPGA 器件來實現(xiàn)更經(jīng)濟且更高能效的大模型推理解決方案

嵌入式系統(tǒng) Achronix FPGA | 2024-06-18

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

基于FPGA的可編程數(shù)字濾波器系統(tǒng)

資源下載 Max FPGA 可編程數(shù)字濾波器 | 2007-12-14

視頻協(xié)議板-FPGA配置基于LatticeECP3的設(shè)計

設(shè)計方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

高速ADC與內(nèi)置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

ALTERA的PCI_IP Core問答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實現(xiàn)創(chuàng)新

視頻 Altera FPGA ASIC | 2009-07-13

基于SD7502構(gòu)成的FPGA-ASK電路圖

設(shè)計方案基于 SD7502 構(gòu)成 FPGA-ASK 電路圖 | 2011-07-13

國產(chǎn)28納米FPGA流片

嵌入式系統(tǒng) FPGA EDA 芯片 | 2024-05-31

3-DES算法的FPGA高速實現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

LatticeECP3設(shè)計的視頻協(xié)議板電路圖-FPGA配置

設(shè)計方案 LatticeECP3 設(shè)計視頻協(xié)議電路圖 -FPGA | 2011-06-27

利用強大的軟件設(shè)計工具為FPGA開發(fā)者賦能

嵌入式系統(tǒng) 軟件設(shè)計工具 FPGA 萊迪思 | 2024-07-17

LabVIEW 8.20技術(shù)資料大全簡介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

9種單片機常用的軟件架構(gòu)

嵌入式系統(tǒng) PCB FPGA 架構(gòu) | 2024-05-21

Altera的FPGA下載常見問題經(jīng)驗小結(jié)

資源下載 Altera FPGA 常見問題經(jīng)驗 | 2007-12-13

FPGA是實現(xiàn)敏捷、安全的工業(yè)4.0發(fā)展的關(guān)鍵

嵌入式系統(tǒng) FPGA 工業(yè)4.0 Lattice 萊迪思 | 2024-05-06

FPGA如何同DDR3存儲器進行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

LabVIEW FPGA 模塊簡介

視頻 NI LabVIEW FPGA | 2009-04-01

實時的噪聲源定位系統(tǒng)

視頻 NI LabVIEW FPGA | 2009-03-25

s3c2410+fpga 做視頻無線傳輸

herbertwj | 2004-08-15

FPGA比單片機厲害嗎？

嵌入式系統(tǒng) FPGA 單片機 | 2024-06-13

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統(tǒng) 萊迪思 FPGA 小型FPGA | 2024-07-23

焦點

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();