走近Caneland服務(wù)器平臺(tái)
Caneland接棒Truland
這并非是英特爾首次推出4核至強(qiáng)處理器。此前,英特爾曾推出基于單路和2路的4核處理器。9月6日推出的Caneland平臺(tái)包括的Xeon 7300系列處理器則是業(yè)界推出的首款面向多路的4核處理器。從Xeon 7300系列開(kāi)始,英特爾未來(lái)的所有服務(wù)器處理器都將采用更高能效的酷睿微架構(gòu),從而支持更高密度的數(shù)據(jù)中心部署,
英特爾產(chǎn)品技術(shù)工程師黃菁介紹,Caneland平臺(tái)不僅實(shí)現(xiàn)了微架構(gòu)遷移,還從平臺(tái)層面融合了一系列最新的前沿技術(shù),以便能夠應(yīng)對(duì)對(duì)數(shù)據(jù)要求苛刻的企業(yè)應(yīng)用和虛擬環(huán)境中的服務(wù)器整合。依然采用mPGA604封裝的Xeon 7300系列由兩個(gè)原生2核組合封裝而成,采用內(nèi)部總線傳輸數(shù)據(jù)并共享二級(jí)緩存。據(jù)英特爾內(nèi)部測(cè)試,相比Xeon 7100系列,Xeon 7300系列的能效表現(xiàn)提升了125%,同時(shí)還進(jìn)一步控制了能耗:用于刀片服務(wù)器的處理器TDP(熱設(shè)計(jì)功耗)為50瓦,機(jī)架式服務(wù)器處理器TDP為80瓦,性能優(yōu)化型處理器的TDP為130瓦。
與上一代平臺(tái)采用的TwinCastle芯片組相比,Caneland平臺(tái)采用的Clarksboro北橋芯片的前端總線變化明顯。Clarksboro芯片改為在每顆4核芯片與芯片組之間使用專用的連接通道,提供了4條1066MT/s的前端總線,即系統(tǒng)中的每顆處理器都有獨(dú)立的高速總線。這改變了以往雙獨(dú)立總線架構(gòu)要求每?jī)深w處理器共享芯片組連接,造成帶寬不足的弊端。
Clarksboro芯片組還整合了容量為64MB的探聽(tīng)過(guò)濾器。它可以看作是包含處理器所有數(shù)據(jù)信息的特別緩沖器。要確保多核處理器緩存的一致性,Caneland平臺(tái)的單顆2核處理器必須注意另一顆2核處理器的總線情況,探聽(tīng)過(guò)濾器就是要減少處理器總線發(fā)生數(shù)據(jù)堵塞的情況。出現(xiàn)高速緩存未中時(shí),探聽(tīng)過(guò)濾器將攔截探聽(tīng),如果讀取請(qǐng)求同一總線上的另一個(gè)處理器得到滿足,則取消探聽(tīng)過(guò)濾器訪問(wèn);如果沒(méi)有得到滿足,訪問(wèn)結(jié)果將確定是否進(jìn)行下一操作。經(jīng)內(nèi)部測(cè)試,與以往的使用轉(zhuǎn)發(fā)器相比,探聽(tīng)過(guò)濾器在4路系統(tǒng)上可以提升10%~15%的性能。
配置FB-DIMM內(nèi)存也非常值得關(guān)注,這項(xiàng)新技術(shù)能夠同時(shí)增強(qiáng)內(nèi)存吞吐率、帶寬、容量和可靠性。與采用DDR2-400內(nèi)存的前代E7520芯片組平臺(tái)相比,F(xiàn)B-DIMM技術(shù)能提供4倍的內(nèi)存容量(64GB)和3倍的最高帶寬(采用1333MHz系統(tǒng)總線,速度為21GB/s)。當(dāng)安裝8GB DIMM模組時(shí),Caneland平臺(tái)最高可配置256GB內(nèi)存。
I/OAT技術(shù)進(jìn)化
近幾年網(wǎng)絡(luò)迅速發(fā)展,語(yǔ)音、視頻、游戲等網(wǎng)絡(luò)應(yīng)用導(dǎo)致I/O負(fù)載壓力急速增大。伴隨著虛擬化應(yīng)用日益普遍,據(jù)統(tǒng)計(jì),20%的服務(wù)器都開(kāi)始采用虛擬化技術(shù)。當(dāng)我們?cè)谔摂M機(jī)上同時(shí)部署多個(gè)應(yīng)用時(shí),勢(shì)必會(huì)給I/O造成越來(lái)越大的壓力。
英特爾在2006年推出Bensley平臺(tái)時(shí),便推出了I/OAT解決方案。它的出現(xiàn),就是為了解決I/O負(fù)載量過(guò)大的問(wèn)題。從技術(shù)實(shí)現(xiàn)的角度來(lái)看,I/OAT是如何工作,解決與基于TCP/IP的通信相關(guān)的系統(tǒng)級(jí)瓶頸問(wèn)題呢?英特爾產(chǎn)品技術(shù)工程師鄧立向記者做出了如下解釋。
與數(shù)據(jù)傳輸?shù)穆窂较嗤?,I/OAT是從網(wǎng)卡到芯片組、CPU的平臺(tái)化解決方案。在采用這一技術(shù)的網(wǎng)卡部分,可以實(shí)現(xiàn)數(shù)據(jù)到達(dá)后的分塊以及頭部的分離與處理,以此來(lái)實(shí)現(xiàn)數(shù)據(jù)加速的過(guò)程。芯片組則內(nèi)嵌了一個(gè)DMA(直接內(nèi)存存取)數(shù)據(jù)加速引擎,數(shù)據(jù)可以不通過(guò)CPU而直接進(jìn)行數(shù)據(jù)打包、卸載以及內(nèi)存提取。DMA引擎幫助芯片組直接承擔(dān)起網(wǎng)卡和內(nèi)存數(shù)據(jù)交換的重任,這樣就減輕了CPU不必要的負(fù)擔(dān),可更快地移動(dòng)數(shù)據(jù)。處理器加速,也主要是針對(duì)七層協(xié)議,如TCP打包、封裝等操作進(jìn)行的,這部分加速提供了為英特爾架構(gòu)優(yōu)化的協(xié)議堆棧,以改進(jìn)數(shù)據(jù)訪問(wèn)。以上三者共同構(gòu)成英特爾的數(shù)據(jù)加速技術(shù)。BIOS和操作系統(tǒng)也已經(jīng)充分釋放了I/OAT的能力。
在Caneland平臺(tái)上,I/OAT發(fā)展到了第二代—I/OAT2,并將在后續(xù)推出的其他平臺(tái)也裝備。新技術(shù)有益于增強(qiáng)數(shù)據(jù)中心網(wǎng)絡(luò)I/O的性能,主要從多端口10GbE、虛擬化、網(wǎng)絡(luò)存儲(chǔ)、應(yīng)用快速響應(yīng)、附加協(xié)議等方面來(lái)實(shí)現(xiàn)。
I/OA T2在原有基礎(chǔ)上增加了直接DCA(高級(jí)緩存訪問(wèn))的工作模式,這是一項(xiàng)快速響應(yīng)、增強(qiáng)性能的新特性。通過(guò)網(wǎng)卡傳送進(jìn)來(lái)的數(shù)據(jù)包如果是小包,DCA將直接把這些包送到緩存當(dāng)中;如果是大包,DCA無(wú)法直接提取,它將協(xié)同DMA工作,一起把數(shù)據(jù)包傳送到高速緩存。DCA的意義在于,數(shù)據(jù)包盡可能采用最近最快的途徑,進(jìn)入CPU的高速緩存中被優(yōu)先訪問(wèn),這將極大降低CPU的數(shù)據(jù)存取延遲。
為了給服務(wù)器整合及虛擬化提供高性能I/O,I/OAT2也做出了重大改進(jìn),目的就在于破除VMM軟件層軟交換機(jī)在數(shù)據(jù)交換時(shí)帶來(lái)的瓶頸,減少網(wǎng)絡(luò)擁塞和延時(shí)。這就是英特爾在新一代網(wǎng)卡中推出的另一項(xiàng)技術(shù)VMDq(虛擬機(jī)設(shè)備排列)。從網(wǎng)絡(luò)上傳送過(guò)來(lái)的數(shù)據(jù)包是雜亂無(wú)章的,沒(méi)有VMDq之前,這些包是直接通過(guò)網(wǎng)卡到達(dá)軟交換機(jī),經(jīng)分別整理處理后送到虛擬機(jī)。這就給給軟交換機(jī)造成了非常大的負(fù)載壓力。采用了VMDq后,數(shù)據(jù)包在送達(dá)軟交換機(jī)之前,已經(jīng)被依照虛擬機(jī)的需求分別排列成不同的組,只需要軟交換機(jī)簡(jiǎn)單處理后就直接傳送,極大提高了數(shù)據(jù)傳輸?shù)男省?/P>
虛擬化支持提速
英特爾是虛擬化堅(jiān)定的推動(dòng)者。通過(guò)這項(xiàng)技術(shù),用戶的IT環(huán)境可以被改造成更強(qiáng)大、更具彈性的架構(gòu)。
數(shù)年前,x86平臺(tái)還沒(méi)有硬件支持虛擬化,甚至連指令集都不是為虛擬化而設(shè)計(jì),這時(shí)主要靠純軟件來(lái)實(shí)現(xiàn)虛擬化。這就遇到了一些難題,比如CPU的優(yōu)先級(jí)問(wèn)題、設(shè)備管理問(wèn)題等等。軟件廠商當(dāng)時(shí)只能通過(guò)代碼轉(zhuǎn)換等技術(shù)手段去繞開(kāi)這些麻煩,無(wú)形中降低了虛擬化的運(yùn)行性能。直到英特爾推出虛擬化技術(shù),將虛擬環(huán)境中的復(fù)雜軟件操作融入到硬件層面。
英特爾產(chǎn)品工程師南波向記者展示了英特爾虛擬化技術(shù)的發(fā)展路線圖。從軟件層面進(jìn)行虛擬化部署之后,英特爾首先在處理器層面支持虛擬化(至強(qiáng)VT-x和安騰VT-i),并逐漸擴(kuò)展到其他設(shè)備,虛擬化也就從純軟件逐漸深入到處理器級(jí),再到平臺(tái)級(jí)乃至I/O級(jí)。對(duì)于關(guān)注I/O性能的企業(yè)級(jí)應(yīng)用而言,完成了處理器虛擬化和I/O虛擬化,整個(gè)平臺(tái)的虛擬化過(guò)程就基本完成了。
這里最值得注意的是將在Caneland平臺(tái)I/O級(jí)上運(yùn)用到的核心技術(shù)VT-d。這是一種基于北橋芯片的硬件輔助虛擬化技術(shù),通過(guò)在北橋中內(nèi)置提供DMA虛擬化和IRQ虛擬化硬件,實(shí)現(xiàn)了新型的I/O虛擬化方式。
=I/O虛擬化的關(guān)鍵在于解決I/O設(shè)備與虛擬機(jī)數(shù)據(jù)交換的問(wèn)題,而這部分主要相關(guān)的是DMA及IRQ中斷請(qǐng)求。成功的I/O虛擬化需要解決好這兩方面的隔離、保護(hù)及性能問(wèn)題。I/O虛擬化需要正確分離這些I/O設(shè)備產(chǎn)生的中斷請(qǐng)求,并送到不同的虛擬機(jī)上。傳統(tǒng)設(shè)備的通過(guò)DMA寫(xiě)請(qǐng)求直接發(fā)送出去的MSI(消息中斷),需要在請(qǐng)求內(nèi)嵌入目標(biāo)內(nèi)存地址,完全訪問(wèn)所有的內(nèi)存地址并不能實(shí)現(xiàn)中斷隔離。VT-d通過(guò)重新定義MSI格式解決了這個(gè)問(wèn)題。新的MSI形式不變,但用消息ID取代了目標(biāo)內(nèi)存地址,通過(guò)維護(hù)表結(jié)構(gòu),硬件可以通過(guò)不同的消息ID辨認(rèn)不同的虛擬機(jī)區(qū)域。
VT-d最終體現(xiàn)到虛擬化模型上,就是新增了虛擬機(jī)直接分配物理I/O設(shè)備給虛擬機(jī)以及I/O設(shè)備共享兩種設(shè)備虛擬化方式,以此來(lái)代替?zhèn)鹘y(tǒng)的設(shè)備模擬/額外設(shè)備接口方式,從而提升了虛擬化的I/O性能。
交換機(jī)相關(guān)文章:交換機(jī)工作原理
評(píng)論