多方位多角度 帶您重新詮釋多核技術(shù)
在X86領(lǐng)域,英特爾和AMD在今后兩年內(nèi)還是會(huì)基于傳統(tǒng)的多核心方案繼續(xù)發(fā)展,其中,英特爾在下半年帶來(lái)的Merom架構(gòu)以高效率見(jiàn)長(zhǎng),但它非常缺乏擴(kuò)展的空間;而AMD公司在未來(lái)兩年內(nèi)更多是對(duì)現(xiàn)有的AMD64架構(gòu)進(jìn)行改良。
本文引用地址:http://www.ex-cimer.com/article/201609/304988.htm在過(guò)去數(shù)十年歷史中,微處理器業(yè)界一直為提高芯片的運(yùn)算性能而努力,得益于IC設(shè)計(jì)和半導(dǎo)體制造技術(shù)的交互拉動(dòng),微處理器的運(yùn)算性能始終保持高速度提升狀態(tài),芯片的集成度、工作頻率、執(zhí)行效率也在這個(gè)過(guò)程中不斷提升,計(jì)算機(jī)工業(yè)由此改變。在大家熟知的X86領(lǐng)域,處理器的技術(shù)進(jìn)步更是對(duì)世界產(chǎn)生重大的影響,作為PC機(jī)的核心,X86處理器事實(shí)上擔(dān)任起信息技術(shù)引擎的作用。
伴隨著X86處理器的性能提升,PC機(jī)可以完成越來(lái)越多的任務(wù):從最初的Basic到功能完善的DOS系統(tǒng),再到圖形化的Windows 95,從平面二維到3D環(huán)境渲染,從一個(gè)無(wú)聲的純視覺(jué)界面進(jìn)入到視覺(jué)、音頻結(jié)合的多媒體應(yīng)用,計(jì)算機(jī)實(shí)現(xiàn)彼此相互聯(lián)網(wǎng),龐大的Internet日漸完善,電子商務(wù)應(yīng)用從概念到全球流行;
與硬件技術(shù)高速發(fā)展相對(duì)應(yīng),PC應(yīng)用也朝向前所未有的深度和廣度拓展:視頻媒體轉(zhuǎn)向HDTV高清晰格式,3D渲染朝向電影畫(huà)質(zhì)進(jìn)發(fā),操作系統(tǒng)的人機(jī)界面也從2D的GUI進(jìn)入到三維時(shí)代,高速互聯(lián)網(wǎng)接入和無(wú)線技術(shù)方興未艾,應(yīng)用軟件越來(lái)越智能化,所有這些應(yīng)用都要求有高性能的處理器作為基礎(chǔ)。而除了應(yīng)用驅(qū)動(dòng)外,激烈的市場(chǎng)競(jìng)爭(zhēng)也成為微處理器業(yè)界競(jìng)相研發(fā)新技術(shù)、提高產(chǎn)品性能的主要推動(dòng)力。
在2006年,我們將看到具有卓越能源效率的英特爾Merom架構(gòu)出臺(tái),AMD則以雙通道DDR2-800支持與之抗衡,同時(shí)雙核心產(chǎn)品成為桌面和移動(dòng)芯片的新標(biāo)準(zhǔn),X86處理器進(jìn)入到性能躍升階段。
毋庸置疑,X86處理器已然成為計(jì)算機(jī)工業(yè)的主導(dǎo)力量,在高端服務(wù)器和嵌入領(lǐng)域廣泛使用的RISC處理器反而少被提起。事實(shí)上,RISC處理器一直都以遠(yuǎn)超X86產(chǎn)品的卓越性能和銳意進(jìn)取的技術(shù)創(chuàng)新著稱(chēng),幾乎所有先進(jìn)的設(shè)計(jì)技術(shù)都是首先出現(xiàn)在RISC領(lǐng)域,之后才被X86產(chǎn)品所借鑒。而換一個(gè)角度來(lái)看,RISC處理器領(lǐng)域的每一次技術(shù)創(chuàng)新又反過(guò)來(lái)對(duì)X86產(chǎn)品產(chǎn)生重大影響,因此,了解當(dāng)前RISC領(lǐng)域的尖端技術(shù)便意味著能夠明晰X86處理器的未來(lái)走向。
今天,微處理器全面轉(zhuǎn)向多核心體系,無(wú)論RISC芯片還是X86芯片皆是如此,不過(guò)我們?cè)诒疚闹兴榻B的并不是人們熟知的雙核心 Pentium D或者Athlon64 X2,而是當(dāng)前多核微處理器領(lǐng)域的最新技術(shù)成果以及面向未來(lái)的新穎概念,它們包括RISC領(lǐng)域的黑馬、P.A.Semi公司的PWRficient雙核處理器,SUN公司推出的 UltraSPARC T1八核心處理器,英特爾公司Many Core計(jì)劃的實(shí)質(zhì)以及AMD正在考慮的HyperTransport協(xié)處理器架構(gòu)。
在這同時(shí),我們也將向大家介紹各微處理器廠商對(duì)未來(lái)技術(shù)發(fā)展的不同理解,以及軟件業(yè)如何應(yīng)對(duì)為多核平臺(tái)編程的巨大挑戰(zhàn)。
高度整合的架構(gòu)
P.A.Semi公司的PWRficient處理器在去年微處理器論壇(MPF2005)上正式揭曉。對(duì)于P.A.Semi這個(gè)名字,相信所有人都感到陌生,這家專(zhuān)門(mén)從事RISC處理器設(shè)計(jì)的技術(shù)型企業(yè)成立于2003年,創(chuàng)始者都是微處理器業(yè)界的頂尖人物。其CEO曾負(fù)責(zé)Alpha服務(wù)器芯片和 StrongARM手持機(jī)芯片的開(kāi)發(fā);負(fù)責(zé)技術(shù)的副總裁科勒也曾從事Alpha芯片的開(kāi)發(fā),后來(lái)進(jìn)入AMD公司幫助定義了Opteron芯片的架構(gòu);另一負(fù)責(zé)架構(gòu)的副總裁皮特同樣曾為Alpha架構(gòu)服務(wù),在DEC公司發(fā)生的數(shù)次并購(gòu)中先后進(jìn)入康柏、惠普和英特爾。
在MPF2005論壇上,P.A.Semi公司對(duì)外公布其設(shè)計(jì)的雙核心PWRficient處理器,高度整合的設(shè)計(jì)令外界耳目一新,并兼具低功耗和高性能兩大特性。該公司同時(shí)表示,PWRficient彈性的架構(gòu)可被方便擴(kuò)展到八核心或用于超級(jí)計(jì)算機(jī)系統(tǒng),在高端服務(wù)器領(lǐng)域頗具競(jìng)爭(zhēng)力。
在設(shè)計(jì)PWRficient之時(shí),P.A.Semi面臨的第一個(gè)問(wèn)題就是指令系統(tǒng)的選擇,X86無(wú)疑更加流行、市場(chǎng)更廣闊,但該領(lǐng)域被英特爾、 AMD把持,機(jī)會(huì)有限,加上X86指令系統(tǒng)復(fù)雜低效,與PWRficient的高端定位相悖。P.A.Semi最終選擇了IBM的Power架構(gòu),這樣 PWRficient處理器便成為IBM Power大家族中的一個(gè)新成員。
但除此之外,PWRficient與IBM的Power芯片并沒(méi)有太多的共同點(diǎn),它擁有一套極富彈性的架構(gòu)、高度整合以及低功耗特性。 PWRficient主要定位在刀片服務(wù)器和低運(yùn)營(yíng)成本的服務(wù)器集群,P.A.Semi公司將英特爾的Sossaman Xeon處理器(Yonah架構(gòu))作為主要的競(jìng)爭(zhēng)對(duì)手。
我們先來(lái)看看PWRficient的系統(tǒng)架構(gòu),如圖1,我們可以看到,PWRficient與通常的處理器邏輯非常不同,除了CPU內(nèi)核和二級(jí)緩存外,它還包括一個(gè)名為ENVIO的智能型I/O子系統(tǒng)。換句話說(shuō),PWRficient上包含CPU和ENVIO I/O子系統(tǒng)等兩大邏輯,兩者通過(guò)一個(gè)名為CONEXIUM Interchage的高速交換總線聯(lián)結(jié)為一個(gè)有機(jī)系統(tǒng)。CPU部分為兩個(gè)代號(hào)為PA6T的64位Power CPU內(nèi)核,運(yùn)行頻率為2GHz。
與其他雙核芯片不同的是,PWRficient的每一個(gè) PA6T內(nèi)核都擁有自己的DDR2內(nèi)存控制器,但兩者是以相互獨(dú)立的模式而非組成共享的雙通道。此種設(shè)計(jì)的好處在于每個(gè)CPU內(nèi)核都能擁有屬于自己的內(nèi)存資源,最大限度降低內(nèi)存搶占的幾率。每個(gè)CPU內(nèi)核都可支持64位或32位模式運(yùn)作,具有諸如超標(biāo)量、亂序執(zhí)行、三發(fā)射等技術(shù)特性。另外,PA6T內(nèi)核也都直接整合了硬件級(jí)的虛擬技術(shù)支持,可以在多套系統(tǒng)同時(shí)運(yùn)行時(shí)仍保持出色的性能。
PA6T內(nèi)核整合了64KB指令緩存和64KB數(shù)據(jù)緩存,而兩個(gè)PA6T核心再共同分享2MB容量的二級(jí)緩存。PWRficient并沒(méi)有采用類(lèi)似Xeon的大緩存方案,原因就在于它的每個(gè)核心都有自己的內(nèi)存,出現(xiàn)內(nèi)存搶占的幾率遠(yuǎn)低于共享總線的落后設(shè)計(jì)。
兩個(gè)PA6T核心、2MB二級(jí)緩存和兩個(gè)DDR2內(nèi)存控制器都是通過(guò)CONEXIUM Interchage交換總線聯(lián)結(jié)為一體,如果未來(lái)有需要,也可以在這條交換總線上聯(lián)結(jié)四個(gè)內(nèi)核甚至八個(gè)內(nèi)核。但CONEXIUM的功能不僅于此,PWRficient處理器中的ENVOI I/O子系統(tǒng)也是通過(guò)這套總線與CPU邏輯直接通訊。與我們通常所見(jiàn)的固定模式不同,ENVOI相當(dāng)靈活且富有彈性,它直接整合了八個(gè)PCI Express控制器(每個(gè)控制器提供4GBps帶寬)、兩個(gè)10GbE網(wǎng)絡(luò)控制器(萬(wàn)兆以太網(wǎng))和四個(gè)GbE(千兆以太網(wǎng))控制器,這三部分I/O邏輯共享24對(duì)串行傳輸線路。
設(shè)備制造商可根據(jù)自身情況對(duì)這24對(duì)串行線路進(jìn)行靈活配置,例如在NAS網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)中,可以讓連接磁盤(pán)系統(tǒng)的PCI Express傳輸獲得更多線路資源,如果需要多端口的網(wǎng)絡(luò)訪問(wèn),那么便可以將線路資源朝向10GbE和GbE系統(tǒng)傾斜。這種高度彈性的架構(gòu)讓制造商擁有寬松的設(shè)計(jì)空間,可以根據(jù)企業(yè)的不同需要定制出最科學(xué)的服務(wù)器系統(tǒng)。而這種高度整合設(shè)計(jì)還有一個(gè)益處在于:無(wú)論是PCI Express系統(tǒng)還是網(wǎng)絡(luò)系統(tǒng),數(shù)據(jù)傳輸時(shí)的總線延遲都極短,進(jìn)而獲得卓越的數(shù)據(jù)傳輸效能。
評(píng)論