2016年CPU/GPU前景展望 誰會稱雄半導體業(yè)?
還有一點值得注意,不光Intel在推8核甚至10核處理器,AMD的Zen架構多核并行能力也有提高,桌面版首發(fā)時至少是4核8線程起步,中高端會是8核16線程,而服務器/工作站出現(xiàn)16核32線程甚至32核64線程也不要驚訝。
本文引用地址:http://www.ex-cimer.com/article/201602/286997.htm不論是Intel的10核處理器還是AMD的16核處理器,桌面處理器在突破6核、8核之后會繼續(xù)進入10核+時代,Intel Broadwell-E在前兩代突破8核之后已經(jīng)確定有10核20線程產(chǎn)品,AMD的Zen架構更加激進,8核16線程不是問題,是否會在桌面市場推出12核甚至16核的旗艦也令人期待。
3、PCI-E 4.0姍姍來遲,廠商自研新總線
伴隨著CPU、GPU計算性能的飛速增長,PCI-E總線也要有相應的準備,不過最新一代PCI-E 4.0總線技術已經(jīng)推遲了,原定于2015年上半年發(fā)布最終規(guī)范,但現(xiàn)在來看PCI-E 4.0總線可能要拖到2016年甚至2017年了。
新一代總線具備更高的性能,具體來說, 目前在用的PCI-E 3.0總線速率是8GT/s,Link帶寬8Tb/s,每一通道帶寬約為1GB/s,x16通道雙向帶寬32GB/s,而PCI-E 4.0在PCI-E 3.0基礎上保持架構不變,速率翻倍到16GT/s,通道帶寬提升到2GB/s,x16雙向帶寬高達64GB/s。
不過PCI-E 4.0面臨的問題也不少,除了銅介質速率繼續(xù)提升的技術難題之外,PCI-E 4.0最大的尷尬之處在于——桌面顯卡用不到這么高的帶寬,高性能計算領域PCI-E 4.0帶寬又不給力。前者很好說,因為從PCI-E 2.0到PCI-E 3.0時代,顯卡性能也沒有因此受益,PCI-E 3.0 x16帶寬已經(jīng)達到了32GB/s,目前的高端顯卡并不需要這么高的帶寬,而升級到PCI-E 4.0,64GB/s的帶寬對桌面顯卡來說也是浪費。
NVIDIA聯(lián)合IBM開發(fā)了NVLink總線技術
如果用到HPC領域,PCI-E 4.0帶寬的64GB/s又有點捉襟見肘了,等不及的廠商早已經(jīng)在暗地里開發(fā)新的總線技術,其中NVIDIA跟IBM聯(lián)合開發(fā)了NVLink總線,號稱帶寬是PCI-E總線的5-12倍,AMD也在開發(fā)自家的架構互聯(lián)技術,帶寬超過100GB/s。
無論AMD還是NVIDIA,他們開發(fā)的新總線技術帶寬可以輕松超過100GB/s,這對服務器產(chǎn)品很有用,但對桌面市場有什么意義呢?值得發(fā)燒友關注的就是多卡互聯(lián)技術,目前AMD、NVIDIA最多能做到的也就是4卡SLI/CF交火,有了NVLink這樣的技術,8卡SLI或者CF都是有可能的。
4、GPU架構、工藝升級:不僅拼性能,效能更重要
說完了CPU處理器,我們也不能忽視GPU處理器。作為當前PC中功耗最高的一部分,顯卡對游戲性能影響至關重要,但在性能越高=功耗越高這條路上,顯卡也面臨一個選擇——NVIDIA的Maxwell架構證明了顯卡性能增長的同時,能耗也可以很低。2016年的GPU不僅要性能,更重要的是效能,我們要看到還是每瓦性能比。
在Maxwell架構之后,NVIDIA將推出新一代的Pascal架構。根據(jù)官方在GTC 2015年大會上公布的資料,Pascal顯卡將支持3D Memory顯存,容量、帶寬可達普通顯存的2-4倍,而顯卡只有標準PCI-E顯卡的1/3大小。
Pascal顯卡會在2016年問世
至于AMD,由于目前的R200、R300系列顯卡大都還在使用GCN架構改款,制程工藝還是28nm工藝,能效方面已經(jīng)落后NVIDIA的Maxwell架構了,所以2016年AMD也會在GPU領域有大動作——推出了GCN 4.0架構Polaris,制程工藝升級到14/16nm FinFET,同時會搭配HBM 2顯存,號稱每瓦性能比提升一倍。
2016年AMD的GCN 4.0架構會大幅提升每瓦性能比
AMD還實際演示了Polaris顯卡的能效優(yōu)勢,之前使用用Polaris架構的一款中端顯卡跟NVIDIA的GTX 950做了對比,同樣是在1920x1080 60fps的性能上,Polaris顯卡的整機功耗是86W,而GTX 950整機功耗是140W,可見功耗優(yōu)勢非常非常大。
5、新一代高帶寬內存:HBM向左,HMC向右
2016年GPU要想提高性能、降低功耗,除了架構改進之外,新一代內存技術也功不可沒,其中AMD在去年的Fury顯卡上首次使用的HBM內存就是代表,NVIDIA所說的3D顯存其實也是HBM技術,不過是HBM 2代技術。與HBM競爭的則是美光主導的HMC內存技術。
HBM技術帶寬更高,功耗更低
對于HBM技術,我們之前做過詳細介紹:AMD詳解HBM顯存:性能遠超GDDR5,功耗降50%,面積小94%。簡單來說,HBM就是在GDDR5顯存無法繼續(xù)大幅提升頻率的情況下?lián)Q了一種思路,通過提高總線位寬來提高帶寬,第一代HBM顯存的頻率只有500MHz,等效1GHz,遠低于目前的GDDR5顯存,但帶寬高達128GB/s,4顆芯片總計可以帶來512GB/s的帶寬,遠高于主流GDDR5顯存。
2016年HBM 2代也來了,JEDEC已經(jīng)正式批準了HBM 2顯存規(guī)范,相比第一代HBM,HBM 2可堆棧的層數(shù)更多,單顆容量最高可達8GB,頻率也翻倍到2Gbps,帶寬從128GB/s提高到256GB/s,這樣一來布置4組HBM 2顯存就可以實現(xiàn)32GB容量、1TB/s的帶寬了,次之也有16GB容量,1TB/s帶寬,這正好與NVIDIA之前宣稱的數(shù)據(jù)相符。
HMC內存技術
HBM內存技術已經(jīng)得到了SK Hynix、三星等廠商的支持,另一個內存技術大腕美光的選擇不同——顯存市場他們繼續(xù)推改良版的GDDR5X,3D堆棧內存上則選擇了HMC(Hybrid Memory Cube),它跟HBM一樣都需要使用TSV工藝連接多層DRAM芯片。
性能方面,HMC閃存相比DDR內存依然有足夠多的優(yōu)勢,普通DDR3-1600內存雙通道帶寬不過12.8GB/s,美光之前宣稱HMC的性能是DDR3內存的20倍,單通道帶寬就有128GB/s(跟HBM 1代相同),同時功耗比DDR3減少70%,占用面積比DDR3減少95%。
HMC陣營實際上也有Intel、三星等其他公司參與,但目前力推HMC的基本上只有美光公司,他們現(xiàn)在推出了2/4GB容量的HMC內存,有兩種封裝,896-Ball BGA封裝的帶寬為160GB/s,666-Ball BGA封裝的帶寬是120GB/s。
Xeon Phi加速卡上的16GB板載緩存就是HMC技術的
具體應用方面,HMC在Intel的新一代Xeon Phi加速卡上露過面了,代號Knights Landing的Xeon Phi加速卡配備了16GB板載緩存,號稱5倍帶寬、5倍能效于DDR4內存,它就是美光提供的HMC內存。
不過總體來看,HMC相對HBM來說還有點滯后,HBM在新一代顯卡上站穩(wěn)腳跟沒問題,未來也會進入服務器等市場,HMC受到的支持力度不如HBM,不過3D內存技術現(xiàn)在還是新興事物,現(xiàn)在給HBM、HMC作出最終判決還有點為時過早。
總之,2016年半導體/處理器技術的進步首先要依賴工藝升級,雖然10nm及7nm工藝還有點遠,但2016年我們可以預期新一代處理器全面升級14/16nm FinFET工藝,這比去年的28nm、20nm工藝已經(jīng)有很大進步了。不論是AMD、Intel的CPU還是AMD、NVIDIA的GPU,F(xiàn)inFET工藝都會帶來20%以上的性能提升,30-40%的功耗降低,最終的CPU/GPU不僅性能更強,功耗也會大幅降低。
評論