<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁(yè) > 新聞縱覽 > PC處理器用3D V-Cache堆緩存,現(xiàn)階段真的值得嗎?

          PC處理器用3D V-Cache堆緩存,現(xiàn)階段真的值得嗎?

          作者: 時(shí)間:2024-09-26 來源: 收藏
          最近AMD Ryzen R7 7800X3D突然又漲到了3000元往上的價(jià)格,不知道是臺(tái)積電一側(cè)3DIC先進(jìn)封裝工藝產(chǎn)能吃緊,還是需求側(cè)突然對(duì)這類帶更大LLC的處理器有了新需求。
          我們之前特別撰文探討過AMD的3D V-Cache技術(shù)。簡(jiǎn)單來說,這是一種通過3D先進(jìn)封裝來增加處理器L3 cache容量的技術(shù)——而且這個(gè)3D先進(jìn)封裝用的還是hybrid bonding混合鍵和這種難度系數(shù)和技術(shù)含量相對(duì)很高的方案,主要應(yīng)當(dāng)是考慮到帶寬和延遲需求。
          比如Ryzen 7800X3D把L3 cache堆到了96MB;更高規(guī)格的7900X3D、7950X3D,相比沒有用3D V-cache的常規(guī)版CPU,L3 cache都擴(kuò)容了1倍,達(dá)到128MB。服務(wù)器Epyc處理器這邊,8個(gè)CCD每片如果都往上疊3D V-ache,則總共能堆出768MB的L3 cache——比當(dāng)年的主存都大...
          堆更大的L3 cache自然有利于較大working set size的負(fù)載實(shí)現(xiàn)更高的性能。那具體是什么負(fù)載呢?其實(shí)早在2021年AMD面向PC推這種3D V-cache技術(shù)時(shí)就已經(jīng)明確了,這種型號(hào)后綴多了“3D”的Ryzen處理器主打游戲(Gaming)——拋開數(shù)據(jù)中心不談,至少在PC應(yīng)用場(chǎng)景內(nèi)就是如此。當(dāng)初在Ryzen 5000系列處理器發(fā)布時(shí),AMD就提過3D V-cache能讓游戲性能平均提升15%。
          會(huì)不會(huì)是因?yàn)椤逗谏裨挘何蚩铡氛?dāng)火熱,所以游戲市場(chǎng)周邊對(duì)此類帶3D V-cache的CPU產(chǎn)生了新一波的需求,帶動(dòng)了7800X3D, 7600X3D這類處理器價(jià)格的上漲呢?
          *測(cè)試平臺(tái):主板 (華碩TUF GAMING B650M-PLUS WIFI, MAG B760M MORTAR WIFI), 顯卡 (GeForce RTX 4070), 內(nèi)存 (DDR5-6000), 電源 (ANTEC 1000W), 操作系統(tǒng) (Windows 11 23H2); 下同…
          其實(shí)從測(cè)試數(shù)據(jù)來看,單就《黑神話:悟空》這一款游戲,Ryzen 7800X3D實(shí)際幀數(shù)表現(xiàn)是不及價(jià)格還略低的酷睿i7-14700KF的。以CPU為瓶頸的測(cè)試下(1080p 推薦畫質(zhì)),前者的幀率甚至比后者低了20%以上——當(dāng)然實(shí)際游玩過程,通常在畫質(zhì)選擇上以GPU為瓶頸,不會(huì)有這么大的差異。
          拋開近期Intel深陷的負(fù)面新聞不談,本文嘗試再說道說道3D V-cache在PC領(lǐng)域內(nèi)的價(jià)值,以及堆LLC是不是真的有那么神。
          有關(guān)3D V-cache技術(shù),及hybrid bonding先進(jìn)封裝,本文就不再多做贅述了。就制造和封裝角度來看,這稱得上是尖端技術(shù)在PC處理器上的應(yīng)用先驅(qū)。而本文主要把注意力集中到應(yīng)用上。
          文首提到的《黑神話:悟空》應(yīng)該說是個(gè)例。就綜合游戲性能而言,Ryzen 7800X3D還是表現(xiàn)出了不錯(cuò)的優(yōu)勢(shì)的——尤其是相較自家不帶V-cache的Ryzen 7800X。主要表現(xiàn)在一些L3 cache敏感型游戲,典型如《永劫無間》《Lol》《Dota 2》等;7800X3D都比酷睿i7-14700KF表現(xiàn)更優(yōu)。
          去年chipsandcheese.com/2023/04/23/amds-7950x3d-zen-4-gets-vcache/ >Chips and Cheese對(duì)3D V-cache版的AMD Ryzen處理器做了micro-benchmark。拋開3D V-cache帶來額外的延遲、些微帶寬降低不談,Chips and Cheese主要測(cè)了4款游戲,分別是《GHPC(Gunner, HEAT, PC)》《賽博朋克2077》《DCS(數(shù)字戰(zhàn)斗模擬)》《使命召喚17:黑色行動(dòng)冷戰(zhàn)》:主要是想看看加了V-cache,相較于沒有V-cache的核心,對(duì)游戲負(fù)載帶來了怎樣的影響。
          《賽博朋克2077》測(cè)試,來源:Chips and Cheese
          在《GHPC》游戲中,V-cache版核心相比不帶V-cache的核心,有著33%的L3 cache命中率提升(58.65%→78.00%),整體IPC提升在9.67%左右。《賽博朋克2077》游戲中,更大的L3 cache能夠達(dá)成13.4%的IPC領(lǐng)先(L3命中率45.99%→63.74%);《使命召喚17》的情況也類似,3D V-cache能夠獲得19%的IPC增長(zhǎng)(L3命中率46.51%→68.68%)——突有一種處理器架構(gòu)換代的即視感。
          對(duì)這三款游戲來說,L3 cache命中率的顯著提升完全能夠抵消3D V-cache更高的緩存延遲——而且Zen 4架構(gòu)增大了L2 cache的容量,很大程度也能緩解L3 cache延遲的增加。
          值得一提的是,《使命召喚》游戲過程中測(cè)得的IPC相比其他游戲更低。從更細(xì)粒度的管線各階段分析來看,Renamer寄存器重命名是其中瓶頸。V-cache的增加能夠顯著降低后端瓶頸——因?yàn)楦叩腸ache命中率也就能更好地喂給后端執(zhí)行單元;但它對(duì)前端性能改善較小。
          最后《DCS》的情況略有不同,L3命中率可提升幅度非常有限(89.06%→92.42%),此時(shí)3D V-cache更高的延遲開始發(fā)揮作用,相比不帶V-cache的標(biāo)準(zhǔn)核心,IPC些微落后了2.3%左右。其實(shí)考慮更多系統(tǒng)層面變量,這點(diǎn)變化可能并不足以較大程度影響游戲幀率;不過此例至少能夠說明,某些情況下,即便是在游戲場(chǎng)景內(nèi),緩存延遲的影響也大于容量。
          《DCS游戲測(cè)試》,來源:Chips and Cheese
          另外值得一提的是,更大的cache也不止能讓游戲受惠,還有文件壓縮(7-Zip)和視頻編碼(libx264)負(fù)載也能因此得到IPC提升。更具體的推薦去看一看Chips and Cheese的原文。只不過個(gè)別應(yīng)用場(chǎng)景的IPC提升,并不是故事的全部。
          Chips and Cheese的測(cè)試中,我們認(rèn)為比較有趣的是libx264視頻編碼測(cè)試。更大的L3 cache是能夠幫助提升視頻編解碼性能的,測(cè)試結(jié)果也明確L3命中率提升10%左右,IPC提升因此也有4.9%。但在絕對(duì)性能上,這項(xiàng)測(cè)試?yán)锊粠-cache的CPU核心性能優(yōu)于帶V-cache的核心。
          原因很簡(jiǎn)單,前者的核心頻率比后者高了7%;更高的IPC不足以彌補(bǔ)頻率缺失。這實(shí)際上在我們看來也成為3D V-cache的關(guān)鍵問題:有時(shí)不得不以更低的核心頻率和核心數(shù)為代價(jià),來?yè)Q取更大的L3 cache。
          我們知道,芯片設(shè)計(jì)是PPA權(quán)衡的藝術(shù),加上3D V-cache意味著更大的die size和成本,以及與計(jì)算單元的功耗資源分配權(quán)衡。
          同型號(hào)后綴是否帶3D對(duì)比,如7950X的核心基頻就比7950X3D高300Mhz??紤]價(jià)格,也就是芯片area面積因素:7950X3D目前京東售價(jià)4099元,而7950X的售價(jià)則為3449元——非官方的3D V-cache版CPU價(jià)格浮動(dòng)會(huì)更大。
          對(duì)用戶而言,這就是個(gè)錢究竟是花在cache上,還是花在核心數(shù)/頻率上的問題。要知道,現(xiàn)在7800X3D的價(jià)格是比7900X還高的。如果我們引入競(jìng)爭(zhēng)對(duì)手的產(chǎn)品,那么情況就更復(fù)雜了——但問題的本質(zhì)不變:錢是花在cache上,還是花在計(jì)算核心上。
          如文首所述,Ryzen 7800X3D目前的價(jià)格是3000元左右;酷睿i7-14700KF的價(jià)格2700元。前者有著更大的L3 cache容量,后者有著更多的計(jì)算核心資源。
          在更單純考察核心算力資源的情況下,參照Cinebench R23的單線程與多線程渲染測(cè)試結(jié)果,這兩顆處理器的情況是這樣的:
          另外,基于7800X3D的優(yōu)勢(shì)項(xiàng),嘗試集合實(shí)測(cè)性能下7800X3D表現(xiàn)不錯(cuò)的游戲有:
          這番對(duì)比大概更有——“你掏錢是愿意買更多核心/更高的頻率,還是愿意花在L3 cache上”——的意思。因?yàn)槲覀儫o法明確不同制造工藝及對(duì)應(yīng)芯片面積的成本差異,拋開市場(chǎng)對(duì)價(jià)格的影響因素,這個(gè)問題的答案大方向可能取決于,你用PC究竟是為了做什么。
          回到同Ryzen體系下的對(duì)比,去年AnandTech對(duì)Ryzen 7950X和7950X3D的評(píng)測(cè)顯示,由于前者有著更高的核心頻率及更寬松的TDP,在辦公、網(wǎng)頁(yè)、渲染、編碼等主流場(chǎng)景,以及涉及兼容性的老測(cè)試中,表現(xiàn)出了更優(yōu)的性能;科學(xué)與模擬仿真測(cè)試,兩者互有勝負(fù);
          游戲測(cè)試的情況則相對(duì)復(fù)雜:4K高分辨率下,性能瓶頸主要在GPU側(cè),7950X3D的勝率略高——只不過受制于GPU,幀率領(lǐng)先非常有限;2k分辨率下,7950X3D的勝率更高;1080p分辨率大約是7950X3D的主場(chǎng),在更多3A游戲中表現(xiàn)出色......
          簡(jiǎn)單來說,基于PC大眾使用場(chǎng)景,3D V-cache技術(shù)的價(jià)值主要表現(xiàn)在游戲應(yīng)用上——而其他主流應(yīng)用場(chǎng)景下,3D V-cache并沒有什么軟用,有時(shí)候甚至?xí)偷姑Α?/div>
          所以AMD對(duì)這項(xiàng)技術(shù)的定位,從5800X3D起就很明確了:游戲。只不過即便是在游戲測(cè)試場(chǎng)景內(nèi),如前文Chips and Cheese測(cè)試的《DCS》以及文首《黑神話:悟空》那樣,也總有些游戲?qū)嶋H是更吃高頻與核心算力——或者說資源堆在核心和頻率上更劃算。
          早就聽聞7800X3D是游戲神U,但實(shí)際跨品牌特別選擇一些游戲的話,酷睿i7-14700KF也是可以讓Ryzen 7800X3D的場(chǎng)面非常難看的,比如像下面這樣:
          一般在游戲過程中,CPU負(fù)責(zé)處理游戲邏輯、AI、物理計(jì)算等非圖形相關(guān)工作。這些任務(wù)也需要快速訪問數(shù)據(jù)。那么更大的CPU cache可存儲(chǔ)這些數(shù)據(jù),就比頻繁訪問更慢的主內(nèi)存更好。
          在與GPU協(xié)作的過程中,CPU準(zhǔn)備面向GPU的數(shù)據(jù)和指令;更大緩存也意味著指揮GPU的時(shí)間能減少。另外,有些游戲可充分利用CPU多核資源,更大的緩存也有利于核間數(shù)據(jù)共享,提升多線程游戲引擎的性能。
          那為什么從測(cè)試結(jié)果來看,3D V-cache對(duì)于部分游戲未能表現(xiàn)得很友好呢?我們猜測(cè)這里面還是有不同變量的。比如說Ryzen處理器基于chiplet方案,每8個(gè)核心為一片CCD(die)——比如對(duì)于7900X3D/7950X3D這樣的處理器而言,就需要兩片CCD。
          3D V-cache只位于其中一片CCD之上,另一片CCD上方是沒有V-cache的。這就造成了兩邊資源的不同,甚至頗有點(diǎn)“異構(gòu)”的意思。那么游戲究竟跑在哪邊的CCD上,就頗有講究了。這對(duì)驅(qū)動(dòng)提出了要求,檢測(cè)特定負(fù)載,決定它更需要cache,還是更需要高頻率——這甚至成為了一個(gè)調(diào)度問題。這一點(diǎn)可能會(huì)成為限制高效發(fā)揮CPU性能的一部分。
          另外,也不是所有游戲都對(duì)cache大小表現(xiàn)出敏感。如果程序本身就有更加可預(yù)測(cè)的存儲(chǔ)訪問模式,或者更小的working set,就不怎么會(huì)從更大容量的LLC獲得什么高收益。
          還有比較典型的事實(shí),部分策略類游戲和老游戲更吃單核性能——Intel此時(shí)就有顯著優(yōu)勢(shì)了。以及不同游戲自身的特性也決定了其性能瓶頸。
          比較典型的像是《微軟模擬飛行》。很多玩家應(yīng)該知道,這是個(gè)相當(dāng)吃CPU資源的游戲。這可能與其游戲性質(zhì)有關(guān):對(duì)實(shí)時(shí)天氣、物理、空中交通的模擬,是很吃CPU資源的;另外游戲內(nèi)有較多數(shù)量的對(duì)象——包括建筑、樹木、車輛等,也都增加了CPU負(fù)載;加上對(duì)象LOD,以及主線程追求更高的單線程性能...雜糅不同要素,酷睿i7-14700KF因此能在這款游戲中表現(xiàn)出顯著優(yōu)于Ryzen 7800X3D的性能。
          當(dāng)然了,在很多游戲場(chǎng)景下,3D V-cache仍然是表現(xiàn)出了性能優(yōu)勢(shì)的——這一點(diǎn)不應(yīng)被否認(rèn)。只不過就綜合性能角度考慮,3D V-cache的確是個(gè)需要被權(quán)衡的參考因素。
          從系統(tǒng)層面來看,包括游戲是否更依賴單核性能,游戲引擎面向硬件的架構(gòu)優(yōu)化,內(nèi)存延遲與帶寬表現(xiàn),以及游戲自身的特性都有關(guān)系?!度鎽?zhàn)爭(zhēng):三國(guó)》《騎馬與砍殺2》《GTA5》等游戲中,3D V-cache未能討到好處也就可以理解了。
          Intel在此間的某些變量要素都有優(yōu)勢(shì),包括單核性能、實(shí)際的內(nèi)存延遲和帶寬表現(xiàn)等。還有個(gè)關(guān)鍵,也在于兩顆處理器算力資源的不對(duì)等。
          總感覺對(duì)比酷睿i7-14700KF和Ryzen 7800X3D,某種程度上并不合理。從標(biāo)稱TDP功耗的角度來看,后者默認(rèn)TDP 120W——從AnandTech去年的實(shí)測(cè)來看,其實(shí)際和日常功耗更低;而前者允許的最大睿頻功耗是253W。
          拋開架構(gòu)、工藝之類的細(xì)節(jié)問題,從粗線條來看,前者是20核28線程的CPU,后者僅8核16線程。所以雖然雙方L3 cache資源不對(duì)等(33MB vs 96MB),計(jì)算資源實(shí)際也是不對(duì)等的。在游戲之外,很容易想見常見的生產(chǎn)力、渲染、內(nèi)容創(chuàng)作等測(cè)試,7800X3D的性能與14700KF不在一個(gè)維度。
          但仍然需要注意,從成本的角度來看,現(xiàn)在酷睿i7-14700KF就是比Ryzen 7800X3D要便宜的。雖然可能用不帶核顯的U來比價(jià)格也略失偏頗了,不過此處要表現(xiàn)的仍然是對(duì)應(yīng)成本下,硬件資源的選擇和權(quán)衡問題。
          如文首所述,不知是hybrid bonding成本高,還是終端產(chǎn)品更多受市場(chǎng)因素影響,3D V-cache現(xiàn)階段可是真的不便宜。單純?yōu)榱藗€(gè)別存儲(chǔ)敏感型游戲些微提升些幀數(shù),堆LLC真的值得嗎?
          最后多提一句,本文僅從PC角度來看現(xiàn)階段的3D V-cache處理器。實(shí)際上,我們認(rèn)為3D V-cache更大的價(jià)值在特定負(fù)載的數(shù)據(jù)中心市場(chǎng)——這大概也是最初AMD預(yù)設(shè)該技術(shù)的主場(chǎng)。不過這就是另一個(gè)話題了。
          Hybrid bonding自然是相當(dāng)一顆賽艇的技術(shù),必然成為HPC的未來;但在具體實(shí)施到PC處理器的3D V-cache上,可能對(duì)大部分人而言,現(xiàn)階段這都是個(gè)成本投入有些高、效率與成本效益都并不及預(yù)期的技術(shù)。




          關(guān)鍵詞:

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();