萬元頂級(jí)旗艦降臨!RTX 3090首發(fā)評(píng)測:沒想到這么能超
前言:安培頂級(jí)旗艦降臨 價(jià)格達(dá)1.2萬
本文引用地址:http://www.ex-cimer.com/article/202009/418814.htm或許很多同學(xué)對(duì)于這一次RTX 3080/3090在流處理器數(shù)量上翻倍的提升感到不可思議。畢竟從2013年的GTX 780 Ti到2019年的Titan RTX,流處理器數(shù)量僅僅只是從2880個(gè)提升到了4608個(gè)。也就是整整6年的時(shí)間,流處理器數(shù)量僅僅只是增加了60%而已。
而此次完整的GA102核心竟然有10752個(gè)流處理器,相當(dāng)于 Titan RTX的2.33倍,如此巨大的提升的確是很多年沒有出現(xiàn)過了!
PS:上一次N卡大幅提升流處理器是8年前的GTX 680,1536個(gè)流處理器數(shù)量是GTX 580的三倍,性能則提升了30%!
相較上一代圖靈構(gòu)架的RTX 20系列顯卡,安培構(gòu)架主要帶來的如下改進(jìn):
1、8nm制程工藝:
圖靈構(gòu)架使用的三星12FFN工藝,在754mm2的面積內(nèi)集成了186億只晶體管。安培構(gòu)架使用的是三星8N工藝,在628mm2的芯片內(nèi)部集成了280億只晶體管。算下來晶體管密度提升了83%之多。
2、整合INT32與FP32單元:
圖靈的INT32單元只能做整數(shù)運(yùn)算,閑置率很高。為了解決這個(gè)問題,提升INT32單元的利用率,NVIDIA改進(jìn)了INT32單元,使之不僅可以運(yùn)行整數(shù)運(yùn)算,也能進(jìn)行單精度浮點(diǎn)運(yùn)算,相當(dāng)于整合了INT32和FP32單元,因而使得以FP32單元計(jì)數(shù)的GPU流處理器數(shù)量直接翻倍,單精度浮點(diǎn)性能也同樣翻倍。
3、將ROP單元從內(nèi)存控制器中分離:
傳統(tǒng)的ROP單元被集成在內(nèi)存控制器中,閹割GPU位寬會(huì)降低ROP單元數(shù)量。而安培構(gòu)架將ROP單元變成了GPC的一部分,每個(gè)GPC含有16個(gè)ROP單元,只要GPC數(shù)量不被閹割,ROP單元數(shù)量就不會(huì)減少。
比如即將發(fā)布的RTX 3070與RTX 3080一樣都有6組GPC,ROP單元數(shù)量同樣都是96個(gè)。
4、第二代RT Core:
NVIDIA通過提升插值算法,提升了光線追蹤技術(shù)在動(dòng)態(tài)模糊效果下的精確度,使得安培構(gòu)架的光追性能得到了翻倍提升。第一代RT Core可以提供10Giga Rays/s的性能,第二代RT Core可以達(dá)到20Giga Rays/s。
5、第三代Tensor Core:
第三代Tensor Core的效率是第二代的4倍,即便安培構(gòu)架將每個(gè)SM中的Tensor Core減半,它依然能達(dá)到圖靈2倍的效能。
6、RTX IO技術(shù):
這項(xiàng)技術(shù)可以讓游戲在加載時(shí)完全規(guī)避CPU,直接將游戲數(shù)據(jù)包從SSD寫入到GPU的顯存中,由GPU替代CPU進(jìn)行數(shù)據(jù)解包。GPU的整數(shù)/浮點(diǎn)性能數(shù)十倍于CPU,可以瞬間完成數(shù)據(jù)的解包工作。
不過這項(xiàng)技術(shù)需要微軟DirectStorage API的支持,預(yù)計(jì)2022年會(huì)正式開始應(yīng)用。
除了以上技術(shù)之外,安培構(gòu)架還支持PCIe 4.0、NVIDIA Reflex等技術(shù),就不再一一敘述了。
9月初,NVIDIA一共發(fā)布了3款GA10X核心的顯卡型號(hào),此前已經(jīng)解禁了RTX 3080,今天我們將向大家展示位于頂端的RTX 3090的詳盡性能評(píng)測。
RTX 3090基于GA102-300-A1核心,擁有7組GPC,82組SM單元共計(jì)10496個(gè)流處理器、112個(gè)ROP、328個(gè)紋理單元、328個(gè)第三代Tensor Cores、82個(gè)第二代RT Cores。搭配24GB GDDR6X顯存,顯存頻率19.5GHz、位寬384Bit、帶寬936GB/s。
由于此次NVIDIA并未提供公版的RTX 3090 Founder Edition,我們拿規(guī)格與之完全一致的影馳RTX 3090金屬大師來進(jìn)行測試。
RTX 3090的詳細(xì)規(guī)格如下:
對(duì)比RTX 3080,RTX 3090的流處理器數(shù)量、Tensor Core、 ROP單元、顯存帶寬、紋理單元都提升了20%左右。
TDP也從RTX 3080的320W進(jìn)一步提高到了350W,這恐怖是有史以來TDP最高的單芯片N卡。
評(píng)論