萬元頂級(jí)旗艦降臨！RTX 3090首發(fā)評(píng)測：沒想到這么能超

作者：時(shí)間：2020-09-26 來源：快科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

前言：安培頂級(jí)旗艦降臨價(jià)格達(dá)1.2萬

本文引用地址：http://www.ex-cimer.com/article/202009/418814.htm

或許很多同學(xué)對(duì)于這一次RTX 3080/3090在流處理器數(shù)量上翻倍的提升感到不可思議。畢竟從2013年的GTX 780 Ti到2019年的Titan RTX，流處理器數(shù)量僅僅只是從2880個(gè)提升到了4608個(gè)。也就是整整6年的時(shí)間，流處理器數(shù)量僅僅只是增加了60%而已。

而此次完整的GA102核心竟然有10752個(gè)流處理器，相當(dāng)于 Titan RTX的2.33倍，如此巨大的提升的確是很多年沒有出現(xiàn)過了！

PS：上一次N卡大幅提升流處理器是8年前的GTX 680，1536個(gè)流處理器數(shù)量是GTX 580的三倍，性能則提升了30%！

相較上一代圖靈構(gòu)架的RTX 20系列顯卡，安培構(gòu)架主要帶來的如下改進(jìn)：

1、8nm制程工藝：

圖靈構(gòu)架使用的三星12FFN工藝，在754mm2的面積內(nèi)集成了186億只晶體管。安培構(gòu)架使用的是三星8N工藝，在628mm2的芯片內(nèi)部集成了280億只晶體管。算下來晶體管密度提升了83%之多。

2、整合INT32與FP32單元：

圖靈的INT32單元只能做整數(shù)運(yùn)算，閑置率很高。為了解決這個(gè)問題，提升INT32單元的利用率，NVIDIA改進(jìn)了INT32單元，使之不僅可以運(yùn)行整數(shù)運(yùn)算，也能進(jìn)行單精度浮點(diǎn)運(yùn)算，相當(dāng)于整合了INT32和FP32單元，因而使得以FP32單元計(jì)數(shù)的GPU流處理器數(shù)量直接翻倍，單精度浮點(diǎn)性能也同樣翻倍。

3、將ROP單元從內(nèi)存控制器中分離：

傳統(tǒng)的ROP單元被集成在內(nèi)存控制器中，閹割GPU位寬會(huì)降低ROP單元數(shù)量。而安培構(gòu)架將ROP單元變成了GPC的一部分，每個(gè)GPC含有16個(gè)ROP單元，只要GPC數(shù)量不被閹割，ROP單元數(shù)量就不會(huì)減少。

比如即將發(fā)布的RTX 3070與RTX 3080一樣都有6組GPC，ROP單元數(shù)量同樣都是96個(gè)。

4、第二代RT Core：

NVIDIA通過提升插值算法，提升了光線追蹤技術(shù)在動(dòng)態(tài)模糊效果下的精確度，使得安培構(gòu)架的光追性能得到了翻倍提升。第一代RT Core可以提供10Giga Rays/s的性能，第二代RT Core可以達(dá)到20Giga Rays/s。

5、第三代Tensor Core：

第三代Tensor Core的效率是第二代的4倍，即便安培構(gòu)架將每個(gè)SM中的Tensor Core減半，它依然能達(dá)到圖靈2倍的效能。

萬元頂級(jí)旗艦降臨！RTX 3090首發(fā)評(píng)測：沒想到這么能超

6、RTX IO技術(shù)：

這項(xiàng)技術(shù)可以讓游戲在加載時(shí)完全規(guī)避CPU，直接將游戲數(shù)據(jù)包從SSD寫入到GPU的顯存中，由GPU替代CPU進(jìn)行數(shù)據(jù)解包。GPU的整數(shù)/浮點(diǎn)性能數(shù)十倍于CPU，可以瞬間完成數(shù)據(jù)的解包工作。

不過這項(xiàng)技術(shù)需要微軟DirectStorage API的支持，預(yù)計(jì)2022年會(huì)正式開始應(yīng)用。

除了以上技術(shù)之外，安培構(gòu)架還支持PCIe 4.0、NVIDIA Reflex等技術(shù)，就不再一一敘述了。

9月初，NVIDIA一共發(fā)布了3款GA10X核心的顯卡型號(hào)，此前已經(jīng)解禁了RTX 3080，今天我們將向大家展示位于頂端的RTX 3090的詳盡性能評(píng)測。

萬元頂級(jí)旗艦降臨！RTX 3090首發(fā)評(píng)測：沒想到這么能超

RTX 3090基于GA102-300-A1核心，擁有7組GPC，82組SM單元共計(jì)10496個(gè)流處理器、112個(gè)ROP、328個(gè)紋理單元、328個(gè)第三代Tensor Cores、82個(gè)第二代RT Cores。搭配24GB GDDR6X顯存，顯存頻率19.5GHz、位寬384Bit、帶寬936GB/s。

由于此次NVIDIA并未提供公版的RTX 3090 Founder Edition，我們拿規(guī)格與之完全一致的影馳RTX 3090金屬大師來進(jìn)行測試。

萬元頂級(jí)旗艦降臨！RTX 3090首發(fā)評(píng)測：沒想到這么能超
影馳RTX 3090金屬大師GPU-Z截圖

RTX 3090的詳細(xì)規(guī)格如下：

對(duì)比RTX 3080，RTX 3090的流處理器數(shù)量、Tensor Core、 ROP單元、顯存帶寬、紋理單元都提升了20%左右。

TDP也從RTX 3080的320W進(jìn)一步提高到了350W，這恐怖是有史以來TDP最高的單芯片N卡。

新聞中心

萬元頂級(jí)旗艦降臨！RTX 3090首發(fā)評(píng)測：沒想到這么能超

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)