第二代光追究竟有哪些提升?來(lái)看詳解
當(dāng)玩家之間還在探討20系顯卡的光線追蹤是否實(shí)用的時(shí)候,搭載第二代光線追蹤的30系顯卡來(lái)了。
本文引用地址:http://www.ex-cimer.com/article/202010/419431.htm第二代光線追蹤技術(shù)在NVIDIA的宣傳中相比上一代都做了哪些改進(jìn),今天筆者給大家通俗易懂的進(jìn)行簡(jiǎn)單介紹。
其實(shí),光線追蹤(Ray Tracing)的概念在很早就已經(jīng)被人所提出了。
光線追蹤技術(shù)其實(shí)就是將光源產(chǎn)生的光線所產(chǎn)生的折射,反射等光線變化和對(duì)陰影產(chǎn)生的反應(yīng)通過(guò)計(jì)算準(zhǔn)確的反映到畫(huà)面之中,為人們帶來(lái)百分之百的光影效果。
光線追蹤這一技術(shù)對(duì)于我們其實(shí)不難理解,畢竟在生活中隨處可見(jiàn),但應(yīng)用到圖形領(lǐng)域則其算法于1979年由Turner Whitted提出。
那么為什么直到2006年,皮克斯的《Cars》才開(kāi)始使用這項(xiàng)技術(shù)用于光線渲染呢?
那就是因?yàn)槠渌枰挠?jì)算量實(shí)在是過(guò)于龐大,上面提到的Turner這張512x512的渲染DEMO當(dāng)時(shí)支持的計(jì)算機(jī)就要耗費(fèi)上百萬(wàn)美元,還是花費(fèi)1.2小時(shí)才渲染完成,足見(jiàn)其耗費(fèi)的資源是如何巨大。
相較于初代的Turing RTX架構(gòu),NVIDIA Ampere架構(gòu)在算力上有著成倍的增長(zhǎng),同時(shí)新的架構(gòu)翻倍了光線與三角形的相交吞吐量,RT Core達(dá)到58 RT TFLOPS,而Turing為34 RT TFLOPS。
怎么理解上面這句話,首先要知道RT Core的工作原理是,著色器發(fā)出光線追蹤的請(qǐng)求,交給RT Core來(lái)處理。
它將進(jìn)行兩種測(cè)試,分別為邊界交叉測(cè)試(Box Intersection testing)和三角形交叉測(cè)試(Triangle Intersection testing)。
基于BVH算法來(lái)判斷,如果是方形,那么就返回縮小范圍繼續(xù)測(cè)試,如果是三角形,則反饋結(jié)果進(jìn)行渲染。
而光線追蹤最耗時(shí)的正是求交計(jì)算,因此,要提升光線追蹤性能,主要是對(duì)兩種求交(BVH/三角形求交)進(jìn)行加速。
在Turing的RT Core中,可以每個(gè)周期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一個(gè)新的三角形位置插值模塊以及一個(gè)的額外的三角形求交模塊,這樣做的目的是為了提升諸如運(yùn)動(dòng)模糊特效時(shí)候的光線追蹤性能。
再簡(jiǎn)單一點(diǎn),我們用示意圖來(lái)解釋光追,左邊是基本的光線追蹤流程,只需要考慮光線的方向,在得出需要追蹤的邊界體積后,再計(jì)算三角形的相交面,最后輸出結(jié)果。
如果要對(duì)運(yùn)動(dòng)模糊的過(guò)程進(jìn)行完整渲染,第一代RT Core則需要計(jì)算多個(gè)圖形,最終再進(jìn)行完整輸出。
而第二代RT Core可以讓光線追蹤與著色同時(shí)進(jìn)行,進(jìn)行的光線追蹤越多,加速就越快,它將光線相交的處理性能提升了一倍,在渲染有動(dòng)態(tài)模糊的影像時(shí),按照NVIDIA自己的實(shí)測(cè),比Turing快8倍。
所以在更為復(fù)雜的光線追蹤環(huán)境下,基于NVIDIA Ampere架構(gòu)的第二代RT Core相較上一代有著質(zhì)的飛躍,當(dāng)然只有光追核心的加強(qiáng)并不能帶來(lái)多少實(shí)際變化。
全新的NVIDIA Ampere GPU核心擁有280億個(gè)晶體管,628平方毫米的面積,基于三星的8nm NVIDIA定制工藝,來(lái)自美光的最新一代GDDR6X顯存。
除了硬件上的更新,在參數(shù)上,GeForce RTX 3080擁有8704個(gè)CUDA,相比上一代旗艦同樣有了翻倍的提升,頻率為1440-1710MHz,采用10GB GDDR6X顯存,位寬為320bit,顯存帶寬達(dá)到了760.3GB/s,光柵單元和紋理單元分別為96和272。
種種翻倍式的提升,共同構(gòu)成了有史以來(lái)性能最強(qiáng)大的GPU——NVIDIA Ampere。
而目前30系顯卡全球斷貨也從側(cè)面說(shuō)明了它的搶手,雖然供貨量不足是一方面,不過(guò)也只有當(dāng)產(chǎn)品足夠好的時(shí)候,才會(huì)有人關(guān)心它的供貨量,不然誰(shuí)會(huì)管呢?
評(píng)論