顯示卡的“心臟” GPU工作原理介紹
圖形處理器(英語(yǔ):Graphics Processing Unit,縮寫(xiě):gpu),又稱顯示核心、視覺(jué)處理器、顯示芯片,是一種專(zhuān)門(mén)在個(gè)人電腦、工作站、游戲機(jī)和一些移動(dòng)設(shè)備(如平板電腦、智能手機(jī)等)上圖像運(yùn)算工作的微處理器。
本文引用地址:http://www.ex-cimer.com/article/201610/311447.htm用途是將計(jì)算機(jī)系統(tǒng)所需要的顯示信息進(jìn)行轉(zhuǎn)換驅(qū)動(dòng),并向顯示器提供行掃描信號(hào),控制顯示器的正確顯示,是連接顯示器和個(gè)人電腦主板的重要元件,也是“人機(jī)對(duì)話”的重要設(shè)備之一。顯卡作為電腦主機(jī)里的一個(gè)重要組成部分,承擔(dān)輸出顯示圖形的任務(wù),對(duì)于從事專(zhuān)業(yè)圖形設(shè)計(jì)的人來(lái)說(shuō)顯卡非常重要。
gpu由于歷史原因,是為了視頻游戲而產(chǎn)生的(至今其主要驅(qū)動(dòng)力還是不斷增長(zhǎng)的視頻游戲市場(chǎng)),在三維游戲中常常出現(xiàn)的一類(lèi)操作是對(duì)海量數(shù)據(jù)進(jìn)行相同的操作,如:對(duì)每一個(gè)頂點(diǎn)進(jìn)行同樣的坐標(biāo)變換,對(duì)每一個(gè)頂點(diǎn)按照同樣的光照模型計(jì)算顏色值。
gpu的眾核架構(gòu)非常適合把同樣的指令流并行發(fā)送到眾核上,采用不同的輸入數(shù)據(jù)執(zhí)行。在 2003-2004年左右,圖形學(xué)之外的領(lǐng)域?qū)<议_(kāi)始注意到gpu與眾不同的計(jì)算能力,開(kāi)始嘗試把gpu用于通用計(jì)算(即GPgpu)。之后NVIDIA發(fā)布了CUDA,amd和等公司也發(fā)布了OpenCL,gpu開(kāi)始在通用計(jì)算領(lǐng)域得到廣泛應(yīng)用,包括:數(shù)值分析,海量數(shù)據(jù)處理(排序,Map- Reduce等),金融分析等等。
簡(jiǎn)而言之,當(dāng)程序員為cpu編寫(xiě)程序時(shí),他們傾向于利用復(fù)雜的邏輯結(jié)構(gòu)優(yōu)化算法從而減少計(jì)算任務(wù)的運(yùn)行時(shí)間,即Latency。當(dāng)程序員為gpu編寫(xiě)程序時(shí),則利用其處理海量數(shù)據(jù)的優(yōu)勢(shì),通過(guò)提高總的數(shù)據(jù)吞吐量(Throughput)來(lái)掩蓋 Lantency。目前,cpu和gpu的區(qū)別正在逐漸縮小,因?yàn)間pu也在處理不規(guī)則任務(wù)和線程間通信方面有了長(zhǎng)足的進(jìn)步。另外,功耗問(wèn)題對(duì)于gpu比cpu更嚴(yán)重。
gpu是顯示卡的“心臟”,也就相當(dāng)于cpu在電腦中的作用,它決定了該顯卡的檔次和大部分性能,同時(shí)也是2D顯示卡和3D顯示卡的區(qū)別依據(jù)。
2D顯示芯片在處理3D圖像和特效時(shí)主要依賴cpu的處理能力,稱為“軟加速”。3D顯示芯片是將三維圖像和特效處理功能集中在顯示芯片內(nèi),也即所謂的“硬件加速”功能。顯示芯片通常是顯示卡上最大的芯片(也是引腳最多的)。gpu使顯卡減少了對(duì)cpu的依賴,并進(jìn)行部分原本cpu的工作,尤其是在3D圖形處理時(shí)。gpu所采用的核心技術(shù)有硬體T&L、立方環(huán)境材質(zhì)貼圖和頂點(diǎn)混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等,而硬體T&L技術(shù)可以說(shuō)是gpu的標(biāo)志。
gpu工作原理-工作原理
簡(jiǎn)單的說(shuō)gpu就是能夠從硬件上支持T&L(Transform and LighTIng,多邊形轉(zhuǎn)換與光源處理)的顯示芯片,因?yàn)門(mén)&L是3D渲染中的一個(gè)重要部分,其作用是計(jì)算多邊形的3D位置和處理動(dòng)態(tài)光線效果,也可以稱為“幾何處理”。一個(gè)好的T&L單元,可以提供細(xì)致的3D物體和高級(jí)的光線特效;只不過(guò)大多數(shù)PC中,T&L的大部分運(yùn)算是交由cpu處理的(這就也就是所謂的軟件T&L),由于cpu的任務(wù)繁多,除了T&L之外,還要做內(nèi)存管理、輸入響應(yīng)等非3D圖形處理工作,因此在實(shí)際運(yùn)算的時(shí)候性能會(huì)大打折扣,常常出現(xiàn)顯卡等待cpu數(shù)據(jù)的情況,其運(yùn)算速度遠(yuǎn)跟不上今天復(fù)雜三維游戲的要求。即使cpu的工作頻率超過(guò) 1GHz或更高,對(duì)它的幫助也不大,由于這是PC本身設(shè)計(jì)造成的問(wèn)題,與cpu的速度無(wú)太大關(guān)系。
gpu圖形處理,可以大致分成 5 個(gè)步驟,如下圖箭頭的部分。分別為 vertex shader、primiTIve processing、rasterisaTIon、fragment shader、tesTIng and blending。
第一步,vertex shader。是將三維空間中數(shù)個(gè)(x,y,z)頂點(diǎn)放進(jìn) gpu 中。在這一步驟中,電腦會(huì)在內(nèi)部模擬出一個(gè)三維空間,并將這些頂點(diǎn)放置在這一空間內(nèi)部。接著,投影在同一平面上,也是我們將看到的畫(huà)面。同時(shí),存下各點(diǎn)距離投影面的垂直距離,以便做后續(xù)的處理。
這個(gè)過(guò)程就像是本地球觀看星星一般。地球的天空,就像是一個(gè)投影面,所有的星星,不管遠(yuǎn)近皆投影在同一面上。本地球的我們,抬起頭來(lái)觀看星星,分不出星星的遠(yuǎn)近,只能分辨出亮度。gpu 所投影出的結(jié)果,和這個(gè)情況類(lèi)似。
從地球所看到的星空,星星就像是投影到一球面上,除非使用特別的儀器,不然分不出星星和地球的距離
第二步,primitive processing。是將相關(guān)的點(diǎn)鏈接在一起,以形成圖形。在一開(kāi)始輸入數(shù)個(gè)頂點(diǎn)進(jìn)入 gpu 時(shí),程序會(huì)特別注記哪些點(diǎn)是需要組合在一起,以形成一線或面。就像是看星座的時(shí)候一樣,將相關(guān)連的星星連起來(lái),形成特定的圖案。
第三步,rasterisation。因?yàn)殡娔X的屏幕是由一個(gè)又一個(gè)的像素組成,因此,需要將一條連續(xù)的直線,使用繪圖的演算法,以方格繪出該直線。圖形也是以此方式,先標(biāo)出邊線,再用方格填滿整個(gè)平面。
第四步,fragment shader。將格點(diǎn)化后的圖形著上顏色。所需著上的顏色也是于輸入時(shí)便被注記。在游玩游戲時(shí),這一步相當(dāng)耗費(fèi) gpu 的計(jì)算資源,因?yàn)楣庥暗男Ч?、物體表面材質(zhì)皆是在這一步進(jìn)行,這些計(jì)算決定著游戲畫(huà)面的精細(xì)程度。因此在游玩游戲時(shí),調(diào)高游戲畫(huà)面品質(zhì)大幅增加這一步的計(jì)算負(fù)擔(dān),降低游戲品質(zhì)。
將一個(gè)三角形,用方格呈現(xiàn)近似原始圖案,并著上顏色。一塊又一塊的方格,就是顯示器上的像素
最后一步,testing and blending。便是將第一步所獲得的投影垂直距離取出,和第四步的結(jié)果一同做最后處理。在去除被會(huì)被其他較近距離的物體擋住的物體后,讓剩下的圖形放進(jìn) gpu 的輸出內(nèi)存。之后,結(jié)果便會(huì)被送到電腦屏幕顯示。
評(píng)論