<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          關(guān) 閉

          新聞中心

          嵌入式流處理器

          作者: 時(shí)間:2006-12-06 來源:網(wǎng)絡(luò) 收藏
          由于半導(dǎo)體技術(shù)的不斷進(jìn)步和多媒體 數(shù)據(jù)應(yīng)用領(lǐng)域的不斷擴(kuò)大,像素幀巨大的處理應(yīng)用的計(jì)算機(jī)體系結(jié)構(gòu),在嵌入式應(yīng)用環(huán)境的體積與功耗的限制下,目前正面臨著三個(gè)要解決的關(guān)鍵問題。一是要解決千億次量級(jí)的運(yùn)算速度;二是由于現(xiàn)代的半導(dǎo)體技術(shù)的集成度已經(jīng)很高了,例如,中芯國(guó)際0.18mm的CMOS工藝在1cm2的芯片面積上可以集成40,000,000支晶體管,但由于芯片引出頭數(shù)目的增加是有限的,因此,必須解決引出頭的數(shù)目受限制的關(guān)鍵問題;三是由于多媒體數(shù)據(jù)處理幾乎沒有時(shí)間和空間局部性,一幅中的每個(gè)像素通常只是被訪問一次,因而不僅要解決運(yùn)算量大的問題,而且要解決處理器與存儲(chǔ)器之間的數(shù)據(jù)帶寬問題。

          國(guó)內(nèi)的處理器設(shè)計(jì)現(xiàn)在還主要處于功能仿制階段,有單位正在研制具有MMX指令的奔騰芯片,以及具有數(shù)據(jù)并行處理能力的TMS 320C6711等芯片。就數(shù)據(jù)并行性計(jì)算來說,高性能奔騰處理器是通過57條MMX指令來支持?jǐn)?shù)據(jù)并行性計(jì)算的,但其數(shù)據(jù)并行計(jì)算的程度是很低的,只能支持8個(gè)8位數(shù)據(jù),或4個(gè)16位數(shù)據(jù),或2個(gè)32位數(shù)據(jù)的數(shù)據(jù)并行計(jì)算。也有單位九五期間自主設(shè)計(jì)研制了含有64(8×8)個(gè)處理元的PE芯片,研制了具有4096個(gè)處理元的SIMD協(xié)處理器的處理機(jī)系統(tǒng)。但是,這些處理器還不能滿足像素幀巨大的嵌入式圖像處理應(yīng)用的要求。

          針對(duì)上述三個(gè)關(guān)鍵問題,近十多年來,國(guó)外對(duì)新一代多媒體處理器體系結(jié)構(gòu)進(jìn)行了廣泛的研究,有專用多媒體處理器、多媒體處理器、處理器以及流處理器等體系結(jié)構(gòu)。

            專用多媒體處理器

          針對(duì)三維圖形應(yīng)用,SGI公司研制了名為InfiniteReality的專用多媒體處理器系統(tǒng)(1997年公布)。它由4個(gè)專用的幾何引擎(Geometry Engine)和80?320個(gè)專用的圖像引擎(Image Engine)構(gòu)成,能提供每秒11,000,000次三角函數(shù)計(jì)算和每秒830,000,000個(gè)像素的處理。它是以存儲(chǔ)容量的冗余為代價(jià)來提高存儲(chǔ)器帶寬的。最近,NVIDIA公司研制了名為GeForce256的專用單芯片圖形處理器。該處理器能提供每秒15,000,000次峰值運(yùn)算和每秒480,000,000個(gè)像素處理。這些專用多媒體處理器的缺點(diǎn)是只要算法稍有變化,性能就會(huì)急劇下降。

            多媒體處理器

          Chromatic公司研制了名為Mpact的多媒體處理器(1996年公布),Philip公司研制了名為TriMedia(1996年公布)和VSP(1994年公布)的多媒體處理器。它們比專用圖形處理系統(tǒng)要靈活得多。Mpact多媒體處理器有一個(gè)4KB的全局寄存器文件(Register file),并且利用了高帶寬的Rambus DRAM來滿足3-D圖形處理對(duì)帶寬的需求。這個(gè)相當(dāng)大的全局寄存器文件,在很大程度上減小了圖形處理中對(duì)工作頁(yè)面進(jìn)行顯式緩存所需的帶寬量,進(jìn)而減少了對(duì)存儲(chǔ)器的訪問次數(shù)。在奔騰等高性能處理器中,通過MMX,MAX-2,和VIS,增加了多媒體擴(kuò)展,也就是增加了來自存儲(chǔ)器的預(yù)取流數(shù)據(jù),并利用這些處理器中可以得到的數(shù)據(jù)帶寬,增加了浮點(diǎn)數(shù)據(jù)類型SIMD操作,以支持?jǐn)?shù)據(jù)并行性。

            處理器

          處理器是通過向量操作來支持?jǐn)?shù)據(jù)并行性的處理器。為了有效地利用向量計(jì)算中的數(shù)據(jù)并行性,向量處理器的結(jié)構(gòu)通常包括向量寄存器文件、深度流水的ALU和一維的SIMD組織形式的多種組合。向量寄存器文件存儲(chǔ)的是數(shù)據(jù)向量,而不是單個(gè)的數(shù)據(jù)字,它們是在對(duì)向量進(jìn)行操作時(shí),順序地進(jìn)行傳送的。不僅圖像處理采用向量處理器技術(shù),當(dāng)前世界上處理速度最快的超級(jí)計(jì)算機(jī)——日本NEC的《地球仿真測(cè)試系統(tǒng)》,也是以0.15mm工藝實(shí)現(xiàn)的向量處理器為基礎(chǔ),由5120個(gè)向量處理器(共有640個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)有8個(gè)向量處理器)組成的。

            流處理器

          流處理器是直接將多媒體的圖形數(shù)據(jù)流映射到流處理器上進(jìn)行處理的,有和不可編程兩種。1995年公布的名為Cheops中的流處理器,是針對(duì)某一個(gè)特定的視頻處理功能而設(shè)計(jì)的一種不可編程的流處理器。但為了得到一定的靈活性,系統(tǒng)中也包含一個(gè)通用的可編程處理器。

          從1996年到2001年,MIT和Standford針對(duì)圖像處理的應(yīng)用,研制了名為Imagine 的可編程流處理器。Imagine流處理器沒有采用cache,而是采用一個(gè)流寄存器文件SRF(Stream Register File),作為流(主)存儲(chǔ)器與處理器寄存器之間的緩沖存儲(chǔ)器,來解決存儲(chǔ)器帶寬問題的。流存儲(chǔ)器與SRF之間的帶寬是2GB/s,SRF與處理器寄存器之間的帶寬是32GB/s, ALU簇(ALU Cluster)內(nèi)寄存器與ALU之間的帶寬是544GB/s,三種帶寬的比例關(guān)系為1:16:272。



          關(guān)鍵詞: 圖像 可編程 向量

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();