<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于TI C6000系列DSP的C/C++程序優(yōu)化技術(shù)

          基于TI C6000系列DSP的C/C++程序優(yōu)化技術(shù)

          作者: 時(shí)間:2009-06-16 來源:網(wǎng)絡(luò) 收藏

          3.2.3 內(nèi)聯(lián)函數(shù)
          通過下面的方法改進(jìn)C語言,可使編譯出的代碼性能顯著提高:
          (1)使用intrinsics(內(nèi)聯(lián)函數(shù))替代復(fù)雜的C/C++代碼;
          (2)使用字(Word)訪問存放在32位寄存器的高16位和低16位字段的數(shù)據(jù);
          (3)使用雙字訪問存放在64位寄存器的32位數(shù)據(jù)(僅指C64xx/C67XX)。
          編譯器提供了許多內(nèi)聯(lián)函數(shù),它們直接對(duì)應(yīng)著C62X/C64X/C67X指令可快速C代碼。這些內(nèi)聯(lián)函數(shù)不易用C/C++語言實(shí)現(xiàn)其功能。內(nèi)聯(lián)函數(shù)用前下劃線“_”特別標(biāo)示,其使用方法與調(diào)用函數(shù)一樣。例如C語言的飽和加法只能寫為需要多周期的函數(shù):


          這段復(fù)雜的代碼可以用_sadd()內(nèi)聯(lián)函數(shù)實(shí)現(xiàn),它是一個(gè)單周期的C6x指令。
          result=_sadd(a,b);
          要提高數(shù)據(jù)處理率,應(yīng)使一條Load/Store指令能訪問多個(gè)數(shù)據(jù)。有與內(nèi)聯(lián)函數(shù)相關(guān)的指令,例如_add2(),_mpyhl(),_mpylh()等,這些操作數(shù)以16位數(shù)據(jù)形式存儲(chǔ)在32位寄存器的高位部分和低位部分。當(dāng)需要對(duì)一連串短型數(shù)據(jù)進(jìn)行操作時(shí),可使用字1次訪問2個(gè)短型數(shù)據(jù),然后使用C6000相應(yīng)指令來處理數(shù)據(jù)。相似的在C64x或C67x中,有時(shí)需要執(zhí)行64位的LDDW來訪問兩個(gè)32位數(shù)據(jù),4個(gè)16位數(shù)據(jù),甚至8個(gè)8位數(shù)據(jù)。
          3.2.4 循環(huán)展開
          循環(huán)展開是改進(jìn)性能的另一種,即把小循環(huán)的迭代展開,以讓循環(huán)的每次迭代出現(xiàn)在代碼中。這種方法可增加并行執(zhí)行的指令數(shù)。當(dāng)每次迭代操作沒有充分利用C6000結(jié)構(gòu)的所有資源時(shí),可使用循環(huán)展開提高性能。
          有3種使循環(huán)展開的方法:
          (1)編譯器自動(dòng)執(zhí)行循環(huán)展開;
          (2)在中使用UNROLL偽指令建議編譯器做循環(huán)展開;
          (3)用戶自己在C/C++代碼中展開。
          3.3 匯編
          在對(duì)C/C++代碼使用了所有的C/C++優(yōu)化手段之后,如果仍然不滿意代碼的性能,就可以寫線性匯編程序,然后用匯編優(yōu)化器進(jìn)行優(yōu)化,生成高性能的代碼。
          3.3.1 寫線性匯編
          使用C6000的剖析工具(Profiling Tools)可以找到代碼中最耗費(fèi)時(shí)間的部分,就是這部分需要用線性匯編重寫。線性匯編代碼與匯編源代碼相似,但是,線性匯編代碼中沒有指令延遲和寄存器使用信息。這樣做的目的是由匯編優(yōu)化器來為自己設(shè)定這些信息。
          寫線性匯編代碼時(shí),需要知道:匯編優(yōu)化器偽指令、影響匯編優(yōu)化器行為的選項(xiàng)、TMS320C6000指令、線性匯編源語句語法、指定寄存器或寄存器組、指定功能單元、源代碼注釋等。
          3.3.2 匯編優(yōu)化器優(yōu)化
          匯編優(yōu)化器的任務(wù)主要有:
          (1)編排指令,最大限度的利用C6000的并行能力;
          (2)確保指令滿足C6000的延遲要求(Latency Requirements);
          (3)為源代碼分配寄存器。


          4 結(jié) 語
          C6000 C/c++代碼優(yōu)化比傳統(tǒng)的代碼優(yōu)化要方便的多,但要真正發(fā)揮其芯片的工作效率還是需要一定的經(jīng)驗(yàn)和技巧。這不僅要求開發(fā)人員熟悉其硬件體系,還要求對(duì)編譯器的編譯原理有一定的理解。另外,在C語言層面上要達(dá)到芯片的峰值即8條指令并行是很難的,大多情況下都只能達(dá)到6.7條指令并行。在實(shí)際開發(fā)中,若優(yōu)化結(jié)果已達(dá)到6,7條指令并行卻還離實(shí)時(shí)的要求相差很遠(yuǎn),再花大量的人力去力求達(dá)到8條指令并行是不經(jīng)濟(jì)的,此時(shí)應(yīng)該考慮其他的改進(jìn)或策略上的調(diào)整以求達(dá)到目的。


          上一頁 1 2 3 下一頁

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();