<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 模擬技術 > 設計應用 > 探索強勁性能的秘密（一）

探索強勁性能的秘密（一）

作者：時間：2013-09-28 來源：網(wǎng)絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

收藏

今年的新手機趨勢無異是全面向四核靠攏，不過同樣是四核，在實際的性能上其實是千差萬別。例如針對入門級主流市場的四核手機普遍采用的都是Cortex-A7以及 Cortex-A9 級別的CPU內(nèi)核，這類內(nèi)核性能、成本以及發(fā)熱都會較低，因此在入門市場上大行其道。

　　而在高端智能手機中則出現(xiàn)了一些新的變化，除了去年就已經(jīng)嶄露頭角的高通Krait系列架構四核外，ARM正統(tǒng)的Cortex-A15也開始走上了四核手機的舞臺，例如三星的Exynos 5 Octa、NVIDIA 的Tegra 4。

　　Cortex-A15是ARM Cortex-A家族中目前最強勁的CPU內(nèi)核架構，發(fā)布時間為2010年，德州儀器是最早（2011年）投產(chǎn)基于該架構處理器（型號為OMAP 5）的授權廠商。

探索強勁性能的秘密（一）

　　和ARM的Cortex-A7、Cortex-A9等微架構相比，Cortex-A15有很大的不同。

　　A15和A9同樣具備亂序執(zhí)行，但是Cortex-A15具備（兩倍）的指令發(fā)射端口和執(zhí)行資源，指令解碼能力也要高出50%，動態(tài)分支預測能力更強（采用了多層級分支表緩存），指令拾取帶寬更強（128 bit vs 64 bit），這些都能讓A15的流水線執(zhí)行具備更高的效率。除此以外，A15采用了VFPv4浮點單元設計，能執(zhí)行FMA指令以及硬件除法指令，相較而言A9的峰值向量浮點性能基本上只有A15的一半。

　　不過在現(xiàn)實中，A15 的對手應該是高通自行設計的 ARMv7A 兼容處理器架構 Krait。高通對 Krait 的架構細節(jié)透露并不是很多，大致上就是 3 個指令解碼端口（和 A15 一樣）、7個指令發(fā)射端口（A15 是8個）、4個發(fā)射端口（A15 是8個），具備4KB+4KB的單周期時延L0 Cache設計。

　　如果采用老掉牙的Dhrystone DMIPS/MHz作為性能衡量指標，Krait 是3.3，A9 是2.5，而A15則是3.5，從紙面上看Krait的確非常適合作為A15的對手。

　　不過Dhrystone的缺點是顯而易見，它是完全可以塞進CPU的L1 cache里執(zhí)行，這就意味著無法以此對L2 cache（A15是一體化設計，Krait是分離式設計，一體化設計可以減少內(nèi)存交換導致的大量時延）、亂序執(zhí)行的硬件效率/復雜性、內(nèi)存子系統(tǒng)單元（A15的內(nèi)存單元可以實現(xiàn)在一定條件下預執(zhí)行一條加載指令，而Krait能否具備這樣的能力尚不清楚）等諸多體系架構區(qū)別對實際性能的影響作出有價值評估。

　　當然，ARM采用的DMIPS指標實際上并非28年前的那個Dhrystone，而是來自EEBMC Coremark（其實 Coremark 就是前者的改善版本，主要是為了減少預優(yōu)化、對測試有比較嚴格的規(guī)則），但是CoreMark同樣可以塞進現(xiàn)今大多數(shù)處理器的L1 cache里，Dhrystone不能反映現(xiàn)今移動設備真實應用的問題在這里依然存在。

　　由于應用環(huán)境日趨復雜，要正確評估一個移動設備處理器的性能變得越來越復雜，因為現(xiàn)在的移動設備跑的網(wǎng)頁瀏覽、三維游戲、音視頻、人工智能等都不可能可以完全塞進L1 Cache里，因為這些應用牽涉到大量的數(shù)據(jù)處理。

　　這時候，人們在臺式機性能評估上學到的經(jīng)驗和測試辦法就可以在移動設備上采用了。對CPU測試來說，最合理的測試方式是采用多種計算規(guī)模的真實應用源代碼以本機代碼進行編譯再進行測試，在這樣的情況下移動設備的計算單元、內(nèi)存單元都得以充分考驗，測試結果最具參考價值。

　　能夠獲得業(yè)界（計算機工業(yè)、學術科研）官方認可的CPU測試當屬SPEC.org的SPEC CPU，它就是采用源代碼方式，讓測試人員可以編譯為本機代碼來測試，許多處理器在研發(fā)伊始就采用SPEC CPU作為最重要的性能評估指標。

　　SPEC CPU的最新版本為CPU2006，但是CPU2006針對的是當前的臺式機、工作站、服務器處理器應用環(huán)境，內(nèi)存容量（CPU2006 支持多線程測試，因此要求的內(nèi)存容量相當高，8線程處理器用16 GB內(nèi)存也是有點勉強）和自身存儲空間（未編譯時就要數(shù)GB空間，編譯后就要占用1xGB了）要求都較高，因此采用CPU2006對目前的移動設備來說是不太現(xiàn)實的。

　　SPEC CPU是每隔幾年就更新一次，在CPU2006之前的舊版本為CPU2000，它的speed整數(shù)性能測試完全可以在1GB級別的移動設備上運行，在

上一頁 1 2 3 4 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： 強勁性能

評論

相關推薦

Cortex-A15架構解析：探索強勁性能的秘密（二）

模擬技術 Cortex-A15 強勁性能 | 2013-12-21

Cortex-A15架構解析：探索強勁性能的秘密(一)

模擬技術 Cortex-A15 強勁性能 | 2013-12-21

Cortex-A15架構解析：探索強勁性能的秘密（四）

模擬技術 Cortex-A15 強勁性能 | 2013-12-21

Cortex-A15架構解析：探索強勁性能的秘密（三）

模擬技術 Cortex-A15 強勁性能 | 2013-12-21

探索強勁性能的秘密（一）

模擬技術強勁性能 | 2013-09-28

焦點

推薦視頻

技術專區(qū)

關閉

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();