<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 嵌入式ARM多核處理器并行化方法

          嵌入式ARM多核處理器并行化方法

          作者: 時(shí)間:2016-09-12 來(lái)源:網(wǎng)絡(luò) 收藏

          3并行化性能分析

          本文引用地址:http://www.ex-cimer.com/article/201609/303909.htm

          3.1實(shí)驗(yàn)環(huán)境介紹

          本文采用德州儀器(Texas Instruments)的OMAP4430開(kāi)發(fā)平臺(tái)。OMAP443O為,擁有對(duì)稱(chēng)多處理雙核處理器(Dual-core Cortex-A、一級(jí)緩存32 KB、二級(jí)緩存1 MB,操作系統(tǒng)采用Ubuntul2.O4內(nèi)核,編譯器為arm-linux-gnueabihf-gcc,使用GNU gprof獲取算法執(zhí)行時(shí)間。

          3.2性能測(cè)試

          如下式所示,采用計(jì)算加速比的方式來(lái)分析并行優(yōu)化的性能,加速比數(shù)值越大表示算法的并行程度越高,最低為1.性能測(cè)試采用4個(gè)算法版本,包括串行版本、并行2線(xiàn)程、并行4線(xiàn)程和緩存優(yōu)化版,從不同角度來(lái)分析性能。

          如圖4所示,從折線(xiàn)圖可以看出,3種并行化優(yōu)化算法相對(duì)于串行版本,算法的并行性能都有較大提升,如表1所列,其并行加速比分別為1.30、1.29和1.21.對(duì)任務(wù)并行優(yōu)化方案而言,分別使用2線(xiàn)程和4線(xiàn)程版本進(jìn)行測(cè)試,從加速比的分析結(jié)果看來(lái),2線(xiàn)程版本較4線(xiàn)程版本略好。理論上并行線(xiàn)程的數(shù)目越多性能越好,但本文采用OMAP443O只有兩個(gè)對(duì)稱(chēng)多處理核心,即使算法擁有4個(gè)并行線(xiàn)程,但實(shí)際執(zhí)行的線(xiàn)程只有2個(gè),同時(shí)4個(gè)線(xiàn)程在獲取2個(gè)物理處理器時(shí)存在競(jìng)爭(zhēng)關(guān)系,因而造成性能較之2線(xiàn)程版本有所下降。

          圖4算法執(zhí)行時(shí)間

          評(píng)價(jià)并行算法優(yōu)劣還需考慮算法的性,如表1、表2所列,緩存優(yōu)化方案標(biāo)準(zhǔn)差遠(yuǎn)遠(yuǎn)小于任務(wù)并行化方案。究其原因,對(duì)于任務(wù)并行化方案而言,不同的測(cè)試數(shù)據(jù)以及劃分算法(partition)對(duì)區(qū)間的劃分有重要影響,從而造成任務(wù)執(zhí)行時(shí)間變化范圍很大;對(duì)于緩存優(yōu)化方案而言,其實(shí)質(zhì)是數(shù)據(jù)并行,其每一個(gè)任務(wù)都是根據(jù)緩存大小進(jìn)行劃分,因此每一個(gè)任務(wù)處理的數(shù)據(jù)規(guī)模基本一致,每一個(gè)任務(wù)執(zhí)行的時(shí)間更確定,但由于并行任務(wù)執(zhí)行完成后,需要對(duì)數(shù)據(jù)進(jìn)行歸并,造成一定的性能下降。

          結(jié)語(yǔ)

          本文通過(guò)對(duì)嵌入式硬件結(jié)構(gòu)的分析,從對(duì)稱(chēng)多處理角度對(duì)串行快速排序算法進(jìn)行并行化優(yōu)化,取得了很好的效果。

          雙核處理器(OMAP4430)作為測(cè)試平臺(tái),從任務(wù)并行和緩存優(yōu)化實(shí)現(xiàn)并行優(yōu)化,從性能測(cè)試的結(jié)果看,任務(wù)并行具有良好的加速比,但性差,并行線(xiàn)程數(shù)目不應(yīng)超過(guò)物理處理器核的數(shù)目,過(guò)多的并行線(xiàn)程競(jìng)爭(zhēng)處理器資源,造成性能下降。緩存優(yōu)化具有良好的性,但需要后續(xù)進(jìn)行歸并操作,造成性能有所下降。

          總之,在嵌入式上進(jìn)行并行化優(yōu)化,一方面要充分發(fā)掘嵌人式多核處理器的并行性能,提高程序的并行性;另一方面也要考慮程序算法的負(fù)載均衡性,確保在不同應(yīng)用環(huán)境中程序性能一致。


          上一頁(yè) 1 2 下一頁(yè)

          評(píng)論


          相關(guān)推薦

          技術(shù)專(zhuān)區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();