<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 利用多內(nèi)核處理器的并行編程功能實(shí)現(xiàn)視頻代碼轉(zhuǎn)換

利用多內(nèi)核處理器的并行編程功能實(shí)現(xiàn)視頻代碼轉(zhuǎn)換

作者：時間：2009-03-04 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

本文引用地址：http://www.ex-cimer.com/article/152623.htm

運(yùn)動估計

運(yùn)動估計是很有價值的。一般需要發(fā)現(xiàn)將像素從輸入圖像中的一個位置挎貝到融合后的圖像上的這種融合，以便融合后的圖像與該幀實(shí)際圖像間的差異盡可能小。首先，像素塊之間的相似性指標(biāo)需要被定義，通常是SSD(差值平方和)或SSA(絕對差值和)。然后使用這種相似性指標(biāo)測試各個候選源塊的位置，以確定良好的匹配。

有兩點(diǎn)需要注意。第一，如果有較強(qiáng)的運(yùn)算能力，那么可以測試較多的候選位置，從而可能找到更好的匹配，并提高壓縮率?？梢杂眠\(yùn)算能力的增強(qiáng)來降低帶寬要求，反之亦然。其次，相似性指標(biāo)是非線性的。這意味著使用多分辨率等技巧來加快相似性匹配速度是不合適的。低分辨率時的最佳匹配不一定是高分辨率時的最佳匹配。

這里有兩個基本點(diǎn)：數(shù)據(jù)位置和并行體系。首先，GPU是具有很高性能的處理器，但目前位于PCI Express卡上，這些卡有自己的存儲器。因此為了壓縮視頻流，數(shù)據(jù)需要傳送到視頻卡上的存儲器中，然后將壓縮結(jié)果傳回來。這一過程需要以流的形式完成，而這種流式處理與運(yùn)算隨時交疊，因此數(shù)據(jù)傳送不會成為瓶頸。RapidMind平臺正常情況下可自動管理數(shù)據(jù)，而且(能在內(nèi)部硬件API支持的地方)提供深層分析功能來管理這種重疊式流處理。GPU存儲器架構(gòu)的其它意義還在于互相依賴的一系列步驟應(yīng)盡可能保持在相同的存儲器空間中。

最大程度的加速

通常在考慮一個應(yīng)用是否能被加速時，人們首先會分析應(yīng)用程序的各個單元，判斷每個單元上需花多長時間，并利用阿姆達(dá)爾定律估計可能的加速程度。

舉例來說，考慮到某個應(yīng)用程序在單元A上要花10%的時間，在單元B上要花75%的時間，單元C上花5%的時間，單元D上花10%的時間。該應(yīng)用程序的流程是A運(yùn)行一次，然后B和C輪流多次反復(fù)運(yùn)行(取決于彼此關(guān)系)，最后才是運(yùn)行D。

同時假設(shè)單元A估計能加速1.5倍，B能加速20倍，C能加速2倍，D不能做任何加速。

這樣理論上的最大時間縮短值是：

0.1/1.5+0.75/20+0.05/2+0.1/1=0.23

相當(dāng)于加速1/0.23(正好超過4)倍。值得注意的是，雖然單元B(75%的運(yùn)行時間)的加速系數(shù)達(dá)到了很大的20，但只有使所有加速步驟對總運(yùn)行時間的影響比較接近的情況下才能取得最好的效果。

事實(shí)上，如果只是以B為目標(biāo)，并設(shè)法使之無限加速，但總的性能仍將受限于其余單元。

使用GPU

進(jìn)一步考慮使用GPU。大家可以看到B和C是反復(fù)進(jìn)行的。如果只是在GPU上加速B，而讓C留在主機(jī)上，那么需要不斷地從主機(jī)那兒來回傳送數(shù)據(jù)，從而嚴(yán)重影響性能。因此，即使單元C的加速幅度很小，但根據(jù)阿姆達(dá)爾定律，它對總的加速效果影響也很小。事實(shí)上，我們可能也想把C移動到GPU上以避免這些傳送。

這正是視頻編碼所面臨的境況。即使運(yùn)動估計是視頻壓縮中最昂貴的成分，我們也不能忽略其它因素，尤其是單幀壓縮和解壓縮，因?yàn)檫\(yùn)動估計的其它階段還需要這些結(jié)果。在考慮這些因素后，階段優(yōu)化工作量就需要正比于它對總體性能的影響程度。

RapidMind平臺

RapidMind平臺能夠用來快速實(shí)現(xiàn)和測試算法，并將算法應(yīng)用于GPU或?qū)嶋H上多內(nèi)核的CPU。如果有大量依附于數(shù)據(jù)的算法單元，Rapid實(shí)現(xiàn)就相當(dāng)重要，因?yàn)樗袉卧仨氁苿拥郊铀倨鞯拇鎯臻g，以避免出現(xiàn)上述數(shù)據(jù)搬移問題。然而，根據(jù)它們的總體影響，優(yōu)化所有這些單元可能不具成本效益，或沒有太大作用。優(yōu)化工作容易使代碼復(fù)雜化，并且更難維護(hù)。

RapidMind通過公共特性集向所有支持的硬件目標(biāo)提供可移植性。僅使用這組公共特性也可能獲得優(yōu)異的性能。然而，RapidMind還提供了深層機(jī)制來訪問特殊硬件特性，這種深層機(jī)制對優(yōu)化可能有用，但也會影響可移植性。因此推薦的做法是軟件項(xiàng)目首先只用公共特性實(shí)現(xiàn)所有必要的單元，然后(在實(shí)現(xiàn)完整功能后)對單元進(jìn)行剖析以確定瓶頸及最有可能的改進(jìn)之處，最后調(diào)整特殊單元，可能的話調(diào)整應(yīng)保持在內(nèi)核可移植功能集中。如果有必要進(jìn)行特殊硬件的深層分析，使用RapidMind的提取功能可以隔離它的影響，原始的內(nèi)核特性參考實(shí)現(xiàn)也可以用于實(shí)現(xiàn)可移植性。

上一頁 1 2 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 實(shí)現(xiàn) 視頻代碼 轉(zhuǎn)換 功能編程 內(nèi)核 處理器 并行利用 編解碼器

評論

相關(guān)推薦

利用功率放大器作為差動放大器的電流控制方式電路

設(shè)計方案利用功率放大器作為差動放大器電流控制方式電路 | 2009-07-06

仿真器概念及實(shí)現(xiàn)技術(shù)

jackwang | 2002-05-14

英偉達(dá)H20現(xiàn)身基準(zhǔn)測試：內(nèi)核數(shù)量相比H100減少41%，性能降低28%

智能計算英偉達(dá) H20 基準(zhǔn)測試內(nèi)核性能 | 2024-07-10

Microchip發(fā)布多核64位微處理器系列產(chǎn)品進(jìn)一步擴(kuò)展處理器產(chǎn)品線

嵌入式系統(tǒng) Microchip 64位微處理器處理器 | 2024-07-10

英特爾先進(jìn)封裝產(chǎn)能也吃緊，影響第二季AI PC處理器供應(yīng)

消費(fèi)電子英特爾先進(jìn)封裝 AI PC 處理器 | 2024-05-01

嵌入式處理器選型上

視頻嵌入式 ARM 處理器 CN896 MIPS | 2009-10-27

米爾基于NXP i.MX 93開發(fā)板的M33處理器應(yīng)用開發(fā)筆記

嵌入式系統(tǒng) 米爾 NXP .MX 93 M33 處理器 | 2024-07-03

拆解：三星Galaxy Watch 7中的Exynos W1000處理器3nm GAA工藝

消費(fèi)電子三星 Galaxy Watch 7 Exynos W1000 處理器 3nm GAA | 2024-07-19

VxWork介紹及編程

jackwang | 2002-05-15

嵌入式系統(tǒng)硬件接口設(shè)計上

視頻嵌入式 Xscale 處理器 S3C2410 | 2009-10-27

利用載波的交流電壓檢出電路

設(shè)計方案利用載波交流電壓檢出電路 | 2009-07-06

ARM簡介及編程

jackwang | 2002-05-15

中國臺灣AI關(guān)鍵組件的發(fā)展現(xiàn)況與布局

智能計算 IC設(shè)計 PCB 散熱處理器內(nèi)存 AI | 2024-06-13

嵌入式處理器選型下

視頻嵌入式 ARM 處理器 MIPS PXA27x | 2009-10-27

電壓-電流轉(zhuǎn)換電路

設(shè)計方案電壓電流轉(zhuǎn)換電路 | 2009-07-06

Linux正則表達(dá)式

EDA/PCB Linux 代碼 PCB | 2024-05-20

模擬電路PWM的實(shí)現(xiàn)

設(shè)計方案模擬電路實(shí)現(xiàn) | 2009-07-06

ARM內(nèi)核結(jié)構(gòu)簡介

資源下載 ARM 嵌入式系統(tǒng) 異常中斷指令集 Thumb 內(nèi)核 | 2007-02-09

MPEG-2 視頻解碼器,1.1版

資源下載 MPEG 視頻解碼器 MPEG-2 | 2007-02-09

高通被曝開發(fā)低成本驍龍 WoA 芯片：AI 算力 40 TOPS、2025Q4 推出

智能計算高通 WoA 處理器 | 2024-06-18

第二炮兵某旅改變組訓(xùn)方式充分利用訓(xùn)練資源　“滾動訓(xùn)練”加快戰(zhàn)斗力生成

hpnet | 2002-05-14

Nios II 處理器中文小冊子（altera）

資源下載 altera Nios II 處理器中文小冊子 | 2007-12-12

電阻-電壓轉(zhuǎn)換

設(shè)計方案電阻電壓轉(zhuǎn)換 | 2009-07-06

從并行到串行再返回：對SerDes的理解

EDA/PCB SerDes，并行，串行，PCB | 2024-05-17

arm學(xué)習(xí)資料

資源下載 ARM 基礎(chǔ) 編程調(diào)試開發(fā) ARM7 | 2007-12-03

uC/OS環(huán)境下的C語言編程(PLD轉(zhuǎn))

amine | 2002-05-16

最新的ARM技術(shù)以及嵌入式發(fā)展動態(tài) 下

視頻 ARM Cortex RISC 處理器 | 2009-11-25

嵌入式系統(tǒng)硬件接口設(shè)計下

視頻嵌入式處理器 SPI EP9315 S3C2410 | 2009-10-27

Sams - C++ Primer Plus, Fourth Edition.part1.rar

資源下載 C++ 編程類 | 2007-02-09

最新智能手機(jī)芯片數(shù)據(jù)：聯(lián)發(fā)科市場份額第一，蘋果同比下降16%

智能手機(jī) 高通聯(lián)發(fā)科蘋果處理器紫光展銳 | 2024-05-23

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();