<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于Xtensa可配置處理器技術(shù)的視頻加速引擎技術(shù)開發(fā)

基于Xtensa可配置處理器技術(shù)的視頻加速引擎技術(shù)開發(fā)

作者：時(shí)間：2010-11-24 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

掌上多媒體設(shè)備的增長(zhǎng)極大地改變了終端多媒體芯片供應(yīng)商對(duì)產(chǎn)品的定位需求。這些芯片提供商的IC設(shè)計(jì)目標(biāo)不再僅僅針對(duì)一兩種多媒體編解碼器。消費(fèi)者希望他們的移動(dòng)設(shè)備能夠利用不同的設(shè)備來播放媒體，能夠采用不同的標(biāo)準(zhǔn)進(jìn)行編碼，并能夠從不同的設(shè)備來下載或者接收媒體數(shù)據(jù)。視頻譯碼器和編碼器引擎必須滿足多種需求，并具有面積和功耗優(yōu)勢(shì)。
　　
　　1、設(shè)計(jì)視頻加速引擎的傳統(tǒng)RTL方法
　　
　　上一代視頻ASIC的設(shè)計(jì)主要對(duì)MPEG-2進(jìn)行編碼和譯碼，因?yàn)檫@是DVD標(biāo)準(zhǔn)。有些視頻ASIC還支持MPEG-1，用于VCD（視頻CD）播放。在多數(shù)情況下，MPEG-2編碼器和譯碼器都采用RTL設(shè)計(jì)方法。一個(gè)典型MPEG-2視頻ASIC體系結(jié)構(gòu)如圖1所示，其中包括由各個(gè)RTL模塊構(gòu)成的視頻子系統(tǒng)、主控制器和片上存儲(chǔ)器。
　　
　　圖1 MPEG-2視頻ASIC體系結(jié)構(gòu)
　　
　　采用硬線RTL體系結(jié)構(gòu)支持多種視頻標(biāo)準(zhǔn)，然而，這也意味著每個(gè)視頻標(biāo)準(zhǔn)都需要一個(gè)專用的RTL模塊來實(shí)現(xiàn)。采用硬線RTL模塊實(shí)現(xiàn)一個(gè)多種標(biāo)準(zhǔn)的視頻加速引擎具有一定的局限性。無論是實(shí)現(xiàn)一個(gè)新的視頻標(biāo)準(zhǔn)、更新已有的標(biāo)準(zhǔn)還是消除其中的故障都需要重新進(jìn)行芯片加工。
　　
　　2、采用處理器作為視頻加速引擎的優(yōu)勢(shì)
　　
　　可編程處理器能夠滿足多種視頻標(biāo)準(zhǔn)的靈活性要求。與RTL模塊設(shè)計(jì)方法相比，可編程處理器具有如下幾個(gè)優(yōu)勢(shì)：一是易于將編解碼器與處理器接口；二是滿足新的視頻標(biāo)準(zhǔn)要求、更新現(xiàn)有編解碼器或者采用軟件方法在芯片投片后也可以修改故障；三是可以采用軟件更新的方法很容易地提高視頻編解碼器的性能。
　　然而，傳統(tǒng)的32位處理器存在性能瓶頸，因?yàn)樗鼈兪敲嫦蛲ㄓ么a設(shè)計(jì)的，而不是面向視頻加速引擎設(shè)計(jì)的。嵌入式DSP也并非專門為視頻量身定做的，而是包括硬件功能部件、指令和接口，專門應(yīng)用于通用DSP領(lǐng)域。因此，為了在傳統(tǒng)RISC和DSP處理器上實(shí)現(xiàn)視頻編解碼器，就必須使這些處理器運(yùn)行在很高的速度(Mhz)上，需要大量的存儲(chǔ)器空間，因此需要很大的功耗，不適合便攜式應(yīng)用。
　　通過研究一個(gè)視頻內(nèi)核程序所需要的計(jì)算量，即可一目了然。比如，一個(gè)絕對(duì)差值累加運(yùn)算SAD，該運(yùn)算是大部分視頻編碼算法中運(yùn)動(dòng)估計(jì)一步常采用的方法。SAD算法將會(huì)在相鄰兩個(gè)連續(xù)視頻幀中找出宏塊的運(yùn)動(dòng)情況，為此，需要計(jì)算兩個(gè)宏塊中每一組對(duì)應(yīng)的像素值之間絕對(duì)差值的累加和。
　　下面C代碼給出了SAD核心算法的簡(jiǎn)單實(shí)現(xiàn)：
　　 for (row = 0; row numrows; row++) {
　　 for (col = 0; col numcols; col++) {
　　 accum += abs(macroblk1[row][col] - macroblk2[row][col]);
　　} /* column loop */
　　} /* row loop */
　　 SAD核心算法的基本計(jì)算方法如圖2所示。正像圖中所示的那樣，SAD核心算法首先執(zhí)行減法操作，然后取絕對(duì)值，最后對(duì)前面的結(jié)果進(jìn)行累加。
　　

本文引用地址：http://www.ex-cimer.com/article/151313.htm

　　圖2 差值絕對(duì)值累加（SAD）主要計(jì)算方法
　　
　　在一個(gè)RISC處理器上計(jì)算一個(gè)由兩個(gè)16x16宏塊組成的SAD運(yùn)算需要256次減法運(yùn)算、256次絕對(duì)值運(yùn)算和256次累加運(yùn)算，共需要768次算術(shù)運(yùn)算，這還不包括因數(shù)據(jù)轉(zhuǎn)移需要的取數(shù)和存數(shù)操作。由于這需要對(duì)每一幀的所有宏塊進(jìn)行操作，因此，隨著分辨率的提高引起視頻幀增加，使得計(jì)算成本極度昂貴。
　　事實(shí)上，對(duì)于一個(gè)一般的通用RISC處理器而言（包括一些DSP指令，如乘法指令和乘累加指令），執(zhí)行一個(gè)H.264基準(zhǔn)譯碼算法需要250 MHz的性能（CIF分辨率），而執(zhí)行一個(gè)H.264基準(zhǔn)編碼算法則需要超過1 GHz的性能（CIF分辨率）。完成上述運(yùn)算，僅處理器內(nèi)核就需要500mW的功耗，更不要說由訪存和視頻SOC的其它部件所用的功耗。
　　
　　3、可配置處理器方法
　　
　　在一個(gè)處理器上實(shí)現(xiàn)SAD核心算法的一個(gè)更加有效的途徑是建立 “減法－絕對(duì)值－加法”專用指令。這將大大降低算術(shù)運(yùn)算的開銷，對(duì)一個(gè)16x16宏塊而言，運(yùn)算次數(shù)將從768次降為256次。而且，由于采用一個(gè)功能部件就可以實(shí)現(xiàn)多個(gè)簡(jiǎn)單算術(shù)運(yùn)算的融合操作，因此上面的運(yùn)算只需一個(gè)指令周期就可以完成，這相當(dāng)于原來的256個(gè)周期。用戶不能往一個(gè)標(biāo)準(zhǔn)的32位RISC處理器中添加指令，但是，完全可以往一個(gè)可配置處理器中添加專用指令?？?a class="contentlabel" href="http://www.ex-cimer.com/news/listbylabel/label/配置">配置處理器允許設(shè)計(jì)人員從可配置選項(xiàng)菜單中選擇相關(guān)配置命令來擴(kuò)展處理器功能，包括增加專用指令、寄存器文件和接口等。
　　下面是現(xiàn)代可配置處理器（例如Tensilica公司的 Xtensa處理器）提供的配置和擴(kuò)展選項(xiàng)，這對(duì)于傳統(tǒng)的固定模式處理器而言是做不到的。
　　 (i) 配置選項(xiàng)：選項(xiàng)菜單包括下面幾項(xiàng)：
　　 a. 設(shè)計(jì)人員需要或者不需要的指令。例如，16x16的乘法或者乘累加、移位、浮點(diǎn)指令等等。
　　 b. 零開銷循環(huán)、五級(jí)或者七級(jí)流水線、局部數(shù)據(jù)加載或者存儲(chǔ)部件個(gè)數(shù)等。
　　 c. 是否需要存儲(chǔ)器保護(hù)、存儲(chǔ)器地址轉(zhuǎn)換或者存儲(chǔ)器管理部件（MMU）
　　 d. 包含或者不包含系統(tǒng)總線接口
　　 e. 系統(tǒng)總線寬度和局部存儲(chǔ)器接口寬度
　　 f. 局部（緊密耦合）存儲(chǔ)器大小和數(shù)量。
　　 g. 中斷數(shù)量及中斷類型和中斷優(yōu)先級(jí)。
　　 (ii) 擴(kuò)展選項(xiàng)：增加設(shè)計(jì)人員自己定義的功能部件，包括：
　　 a. 寄存器和寄存器文件。
　　 b. 多周期、仲裁復(fù)雜指令功能部件。
　　 c. 單指令流多數(shù)據(jù)流SIMD功能部件。
　　 d. 將單發(fā)射處理器變?yōu)槎喟l(fā)射處理器。
　　 e. 用戶定制接口，可以直接對(duì)數(shù)據(jù)通路進(jìn)行讀寫操作，例如，類似GPIO（通用輸入/輸出）引腳的處理器內(nèi)核端口或者引腳，用于擴(kuò)展先進(jìn)先出FIFO隊(duì)列的隊(duì)列接口（可以與其它邏輯或者處理器內(nèi)核進(jìn)行接口）。
　　配置選項(xiàng)的好處是讓設(shè)計(jì)人員通過僅選擇與其應(yīng)用有關(guān)的選項(xiàng)，就可以構(gòu)建一個(gè)規(guī)模適度的處理器，并能夠滿足其特定應(yīng)用。擴(kuò)展選項(xiàng)的好處是讓設(shè)計(jì)人員根據(jù)應(yīng)用定制處理器，包括建立專用指令、寄存器文件、功能部件和相關(guān)接口，用于加速系統(tǒng)應(yīng)用算法的執(zhí)行。

上一頁 1 2 3 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：加速引擎 技術(shù)開發(fā) 視頻 技術(shù) Xtensa 配置 處理器 基于

評(píng)論

相關(guān)推薦

微軟嵌入式技術(shù)教育大會(huì)專訪實(shí)錄(老站轉(zhuǎn))

amine | 2002-05-16

嵌入式系統(tǒng)硬件接口設(shè)計(jì) 下

視頻嵌入式處理器 SPI EP9315 S3C2410 | 2009-10-27

嵌入式處理器選型上

視頻嵌入式 ARM 處理器 CN896 MIPS | 2009-10-27

PLD設(shè)計(jì)技巧——用單片機(jī)配置FPGA

資源下載 PLD 單片機(jī) FPGA 配置 | 2007-02-09

最新智能手機(jī)芯片數(shù)據(jù)：聯(lián)發(fā)科市場(chǎng)份額第一，蘋果同比下降16%

智能手機(jī) 高通聯(lián)發(fā)科蘋果處理器紫光展銳 | 2024-05-23

傳感器和顯示器接口技術(shù)廣受關(guān)注 (轉(zhuǎn)載）

hpnet | 2002-05-17

嵌入式系統(tǒng)硬件接口設(shè)計(jì) 上

視頻嵌入式 Xscale 處理器 S3C2410 | 2009-10-27

MPEG-2 視頻解碼器,1.1版

資源下載 MPEG 視頻解碼器 MPEG-2 | 2007-02-09

嵌入式處理器選型下

視頻嵌入式 ARM 處理器 MIPS PXA27x | 2009-10-27

米爾基于NXP i.MX 93開發(fā)板的M33處理器應(yīng)用開發(fā)筆記

嵌入式系統(tǒng) 米爾 NXP .MX 93 M33 處理器 | 2024-07-03

仿真器概念及實(shí)現(xiàn)技術(shù)

jackwang | 2002-05-14

快來看MCX N系列微處理器的眼睛-攝像頭接口

物聯(lián)網(wǎng)與傳感器控制器 SmartDMA 處理器攝像頭 LCD | 2024-04-12

高通被曝開發(fā)低成本驍龍 WoA 芯片：AI 算力 40 TOPS、2025Q4 推出

智能計(jì)算高通 WoA 處理器 | 2024-06-18

基于D類功放專用驅(qū)動(dòng)芯片驅(qū)動(dòng)的高保真純正弦波逆變器1

設(shè)計(jì)方案基于功放專用驅(qū)動(dòng) 芯片高保真正弦波逆變器 | 2009-07-06

拆解：三星Galaxy Watch 7中的Exynos W1000處理器3nm GAA工藝

消費(fèi)電子三星 Galaxy Watch 7 Exynos W1000 處理器 3nm GAA | 2024-07-19

中國(guó)臺(tái)灣AI關(guān)鍵組件的發(fā)展現(xiàn)況與布局

智能計(jì)算 IC設(shè)計(jì) PCB 散熱處理器內(nèi)存 AI | 2024-06-13

[轉(zhuǎn)帖]IBM可編程網(wǎng)絡(luò)處理器

amine | 2002-05-17

微軟2002嵌入式技術(shù)教育大會(huì)情況（4月11-12）北京(老站轉(zhuǎn))

amine | 2002-05-16

PoerPC處理器的BDM調(diào)試頭原理圖

資源下載 PoerPC 處理器 BDM 調(diào)試頭原理圖 | 2007-02-09

基于D類功放專用驅(qū)動(dòng)芯片驅(qū)動(dòng)的高保真純正弦波逆變器

設(shè)計(jì)方案基于功放專用驅(qū)動(dòng) 芯片高保真正弦波逆變器 | 2009-07-06

基于RC電路的一次性濾波器

設(shè)計(jì)方案基于電路一次性濾波器 | 2009-07-06

基于MSP430F133的電子鎮(zhèn)流器綜合測(cè)試儀

設(shè)計(jì)方案基于 MSP430F133 電子鎮(zhèn)流器綜合測(cè)試儀 | 2009-07-06

最新的ARM技術(shù)以及嵌入式發(fā)展動(dòng)態(tài) 下

視頻 ARM Cortex RISC 處理器 | 2009-11-25

Microchip發(fā)布多核64位微處理器系列產(chǎn)品進(jìn)一步擴(kuò)展處理器產(chǎn)品線

嵌入式系統(tǒng) Microchip 64位微處理器處理器 | 2024-07-10

USB系統(tǒng)研究

資源下載 USB 技術(shù) USB 協(xié)議 USB 總線總線拓?fù)潴w系 | 2007-02-09

透視麒麟9010：博采眾長(zhǎng)但依舊任重道遠(yuǎn)

手機(jī)與無線通信麒麟9010 Pura 70 處理器 Arm TCS23 Firestorm 鴻蒙NEXT | 2024-04-23

封閉沒有前途！Intel打造開放AI生態(tài) 誓要虎口奪食

智能計(jì)算英特爾 AI 處理器 Lunar Lake | 2024-04-16

英特爾先進(jìn)封裝產(chǎn)能也吃緊，影響第二季AI PC處理器供應(yīng)

消費(fèi)電子英特爾先進(jìn)封裝 AI PC 處理器 | 2024-05-01

基于運(yùn)放的差動(dòng)放大器

設(shè)計(jì)方案基于運(yùn)放差動(dòng) 放大器 | 2009-07-06

Nios II 處理器中文小冊(cè)子（altera）

資源下載 altera Nios II 處理器中文小冊(cè)子 | 2007-12-12

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();