<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 工控自動(dòng)化 > 設(shè)計(jì)應(yīng)用 > 基于龍芯3B的H.264解碼器的向量化

基于龍芯3B的H.264解碼器的向量化

作者：時(shí)間：2010-12-15 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

摘要：本文實(shí)現(xiàn)了ffmpeg解碼器到龍芯3B平臺(tái)的移植，并針對(duì)龍芯3B所支持的向量擴(kuò)展指令，對(duì)ffmpeg解碼器進(jìn)行了向量化。實(shí)驗(yàn)結(jié)果表明：實(shí)現(xiàn)向量化的ffmpeg解碼器，其性能比使用GCC向量化編譯得到的ffmpeg解碼器具有更好的性能，而且性能提升的比率比在一些商業(yè)平臺(tái)上更大。
關(guān)鍵詞：H．264；ffmpeg；解碼器；Godson3B；向量化

0 引言
當(dāng)今社會(huì)已經(jīng)步入信息時(shí)代，傳統(tǒng)的信息載體和通信方式已經(jīng)無(wú)法滿足人們對(duì)信息的需求。而實(shí)驗(yàn)表明：相比較語(yǔ)音和抽象數(shù)據(jù)，人類接受的信息更多是以圖片和視頻方式為載體的。其中視頻信息具有直觀、具體和高效的特點(diǎn)，這也就決定了視頻通信技術(shù)將成為信息時(shí)代的重要技術(shù)之一。
由于視頻的數(shù)據(jù)量巨大，而存儲(chǔ)視頻的資源通常是非常有限的，因而對(duì)視頻進(jìn)行壓縮編碼，以減少存儲(chǔ)資源的消耗，非常必要。然而，通常情況下，使用的壓縮算法的復(fù)雜度越高，壓縮比率越高，視頻播放時(shí)的解碼速度就會(huì)越低。因而在提高編碼壓縮率的同時(shí)，也需要對(duì)解碼器進(jìn)行相應(yīng)的優(yōu)化，以提高視頻解碼器在目標(biāo)平臺(tái)上的性能。本文就實(shí)現(xiàn)了ffmpeg解碼器在龍芯3B上的移植與向量化，提高了該解碼器在龍芯3B上的性能。

1 視頻編／解碼與龍芯3B
1．1 視頻編／解碼
目前，成熟的壓縮編／解碼方法有很多。其中H．261、MPEG-1、MPEG-3和H．263采用了第一代壓縮編碼方法，如預(yù)測(cè)編碼、變換編碼、熵編碼以及運(yùn)動(dòng)補(bǔ)償；而MPEG-4和H．264采用了第二代的壓縮編碼方法，如分段編碼和基于模型或?qū)ο蟮木幋a等。
視頻壓縮編碼的主要目的是減少存儲(chǔ)視頻所占用的資源，而解碼技術(shù)的目標(biāo)則是提高解碼的速度，從而提高視頻播放的流暢性。常見的基于H．264編碼方法的軟解碼器包括CoreAVC、ffmpeg和JM等。其中JM是H．264官方網(wǎng)站提供的編／解碼器，集合了各種編／解碼算法，而且代碼的結(jié)構(gòu)清晰，很適合應(yīng)用于對(duì)視頻編／解碼技術(shù)的研究。而CoreAVC解碼器則主要用于商用，其解碼速率比f(wàn)fmpeg快50％以上。ffmpeg是開源的解碼器，而且性能相對(duì)較好，很多開源項(xiàng)目都直接或間接地使用了ffmpeg，如mplayer播放器等。通過(guò)對(duì)性能以及開源特性的綜合考慮，本文選擇ffmlpeg作為移植和向量化對(duì)象。
1．2 龍芯3B體系結(jié)構(gòu)
龍芯3B處理器在兼容了MIPS64指令集的同時(shí)，實(shí)現(xiàn)了針對(duì)多媒體應(yīng)用的向量擴(kuò)展指令，這對(duì)視頻編／解碼應(yīng)用性能的提升有很大的幫助。
龍芯3B提供了256位的向量寄存器并實(shí)現(xiàn)包括256位向量訪存在內(nèi)的向量擴(kuò)展指令。使用向量指令可以一次完成32個(gè)字節(jié)寬度數(shù)據(jù)的操作。而這樣的結(jié)構(gòu)和指令集設(shè)計(jì)，使得龍芯3B非常適合于實(shí)現(xiàn)大規(guī)模相同類型數(shù)據(jù)的相同運(yùn)算，比如矩陣乘法運(yùn)算和FFT運(yùn)算，以及視頻編
／解碼運(yùn)算等。
不過(guò)由于ffmpeg并未實(shí)現(xiàn)對(duì)龍芯3B平臺(tái)的支持，因而需要完成ffmpeg到龍芯3B的移植工作。本文之前也有一些ffmpeg到其他平臺(tái)的移植工作和針對(duì)龍芯平臺(tái)的移植與優(yōu)化工作，都取得了不錯(cuò)效果。

2 基于龍芯3B的ffmpeg移植
2．1 ffmpeg的移植
ffmpeg解碼器提供了對(duì)不同目標(biāo)平臺(tái)的支持，而與這些平臺(tái)相關(guān)的文件都保存在以該目標(biāo)平臺(tái)命名的目錄下。例如，ffmpeg解碼器實(shí)現(xiàn)了對(duì)arm和sparc平臺(tái)，以及x86平臺(tái)的支持。
對(duì)于實(shí)現(xiàn)ffmpeg解碼器對(duì)龍芯3B的支持，主要完成以下5個(gè)步驟：
(1)修改configure配置文件，增加與龍芯體系結(jié)構(gòu)相關(guān)的配置選項(xiàng)；
(2)新建龍芯專用文件夾godson，將龍芯體系結(jié)構(gòu)相關(guān)的文件都存放于該文件夾中；
(3)將godson文件夾下新增的需要編譯的文件添加到Makefile中；
(4)增加與dsputil_init類似的新的初始化函數(shù)dsputil_init_godson；
(5)在頭文件中添加新增函數(shù)的聲明。
針對(duì)龍芯3B的ffmpeg移植工作相對(duì)比較簡(jiǎn)單，因而本文重點(diǎn)介紹針對(duì)龍芯3B的向量化工作。
2．2 移植后的ffmpeg的性能比較
本節(jié)對(duì)移植后的ffmpeg解碼器進(jìn)行了性能測(cè)試，對(duì)使用龍芯3B向量擴(kuò)展指令和不使用龍芯3B擴(kuò)展指令兩種情況下的性能進(jìn)行了比較。測(cè)試時(shí)使用支持龍芯3B擴(kuò)展指令集的GCC編譯器進(jìn)行編譯，并且開啟-ftree-vectorize和-march=godson3b編譯選項(xiàng)來(lái)支持龍芯 3B擴(kuò)展指令。使
用的測(cè)試用例為視頻“walk_vag_640x480_qp26．264”，測(cè)試結(jié)果如表1所示。
從表1的測(cè)試結(jié)果中可以看出，使用龍芯3B的向量擴(kuò)展指令可以提高ffmpeg解碼器在龍芯3B上的性能，用來(lái)測(cè)試的視頻的解碼時(shí)間減少了約466s。盡管如此，由于GCC編譯器本身自動(dòng)向量化能力的限制，ffmpeg解碼器的性能提升還是比較有限的，因而針對(duì)龍芯3B的指令集對(duì)移植后的ffmpeg解碼器進(jìn)行向量化，就成為了進(jìn)一步提高性能的重要工作。

上一頁(yè) 1 2 3 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 龍芯3B 解碼器 向量

評(píng)論

相關(guān)推薦

深度探討汽車遙控解碼器安全性/攻擊性

汽車電子汽車遙控解碼器安全性攻擊性 | 2018-08-07

通用型解碼器

資源下載監(jiān)控系統(tǒng) 解碼器通用型解碼器 RS485 曼徹斯特碼 | 2007-02-16

MPEG-2 視頻解碼器,1.1版

資源下載 MPEG 視頻解碼器 MPEG-2 | 2007-02-09

使用多功能運(yùn)算IC的向量運(yùn)算電路

模擬技術(shù) 多功能 IC的運(yùn)算向量 | 2018-09-11

FM遠(yuǎn)程編碼器/解碼器電路

嵌入式系統(tǒng) FM 編碼器解碼器 | 2023-07-21

請(qǐng)教有關(guān)44b0中斷向量的問(wèn)題

btv | 2005-02-24

Gif文件格式說(shuō)明和解碼器

資源下載 Gif文件格式解碼器 | 2007-04-19

全球編解碼器市場(chǎng)升溫

hpnet | 2002-10-03

從隱空間領(lǐng)會(huì)解碼器

智能計(jì)算 202307 隱空間解碼器 | 2023-07-27

基于數(shù)字語(yǔ)音解碼器的低功耗設(shè)計(jì)方案

工控自動(dòng)化數(shù)字語(yǔ)音解碼器低功耗設(shè)計(jì) | 2016-10-10

松下DVD-A300MU型DVD-視頻解碼器部分A

設(shè)計(jì)方案松下 DVD-A300MU 視頻解碼器部分 | 2009-08-06

一種基于樹狀結(jié)構(gòu)的新型解碼器

樹狀解碼器 | 2016-10-29

松下DVD-A300MU型DVD-視頻解碼器部分B

設(shè)計(jì)方案松下 DVD-A300MU 視頻解碼器部分 | 2009-08-06

4510中斷向量的寫法

xietong | 2005-05-31

關(guān)于44b0的非向量中斷與向量中斷的問(wèn)題？

xiaolin076 | 2004-12-21

專業(yè)音視頻領(lǐng)域中，Pro AV 的崛起之路

模擬技術(shù) AV IP 視頻傳輸音頻信號(hào)源解碼器 IP交換機(jī) | 2023-10-20

RXD-433/418/315-KH系列帶解碼器的接收器模塊

設(shè)計(jì)方案 RXD-433 315-KH 系列解碼器接收器模塊 | 2009-07-06

關(guān)于ARM7TDMI的中斷向量問(wèn)題

seasoblue | 2002-05-16

解密汽車遙控解碼器：安全性/攻擊性探討

汽車電子解碼器汽車電子 | 2017-10-27

SMP08／18用做多路輸出選擇器，與解碼器、D／A轉(zhuǎn)換器構(gòu)成的八通道多路復(fù)用D／A變換電路

設(shè)計(jì)方案 SMP08 用做多路輸出選擇器解碼器轉(zhuǎn)換器構(gòu)成 | 2009-07-06

7段LED顯示解碼器

嵌入式系統(tǒng) LED 解碼器 | 2023-05-31

如何讓數(shù)字硬件設(shè)計(jì)簡(jiǎn)單化

電源與新能源控制器嵌入式解碼器 | 2018-07-27

SC16C2550帶16字節(jié)收發(fā)FIFO和紅外編碼器解碼器的UART...

資源下載周立功單片機(jī) 16字節(jié) 收發(fā) FIFO 紅外編碼器解碼器 UART SC16C2550 | 2007-03-30

用MC145026/27實(shí)現(xiàn)多機(jī)并口無(wú)線通信

資源下載并行接口無(wú)線通信編碼器解碼器 MC145026/27 | 2007-03-20

YN5101/5201多路紅外遙控編碼、解碼器典型應(yīng)用電路圖

設(shè)計(jì)方案 YN5101 多路紅外遙控編碼解碼器典型應(yīng)用電 | 2009-07-06

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();