<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > EDA/PCB > 設(shè)計(jì)應(yīng)用 > 基于流水線及混合濾波技術(shù)的H．264去塊效應(yīng)模塊設(shè)計(jì)

基于流水線及混合濾波技術(shù)的H．264去塊效應(yīng)模塊設(shè)計(jì)

作者：時(shí)間：2016-10-29 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

收藏

引言

本文引用地址：http://www.ex-cimer.com/article/201610/308615.htm

圖像的編解碼技術(shù)是多媒體技術(shù)的關(guān)鍵，H．264／AVC是國(guó)際上最先進(jìn)的視頻壓縮技術(shù)，其主要特點(diǎn)是采用小尺寸整數(shù)余弦變換、1／4像素的運(yùn)動(dòng)估計(jì)精度、多參考幀預(yù)測(cè)，基于上下文可變長(zhǎng)度編碼和環(huán)路內(nèi)去塊效應(yīng)濾波器等技術(shù)。由于去塊效應(yīng)濾波器大約占整個(gè)解碼器1／3的運(yùn)算量，因此該部分的設(shè)計(jì)成為整個(gè)解碼器設(shè)計(jì)的瓶頸，在此研究了一種新穎的環(huán)路內(nèi)去塊效應(yīng)濾波器設(shè)計(jì)。設(shè)計(jì)中采用5階流水線的去塊效應(yīng)模塊，利用混合濾波順序與打亂的存儲(chǔ)更新機(jī)制的方法提高了流水線暢順性，濾波一個(gè)16×16大小的宏塊僅需要198個(gè)時(shí)鐘周期。

1 H．264／AVC的去塊效應(yīng)

在基于塊的視頻編碼方法中，各個(gè)塊的編解碼是互相獨(dú)立的，由于預(yù)測(cè)、補(bǔ)償、變化、量化等引起塊與塊之間的邊界處會(huì)產(chǎn)生不連續(xù)，因此新版H．264／AVC標(biāo)準(zhǔn)采用了環(huán)路內(nèi)去塊濾波器來(lái)解決每個(gè)16×16宏塊重建后的邊界扭曲問(wèn)題。去塊效應(yīng)濾波有兩種方法：后處理去塊效應(yīng)濾波；環(huán)路內(nèi)去塊效應(yīng)濾波。H．264／AVC采用環(huán)路內(nèi)去塊效應(yīng)濾波（見(jiàn)圖1），即濾波后的幀作為后面預(yù)測(cè)的參考幀。與之前的H．263或MPEG的濾波器相比較，新版H．264標(biāo)準(zhǔn)采用的濾波器基于更小的4×4的基本宏塊，基本宏塊的邊界根據(jù)片級(jí)／宏塊級(jí)的特性與根據(jù)像素穿過(guò)濾波邊界的漸變度，對(duì)需要濾波的宏塊邊界進(jìn)行有條件的濾波。重建幀的每個(gè)像素都需要從外部存儲(chǔ)器中重調(diào)出來(lái)以進(jìn)行濾波處理或作為相鄰像素來(lái)判斷當(dāng)前像素是否需要進(jìn)行濾波。顯然，這些操作需要消耗巨大的存儲(chǔ)器帶寬，對(duì)像素值進(jìn)行修改。

本文設(shè)計(jì)的去塊效應(yīng)濾波模塊采用流水線技術(shù)來(lái)提高系統(tǒng)吞吐量。理想流水線的高效率實(shí)現(xiàn)基于相鄰的濾波操作沒(méi)有數(shù)據(jù)性。文獻(xiàn)［3，4］采用了非流水線的架構(gòu)，因此無(wú)法提高系統(tǒng)的吞吐量。而對(duì)于流水線架構(gòu)，如若不優(yōu)化濾波順序與存儲(chǔ)器訪問(wèn)次序，則所產(chǎn)生的數(shù)據(jù)與結(jié)構(gòu)冒險(xiǎn)也將大大降低流水線的效率。有人使用雙端口的片上SRAM來(lái)減少片外存儲(chǔ)器的帶寬，增加了系統(tǒng)的吞吐量，但是雙端口存儲(chǔ)器面積較大且增加功耗。與流水線的濾波器相比，非流水線濾波器的操作（包括條件判斷、查表、像素計(jì)算等）是順序化的，即每個(gè)時(shí)鐘僅處理一個(gè)操作類(lèi)型，因此它所能達(dá)到的最大系統(tǒng)頻率要低很多。

采用不同的邊界濾波順序，會(huì)大大的影響去塊效應(yīng)濾波器的性能。在H．264／AVC標(biāo)準(zhǔn)中，每個(gè)宏塊的濾波順序得到了描述，只要保持濾波數(shù)據(jù)依賴(lài)性，H．264／AVC標(biāo)準(zhǔn)所描述的濾波順序可以被改進(jìn)。其濾波順序包括兩類(lèi)：順序?yàn)V波和混合濾波。但是其濾波順序以及相應(yīng)的存儲(chǔ)更新機(jī)制都是針對(duì)非流水線結(jié)構(gòu)的，因此如果直接將之應(yīng)用于本文的流水線設(shè)計(jì)，就有可能引發(fā)嚴(yán)重的競(jìng)爭(zhēng)與冒險(xiǎn)從而降低流水線的性能。

2 去塊效應(yīng)濾波器的存儲(chǔ)管理與濾波算法

H．264／AvC標(biāo)準(zhǔn)基于4×4宏塊作為濾波的基本宏塊，它有5種濾波強(qiáng)度，分別是Bs=0，1，2，3，4。濾波方式分為強(qiáng)濾波、標(biāo)準(zhǔn)濾波和直通3種方式，其中強(qiáng)濾波影響邊界兩邊的共6個(gè)像素，標(biāo)準(zhǔn)濾波影響邊界兩邊的共4個(gè)像素，直通方式不修改邊界兩側(cè)的像素。H．264／AVC標(biāo)準(zhǔn)規(guī)定先對(duì)垂直邊界進(jìn)行濾波，然后再對(duì)水平邊界進(jìn)行濾波，只有對(duì)垂直與水平邊界全部濾波完成后，才可以對(duì)下一個(gè)宏塊進(jìn)行濾波。同一個(gè)宏塊中，先對(duì)亮度部分進(jìn)行濾波，再對(duì)色度部分進(jìn)行濾波；色度部分濾波時(shí)，先對(duì)C6部分進(jìn)行濾波，再對(duì)Cr部分進(jìn)行濾波，對(duì)整個(gè)16×16宏塊的濾波順序如圖2所示。

（1）邊界濾波強(qiáng)度與像素濾波的存儲(chǔ)器

按照H．264／AVC的標(biāo)準(zhǔn)，需要對(duì)被濾波的邊界兩側(cè)的像素進(jìn)行有條件的濾波。該條件決定于邊界強(qiáng)度BS與像素穿越邊界的傾斜度。邊界強(qiáng)度BS：0，1，2，3或4，在進(jìn)行濾波之前被賦給相應(yīng)的邊界。BS=4表示強(qiáng)濾波，BS=0表示不需要進(jìn)行濾波，即直通方式；否則，BS=1，2，3表示中等強(qiáng)度的濾波，色度部分邊界的濾波強(qiáng)度與對(duì)應(yīng)亮度部分是相同的。濾波每條水平或垂直邊界需要被提供邊界兩邊的8個(gè)像素，p0～p3q0～q3；需要更新的像素共6個(gè)或4個(gè)：p0～p2q0～q2或聲p0，p1q0，q1。

對(duì)一個(gè)16×16宏塊進(jìn)行濾波需要提供左邊相鄰像素、右邊相鄰像素和本宏塊的像素。對(duì)于宏塊邊界，比如最左邊界與最右邊界而言，p0～p3與q0～q3來(lái)自不同的模塊（即分別來(lái)自相鄰宏塊的像素與本宏塊的像素）；對(duì)于非16×16宏塊的邊界濾波，像素p0～p3與q0～q3均來(lái)自16×16宏塊本身，因此至少需要4個(gè)存儲(chǔ)單元：左相鄰像素存儲(chǔ)單元、上相鄰像素存儲(chǔ)單元、本身模塊的像素存儲(chǔ)單元和轉(zhuǎn)換緩沖單元，每個(gè)存儲(chǔ)單元的帶寬是32位。

當(dāng)濾波從垂直邊界向水平邊界變換時(shí)，為了方便濾波過(guò)程中的存儲(chǔ)器訪問(wèn)，這里利用額外的轉(zhuǎn)換緩沖器BUF0～BUF3來(lái)緩存中間濾波數(shù)據(jù)，采用轉(zhuǎn)換緩沖器后獲取一行或一列像素的值（即p0～p3q0～q3）只需要1個(gè)時(shí)鐘周期，否則需要4個(gè)時(shí)鐘周期。

（2）濾波算法

環(huán)路濾波的基本思想是：判斷該邊界是圖像的真實(shí)邊界還是編碼所形成的塊效應(yīng)邊界；對(duì)真實(shí)邊界不濾波，對(duì)偽邊界根據(jù)像素穿越邊界的漸變度和編碼方式進(jìn)行濾波；根據(jù)濾波強(qiáng)度，選擇不同的濾波系數(shù)對(duì)邊界兩側(cè)像素進(jìn)行濾波操作。濾波強(qiáng)度Bs=0的邊界將不會(huì)進(jìn)行濾波，而濾波強(qiáng)度Bs不為0的邊界，依賴(lài)于獲取的量化參數(shù)α與β，進(jìn)行閾值判斷，對(duì)鄰近的像素進(jìn)行有條件的濾波。當(dāng)濾波強(qiáng)度Bs不是0，并且下面3個(gè)條件成立時(shí)，才對(duì)鄰近像素進(jìn)行濾波。

像素p1僅在式（3）成立的時(shí)候進(jìn)行修改，同p0與q0修改的方式相同；而像素p2與q2對(duì)于濾波強(qiáng)度Bs不為4的情況下，不進(jìn)行濾波。在色度分量進(jìn)行濾波時(shí)，只有對(duì)p0與q0進(jìn)行濾波，濾波的方式與亮度濾波的方式相同。

3 流水線濾波架構(gòu)

3．1 流水線分析

流水線技術(shù)適合于連續(xù)的批處理任務(wù)，當(dāng)一個(gè)N階流水線被灌滿(mǎn)以后，系統(tǒng)在一個(gè)周期內(nèi)可以并行處理N個(gè)任務(wù)，由此提高了整組任務(wù)的處理速度并增大了系統(tǒng)吞吐能力。如果相鄰的濾波操作沒(méi)有數(shù)據(jù)競(jìng)爭(zhēng)，并且所有的階段都被很好地進(jìn)行了平衡，則濾波過(guò)程能夠被進(jìn)行流水線操作化并可將速度提高N倍數(shù)。然而，如若存在競(jìng)爭(zhēng)與冒險(xiǎn)問(wèn)題，則無(wú)法實(shí)現(xiàn)。此時(shí)的主要任務(wù)是如何均衡流水線的各個(gè)階段，如何把總的操作盡可能平均的分配給不同的流水線階段，如何避免或消除競(jìng)爭(zhēng)與冒險(xiǎn)，以便獲得一個(gè)比較平衡暢順的流水線架構(gòu)。按照去塊效應(yīng)濾波器模塊的實(shí)現(xiàn)算法，大多數(shù)的關(guān)鍵路徑位于以下操作中。

（1）查找表操作：取得α，β，c1參數(shù)。α，β參數(shù)均需在查找表操作之前進(jìn)行基于量化參數(shù)與片級(jí)偏移參數(shù)的計(jì)算中使用。當(dāng)Bs=1，2，3時(shí)，為獲取c1進(jìn)行LUT操作，該操作比獲取α，β的LUT操作大3倍。

（2）當(dāng)Bs=4時(shí)，需用4或5抽頭的濾波器進(jìn)行濾波，原來(lái)的p，q像素值需要進(jìn)行移位、相加等操作，以得到最后的結(jié)果。

3．2 流水線架構(gòu)

基于上述分析，這里提出了5階流水線以提高吞吐量，見(jiàn)圖3。由于整個(gè)任務(wù)被分配到不同的階段實(shí)現(xiàn)，降低濾波的平均時(shí)間。

4 階流水線每個(gè)階段的任務(wù)

階流水線每個(gè)階段的任務(wù)為：獲取像素與濾波強(qiáng)度；閾值判斷；預(yù)濾波；二次濾波；回寫(xiě)。操作類(lèi)型轉(zhuǎn)換與可重新配置路徑設(shè)計(jì)：首先進(jìn)行操作類(lèi)型的變換，使用加法與移位操作硬件替換了原來(lái)所有的乘法與除法硬件。當(dāng)Bs=4時(shí)，濾波被3，4，5抽頭的濾波器執(zhí)行，盡管應(yīng)用不同抽頭數(shù)目的濾波器，仍考慮硬件復(fù)用以及輸入數(shù)據(jù)路徑重新配置。由于設(shè)計(jì)中的表達(dá)式采用兩輸入加法，因而可以公用加法的中間結(jié)果。此外，通過(guò)重新配置在不同濾波抽頭系數(shù)時(shí)的加法器的輸入，達(dá)到共享資源的目的。同理，當(dāng)Bs=1，2，3時(shí)，通過(guò)輸入路徑的重新配置，同樣達(dá)到共享加法與減法器，達(dá)到共享資源的目的，資源使用前后對(duì)比見(jiàn)表1。

5 流水線競(jìng)爭(zhēng)與混合濾波順序

5．1 流水線競(jìng)爭(zhēng)的原因

（1）數(shù)據(jù)競(jìng)爭(zhēng)：當(dāng)目的結(jié)果需要用作源操作數(shù)時(shí)；

（2）結(jié)構(gòu)競(jìng)爭(zhēng)：由于有限的存儲(chǔ)器帶寬，大量而頻繁的像素訪問(wèn)需要以及存儲(chǔ)器的低效率管理而引起；

（3）控制競(jìng)爭(zhēng)：相鄰邊界的濾波是相對(duì)獨(dú)立的，當(dāng)一條邊界進(jìn)入它的流水線階段時(shí)，它不能夠停止，直到它的第5階段新像素值回寫(xiě)存儲(chǔ)器操作結(jié)束?？刂聘?jìng)爭(zhēng)，由于分支語(yǔ)句或延遲等待引起的。

5．2 一種新穎的混合濾波順序

傳統(tǒng)的設(shè)計(jì)按照H．264／AVC標(biāo)準(zhǔn)使用了基本的順序?yàn)V波，沒(méi)有考慮到相鄰濾波邊界的數(shù)據(jù)重用與數(shù)據(jù)相互依賴(lài)性以及存儲(chǔ)器的讀與寫(xiě)訪問(wèn)延時(shí)，因此這里提出了新穎的濾波方法。新穎的濾波順序仍然遵守先左后右，先上后下的原則，但是考慮了相鄰邊界的數(shù)據(jù)依賴(lài)性與重用性，解決了數(shù)據(jù)冒險(xiǎn)與結(jié)構(gòu)冒險(xiǎn)問(wèn)題，避免了流水線的延遲。濾波包括亮度部分與色度部分，共48條邊界，濾波順序按照如圖4所示的從小到大的數(shù)字進(jìn)行。

5．3 新穎的存儲(chǔ)更新策略

考慮到外部存儲(chǔ)器的帶寬是32位的，為了配合這里提出的邊界濾波順序，避免由于存儲(chǔ)器的帶寬限制而引起的結(jié)構(gòu)競(jìng)爭(zhēng)從而導(dǎo)致流水線出現(xiàn)延遲，這里提出了新穎的存儲(chǔ)器更新機(jī)制，即給不同的4×4宏塊分配不同的時(shí)隙進(jìn)行像素回寫(xiě)。

去塊效應(yīng)模塊被分配在整個(gè)解碼模塊的最后一步實(shí)現(xiàn)，而其它的重建步驟、像幀內(nèi)濾波模塊、幀間濾波模塊均以4×4宏塊為基本單位來(lái)進(jìn)行流水線處理，但是由于去塊效應(yīng)濾波模塊中不同邊界之間的數(shù)據(jù)依賴(lài)關(guān)系，因而它是以整個(gè)16×16宏塊為基本單位進(jìn)行濾波的。此外，只有整個(gè)16×16宏塊的像素重建完畢之后．才可以進(jìn)行該宏塊的濾波，因而使用了2個(gè)SRAM，一個(gè)為像素重建提供像素；另一個(gè)為像素濾波提供像素，當(dāng)一個(gè)宏塊被處理完畢，兩個(gè)SRAM交換角色，這樣避免在兩個(gè)SRAM之間傳遞數(shù)據(jù)導(dǎo)致的時(shí)間與功耗開(kāi)銷(xiāo)。使用仿真工具對(duì)整個(gè)去塊效應(yīng)頂層模塊DF_top進(jìn)行了仿真，仿真部分結(jié)果如圖5所示。

6 結(jié) 語(yǔ)

使用硬件描述語(yǔ)言完成了設(shè)計(jì)，并在FPGA平臺(tái)上得到驗(yàn)證。設(shè)計(jì)采用流水線技術(shù)，混合濾波方法，配合新穎的存儲(chǔ)器更新機(jī)制等方案，實(shí)時(shí)濾波頻率上限約為200 MHz，吞吐量為濾波每個(gè)16×16宏塊需要198個(gè)時(shí)鐘周期。使用HJTC，CMOS工藝，使用Syn-opsys Co．的DC工具進(jìn)行綜合，時(shí)序分析以及功耗分析，結(jié)論是時(shí)序滿(mǎn)足收斂要求，并且完成單個(gè)宏塊的濾波消耗的能量大約為2μW，功耗得到了很大的降低。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 流水線 濾波技術(shù) 效應(yīng)

評(píng)論

相關(guān)推薦

100W場(chǎng)效應(yīng)管功率放大電路

設(shè)計(jì)方案效應(yīng) 功率放大 | 2009-07-06

基于FPGA流水線結(jié)構(gòu)并行FFT的設(shè)計(jì)與實(shí)現(xiàn)

EDA/PCB FFT FPGA 流水線并行處理 | 2016-10-16

基于并行流水線技術(shù)的RS255/RS233譯碼器設(shè)計(jì)

嵌入式系統(tǒng) ModelSim RS糾錯(cuò)編碼流水線 | 2017-06-05

針對(duì)Flash存儲(chǔ)特性的航天器大容量固態(tài)存儲(chǔ)技術(shù)

模擬技術(shù) 固態(tài)存儲(chǔ)器 Flash存儲(chǔ)特性并行總線流水線 Flash存儲(chǔ)系統(tǒng) | 2016-10-16

一個(gè)用于流水線模數(shù)轉(zhuǎn)換器的高精度、低功耗采樣保持電路

模擬技術(shù) 流水線高精度低功耗采樣保持電路 | 2018-09-12

采用場(chǎng)效應(yīng)管提高輸入阻抗的放大電路

設(shè)計(jì)方案用場(chǎng) 效應(yīng) 提高輸入阻抗放大電路 | 2009-07-06

“零關(guān)稅”效應(yīng)突顯首季上?？诎妒謾C(jī)“大進(jìn)出”

hpnet | 2003-05-01

場(chǎng)效應(yīng)管功率放大電路

設(shè)計(jì)方案效應(yīng) 功率放大 | 2009-07-06

pcb賈凡尼效應(yīng)原理與化學(xué)銀鍍工藝分析

嵌入式系統(tǒng) 賈凡尼效應(yīng) PCB | 2018-08-09

[求助]幫忙推薦一個(gè)貼片場(chǎng)效應(yīng)管!!

shania | 2005-04-06

基于狀態(tài)機(jī)和流水線技術(shù)的3DES加密算法及其FPGA設(shè)計(jì)

資源下載狀態(tài)機(jī) 流水線 3DES 加密算法 FPGA Stratix EP1S25F780C5 | 2008-10-08

ARM與MIPS比較

資源下載 ARM MIPS 流水線指令結(jié)構(gòu) 寄存器地址空間 RISC | 2008-10-19

在示波器上使用DSP 濾波技術(shù)的探討

資源下載 DSP 示波器濾波技術(shù) | 2007-02-28

采用場(chǎng)效應(yīng)管的啟動(dòng)電路

設(shè)計(jì)方案用場(chǎng) 效應(yīng) 啟動(dòng) | 2009-07-06

基于流水線及混合濾波技術(shù)的H．264去塊效應(yīng)模塊設(shè)計(jì)

EDA/PCB 流水線濾波技術(shù) 效應(yīng) | 2016-10-29

輸入端采用場(chǎng)效應(yīng)晶體管的運(yùn)算放大器電路

設(shè)計(jì)方案輸入端用場(chǎng) 效應(yīng) 晶體管運(yùn)算放大器電路 | 2009-07-06

數(shù)字電視CAS中DES加密模塊的FPGA實(shí)現(xiàn)

嵌入式系統(tǒng) 數(shù)據(jù)加密標(biāo)準(zhǔn)算法 DES FPGA 流水線 | 2017-06-05

基于狀態(tài)機(jī)和流水線技術(shù)的3DES加密算法及其FPGA設(shè)計(jì)

資源下載狀態(tài)機(jī) 流水線 3DFS FPGA | 2007-10-23

關(guān)于處理器流水線，此流水線非彼流水線

嵌入式系統(tǒng) 處理器流水線 | 2018-03-27

基于PLB總線的H.264整數(shù)變換量化軟核的設(shè)計(jì)

嵌入式系統(tǒng) 動(dòng)態(tài)數(shù)據(jù)寬度流水線軟核 | 2017-06-05

基于FPGA流水線分布式算法的FIR濾波器的實(shí)現(xiàn)

資源下載 Xilinx FPGA FIR濾波器 Virtex-E 流水線分布式算法 | 2008-10-08

流水線和Data abort的問(wèn)題

Copperhead | 2004-11-09

Xilinx哈夫曼編碼系統(tǒng)設(shè)計(jì)　

網(wǎng)絡(luò)與存儲(chǔ) 哈夫曼編碼流水線并行 201711 | 2017-10-27

流水線的流水性能 (3)

Naiqa | 2002-11-20

常用三極管、場(chǎng)效應(yīng)管資料下載

hpnet | 2003-05-01

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();