基于流水線及混合濾波技術(shù)的H.264去塊效應(yīng)模塊設(shè)
像素p1僅在式(3)成立的時候進(jìn)行修改,同p0與q0修改的方式相同;而像素p2與q2對于濾波強(qiáng)度Bs不為4的情況下,不進(jìn)行濾波。在色度分量進(jìn)行濾波時,只有對p0與q0進(jìn)行濾波,濾波的方式與亮度濾波的方式相同。
3 流水線濾波架構(gòu)
3.1 流水線分析
流水線技術(shù)適合于連續(xù)的批處理任務(wù),當(dāng)一個N階流水線被灌滿以后,系統(tǒng)在一個周期內(nèi)可以并行處理N個任務(wù),由此提高了整組任務(wù)的處理速度并增大了系統(tǒng)吞吐能力。如果相鄰的濾波操作沒有數(shù)據(jù)競爭,并且所有的階段都被很好地進(jìn)行了平衡,則濾波過程能夠被進(jìn)行流水線操作化并可將速度提高N倍數(shù)。然而,如若存在競爭與冒險問題,則無法實(shí)現(xiàn)。此時的主要任務(wù)是如何均衡流水線的各個階段,如何把總的操作盡可能平均的分配給不同的流水線階段,如何避免或消除競爭與冒險,以便獲得一個比較平衡暢順的流水線架構(gòu)。按照去塊效應(yīng)濾波器模塊的實(shí)現(xiàn)算法,大多數(shù)的關(guān)鍵路徑位于以下操作中。
(1)查找表操作:取得α,β,c1參數(shù)。α,β參數(shù)均需在查找表操作之前進(jìn)行基于量化參數(shù)與片級偏移參數(shù)的計算中使用。當(dāng)Bs=1,2,3時,為獲取c1進(jìn)行LUT操作,該操作比獲取α,β的LUT操作大3倍。
(2)當(dāng)Bs=4時,需用4或5抽頭的濾波器進(jìn)行濾波,原來的p,q像素值需要進(jìn)行移位、相加等操作,以得到最后的結(jié)果。
3.2 流水線架構(gòu)
基于上述分析,這里提出了5階流水線以提高吞吐量,見圖3。由于整個任務(wù)被分配到不同的階段實(shí)現(xiàn),降低濾波的平均時間。
4 階流水線每個階段的任務(wù)
階流水線每個階段的任務(wù)為:獲取像素與濾波強(qiáng)度;閾值判斷;預(yù)濾波;二次濾波;回寫。操作類型轉(zhuǎn)換與可重新配置路徑設(shè)計:首先進(jìn)行操作類型的變換,使用加法與移位操作硬件替換了原來所有的乘法與除法硬件。當(dāng)Bs=4時,濾波被3,4,5抽頭的濾波器執(zhí)行,盡管應(yīng)用不同抽頭數(shù)目的濾波器,仍考慮硬件復(fù)用以及輸入數(shù)據(jù)路徑重新配置。由于設(shè)計中的表達(dá)式采用兩輸入加法,因而可以公用加法的中間結(jié)果。此外,通過重新配置在不同濾波抽頭系數(shù)時的加法器的輸入,達(dá)到共享資源的目的。同理,當(dāng)Bs=1,2,3時,通過輸入路徑的重新配置,同樣達(dá)到共享加法與減法器,達(dá)到共享資源的目的,資源使用前后對比見表1。
評論