視頻壓縮技術(shù)的系統(tǒng)考慮
整數(shù)變換:采用 DCT 的早期標(biāo)準(zhǔn)必須為逆變換的固點(diǎn)實(shí)施來定義舍入誤差的容差范圍。編碼器與解碼器之間的 IDCT 精度失配造成的漂移是質(zhì)量損失的根源。H.264 利用整數(shù) 4(4 空域變換解決了這一問題——這種變換是 DCT 的近似值。4(4 的小區(qū)塊還有助于減少阻塞與振鈴失真。
量化與變換系數(shù)掃描:變換系數(shù)通過標(biāo)量量化方式得到量化,不產(chǎn)生加大的死區(qū)。與之前的標(biāo)準(zhǔn)類似,每個 MB 都可選擇不同的量化步長,不過步長以大約 12.5%的復(fù)合速率增加,而不是固定遞增。同時,更精細(xì)的量化步長還可以用于色度成分,尤其是在粗劣量化光度系數(shù)的情況下。
熵編碼:與根據(jù)所涉及的數(shù)據(jù)類型提供多個靜態(tài) VLC 表的先前標(biāo)準(zhǔn)不同,H.264 針對變換系數(shù)采用上下文自適應(yīng) VLC,同時針對所有其他符號采用統(tǒng)一的 VLC (Universal VLC) 方法。主類還支持新的上下文自適應(yīng)二進(jìn)制算術(shù)編碼器 (CABAC)。CAVLC 優(yōu)于以前的 VLC 實(shí)施,不過成本卻比VLC高。
CABAC利用編碼器和譯碼器的機(jī)率模型來處理所有語法元素 (syntax elements),包括:變換系數(shù)和運(yùn)動矢量。為了提高算術(shù)編碼的編碼效率,基本概率模型通過一種稱為上下文建模的方法對視頻幀內(nèi)不斷變換的統(tǒng)計進(jìn)行適應(yīng)。上下文建模分析提供編碼符號的條件概率估計值。只要利用適當(dāng)?shù)纳舷挛哪P?,就能根?jù)待編碼符號周圍的已編碼符號,在不同的概率模型間進(jìn)行切換,進(jìn)而充份利用符號間的冗余性。每個語法元素都可以保持不同的模型(例如,運(yùn)動矢量和變換系數(shù)具有不同的模型)。相較于 VLC 熵編碼方法 (UVLC/CAVLC),CABAC 能多節(jié)省 10 % bit速率。
加權(quán)預(yù)測:它利用前向和后向預(yù)測的加權(quán)總和建立對雙向內(nèi)插宏模塊的預(yù)測,這樣可以提高場景變化時的編碼效率,尤其是在衰落情況下。
保真度范圍擴(kuò)展
2004 年 7 月,H.264 標(biāo)準(zhǔn)增加了稱為保真度范圍擴(kuò)展 (FRExt) [11]的新修訂。這次擴(kuò)展在H.264 中添加了一整套工具,而且允許采用附加的色域、視頻格式和位深度。另外還增加了對無損幀間編碼與立體顯示視頻的支持。FRExt 修訂版在 H.264 中引入了 4 種新類,即:
* High Profile (HP):用于標(biāo)準(zhǔn) 4:2:0 色度采樣,每分量 8 位彩色。此類引入了新的工具 —— 隨后詳述。
* High 10 Profile (Hi10P):用于更高清晰度視頻顯示的標(biāo)準(zhǔn) 4:2:0 色度采樣,10 位彩色。
* High 4:2:2 10 bit color profile (H422P):用于源編輯功能,如:( 混合。
* High 4:4:4 12 bit color profile (H444P):最高品質(zhì)的源編輯與色彩保真度,支持視頻區(qū)域的無損編碼以及與新的整數(shù)色域變換(從 RGB 到 YUV 及黑色)。
在新的應(yīng)用領(lǐng)域中,H.264 HP 對廣播與 DVD 尤為有利。某些試驗顯示出 H.264 HP 的性能比MPEG2 提高了 3 倍。下面介紹 H.264 HP 中引入的主要附加工具。
自適應(yīng)殘差塊大小與整數(shù) 8(8 變換:用于變換編碼的殘差塊可以在 8(8 與 4(4 之間切換。引入了用于 8(8 塊的新 16 位整數(shù)變換。較小的塊仍然可以采用以前的 4(4 變換。
8(8 亮度幀內(nèi)預(yù)測:增加了 8 種模式,除之前的 16(16 和 4(4 塊以外,使亮度內(nèi)部宏模塊還能夠?qū)?8(8 塊進(jìn)行幀內(nèi)預(yù)測。
量化加權(quán):用于量化 8(8 變換系數(shù)的新量化加權(quán)矩陣。
單色:支持黑/白視頻編碼。
8. Windows Media Video 9 / VC-1
Windows Media 是提供網(wǎng)上音樂與視頻預(yù)訂服務(wù)與視頻流的主要格式。微軟公司于 2002 年推出了 Windows Media Video 9 系列編解碼器,實(shí)現(xiàn)了視頻壓縮效率的顯著提高。WMV9 另外還作為 VC-1 在 SMPTE 中實(shí)現(xiàn)了標(biāo)準(zhǔn)化[12]。
與 H.264 類似,它包含許多高級編碼工具,不過種類有所不同。除了支持半象素雙線性插值之外,WMV9 的 ME 還允許 1/4 象素雙立方插值(采用 4 抽頭近似雙立方濾波器)。另外它還包含與 H.264 類似的環(huán)內(nèi)去塊濾波器,不過濾波器和決策細(xì)節(jié)不同。其他部分功能包括:
多個 VLC 表:WMV9 主類包含多套針對不同類型內(nèi)容進(jìn)行優(yōu)化的 VLC 表。這些表可以在幀級切換,以適應(yīng)輸入視頻的特征。
DCT/IDCT 變換切換:WMV9 支持多種 DCT 塊大小,包括:8(8、8(4、4(8 和 4(4。其采用專用的 16 位整數(shù)變換與逆變換。
量化:采用一般基于步長的量化和死區(qū)量化。死區(qū)量化可以在低比特率時實(shí)現(xiàn)顯著節(jié)省。
另一個有趣的功能是能夠在涉及衰落的情況下采用明確的衰落補(bǔ)償。它可以提高這些情況下運(yùn)動補(bǔ)償?shù)馁|(zhì)量。
WMV9/VC-1 在性能方面與 MPEG-2 和 MPEG-4 簡化類相比有顯著提高,相對于 H.264,其知覺質(zhì)量感受也非常優(yōu)秀[13]。不過,在提供相似壓縮效率情況下,WMV9/VC-1 與 H.264 主類相比復(fù)雜性要求較低。WMV9 廣泛應(yīng)用于個人電腦環(huán)境,而且已經(jīng)成為互聯(lián)網(wǎng)消費(fèi)設(shè)備中的重要技術(shù)。WMV9/VC-1 在好萊塢和獨(dú)立制片業(yè)正日益受寵,多部電影的發(fā)行開始采用WMV9/VC-1 進(jìn)行編碼,以實(shí)現(xiàn) PC DVD 上的高清晰播放。此外,WMV9 已經(jīng)作為新興的 HD-DVD 格式壓縮選項實(shí)現(xiàn)了標(biāo)準(zhǔn)化。
9. AVS
中國信息產(chǎn)業(yè)部成立的音視頻技術(shù)標(biāo)準(zhǔn) (AVS) 工作組宣布準(zhǔn)備針對移動多媒體、廣播、DVD等應(yīng)用編寫一份國家標(biāo)準(zhǔn)。該視頻標(biāo)準(zhǔn)稱為 AVS [14],由兩個相關(guān)部分組成 - 針對移動視頻應(yīng)用的 AVS-M 和針對廣播與 DVD 的 AVS1.0。AVS 標(biāo)準(zhǔn)與 H.264 相似。
AVS1.0 同時支持隔行和逐行掃描模式。AVS 中 P 幀可以利用 2 幀的前向參考幀,同時允許 B 幀采用前后各一個幀。在隔行模式下,4 個場可以用作參考??梢詢H在幀級執(zhí)行隔行模式中的幀/場編碼,這一點(diǎn)與 H.264 不同,其中允許此選項的 MB 級自適應(yīng)。AVS 具有與 H.264相似的環(huán)路濾波器,可以在幀級關(guān)閉。另外,B 幀還無需環(huán)路濾波器。幀內(nèi)預(yù)測是以 8(8 塊為單位進(jìn)行。MC 允許對亮度塊進(jìn)行 1/4 象素補(bǔ)償。ME 的塊大小可以是 16(16、16(8、8(16 或 8(8。變換方式是基于 16 位的 8(8 整數(shù)變換(與 WMV9 相似)。VLC 是基于上下文自適應(yīng) 2D 運(yùn)行/級別編碼。采用 4 個不同的 Exp-Golomb 編碼。用于每個已量化系數(shù)的編碼自適應(yīng)到相同 8(8 塊中前面的符號。由于 Exp-Golomb 表是參數(shù)化的表,因此表較小。用于逐行視頻序列的 AVS 1.0 的視頻質(zhì)量在相同比特率時稍遜于 H.264 主類。
AVS-M 主要針對移動視頻應(yīng)用,與 H.264 基本規(guī)范存在交叉。它僅支持逐行視頻、I 與 P 幀,不支持 B 幀。主要 AVS-M 編碼工具包括基于 4(4 塊的幀內(nèi)預(yù)測、1/4象素運(yùn)動補(bǔ)償、整數(shù)變換與量化、上下文自適應(yīng) VLC 以及高度簡化的環(huán)路濾波器。與 H.264 基本規(guī)范相似,AVS-M 中的運(yùn)動矢量塊大小降至 4(4,因此 MB 可擁有多達(dá) 16 個運(yùn)動矢量。采用多幀預(yù)測,但僅支持 2 個參考幀。此外,AVS-M 中還定義了 H.264 HRD/SEI 消息的子集。AVS-M的編碼頻率約為 0.3dB,在相同設(shè)置下稍遜于 H.264 基本規(guī)范,而解碼器的復(fù)雜性卻降低了大約20%。
評論