H.264與AVS視頻標準核心技術比較
視頻編碼技術在過去幾年最重要的發(fā)展之一是由ITU和ISO/IEC的聯(lián)合視頻小組 (JVT)開發(fā)了H.264/MPEG-4 AVC[8]標準。在發(fā)展過程中,業(yè)界為這種新標準取了許多不同的名稱。ITU在1997年開始利用重要的新編碼工具處理H.26L(長期),結果令人鼓舞,于是ISO決定聯(lián)手ITU組建JVT并采用一個通用的標準。因此,大家有時會聽到有人將這項標準稱為JVT,盡管它并非正式名稱。ITU在2003年5月批準了新的H.264標準。ISO在2003年10 月以MPEG-4 Part 10、高級視頻編碼或AVC的名稱批準了該標準。
本文引用地址:http://www.ex-cimer.com/article/165470.htmH.264 實現(xiàn)的改進創(chuàng)造了新的市場機遇
H.264/AVC在壓縮效率方面取得了巨大突破,一般情況下達到MPEG-2及MPEG-4簡化類壓縮效率的大約2倍。在JVT進行的正式測試中,H.264在85個測試案例中有78%的案例實現(xiàn)1.5倍以上的編碼效率提高,77%的案例中達到2倍以上,部分案例甚至高達4倍。H.264 實現(xiàn)的改進創(chuàng)造了新的市場機遇,如:600Kbps的VHS品質(zhì)視頻可以通過ADSL線路實現(xiàn)視頻點播;高清晰電影無需新的激光頭即可適應普通 DVD。
H.264標準化時支持三個類別:基本類、主類及擴展類。后來一項稱為高保真范圍擴展 (FRExt)的修訂引入了稱為高級類的4個附加類。在初期主要是基本類和主類引起了大家的興趣?;绢惤档土擞嬎慵跋到y(tǒng)內(nèi)存需求,而且針對低時延進行了優(yōu)化。由于B幀的內(nèi)在時延以及CABAC的計算復雜性,因此它不包括這兩者?;绢惙浅_m合可視電話應用以及其他需要低成本實時編碼的應用。
主類提供的壓縮效率最高,但其要求的處理能力也比基本類高許多,因此使其難以用于低成本實時編碼和低時延應用。廣播與內(nèi)容存儲應用對主類最感興趣,它們是為了盡可能以最低的比特率獲得最高的視頻質(zhì)量。
盡管H.264采用與舊標準相同的主要編碼功能,不過它還具有許多與舊標準不同的新功能,它們一起實現(xiàn)了編碼效率的提高。其主要差別,概述如下:
幀內(nèi)預測與編碼:H.264采用空域幀內(nèi)預測技術來預測相鄰塊鄰近像素的Intra-MB中的像素。它對預測殘差信號和預測模式進行編碼,而不是編碼塊中的實際像素。這樣可以顯著提高幀內(nèi)編碼效率。
幀間預測與編碼:H.264中的幀間編碼采用了舊標準的主要功能,同時也增加了靈活性及可操作性,包括適用于多種功能的幾種塊大小選項,如:運動補償、四分之一像素運動補償、多參考幀、通用 (generalized)雙向預測和自適應環(huán)路去塊。
可變矢量塊大小:允許采用不同塊大小執(zhí)行運動補償。可以為小至4(4的塊傳輸單個運動矢量,因此在雙向預測情況下可以為單個MB傳輸多達32個運動矢量。另外還支持16(8、8(16、8(8、8(4和4(8的塊大小。降低塊大小可以提高運動細節(jié)的處理能力,因而提高主觀質(zhì)量感受,包括消除較大的塊化失真。
四分之一像素運動估計:通過允許半像素和四分之一像素運動矢量分辨率可以改善運動補償。
多參考幀預測:16個不同的參考幀可以用于幀間編碼,從而可以改善視頻質(zhì)量的主觀感受并提高編碼效率。提供多個參考幀還有助于提高H.264位流的容錯能力。值得注意的是,這種特性會增加編碼器與解碼器的內(nèi)存需求,因為必須在內(nèi)存中保存多個參考幀。
自適應環(huán)路去塊濾波器:H.264采用一種自適應解塊濾波器,它會在預測回路內(nèi)對水平和垂直區(qū)塊邊緣進行處理,用于消除塊預測誤差造成的失真。這種濾波通常是基于4(4塊邊界為運算基礎,其中邊界各邊的3個像素可通過4級濾波器進行更新。
整數(shù)變換:采用DCT的早期標準必須為逆變換的固點實施來定義舍入誤差的容差范圍。編碼器與解碼器之間的 IDCT 精度失配造成的漂移是質(zhì)量損失的根源。H.264利用整數(shù)4(4空域變換解決了這一問題——這種變換是DCT的近似值。4(4的小區(qū)塊還有助于減少阻塞與振鈴失真。
量化與變換系數(shù)掃描:變換系數(shù)通過標量量化方式得到量化,不產(chǎn)生加大的死區(qū)。與之前的標準類似,每個MB都可選擇不同的量化步長,不過步長以大約12.5%的復合速率增加,而不是固定遞增。同時,更精細的量化步長還可以用于色度成分,尤其是在粗劣量化光度系數(shù)的情況下。
熵編碼:與根據(jù)所涉及的數(shù)據(jù)類型提供多個靜態(tài)VLC表的先前標準不同,H.264針對變換系數(shù)采用上下文自適應VLC,同時針對所有其他符號采用統(tǒng)一的VLC (UniversalVLC)方法。主類還支持新的上下文自適應二進制算術編碼器 (CABAC)。CAVLC優(yōu)于以前的VLC實施,不過成本卻比VLC高。
CABAC利用編碼器和譯碼器的機率模型來處理所有語法元素 (syntax elements),包括:變換系數(shù)和運動矢量。為了提高算術編碼的編碼效率,基本概率模型通過一種稱為上下文建模的方法對視頻幀內(nèi)不斷變換的統(tǒng)計進行適應。上下文建模分析提供編碼符號的條件概率估計值。只要利用適當?shù)纳舷挛哪P停湍芨鶕?jù)待編碼符號周圍的已編碼符號,在不同的概率模型間進行切換,進而充份利用符號間的冗余性。每個語法元素都可以保持不同的模型(例如,運動矢量和變換系數(shù)具有不同的模型)。相較于VLC熵編碼方法 (UVLC/CAVLC),CABAC 能多節(jié)省10%bit速率。
加權預測:它利用前向和后向預測的加權總和建立對雙向內(nèi)插宏模塊的預測,這樣可以提高場景變化時的編碼效率,尤其是在衰落情況下。
保真度范圍擴展:2004年7月,H.264標準增加了稱為保真度范圍擴展 (FRExt) [11]的新修訂。這次擴展在H.264中添加了一整套工具,而且允許采用附加的色域、視頻格式和位深度。另外還增加了對無損幀間編碼與立體顯示視頻的支持。FRExt修訂版在H.264中引入了4種新類,即:
•High Profile (HP):用于標準 4:2:0色度采樣,每分量8位彩色。此類引入了新的工具—— 隨后詳述。
•High 10 Profile (Hi10P):用于更高清晰度視頻顯示的標準 4:2:0 色度采樣,10位彩色。
•High 4:2:2 10 bit color profile (H422P):用于源編輯功能。
•High 4:4:4 12 bit color profile (H444P):最高品質(zhì)的源編輯與色彩保真度,支持視頻區(qū)域的無損編碼以及與新的整數(shù)色域變換(從RGB到YUV及黑色)。
在新的應用領域中,H.264 HP對廣播與DVD尤為有利。某些試驗顯示出H.264 HP的性能比MPEG2 提高了3倍。下面介紹H.264 HP中引入的主要附加工具。
評論