H.264與AVS視頻標(biāo)準(zhǔn)核心技術(shù)比較
自適應(yīng)殘差塊大小與整數(shù)8(8變換:用于變換編碼的殘差塊可以在8(8與4(4之間切換。引入了用于8(8塊的新16位整數(shù)變換。較小的塊仍然可以采用以前的4(4變換。
8(8亮度幀內(nèi)預(yù)測(cè):增加了8種模式,除之前的16(16和4(4塊以外,使亮度內(nèi)部宏模塊還能夠?qū)?(8塊進(jìn)行幀內(nèi)預(yù)測(cè)。
量化加權(quán) :用于量化8(8變換系數(shù)的新量化加權(quán)矩陣。
單色:支持黑/白視頻編碼。
2002 年,中國(guó)信息產(chǎn)業(yè)部成立的音視頻技術(shù)標(biāo)準(zhǔn) (AVS)工作組宣布準(zhǔn)備針對(duì)移動(dòng)多媒體、廣播、DVD等應(yīng)用編寫(xiě)一份國(guó)家標(biāo)準(zhǔn)。該視頻標(biāo)準(zhǔn)稱(chēng)為AVS [14],由兩個(gè)相關(guān)部分組成針對(duì)移動(dòng)視頻應(yīng)用的AVS-M和針對(duì)廣播與DVD的AVS1.0。AVS標(biāo)準(zhǔn)與H.264相似。
AVS1.0同時(shí)支持隔行和逐行掃描模式。AVS中P幀可以利用2幀的前向參考幀,同時(shí)允許B幀采用前后各一個(gè)幀。在隔行模式下,4個(gè)場(chǎng)可以用作參考??梢?xún)H在幀級(jí)執(zhí)行隔行模式中的幀/場(chǎng)編碼,這一點(diǎn)與H.264不同,其中允許此選項(xiàng)的MB級(jí)自適應(yīng)。AVS具有與H.264相似的環(huán)路濾波器,可以在幀級(jí)關(guān)閉。另外,B幀還無(wú)需環(huán)路濾波器。幀內(nèi)預(yù)測(cè)是以8(8塊為單位進(jìn)行。MC允許對(duì)亮度塊進(jìn)行1/4象素補(bǔ)償。ME的塊大小可以是16(16、16(8、8(16或8(8。變換方式是基于16位的8(8整數(shù)變換(與WMV9相似)。VLC是基于上下文自適應(yīng)2D運(yùn)行/級(jí)別編碼。采用4個(gè)不同的Exp-Golomb編碼。用于每個(gè)已量化系數(shù)的編碼自適應(yīng)到相同8(8塊中前面的符號(hào)。由于Exp-Golomb表是參數(shù)化的表,因此表較小。用于逐行視頻序列的AVS 1.0的視頻質(zhì)量在相同比特率時(shí)稍遜于H.264主類(lèi)。
AVS-M主要針對(duì)移動(dòng)視頻應(yīng)用,與H.264基本規(guī)范存在交叉。它僅支持逐行視頻、I與P幀,不支持B幀。主要AVS-M編碼工具包括基于4(4塊的幀內(nèi)預(yù)測(cè)、1/4象素運(yùn)動(dòng)補(bǔ)償、整數(shù)變換與量化、上下文自適應(yīng)VLC以及高度簡(jiǎn)化的環(huán)路濾波器。與H.264基本規(guī)范相似AVS-M中的運(yùn)動(dòng)矢量塊大小降至4(4,因此MB可擁有多達(dá)16個(gè)運(yùn)動(dòng)矢量。采用多幀預(yù)測(cè),但僅支持2個(gè)參考幀。此外,AVS-M中還定義了H.264 HRD/SEI消息的子集。AVS-M的編碼頻率約為0.3dB,在相同設(shè)置下稍遜于H.264基本規(guī)范,而解碼器的復(fù)雜性卻降低了大約20%。
H.264和AVS的背景
H.264/MPEG-4AVC是ITU-T的VCG(Video Coding Experts Group)和ISO/IEC的MPEG(Moving Picture Experts Group)聯(lián)合開(kāi)發(fā)的新一代視頻編碼標(biāo)準(zhǔn)。應(yīng)用范圍包括可視電話、視頻會(huì)議等。H.264的主要特色就是極大得提高了壓縮率,是MPEG-2及MPEG-4壓縮效率的一倍以上。H.264核心技術(shù)與之前標(biāo)準(zhǔn)相同,仍采用基于預(yù)測(cè)變換的混合編碼框架,但是在細(xì)節(jié)的實(shí)現(xiàn)上有很大不同,就是細(xì)節(jié)上的改進(jìn)導(dǎo)致壓縮效率極大得提高。而且新一代視頻編碼標(biāo)準(zhǔn)H.264具有良好的網(wǎng)絡(luò)適應(yīng)性和容錯(cuò)等特點(diǎn)。
AVS的誕生可以說(shuō)是一個(gè)歷史的機(jī)遇,面對(duì)H.264以及MPEG-2等標(biāo)準(zhǔn)高額的專(zhuān)利費(fèi),我國(guó)數(shù)字視頻產(chǎn)業(yè)面臨嚴(yán)重挑戰(zhàn)。加上我國(guó)致力于提高國(guó)內(nèi)數(shù)字音視頻產(chǎn)業(yè)的核心競(jìng)爭(zhēng)力,由國(guó)家信息產(chǎn)業(yè)部科學(xué)技術(shù)司于2006年6月批準(zhǔn)成立了“數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組”,聯(lián)合國(guó)內(nèi)從事數(shù)字音視頻編解碼技術(shù)研發(fā)的科研機(jī)構(gòu)和企業(yè),針對(duì)我國(guó)音視頻產(chǎn)業(yè)的需求,提出了我國(guó)自主知識(shí)產(chǎn)權(quán)的信源編碼標(biāo)準(zhǔn)DDD《信息技術(shù) 先進(jìn)音視頻編碼》系列標(biāo)準(zhǔn),簡(jiǎn)稱(chēng)AVS(audio video coding standard).自主的AVS標(biāo)準(zhǔn)在技術(shù)和性能上處于國(guó)際先進(jìn)水平,如果抓住這次機(jī)遇,我國(guó)在技術(shù)-專(zhuān)利-標(biāo)準(zhǔn)-芯片-系統(tǒng)-產(chǎn)業(yè)這個(gè)產(chǎn)業(yè)鏈上,就有可能具有全面的主動(dòng)權(quán)。
H.264和AVS核心技術(shù)分析及對(duì)比
H.264和以前的標(biāo)準(zhǔn)一樣,還是采用的混合編碼的框架,AVS視頻標(biāo)準(zhǔn)采用了與H.264類(lèi)似的技術(shù)框架,包括變換、量化、熵編碼、幀內(nèi)預(yù)測(cè)、幀間預(yù)測(cè)、環(huán)路濾波等模塊。他們核心技術(shù)的不同包括以下幾點(diǎn):
一、變換和量化
H.264對(duì)殘差數(shù)據(jù)采用基于塊的變換編碼,去除原始圖像的空間冗余,使圖像能力集中在小部分系數(shù)上,直流系數(shù)值一般來(lái)說(shuō)是最大的,這樣可以提高壓縮比、增強(qiáng)抗干擾能力。先前標(biāo)準(zhǔn)一般采用DCT變換,這種變換的缺點(diǎn)是會(huì)出現(xiàn)失配現(xiàn)象,原始數(shù)據(jù)經(jīng)過(guò)變換和反變換恢復(fù)后會(huì)有一個(gè)差值,由于是實(shí)數(shù)運(yùn)算計(jì)算量也比較大。H.264采用的是基于4×4塊的整數(shù)變換。
AVS采用8×8的整數(shù)變換,可以在16位處理器上無(wú)失配地實(shí)現(xiàn)。對(duì)高分辨率的視頻圖像去相關(guān)性要比4×4變換有效,采用了64級(jí)量化,可以適應(yīng)不同的應(yīng)用和業(yè)務(wù)對(duì)碼流和質(zhì)量的要求。
二、幀內(nèi)預(yù)測(cè)
H.264和AVS技術(shù)都采用幀內(nèi)預(yù)測(cè)的方式,用相鄰的像素預(yù)測(cè)當(dāng)前塊,采用代表空間域紋理的多種預(yù)測(cè)模式。H.264的亮度預(yù)測(cè)有4×4塊和16×16塊2種預(yù)測(cè)方式,對(duì)于4×4的塊:從-135度到+22.5度方向加上一個(gè)直流預(yù)測(cè)一共是9種預(yù)測(cè)方向;對(duì)于16×16塊:有4種預(yù)測(cè)方向。色度預(yù)測(cè)是8×8塊,有4種預(yù)測(cè)模式,類(lèi)似于幀內(nèi)16×16預(yù)測(cè)的4種模式,其中DC為模式0、水平為模式1、垂直為模式2、平面為模式3。
三、幀間預(yù)測(cè)
H.264幀間預(yù)測(cè)是利用以編碼視頻幀和基于塊的運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)模式,與以往標(biāo)準(zhǔn)幀間預(yù)測(cè)的區(qū)別在于塊尺寸范圍更廣、亞像素運(yùn)動(dòng)矢量的使用和多參考幀的運(yùn)用。
H.264有16×16、16×8、8×16、8×8、8×4、4×8和4×4一共8種宏塊及子宏塊劃分,而AVS只有16×16、16×8、8×16和8×8一共4種宏塊劃分方式。
H.264支持使用多個(gè)不同的參考幀對(duì)幀間宏塊和片進(jìn)行預(yù)測(cè),AVS中P幀可以利用至多2幀的前向參考幀,B幀采用前后各一個(gè)參考幀。
四、熵編碼
H.264制定了基于信息量的熵編碼效率,一種是對(duì)所有的待編碼的符號(hào)采用統(tǒng)一的可變長(zhǎng)編碼(UVLC),另一種是采用基于內(nèi)容的自適應(yīng)二進(jìn)制算術(shù)編碼(CABAC, Context-Adaptive Binary Arithmetic Coding),大大減少了塊編碼相關(guān)性冗余,提高了編碼效率。UVLC計(jì)算復(fù)雜度較低,主要針對(duì)對(duì)編碼時(shí)間很?chē)?yán)格的應(yīng)用,缺點(diǎn)就是效率低,碼率較高。CABAC是一種效率很高的熵編碼方法,其編碼效率比UVLC編碼高50%。
AVS熵編碼采用自適應(yīng)變長(zhǎng)編碼技術(shù)。在AVS熵編碼過(guò)程中,所有的語(yǔ)法元素和殘差數(shù)據(jù)都是以指數(shù)哥倫布碼的形式映射成二進(jìn)制比特流。
評(píng)論