新的視頻壓縮標(biāo)準(zhǔn)對(duì)測(cè)試技術(shù)提出挑戰(zhàn)
——
近幾年來(lái),數(shù)字通信媒體包括有線電視、衛(wèi)星、因特網(wǎng)、DVD等等,它們的傳輸容量取得了突飛猛進(jìn)的發(fā)展,雖然容量在不斷地增加,然而,這些媒體所能提供的節(jié)目通道容量只具有兩個(gè)或稍多些的數(shù)量級(jí),這對(duì)于傳輸/存儲(chǔ)未經(jīng)壓縮的高質(zhì)量視頻節(jié)目來(lái)說(shuō),還是嫌太小。
圖1:視頻壓縮標(biāo)準(zhǔn)的演變過(guò)程。
現(xiàn)在,對(duì)更多頻道數(shù)、移動(dòng)視頻、高質(zhì)量視頻、高清晰度視頻的需求愈來(lái)愈強(qiáng)烈,數(shù)字通信媒體容量的增長(zhǎng)速率遠(yuǎn)遠(yuǎn)不能滿足消費(fèi)者期望值的增長(zhǎng)需要。視頻節(jié)目究竟需要多大的帶寬?
在有線傳輸中,一套質(zhì)量良好的標(biāo)準(zhǔn)清晰度(SD)視頻節(jié)目(分辨率為720X480NTSC或720x576PAL),大約需要10-12Mbps的帶寬。如果在相同的帶寬內(nèi)能夠傳輸三個(gè)或者更多的頻道數(shù)是不是更好?果能如此,將會(huì)給消費(fèi)者帶來(lái)更多的選擇,也會(huì)給服務(wù)供應(yīng)商帶來(lái)更多的收益。
如果是高清晰度(HD)電視又會(huì)怎么樣?傳輸一個(gè)頻道、分辨率為720的HD節(jié)目(即1280X720,逐行掃描格式)的所需帶寬大約是一個(gè)頻道SD節(jié)目的2.6倍,而傳輸一個(gè)頻道、分辨率為1080i(即1920x1088,隔行掃描格式--這也是為大多數(shù)電視廣播地區(qū)所樂(lè)于作出的選擇)的HD節(jié)目,所需帶寬大約是一個(gè)頻道SD節(jié)目的6倍。節(jié)目供應(yīng)商也許會(huì)在SD節(jié)目上增加HD節(jié)目,但是消費(fèi)者卻不愿意只能收看較少的節(jié)目(也不愿意為HD支付更多的費(fèi)用)。這樣看來(lái),如果不在傳輸和接收技術(shù)上額外增加投資,唯一的選擇就是采用更好的視頻壓縮方案。
視頻壓縮并不是什么新鮮事物;它早在1980年就有了H.261視頻壓縮標(biāo)準(zhǔn),它是為視頻會(huì)議應(yīng)用而設(shè)計(jì)的,其比特率為64kbps,如圖1所示。按照H.261視頻壓縮標(biāo)準(zhǔn),它的畫面尺寸較小,受到幀頻的限制,但是,它反映了當(dāng)時(shí)能夠處理圖象壓縮的能力和可以實(shí)現(xiàn)的可用帶寬。
標(biāo)準(zhǔn)的演變
多少年來(lái),在視頻壓縮算法/壓縮標(biāo)準(zhǔn)上并行著兩個(gè)國(guó)際組織的開發(fā)過(guò)程:1. H標(biāo)準(zhǔn),這是由ITU(國(guó)際電信聯(lián)盟)所開發(fā)的標(biāo)準(zhǔn)。2. MPEG標(biāo)準(zhǔn),這是由MPEG委員會(huì)、后來(lái)又經(jīng)lSO(國(guó)際標(biāo)準(zhǔn)組織)所批準(zhǔn)的標(biāo)準(zhǔn)。
正如人們所預(yù)計(jì)的那樣,新的視頻壓縮標(biāo)準(zhǔn)要優(yōu)于老的視頻壓縮標(biāo)準(zhǔn),對(duì)于相同的圖像序列,分別采用MPEG-2和H.264/AVC標(biāo)準(zhǔn)進(jìn)行壓縮,比較結(jié)果如圖2所示,后者的壓縮比得到了改善。什么原因使MPEG-4未能得到廣泛的采用?MPEG-4第二部分可以提供良好的視頻壓縮質(zhì)量,明顯地超出早期標(biāo)準(zhǔn),但它并沒有得到更充分的利用。
就商業(yè)應(yīng)用而言,H.26/AVC卻超過(guò)了它,這是什么原因呢? 有這樣幾個(gè)原因:
1. MPEG-4標(biāo)準(zhǔn)實(shí)際上是一個(gè)十分龐大的而又復(fù)雜的標(biāo)準(zhǔn),它由許多部分所組成:視頻、句法結(jié)構(gòu)、音頻、系統(tǒng)、參考軟件、測(cè)試比特流、數(shù)字權(quán)限管理等等。為使標(biāo)準(zhǔn)中的各個(gè)部分相互兼容,這無(wú)疑是一項(xiàng)非常艱巨的工作,因而也就延緩了標(biāo)準(zhǔn)的制訂過(guò)程。
2. 單就MPEG-4視頻部分(即lS014496-2 MPEG-4第二部分,圖像)而言,它也是一個(gè)很復(fù)雜的標(biāo)準(zhǔn),到目前為止,它還涉及到一些在商業(yè)上如何實(shí)現(xiàn)的問(wèn)題。
3. 由于標(biāo)準(zhǔn)非常復(fù)雜,它有許多類別,其中有相當(dāng)多的部分都是無(wú)法在商業(yè)上獲得應(yīng)用的。
4. 標(biāo)準(zhǔn)中有許多部分在技術(shù)上作了折衷處理,例如有關(guān)句法結(jié)構(gòu)也不象它應(yīng)具備的那樣清晰,這就造成難于執(zhí)行以及存在著互操作性問(wèn)題。
5. 標(biāo)準(zhǔn)中有一些內(nèi)容不是十分清楚,也不夠開放。
6. 標(biāo)準(zhǔn)中還存在著某些錯(cuò)誤,例如標(biāo)準(zhǔn)和所規(guī)定的參考軟件、所規(guī)定的比特流相互之間有時(shí)存在著不一致的地方。
在MPEG-4的開發(fā)和標(biāo)準(zhǔn)化的過(guò)程中,壓縮技術(shù)仍在繼續(xù)發(fā)展-H.264/VC無(wú)疑具有更好的壓縮性能。在商業(yè)應(yīng)用上,其中的一個(gè)重要方面是許可證問(wèn)題:對(duì)MPEG-4的第二部分來(lái)說(shuō),完善許可證的管理需要太長(zhǎng)的過(guò)程。如此說(shuō)來(lái),雖然有許多人熱衷于MPEG-4的第二部分,但是,有更多新的工作正在轉(zhuǎn)向H.264/AVC,也包括VC-1在內(nèi)。
是什么因素推動(dòng)了H.264/AVC和VC-l標(biāo)準(zhǔn)的建立? H.264/AVC是很誘人的,這是因?yàn)橛邢旅鎺讉€(gè)原因:
1. H.264/AVC是當(dāng)前能夠應(yīng)用的最好壓縮方式(也是最新的壓縮方式);
2. 它符合國(guó)際標(biāo)準(zhǔn),得到MPEG/lS0和ITU的支持
3. H.264/AVC只是集中在視頻部分,因此,對(duì)其標(biāo)準(zhǔn)化是較為容易的,也是在較短時(shí)間內(nèi)能夠?qū)崿F(xiàn)的(它不需要與同一標(biāo)準(zhǔn)的其它許多部分的互操作問(wèn)題);
4. 就H.264/AVC標(biāo)準(zhǔn)本身而言,它注意到了其使用的系統(tǒng)要素的通用性問(wèn)題-例如,它只需要稍作修改,就可以用MPEG-2傳送流來(lái)傳送H.264/AVC視頻以及MPEG-2視頻。
如上所述,對(duì)于正在使用MPEG-2傳送流(TS)的整個(gè)電視廣播行業(yè)來(lái)說(shuō),H.264/AVC是愈來(lái)愈誘人的。能夠?qū).264/AVC視頻嵌入到MPEG-2傳送流中,這就說(shuō)明它具有后向兼容性,能夠使用現(xiàn)已存在的、大量的、投資高昂的基礎(chǔ)設(shè)施-例如衛(wèi)星傳輸、TV/有線傳輸?shù)鹊?。只需?duì)源端和目的端的視頻部分加以修改,就可以發(fā)揮其性能優(yōu)勢(shì):改善了的視頻質(zhì)量/可收看更多的頻道/接收和傳輸高清晰度視頻節(jié)目,這些都是由H.264/AVC所提供的。
圖2:MPEG-4的演變過(guò)程。
盡管就H.264/AVC本身來(lái)說(shuō)較為復(fù)雜(參見“H.264/AVC的復(fù)雜性”),但該標(biāo)準(zhǔn)經(jīng)過(guò)了很好的設(shè)計(jì),也可以使用相對(duì)較好的參考軟件。對(duì)工程技術(shù)人員來(lái)說(shuō),運(yùn)用H.264/AVC,盡管任務(wù)很龐大,但與運(yùn)用MPEG-4相比較,一般要更容易些。
當(dāng)然,還有一些理由能夠支持H.264/AVC,VC-1具有類似于H.264/AVC的性能,而且可簡(jiǎn)化處理過(guò)程并可以降低對(duì)存儲(chǔ)器的需求。已經(jīng)有很多標(biāo)準(zhǔn)團(tuán)體采納了VC-1,因此它會(huì)得到廣泛的應(yīng)用。對(duì)H.264/AVC和VC-1來(lái)說(shuō),還有一個(gè)重要的因素,那就是可以避免MPEG-4的商業(yè)使用許可證問(wèn)題。實(shí)際上,不存在使用費(fèi)用是它們能夠獲得大量商業(yè)應(yīng)用的一個(gè)理由。
測(cè)試前的要求
在按照上述視頻標(biāo)準(zhǔn)生產(chǎn)出某一產(chǎn)品時(shí),如果使用第三方的編解碼器不能正常地播放視頻節(jié)目(或者完全不能播放),那么所帶來(lái)的問(wèn)題是:第一,是哪個(gè)設(shè)備有問(wèn)題(是您的設(shè)備,還是第三方設(shè)備?或者它們都有問(wèn)題);第二,問(wèn)題究竟出在哪里(是句法要素錯(cuò)誤,還是取值錯(cuò)誤,或者是使用特性問(wèn)題,或者是參數(shù)錯(cuò)誤--更多的情況下,是由句法/數(shù)值/特性等多種原因所造成的問(wèn)題)。
編碼器或解碼器測(cè)試上一個(gè)非常簡(jiǎn)單的方法是播放大量的視頻節(jié)目(最好是來(lái)自不同的節(jié)目源),而后觀察有無(wú)錯(cuò)誤發(fā)生,也可使用其它銷售商的編解碼器,來(lái)測(cè)試您的編解碼器的互操作性。這種方法對(duì)于用來(lái)檢查上述復(fù)雜視頻壓縮標(biāo)準(zhǔn)中的許多錯(cuò)誤來(lái)說(shuō),并不是足夠嚴(yán)格的測(cè)試。不過(guò),使用那些被許多開發(fā)商所使用過(guò)的工具、而且又是參照同一標(biāo)準(zhǔn)而測(cè)試的工具,也許是一種有效的方法。
測(cè)試之前要了解標(biāo)準(zhǔn)的所有細(xì)節(jié)。沒有一個(gè)人能夠把為保證標(biāo)準(zhǔn)一致性所必需的所有信息均存入其記憶之中。為了保證標(biāo)準(zhǔn)的一致性,通常是利用手邊的標(biāo)準(zhǔn)將其與已開發(fā)的編解碼器相比較,這樣進(jìn)展緩慢且容易出錯(cuò)。最好的方法是盡快地進(jìn)行自動(dòng)測(cè)試。不同的視頻壓縮標(biāo)準(zhǔn)之間有著重大的差別,從事視頻壓縮的工程技術(shù)人員需要對(duì)相關(guān)視頻標(biāo)準(zhǔn)有著深入的理解,最好使用特定標(biāo)準(zhǔn)的測(cè)試工具,這樣有助于圓滿地完成任務(wù)。
編碼器和解碼器的測(cè)試需求
編碼器比解碼器要復(fù)雜得多,因?yàn)樗粌H要產(chǎn)生句法正確的比特流,還能進(jìn)行智能性的運(yùn)算以逼近輸入視頻,這樣才能選擇最佳的壓縮算法,并且速度要盡量地快(也許可以實(shí)時(shí)進(jìn)行)。對(duì)于一個(gè)特定的幀/象條/宏塊/象塊,要在各種可能的編碼方案中作出最佳選擇,可能需要較長(zhǎng)的時(shí)間。在這個(gè)過(guò)程中,需要從本幀圖像的其它部分或者從其它幀圖像中尋找相關(guān)的或相接近的數(shù)據(jù),通過(guò)運(yùn)算看能否以較少的比特從本幀或前后幀中附近某一宏塊來(lái)復(fù)制宏塊或預(yù)測(cè)相關(guān)宏塊。
一般來(lái)說(shuō),為了作出哪種壓縮特性或特性的組合能夠給出最高壓縮比的判決,需要對(duì)每幀的每一部分反復(fù)進(jìn)行多次。也許如預(yù)期的那樣,這需要很長(zhǎng)的時(shí)間;對(duì)于新視頻壓縮方案,它將在壓縮比率和編碼速度之間作出折衷處理。
因此,與一個(gè)不能實(shí)時(shí)工作的編碼器相比較,在相同的視頻質(zhì)量下,一個(gè)相對(duì)簡(jiǎn)單,速度較快的實(shí)時(shí)編碼器,卻可能給出較低的壓縮比。優(yōu)化編碼器的一個(gè)困難是,如果壓縮效率只有少量的改善,在通常情況下,人眼是看不出來(lái)的。所以,為了按照一定的方式來(lái)提高效率,應(yīng)當(dāng)對(duì)視頻質(zhì)量進(jìn)行測(cè)量。
編碼器性能的連續(xù)改善
在相同的視頻質(zhì)量下,新一代的編碼器具有更高的壓縮比,編碼器在作出判決時(shí)也更加智能化。所必需的附加處理能力也更為合用,編碼器技術(shù)也得到進(jìn)一步的提高。要盡可能迅速地獲取性能改善曲線,為了在性能和視頻質(zhì)量上作出恰當(dāng)?shù)奶幚?,就需要深入了解一些技術(shù)細(xì)節(jié)。例如,要能夠回答這樣的問(wèn)題:如果運(yùn)動(dòng)矢量的搜索范圍減小了X倍,那么該種類型的視頻質(zhì)量會(huì)降低多少?
解碼器比編碼器要簡(jiǎn)單些;它獲取的是給定的比特流,如果在給定的時(shí)間內(nèi)能夠得到正確的分析和比特流的解釋,也就能夠正確地顯示每一幀圖像。
在這里理想的狀況是:
1. 用己知性能良好的解碼器對(duì)YUV顯示輸出進(jìn)行逐個(gè)比特的比較;
2. 如果存在著差別,能夠獲取該解碼器如何對(duì)顯示象素進(jìn)行計(jì)算的詳盡信息,即能夠提供反映該解碼器內(nèi)部工作狀況的易于理解的完整信息。
移動(dòng)電話視頻測(cè)試案例
這是歐洲一家生產(chǎn)移動(dòng)電話的大型公司的事例。該手持式電話生產(chǎn)商遇到一個(gè)麻煩:他們生產(chǎn)的新型3G手機(jī)不能解碼由歐洲一家網(wǎng)絡(luò)運(yùn)營(yíng)商提供的視頻節(jié)目。網(wǎng)絡(luò)運(yùn)營(yíng)商正計(jì)劃購(gòu)置手機(jī)以銷售給他們的用戶,當(dāng)然,手機(jī)廠商竭力想解決這一問(wèn)題。
正如所料,對(duì)于問(wèn)題出在哪里,這兩家公司存在著爭(zhēng)議但這兩家公司的工程技術(shù)人員都不真正地了解問(wèn)題究竟在何處:是手機(jī)的問(wèn)題?還是視頻編碼的方式問(wèn)題?也不清楚視頻是怎樣通過(guò)網(wǎng)絡(luò)發(fā)送的。
兩個(gè)月以后,手機(jī)廠商購(gòu)置了壓縮視頻基本流分析儀。利用這個(gè)測(cè)試軟件,手機(jī)廠商的半導(dǎo)體部門終于發(fā)現(xiàn)了問(wèn)題根本不出在手機(jī)上,也不在視頻的網(wǎng)絡(luò)處理上,而是在視頻編碼器--視頻編碼器與MPEG-4標(biāo)準(zhǔn)不完全一致,這就是手機(jī)不能正確顯示視頻節(jié)目的原因。
手機(jī)廠商不僅能夠發(fā)現(xiàn)視頻中的問(wèn)題,而且能夠清楚地解釋是什么樣的問(wèn)題,以及能夠說(shuō)明句法的哪一特定部分存在著錯(cuò)誤。更有意思的是,網(wǎng)絡(luò)運(yùn)營(yíng)商是這樣回復(fù)的:“我們現(xiàn)在知道了我們的視頻不符合標(biāo)準(zhǔn),但這是由我們提供的視頻節(jié)目-你們應(yīng)當(dāng)對(duì)這樣的視頻進(jìn)行處理?!?nbsp;
盡管手機(jī)廠商對(duì)網(wǎng)絡(luò)運(yùn)營(yíng)商的回復(fù)并不十分滿意,但他們利用分析儀軟件提供了詳盡的信息,利用這些信息研究出如何改變他們的手機(jī),使之能夠接收這種非標(biāo)準(zhǔn)的視頻節(jié)目。
本文小結(jié)
最近推出的MTS4EA視頻基本流分析儀是一種變革性的新軟件產(chǎn)品,它能為新一代和當(dāng)前使用的視頻壓縮技術(shù)提供靈活的、可升級(jí)的測(cè)試解決方案,能夠給出全面的基本流分析,MTS4EA支持MPEG-2、MPEG-4、H.264/AVC、H.261、H.263、H.263+和3GPP標(biāo)準(zhǔn)。有關(guān)所支持的最新視頻壓縮標(biāo)準(zhǔn)的信息,請(qǐng)?jiān)L問(wèn)泰克公司網(wǎng)站:www.tektronix.com.cn/MTS4EA以了解更多信息。
視頻質(zhì)量的PSNR測(cè)量
PSNR定義為信號(hào)功率與噪聲功率之比,通常用分貝表示。在圖像處理的過(guò)程中,可將信號(hào)功率當(dāng)作是峰值圖像樣值數(shù)的平方,而噪聲功率可認(rèn)為是該圖像中誤碼數(shù)RMS的平方,即:
PSNR=10log(?2/RMS2)
在很多精況下,PSNR并不是圖像質(zhì)量的理想測(cè)量值,有許多人認(rèn)為它并不能準(zhǔn)確地代表接收的圖像質(zhì)量 (當(dāng)然,這也是非常難于測(cè)量的)。
還有,在比較不同的視頻碼流時(shí),PSNR測(cè)量值也不能很好地反映不同碼流的相對(duì)質(zhì)量。在任何情況下,不過(guò),為了測(cè)量原始的、未經(jīng)壓縮的源視頻質(zhì)量,那么測(cè)量PSNR仍是必要的。雖然如此,在比較相同的、單個(gè)的視頻序列時(shí),盡管壓縮方式有許多種(例如使用不同的視頻壓縮標(biāo)準(zhǔn),或者使用同一標(biāo)準(zhǔn)的不同版本),卻也不能提供更好的有用數(shù)據(jù)。
評(píng)論