基于場景切換的H.264碼率控制技術
摘 要:在H.264/AVC編碼器中,由于采用了固定長度的圖像組(GOP)結構,不能有效地處理視頻序列中的場景切換,導致場景切換幀后續(xù)各幀編碼質(zhì)量嚴重下降。為了有效解決該問題。提出一種自適應的碼率控制算法,通過場景切換的快速檢測方法檢測視頻序列中的場景切換,在場景切換幀處終止當前COP并對GOP層的碼率分配算法做出修正。仿真結果表明:采用該算法可以有效地降低場景切換對后續(xù)帖編碼質(zhì)量的影響,而且合理地分配碼率資源,提高了整個視頻序列的編碼質(zhì)量。在相同碼率條件下,整體編碼質(zhì)量可以提高0.3~O.5 dB。
關鍵詞:視頻編碼;自適應碼率控制;場景切換檢測
碼率控制技術在帶寬受限的多媒體通信系統(tǒng)中具有重要的作用。傳統(tǒng)的視頻通信碼率控制算法,如H.264/AVC編碼器中采用的碼率控制算法,在將碼率資源分配到圖像組(GOP)中各幀圖像時,僅僅考慮了各幀圖像自身的復雜度,而忽視了同GOP中各幀圖像之間的相關性,如對含有頻繁場景切換的視頻序列進行編碼時,GOP中某幀圖像可能因出現(xiàn)場景切換而與其參考幀之間毫無相關性,如果仍然采用傳統(tǒng)的碼率控制方法,將導致圖像編碼資源浪費和編碼質(zhì)量的下降。
本文提出一種自適應改變GOP長度的碼率控制算法,可以有效地節(jié)省碼率資源,并且能夠有效地提高場景切換幀后續(xù)各幀的編碼質(zhì)量和序列整體的編碼質(zhì)量。
1 碼率控制技術與視頻場景切換
由于視頻序列中I、P及B幀編碼后產(chǎn)生的比特數(shù)不一樣,為了使輸出碼流速率與信道速率相匹配,提高信道利用率,一般在編碼器和信道之間加一個緩沖區(qū),而緩沖區(qū)容量大小與通信時延的要求構成了一對新的矛盾,碼率控制的目的就是為了解決這一矛盾。對于編碼器來說,一個魯棒的碼率控制算法應該在充分利用帶寬資源和保證緩沖區(qū)不溢出的前提下,將有限的碼率資源進行合理分配,獲得盡可能好的編碼質(zhì)量。
當視頻序列中出現(xiàn)場景切換時,其編碼質(zhì)量將受到影響,影響程度取決于場景切換幀在其所處GOP中的位置。當場景切換發(fā)生在I幀時,由于I幀采用幀內(nèi)編碼模式,場景切換對于I幀本身不會產(chǎn)生任何影響,同時也不會對后續(xù)幀的預測編碼產(chǎn)生影響;由于B幀為雙向預測,只要其前后2個參考幀有1幀與其處于同一場景中(假設序列中沒有連續(xù)2幀同時發(fā)生場景切換),其預測編碼的精度仍然能夠得到保證,編碼質(zhì)量不會受到很大影響。不同于I幀和B幀,當場景切換發(fā)生在P幀,對當前GOP編碼質(zhì)量的影響相當大:首先,由于當前P幀與其參考幀處于不同的場景中,幀間預測編碼將完全失效,宏塊必須通過RDO(rate-distortion optimiza-tion)模式選擇后才采取幀內(nèi)編碼,優(yōu)化過程極大浪費了編碼時間;其次,由于絕大多數(shù)宏塊采用幀內(nèi)編碼模式,占用了大量的碼率資源,使得后續(xù)各幀由于碼率資源缺乏而編碼質(zhì)量下降,此影響還會延續(xù)至后續(xù)的GOP。
圖1給出了一個有5處場景切換的測試序列(詳見2.3節(jié))在80 kb/s碼率條件下各幀編碼比特曲線和Y分量PSNR(峰值信噪比)曲線。同時,表1也給出了場景切換幀前10幀和后10幀Y分量平均PSNR值數(shù)據(jù)及其變化值。由圖中(虛線表示場景切換幀位置)可以看出,在場景切換時,當前幀將占用較多編碼比特資源,從而導致后續(xù)幀由于碼率資源缺乏而PSNR值下降,詳細數(shù)據(jù)可見表1。
現(xiàn)實中的視頻序列,不可避免存在場景切換。如果編碼器不考慮場景切換的影響,就會浪費有限的碼率資源,從而導致編碼質(zhì)量下降。目前,針對場景切換提出了很多碼率控制算法,其中常用的方法是通過改變GOP的結構和長度來重新分配碼率資源。如在文的算法中,當檢測到場景切換時,當前GOP剩余幀和下一個GOP的所有幀合并為一個GOP,因此,GOP長度要比默認長度N大,最糟的情況下為2N-1。由于GOP過長容易導致緩沖區(qū)的溢出,并且導致GOP中后面部分幀的編碼性能下降。在文提出的算法中,采取將過長的GOP拆分成2個新的GOP來解決這個問題,但這樣做的后果是導致增加一個I幀,造成碼率資源的浪費。本文算法與文相比,不額外增加I幀的數(shù)量,可以有效地節(jié)省碼率資源,同時有效地提高場景切換幀后續(xù)各幀的編碼質(zhì)量和序列整體的編碼質(zhì)量。
2 針對場景切換的自適應碼率控制算法
2.1 自適應碼率控制算法
在該算法中,當前GOP的長度將隨著場景切換幀的出現(xiàn)自適應地改變,并且同時對碼率資源進行重新分配。假設默認的GOP長度為N,分配給每個GOP的碼率資源為
其中:B表示帶寬;F表示幀速率;Rprev表示前一個GOP編碼剩余比特或超支比特。對于第1個GOP來說,Rprev=0。每編碼一幀圖像,R更新如下:
其中Sipb為剛編碼幀(可能為I幀、P幀或B幀)所用的比特數(shù)。當GOP所有幀編碼完畢后,Rprev=R。
假設當前GOP在編碼M(MN)幀后,第M+1幀檢測出場景切換,在H.264編碼算法中,此幀內(nèi)絕大多數(shù)宏塊經(jīng)過RDO優(yōu)化之后均采用幀內(nèi)預測模式編碼,當前GOP也在編完所有N幀之后結束。采用本文的算法,當檢測到第M+1幀有場景切換時,當前GOP即提前終止,并提前進入下一個GOP的編碼。由上述分析可知,發(fā)生場景切換時當前GOP的實際長度為M幀,因此,其預分配的碼率按
照式(1)計算并不合適,應由下式?jīng)Q定:
由于GOP提前終止,其未編碼的N-M幀應分配的編碼比特數(shù)為
這部分比特應該從當前GOP按照式(1)計算的預分配碼率中減去,則當前GOP提前終止時,Rprev應該修正如下:
當前GOP提前終止后對Rprev做出修正,根據(jù)式(1)則可計算出下一個GOP的預分配碼率,并開始下一個GOP的編碼。
本算法的前提是必須能檢測出場景切換,因此,快速有效地檢測檢測出場景切換是十分必要的。
2.2 視頻場景切換快速檢測算法
視頻場景切換包含如下幾種類型:突變場景切換、消融和淡入淡出等。目前,已有的場景切換檢測算法分為3類:基于灰度值檢測、基于運動搜索檢測和基于邊緣輪廓檢測。雖然后2種檢測算法具有比較好的性能,但是算法的高復雜度極大地限制了它們的應用,尤其是在對于實時性要求比較高的視頻通信碼率控制算法中。
通過對視頻序列的統(tǒng)計分析發(fā)現(xiàn),當有場景切換時,當前幀與其參考幀在灰度和色彩信息上有很大的區(qū)別,而沒有場景切換的時候,整個序列的灰度和色彩基本處于平穩(wěn)或者緩變的狀態(tài)。選擇mobile和grandma 2個YUV視頻序列(無場景切換),其各分量(Y為亮度分量,U、V為色度分量)的均值變化緩慢,如圖2所示。同時,對于有頻繁場景切換的視頻序列(以CNN新聞摘要片斷和一個構造序列為例),可知在場景切換處,3個分量的均值全部或部分出現(xiàn)突變,如圖3所示。
圖中mean(x)為枧頻序列X分量的均值,X代表視頻序列的Y、U、V 3個分量。
通過以上分析可知,當圖像序列的各分量的均值發(fā)生突變時,一般來說是有場景切換發(fā)生。據(jù)此,采用當前幀和參考幀3個分量均值的絕對差值作為判斷當前幀圖像是否有場景切換的差異函數(shù)為
其中:mean()為均值函數(shù);Scur和Sref分別表示當前幀圖像和其參考幀圖像;X代表其3個分量。
根據(jù)差異函數(shù),判斷是否有場景切換可以依據(jù)式(7)和(8):
當式(7)和式(8)同時滿足時,可以判定當前幀有場景切換發(fā)生。式中:mean(Y)、mean(U)和mean(V)分別為當前GOP內(nèi)當前幀之前所有幀各分量均值的平均值;tTHl和tTH2為判決門限系數(shù),分別描述當前幀和參考幀之間亮度和色度均值的相對差異和絕對差異。
顯然,上述算法只需要計算各幀圖像3個分量的均值,算法復雜度非常低,很適合于碼率控
評論