基于單環(huán)和膚色選擇的FGS視頻編碼
Internet的快速發(fā)展使得網(wǎng)絡(luò)多媒體的需求急劇增加,這就對視頻的編碼技術(shù)提出了新的要求。網(wǎng)絡(luò)的異構(gòu)性和缺乏QoS(服務(wù)質(zhì)量)保證,使得帶寬會在一個較大的范圍內(nèi)波動。傳統(tǒng)的用于解決該問題的視頻編碼方法有聯(lián)播和碼流轉(zhuǎn)換,但這兩種方法的碼率變化均被限制在幾個特定的碼率中,很難實現(xiàn)傳輸過程中任意碼流的動態(tài)切換,從而不能充分利用信道的容量。解決這些問題的一個有效方法就是粒度可分級視頻編碼,它將原始視頻編碼成基本層碼流和增強(qiáng)層碼流,其中基本層碼流是必須要傳輸?shù)?,它能夠單?dú)進(jìn)行解碼。增強(qiáng)層碼流可以根據(jù)網(wǎng)絡(luò)當(dāng)時的帶寬情況在任何一個地點截斷。但FGS獲得的這些特性都是以犧牲編碼效率為代價的[1]。在增強(qiáng)層中引入膚色選擇的算法,雖然能夠快速地定位出視頻中的感興趣區(qū)域,通過對其進(jìn)行位平面提升和優(yōu)先編碼來改善視頻的主觀質(zhì)量,但也會在一定程度上降低整體的編碼效率。因此,針對編碼效率低的問題,本文提出了在基本層中引入單環(huán)算法,以提高FGS的編碼效率。
1 基于膚色選擇的FGS視頻編碼
1.1 膚色選擇算法介紹[2]
用膚色選擇算法對FGS進(jìn)行選擇增強(qiáng),充分利用了人的視覺特性。相對于其他較復(fù)雜的人臉檢測算法,該算法具有復(fù)雜度低和運(yùn)算簡單等特點。對于人臉和頭肩占主要部分的序列,可以認(rèn)為人臉區(qū)域主要就是膚色區(qū)域。因此在這類視頻序列中,用膚色區(qū)域代替人臉區(qū)域作為感興趣區(qū)域,并對其進(jìn)行位平面提升、優(yōu)先編碼和傳輸,從而提高感興趣區(qū)域的編碼效率,并改善視頻的主觀質(zhì)量。
大量實驗表明,不同人種的膚色主要受到亮度信息的影響,而受色度信息的影響很小,且膚色在CbCr空間的分布具有很強(qiáng)的聚類特性,因此本文中直接采用通用閾值(133≤Cr≤173,77≤Cb≤127)來對膚色區(qū)域進(jìn)行判斷。對于序列中的所有幀圖像的每一個像素有:
將M=1的像素定為膚色點,然后對每幀圖像中的每個宏塊內(nèi)M值為1的像素點進(jìn)行統(tǒng)計,將統(tǒng)計結(jié)果與預(yù)先給定的閾值T進(jìn)行比較,來判斷該宏塊是否進(jìn)行選擇性增強(qiáng)。如果大于或等于閾值T,則對該宏塊進(jìn)行選擇性增強(qiáng),反之,則不進(jìn)行選擇性增強(qiáng)。圖1為Akiyo序列、Foreman序列和Carphone序列的原始圖、膚色分割圖和選擇性增強(qiáng)的宏塊圖。
1.2 基于膚色選擇的FGS視頻編碼
通過上述的膚色選擇算法來定位出人臉區(qū)域,并將其作為感興趣區(qū)域,引入到FGS編碼器中。與其他人臉檢測算法相比,該方法具有復(fù)雜度低、自適應(yīng)選擇和運(yùn)算簡單等優(yōu)點。
2 基于單環(huán)與膚色選擇的FGS視頻編碼
采用膚色選擇算法提高視頻序列感興趣區(qū)域的編碼效率和改善視頻主觀質(zhì)量的同時,也降低了FGS的整體編碼效率。單環(huán)算法由于使用了更高的擴(kuò)展基本層(基本層+增強(qiáng)層)圖像來用作基本層的參考圖像,因此能夠較好地提高整體編碼效率。所以本文提出了基于單環(huán)的FGS視頻編碼與基于膚色選擇的FGS視頻編碼相結(jié)合的方法(基于單環(huán)和膚色選擇的FGS視頻編碼)來同時提高FGS的整體編碼效率和視頻的主觀質(zhì)量。其編碼原理圖如圖2所示。
評論