視頻壓縮技術(shù)解析
1. 奈奎斯特取樣定理
理想取樣時, 只要取樣頻率大于或等于模擬信號中最高頻率的兩倍, 就可以不失真地恢復(fù)模擬信號, 稱為奈奎斯特取樣定理。 模擬信號中最高頻率的兩倍稱為折疊頻率。
2. 亞奈奎斯特取樣
按取樣定理, 若取樣頻率fs小于模擬信號最高頻率fmax的2倍會產(chǎn)生混疊失真, 但若巧妙地選擇取樣頻率, 令取樣后頻譜中的混疊分量落在色度分量和亮度分量之間, 就可用梳狀濾波器去掉混疊成分。 本文引用地址:http://www.ex-cimer.com/article/165860.htm
3. 均勻量化和非均勻量化
在輸入信號的動態(tài)范圍內(nèi), 量化間隔幅度都相等的量化稱為均勻量化或線性量化。 對于量化間距固定的均勻量化, 信噪比隨輸入信號幅度的增加而增加, 在強信號時固然可把噪波淹沒掉, 在弱信號時, 噪波的干擾就十分顯著。
為改善弱信號時的信噪比, 量化間距應(yīng)隨輸入信號幅度而變化, 大信號時進行粗量化, 小信號時進行細量化, 也就是采用非均勻量化(或稱非線性量化)。
非均勻量化有兩種方法, 一是把非線性處理放在編碼器前和解碼器后的模擬部分, 編、 解碼仍采用均勻量化, 在均勻量化編碼器之前, 對輸入信號進行壓縮, 這樣等效于對大信號進行粗量化, 小信號進行細量化; 在均勻量化解碼器之后, 再進行擴張, 以恢復(fù)原信號。 另一種方法是直接采用非均勻量化器, 輸入信號大時進行粗量化(量化間距大) , 輸入信號小時細量化(量化間距小)。 也有采用若干個量化間距不等的均勻量化器, 當輸入信號超過某一電平時進入粗間距均勻量化器, 低于某一電平時進入細間距量化器, 稱為準瞬時壓擴方式。
通常用Q表示量化, 用Q-1表示反量化。 量化過程相當于由輸入值找到它所在的區(qū)間號, 反量化過程相當于由量化區(qū)間號得到對應(yīng)的量化電平值。 量化區(qū)間總數(shù)遠遠少于輸入值的總數(shù), 所以量化能實現(xiàn)數(shù)據(jù)壓縮。 很明顯, 反量化后并不能保證得到原來的值, 因此量化過程是一個不可逆過程, 用量化的方法來進行壓縮編碼是一種非信息保持型編碼。 通常這兩個過程均可用查表方法實現(xiàn), 量化過程在編碼端完成, 而反量化過程則在解碼端完成。
對量化區(qū)間標號(量化值)的編碼一般采用等長編碼方法。 當量化分層總數(shù)為K時, 經(jīng)過量化壓縮后的二進制數(shù)碼率為lbK比特/量值。 在一些要求較高的場合, 可采用可變字長編碼如哈夫曼編碼或算術(shù)編碼來進一步提高編碼效率。
6.1.3 ITU-R BT.601分量數(shù)字系統(tǒng)
數(shù)字視頻信號是將模擬視頻信號經(jīng)過取樣、 量化和編碼后形成的。 模擬電視有PAL、 NTSC等制式, 必然會形成不同制式的數(shù)字視頻信號, 不便于國際數(shù)字視頻信號的互通。 1982年10月, 國際無線電咨詢委員會(CCIR, Consultative Committee for International Radio)通過了第一個關(guān)于演播室彩色電視信號數(shù)字編碼的建議, 1993年變更為ITU-R(國際電聯(lián)無線電通信部分, International Telecommunications Union-Radio communications Sector)BT.601分量數(shù)字系統(tǒng)建議。
BT.601建議采用了對亮度信號和兩個色差信號分別編碼的分量編碼方式, 對不同制式的信號采用相同的取樣頻率13.5 MHz, 與任何制式的彩色副載波頻率無關(guān), 對亮度信號Y的取樣頻率為13.5 MHz。 由于色度信號的帶寬遠比亮度信號的帶寬窄, 對色度信號U和V的取樣頻率為6.75 MHz。 每個數(shù)字有效行分別有720個亮度取樣點和360×2個色差信號取樣點。 對每個分量的取樣點都是均勻量化, 對每個取樣進行8比特精度的PCM編碼。
這幾個參數(shù)對525行、 60場/秒和625行50場/秒的制式都是相同的。 有效取樣點是指只有行、 場掃描正程的樣點有效, 逆程的樣點不在PCM編碼的范圍內(nèi)。 因為在數(shù)字化的視頻信號中, 不再需要行、 場同步信號和消隱信號, 只要有行、 場(幀)的起始位置即可。 例如, 對于PAL制, 傳輸所有的樣點數(shù)據(jù), 大約需要200 Mb/s的傳輸速率, 傳輸有效樣點只需要160 Mb/s左右的速率。
色度信號的取樣率是亮度信號取樣率的一半, 常稱作4∶2∶2格式, 可以理解為每一行里的Y、 U、 V的樣點數(shù)之比為4∶2∶2。
6.1.4 熵編碼
熵編碼(Entropy Coding)是一類無損編碼, 因編碼后的平均碼長接近信源的熵而得名。 熵編碼多用可變字長編碼(VLC, Variable Length Coding)實現(xiàn)。 其基本原理是對信源中出現(xiàn)概率大的符號賦以短碼, 對出現(xiàn)概率小的符號賦以長碼, 從而在統(tǒng)計上獲得較短的平均碼長。 所編的碼應(yīng)是即時可譯碼, 某一個碼不會是另一個碼的前綴, 各個碼之間無需附加信息便可自然分開。
1. 霍夫曼(Huffman)編碼
霍夫曼(Huffman)編碼是一種可變長編碼, 編碼方法如圖6-2所示。
(1) 將輸入信號符號以出現(xiàn)概率由大至小為序排成一列。
(2) 將兩處最小概率的符號相加合成為一個新概率, 再按出現(xiàn)概率的大小排序。
(3) 重復(fù)步驟(2), 直至最終只剩兩個概率。
(4) 編碼從最后一步出發(fā)逐步向前進行, 概率大的符號賦予“0”碼, 另一個概率賦予“1”碼, 直至到達最初的概率排列為止。
圖 6-2 霍夫曼(Huffman)編碼
評論