嵌入式零樹小波EZW編碼及其算法改進(jìn)
在基于小波變換的圖象壓縮方案中,嵌入式零樹小波 EZW(Embedded Zerotree Wavelets)[1]編碼很好地利用小波系數(shù)的特性使得輸出的碼流具有嵌入特性。近年來,在對(duì)EZW改進(jìn)的基礎(chǔ)上,提出了許多新的性能更好的算法,如多級(jí)樹集合分裂算法(SPIHT :Set Partitioning In Hierarchical Trees)[2],集合分裂嵌入塊編碼(SPECK:Set Partitioned Embedded bloCK coder),可逆嵌入小波壓縮算法(CREW:Compression with Reversible Embedded Wavelets)[3] 。本文對(duì)這些算法進(jìn)行了原理分析、性能比較,說明了嵌入式小波圖象編碼的研究方向。
本文引用地址:http://www.ex-cimer.com/article/150328.htm 1. 1算法原理:
內(nèi)嵌編碼[1](embedded coding)就是編碼器將待編碼的比特流按重要性的不同進(jìn)行排序,根據(jù)目標(biāo)碼率或失真度大小要求隨時(shí)結(jié)束編碼;同樣,對(duì)于給定碼流解碼器也能夠隨時(shí)結(jié)束解碼,并可以得到相應(yīng)碼流截?cái)嗵幍哪繕?biāo)碼率的恢復(fù)圖象。內(nèi)嵌編碼中首先傳輸?shù)氖亲钪匾男畔ⅲ簿褪欠底畲蟮淖儞Q系數(shù)的位信息。圖1顯示了一個(gè)幅度值由大到小排序后的變換系數(shù)的二進(jìn)制列表。表中每一列代表一個(gè)變換系數(shù)的二進(jìn)制表示,每一行代表一層位平面,最上層為符號(hào)位,越高層的位平面的信息權(quán)重越大,對(duì)于編碼也越重要。內(nèi)嵌編碼的次序是從最重要的位(最高位)到最不重要的位(最低位)逐個(gè)發(fā)送,直到達(dá)到所需碼率后停止。
由圖1可知內(nèi)嵌編碼的輸出信息主要包括兩部分:排序信息和重要象素的位信息。其中,位信息是編碼必不可少的有效信息,對(duì)應(yīng)于表中箭頭所劃過的比特位;而排序信息則是輔助信息,按其重要性從左到右排列,反映了重要象素在原圖上的空間位置,用于恢復(fù)原始的數(shù)據(jù)結(jié)構(gòu)。因此,內(nèi)嵌算法中排序算法的優(yōu)劣和排序信息的處理決定了整個(gè)編碼算法的效率。
一副圖象經(jīng)過三級(jí)小波分解后形成了十個(gè)子帶,如圖2所示。小波系數(shù)的分布特點(diǎn)是越往低頻子帶系數(shù)值越大,包含的圖象信息越多,如圖2中的LL3子帶。而越往高頻子帶系數(shù)值越小,包含的圖象信息越少。就是在數(shù)值相同的情況下,由于低頻子帶反映的是圖象的低頻信息,對(duì)視覺比較重要,而高頻子帶反映的是圖象的高頻信息,對(duì)視覺來說不太重要。這樣對(duì)相同數(shù)值的系數(shù)選擇先傳較低頻的系數(shù)的重要比特,后傳輸較高頻系數(shù)的重要比特。正是由于小波系數(shù)具有的這些特點(diǎn),它非常適合于嵌入式圖象的編碼算法。在JPEG2000標(biāo)準(zhǔn)中以小波變換作為圖象編碼的變換方法。
EZW算法利用小波系數(shù)的特點(diǎn)較好地實(shí)現(xiàn)了圖象編碼的嵌入功能,主要包括以下三個(gè)過程:零樹預(yù)測,用零樹結(jié)構(gòu)編碼重要圖,逐次逼近量化。
1) 零樹預(yù)測
一副經(jīng)過小波變換的圖象按其頻帶從低到高形成一個(gè)樹狀結(jié)構(gòu),樹根是最低頻子帶的結(jié)點(diǎn),它有三個(gè)孩子分別位于三個(gè)次低頻子帶的相應(yīng)位置,見圖2左上角,其余子帶(最高頻子帶除外)的結(jié)點(diǎn)都有四個(gè)孩子位于高一級(jí)子帶的相應(yīng)位置(由于高頻子帶分辨率增加,所以一個(gè)低頻子帶結(jié)點(diǎn)對(duì)應(yīng)有四個(gè)高頻子帶結(jié)點(diǎn),即相鄰的2×2矩陣,見圖2)。這樣圖2所示的三級(jí)小波分解就形成了深度為4的樹。
定義一個(gè)零樹的數(shù)據(jù)結(jié)構(gòu):一個(gè)小波系數(shù)x,對(duì)于一個(gè)給定的門限T,如果|x|
2) 用零樹結(jié)構(gòu)編碼重要圖
重要圖包括三種要素:即重要系數(shù)、孤立零和零樹根。其中,對(duì)于一個(gè)給定的閾值T,如果系數(shù)X本身和它的所有的子孫都小于T,則該點(diǎn)就稱為零樹根;如果系數(shù)本身小于T,但其子孫至少有一個(gè)大于或等于T,則該點(diǎn)就稱為孤立零點(diǎn)。在編碼時(shí)分別用三種符號(hào)與之對(duì)應(yīng)。當(dāng)編碼到最高分辨率層的系數(shù)時(shí),由于它們沒有子孫,零樹根不再存在,只需其余兩種符號(hào)即可。為了有利于內(nèi)嵌編碼,將重要系數(shù)的符號(hào)與重要圖一起編碼,這樣就要使用四種符號(hào):零樹根、孤立零、正重要系數(shù)、負(fù)重要系數(shù)。
3) 逐次逼近量化(Successive-Approximation Quantization,SAQ)
內(nèi)嵌編碼的核心在于采用了逐次逼近的量化方法(SAQ)。SAQ按順序使用了一系列閾值T0、T1,┄,TN-1來判決重要性,其中Ti=Ti-1/2,初始閾值T0按如下條件選擇,OXjO2T0,其中Xj表示所有變換系數(shù)。
在編(譯)碼過程中,始終保持著兩個(gè)分離的列表:主表和輔表。主表對(duì)應(yīng)于編碼中的不重要的集合或系數(shù),其輸出信息起到了恢復(fù)各重要值的空間位置結(jié)構(gòu)的作用,而輔表是編碼的有效信息,輸出為各重要系數(shù)的二進(jìn)制值。編碼分為主、輔兩個(gè)過程:在主過程中,設(shè)定閾值為Ti,按上述原理對(duì)主表進(jìn)行掃描編碼,若是重要系數(shù),則將其幅值加入輔表中,然后將該系數(shù)在數(shù)組中置為零,這樣當(dāng)閾值減小時(shí),該系數(shù)不會(huì)影響新零樹的出現(xiàn);在輔過程中,對(duì)輔表中的重要系數(shù)進(jìn)行細(xì)化,細(xì)化過程類似于比特平面編碼。對(duì)閾值Ti來說,重要系數(shù)的所在區(qū)間為[Ti,2Ti],若輔表中的重要系數(shù)位于[Ti,3Ti/2],則用符號(hào)“0”表示,否則用符號(hào)“1”表示。編碼在兩個(gè)過程中交替進(jìn)行,在每個(gè)主過程前將閾值減半。譯碼時(shí)系數(shù)的重構(gòu)值可以位于不確定區(qū)間的任意處,如果采用MMSE準(zhǔn)則,則重構(gòu)值應(yīng)位于不確定區(qū)間的質(zhì)心處。實(shí)際中為簡單起見使用區(qū)間的中心作為重構(gòu)值。
1. 2算法分析:
研究表明,在圖象的低比特率編碼中,用來表示非零系數(shù)所在位置的開銷遠(yuǎn)遠(yuǎn)大于用來表示非零系數(shù)值的開銷。零樹結(jié)構(gòu)正是一種描述圖象經(jīng)過小波變換后非零數(shù)值位置的有效方法。EZW的編碼思想是不斷掃描變換后的圖象,生成多棵零樹來對(duì)圖象編碼:一棵零樹的形成需要對(duì)圖象進(jìn)行兩次掃描。在生成第一棵零樹時(shí),首先找出變換后圖象的最大絕對(duì)值系數(shù),用它對(duì)應(yīng)的T0作初始閾值,對(duì)圖象進(jìn)行第一次掃描。將圖象中絕對(duì)值小于閾值系數(shù)都看作零,然后按前面的符號(hào)定義形成零樹。在第二次掃描中,對(duì)那些絕對(duì)值大于閾值的結(jié)點(diǎn)(POS和NEG)按其絕對(duì)值是否大于閾值的1.5倍附加一個(gè)比特1或0來描述其精度。這樣做的目的是減小非零結(jié)點(diǎn)系數(shù)值的變化范圍,使其適應(yīng)下一次閾值減半后的比特附加(具體細(xì)節(jié)見文[1])。而后將閾值減半,再經(jīng)兩次掃描生成第二棵零樹,在第一次掃描生成零樹時(shí),以前已經(jīng)大于閾值的結(jié)點(diǎn)不再考慮,而第二次掃描附加比特時(shí)則要考慮以前數(shù)值較大的結(jié)點(diǎn)以保證精度。如此重復(fù)下去,不斷生成零樹,直到達(dá)到需要的編碼精度為止。
研究發(fā)現(xiàn)EZW算法存在的問題是:
(1).由于編碼時(shí)它形成多棵零樹,因而要多次掃描圖象,造成效率很低。而且每一棵樹必須在前一棵樹形成之后才能形成,所以也很難用并行算法優(yōu)化。
(2).對(duì)所有的頻域進(jìn)行等同重要度的編碼,不能充分利用小波變換的特點(diǎn)。改進(jìn)辦法之一是把最低頻子圖與其它子圖分開處理,對(duì)其進(jìn)行單獨(dú)的無失真編碼。
(3).在一棵零樹中包含的元素越多,則越有利于數(shù)據(jù)壓縮。在EZW算法中存在這樣的樹間冗余,在SPIHT算法中則進(jìn)一步利用了這種樹間冗余。
(4).通過對(duì)小波系數(shù)的分析發(fā)現(xiàn),在同一子帶中相鄰元素間有一定的相關(guān)性,尤其在高頻子帶存在大量的低值元素,所以可以通過子帶中的集合把大量的這種低值元素組織到一起,達(dá)到數(shù)據(jù)壓縮的目的。而EZW算法并沒有充分利用這種相關(guān)性。在SPECK算法中利用這種相關(guān)性達(dá)到了數(shù)據(jù)壓縮的目的。
2. 多級(jí)樹集合分裂算法 SPIHT
原理分析:
EZW算法是一種基于零樹的嵌入式圖象編碼算法,雖然在小波變換系數(shù)中,零樹是一個(gè)比較有效的表示不重要系數(shù)的數(shù)據(jù)結(jié)構(gòu),但是,在小波系數(shù)中還存在這樣的樹結(jié)構(gòu),如圖2,即它的樹根是重要的,除樹根以外的其它結(jié)點(diǎn)是不重要的。對(duì)這樣的系數(shù)結(jié)構(gòu)零樹就不是一種很有效的表示方法。A.Said和W.A.Pearlman根據(jù)Shapiro零樹編碼算法(EZW)的基本思想,提出了一種新的且性能更優(yōu)的實(shí)現(xiàn)方法,即基于分層樹集合分割排序(Set Partitioning in Hierarchical Trees,SPIHT)的編碼算法。它采用了空間方向樹(SOT:spatial orientation tree)、集合D(i,j)和L(i,j)更有效地表示這樣的系數(shù)結(jié)構(gòu),從而提高了編碼效率。
1)SPIHT算法中用到的概念
算法中的一些符號(hào)和概念說明如下:
● H:空間方向樹所有根結(jié)點(diǎn)的坐標(biāo)集合;
● Z(i,j):點(diǎn)(i,j)及其所有的后代的坐標(biāo)集合,即指空間方向樹;
● D(i,j):點(diǎn)(i,j)的所有后代(子孫)的坐標(biāo)集合,不包括(i,j)點(diǎn)本身;
● O(i,j):點(diǎn)(i,j)的直接后代(兒子)的坐標(biāo)集合,在分層塔形結(jié)構(gòu)的最高層H有O(i,j)={(i+LL,j),(i,j+LL),(i+LL,j+LL)},除此之外的結(jié)點(diǎn)有O(i,j)={(2i,2j),(2i,2j+1),(2i+1,2j), (2i+1,2j+1)},這里L(fēng)L為最高層H的尺度。
● L(i,j):點(diǎn)(i,j)除直接后代外所有后代坐標(biāo)的集合;
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)
評(píng)論