具有感興趣區(qū)域的靜止圖像壓縮編碼算法研究 作者: 時(shí)間:2007-03-09 來源:網(wǎng)絡(luò) 加入技術(shù)交流群 掃碼加入和技術(shù)大咖面對(duì)面交流海量資料庫查詢 收藏 摘要:在研究人眼視覺掩蓋效應(yīng)的基礎(chǔ)上,采用了一種感興趣區(qū)域的嵌入式零樹小波編碼算法(EZW_ROI算法),對(duì)感興趣的區(qū)域和不感興趣區(qū)域分別進(jìn)行編碼,充分利用了信道資源和存儲(chǔ)空間,提高感興趣區(qū)域的圖像質(zhì)量,使重建圖像視覺效果更好。關(guān)鍵詞:圖像壓縮 小波變換 視覺掩蓋效應(yīng) EZW_ROI算法 被譽(yù)為數(shù)學(xué)顯微鏡的小波變換是從傅里葉變換和加窗傅里葉變換發(fā)展而來的。小波變換引入伸縮和平移兩個(gè)參數(shù),實(shí)現(xiàn)了時(shí)域-頻域局域化分析,從而可以對(duì)圖像的任何局部區(qū)域進(jìn)行多分辨率分析。由于小波變換后圖像具有高頻的方向選擇性,與人眼的視覺特性相吻合,人眼最重要的視覺特性是視覺掩蓋效應(yīng),即不變和有規(guī)則變化的區(qū)域很容易被遺忘,而對(duì)突變和極不規(guī)則變化的區(qū)域感興趣。采用嵌入式零樹小波編碼及算法,通過對(duì)感興趣的區(qū)域和不感興趣區(qū)域分別進(jìn)行編碼,可以達(dá)到充分利用信道資源和存儲(chǔ)空間、提高感興趣區(qū)域的圖像質(zhì)量的目的。 1 視覺掩蓋效應(yīng) 在大多數(shù)應(yīng)用場(chǎng)合,最終的圖像總是由人眼來觀測(cè)的,但是人類的視覺系統(tǒng)并不完美。通過對(duì)人眼視覺現(xiàn)象的觀察與研究發(fā)現(xiàn),視覺掩蓋效應(yīng)可以用于改善圖像信息的處理。視覺選擇性與客體的特性有關(guān),人眼對(duì)空間頻率接近于零的平滑區(qū)域和空間頻率相似紋理區(qū)域有很大的鈍性,所以不變與規(guī)則變化的場(chǎng)景很容易在人的意識(shí)中被遺忘,人類視覺通常只對(duì)突變和極不規(guī)則變化的區(qū)域感興趣。這種與生俱來的選擇性使視覺只限定在有限的目標(biāo)上。 1.1 靜態(tài)對(duì)比靈敏度 人眼主觀上可辨別的最小亮度差別所需要的最小光強(qiáng)差值稱為亮度的辨別閥值。也就是說,當(dāng)刺激光強(qiáng)I增大時(shí),最初感覺不出,直到I變化到I+ΔI時(shí)人眼就感覺到亮度有變化了。人眼對(duì)亮度光強(qiáng)變化的響應(yīng)是非線性的,比值ΔI/I稱為對(duì)比靈敏度。在相當(dāng)寬的光強(qiáng)范圍內(nèi),ΔI/I保持常數(shù)為0.02,但在I很低或很高時(shí)不是常數(shù)。如果有背景,則對(duì)比靈敏度不僅與目標(biāo)物的光強(qiáng)度I有關(guān),而且與背景亮度I。有關(guān)。圖1給出了有背景和無背景時(shí)人眼的靜態(tài)對(duì)比靈敏度曲線。此外,人眼的對(duì)比靈敏度還與刺激的空間變化周期(空間變化周期是指刺激的明暗不變,只改變明暗的空間間隔)有關(guān)。如果亮度固定在一定水平下,則對(duì)比靈敏度與光刺激的空間變化周期之間的關(guān)系如圖2所示。這一關(guān)系通常被稱為人眼的調(diào)制傳遞函數(shù)。圖2中還給出了等亮度的色差信號(hào)Y-R和Y-B的對(duì)比靈敏度曲線。由圖1和圖2可得到以下結(jié)論: (1)恢復(fù)圖像的誤差如果低于對(duì)比靈敏度,則不會(huì)被人眼覺察。 (2)高頻部分在相同的靈敏度閾值下,色差信號(hào)Y-R的空間頻率只有亮度Y的一半,Y-B則為Y的1/4,通常表示色差信號(hào)所需的像素比亮度要少得多。 (3)在相同的靈敏度閾值下,斜向柵格的空間頻率只有正常柵格的0.7,因此按斜向柵格對(duì)圖像數(shù)據(jù)采樣所需的頻率較低。(4)高頻端的靈敏度要小于低頻端,因此對(duì)這些部分的量化誤差可大一些。 1.2 具有感興趣區(qū)域的人眼視覺特性 人們?cè)谟^察和理解圖像時(shí)常常不自覺地對(duì)其中某些區(qū)域產(chǎn)生興趣,把這些區(qū)域稱為視覺感興趣區(qū)域。整幅圖像的主觀視覺質(zhì)量取決于感興趣區(qū)域的視覺質(zhì)量,而不感興趣區(qū)域的降質(zhì)常常不易被人覺察,對(duì)整幅圖像視覺質(zhì)量的影響較小。例如對(duì)一副人像照片,反映一個(gè)人主要特征的是面部信息,在進(jìn)行圖像壓縮時(shí),人的面部信息與其它不重要的信息不必采用相同的壓縮比。顯然,感興趣區(qū)域的視覺特性也是一種視覺掩蓋效應(yīng)。 2 嵌入式零樹小波編碼及算法 2.1 EZW編碼 一幅圖像經(jīng)過三級(jí)小波分解后形成十個(gè)子帶,如圖3所示。小波系數(shù)的分布特點(diǎn)是越往低頻子帶,系數(shù)值越大,包含的圖像信息越多。如圖3中的LL3子帶,越是高頻子帶,系數(shù)值越小,包含的圖像信息越小。在系數(shù)數(shù)值相同時(shí),低頻子帶反映圖像的低頻信息,對(duì)視覺比較重要;而高頻子帶反映圖像的高頻信息,對(duì)視覺不太重要。應(yīng)選擇先傳輸較低頻系數(shù)的重要比特,后傳輸較高頻系數(shù)的重要比特。正是由于小波系數(shù)具有的這些特點(diǎn),它非常適合于嵌入式編碼算法。嵌入式零樹小波編碼EZW(Embedded Zerotree Wavelet)方法是對(duì)整幅圖像進(jìn)行同一級(jí)別編碼的方法,圖像中的重要區(qū)域(感興趣區(qū)域)與背景區(qū)域(非感興趣區(qū)域)具有同樣的編碼級(jí)數(shù)。EZW編碼算是一個(gè)簡(jiǎn)單而有效的圖像編碼算法,這種算法得到的比特流中的比特按其重要性排序。使用這種算法,編碼者能夠在任一點(diǎn)結(jié)束編碼,允許精確到任一個(gè)目標(biāo)比特率或目標(biāo)失真率。 2.2 EZW算法 EZW算法利用小波系數(shù)的特點(diǎn)較好地實(shí)現(xiàn)了圖像編碼的嵌入功能,為了改善小波系數(shù)重要圖的壓縮,定義了一個(gè)零數(shù)的數(shù)據(jù)結(jié)構(gòu),即一個(gè)小波系數(shù)χ。對(duì)于一個(gè)給定的門限T,如果|χ|3 具有感興趣區(qū)域的靜止圖像壓縮編碼算法研究 3.1 EZW_ROI編碼算法 為了提高感興趣區(qū)域的圖像質(zhì)量,在信道資源和存儲(chǔ)空間有限的條件下,提出感興趣區(qū)域的零樹編碼算法EZW_ROI(Embedded Zerotree Wavelet with Region of interests),它對(duì)感興趣區(qū)域圖像和背景圖像采用不同的壓縮步驟,使感興趣區(qū)域內(nèi)的圖像比背景圖像具有更好的圖像質(zhì)量。 對(duì)感興趣區(qū)域內(nèi)外的圖像采用不同的零數(shù)小波編碼。整個(gè)編碼算法分三步進(jìn)行: (1)確定感興趣區(qū)域:人像照片可以把感興趣區(qū)域確定為面部區(qū)域。在視頻監(jiān)視系統(tǒng)中,可以把監(jiān)視環(huán)境中的重要場(chǎng)景設(shè)為感興趣區(qū)域。 (2)對(duì)低頻子帶中感興趣區(qū)域內(nèi)的系數(shù)進(jìn)行編碼:即對(duì)感興趣區(qū)域內(nèi)的圖像進(jìn)行編碼,系數(shù)采用EZW算法的零樹結(jié)構(gòu),按照EZW算法的思想進(jìn)行零樹掃描和編碼。 (3)對(duì)低頻子帶中不在感興趣區(qū)域內(nèi)的系數(shù)進(jìn)行編碼:即對(duì)背景區(qū)域的圖像進(jìn)行編碼,系數(shù)的編碼不用EZW算法的零樹結(jié)構(gòu),只對(duì)背景區(qū)域的低頻信息進(jìn)行編碼。圖5是EZW_ROI算法的編碼結(jié)構(gòu)框圖。 3.2 EZW_ROI解碼算法 對(duì)編碼圖像進(jìn)行解碼時(shí),與編碼過程相反,也分三步進(jìn)行: (1)對(duì)低頻子帶中的感興趣區(qū)域內(nèi)圖像進(jìn)行與EZW算法同樣的零樹編碼。 (2)對(duì)低頻子帶中的感興趣區(qū)域外圖像進(jìn)行簡(jiǎn)單的位解碼。 (3)消除邊緣效應(yīng):在以上兩步的基礎(chǔ)上,對(duì)感興趣區(qū)域的四周做3%26;#215;3的均值濾波,以消除感興趣區(qū)域邊緣的影響,使得感興趣區(qū)域外的圖像在視覺上差別變?nèi)酢? 圖6是EZW_ROI算法的解碼結(jié)構(gòu)框圖。4 應(yīng)用實(shí)例 在研究中采用了一幅標(biāo)準(zhǔn)的8bpp的灰度人像,首先,確定感興趣區(qū)域?yàn)槿讼竦拿娌?,?duì)原始圖像進(jìn)行四級(jí)的小波分解,小波變換采用S+P變換;最后對(duì)圖像進(jìn)行32倍壓縮,即壓縮后的比特率為0.25bpp。用EZW算法和EZW_ROI算法恢復(fù)的圖像如圖7所示。在信道資源和存儲(chǔ)空間有限的條件下,為了提高感興趣區(qū)域的圖像質(zhì)量,采用具有感興趣區(qū)域的圖像壓縮方式,對(duì)感興趣區(qū)域背景圖像采用不同的壓縮步驟,使圖像中的重要信息盡可能少損失。試驗(yàn)證明,在高壓縮比的情況下,EZW_ROI算法的重建圖像比EZW算法的重建圖像具有更好的視覺效果。
評(píng)論