基于小波包變換和壓縮感知的人臉識(shí)別算法
引言
本文引用地址:http://www.ex-cimer.com/article/235426.htm人臉識(shí)別是一個(gè)經(jīng)典的模式識(shí)別問(wèn)題。壓縮感知理論的出現(xiàn)和發(fā)展,給人臉識(shí)別帶來(lái)了新的啟發(fā),使得基于稀疏表示的人臉識(shí)別技術(shù)得到了廣泛研究。傳統(tǒng)的基于稀疏表示的人臉識(shí)別是利用壓縮感知超完備庫(kù)下的稀疏表示,將訓(xùn)練圖片直接構(gòu)造為冗余字典,再求解重構(gòu)算法下的最優(yōu)稀疏線性組合系數(shù),然后根據(jù)這些系數(shù)來(lái)對(duì)人臉圖像進(jìn)行分類。
鄭軼、蔡體健[1]針對(duì)人臉求解稀疏表示時(shí)正交匹配追蹤算法運(yùn)算度高,提出了一種改進(jìn)的算法,加快了逆矩陣和大矩陣乘積的求解,但在構(gòu)成訓(xùn)練字典時(shí)對(duì)光照[2]、表情[3]、姿態(tài)[4]等考慮較少。Allen Y. Yang[5]等針對(duì)壓縮感知基于最小一范數(shù)求解最優(yōu)稀疏表示時(shí)算法運(yùn)算度高,提出了一種凸優(yōu)化算法,取得了不錯(cuò)的識(shí)別率,但仍然是超完備庫(kù)下的稀疏表示。平強(qiáng)、莊連生[6]等針對(duì)人臉識(shí)別姿態(tài)問(wèn)題提出了基于仿射變換的人臉?lè)謮K稀疏表示,提升了算法的識(shí)別性能,但仿射變換和分塊稀疏表示都增加了運(yùn)算復(fù)雜度。
本文針對(duì)上述字典構(gòu)成問(wèn)題,提出基于基函數(shù)字典下的稀疏表示,尋找一個(gè)正交基,使得信號(hào)表示的稀疏系數(shù)盡可能的少,小波基符合這一要求,同時(shí)小波包變換能提取人臉低頻、高頻四個(gè)頻帶的特征,包括人臉的整體特征和局部紋理特征,小波包多層變換后還可以2n的速度對(duì)人臉圖像進(jìn)行降維。本文在運(yùn)用壓縮感知時(shí),只利用壓縮感知對(duì)高維人臉圖片進(jìn)行降維,不進(jìn)行重構(gòu)算法尋求最優(yōu)稀疏解,大大降低了算法的復(fù)雜度。實(shí)驗(yàn)結(jié)果表明本算法與相關(guān)算法比較識(shí)別率較高,運(yùn)算時(shí)間基本無(wú)劣勢(shì),對(duì)訓(xùn)練樣本的數(shù)目要求較低。
1 基本理論
1.1 小波變換的基本理論
小波變換是一種變換分析方法,它將原始圖像與小波基函數(shù)進(jìn)行內(nèi)積運(yùn)算,圖像經(jīng)小波分解后可得到一個(gè)近似分量和三個(gè)方向的細(xì)節(jié)分量,三個(gè)細(xì)節(jié)分量分別具有高度的局部相關(guān)性,而整體相關(guān)性能最大限度地消除。選擇小波基時(shí)具體要考慮小波基的正交性,使得各子帶間數(shù)據(jù)相關(guān)性最小;緊支性使應(yīng)用精度較高,不需要人為截?cái)鄶?shù)據(jù);小波基的對(duì)稱性也是十分重要的,因?yàn)榭梢詷?gòu)造緊支的正則小波基,從而具有線性相位[7]。
小波包變換區(qū)別于小波變換,它不僅對(duì)信號(hào)的低頻分量進(jìn)行連續(xù)分解,而且對(duì)高頻分量也進(jìn)行連續(xù)分解,不僅可得到許多分辨率較低的低頻分量,而且也可得到許多分辨率較低的高頻分量,如圖1所示,這種變換稱之為小波包變換 [8]。
圖1中,箭頭向左表示當(dāng)前層低通濾波變換,箭頭向右表示當(dāng)前層高通濾波變換。
1.2 壓縮感知理論
壓縮感知理論[9]指出,只要信號(hào)是可壓縮的或在某個(gè)變換域是稀疏的,那么就可以用一個(gè)與變換基不相關(guān)的觀測(cè)矩陣將變換所得高維信號(hào)投影到一個(gè)低維空間上。壓縮感知信號(hào)稀疏表示主要有兩個(gè)方向[10],一是基函數(shù)字典下的稀疏表示,二是超完備庫(kù)下的稀疏表示。稀疏信號(hào)通過(guò)觀測(cè)矩陣投影如公式(1)所示:
其中為觀測(cè)矩陣,為稀疏信號(hào),為信號(hào)經(jīng)觀測(cè)矩陣投影后所得列向量。
將壓縮感知作為特征提取的方法,必須保證觀測(cè)矩陣不會(huì)把兩個(gè)不同的稀疏信號(hào)映射到同一個(gè)采樣集合中,這就要求從觀測(cè)矩陣中抽取的每M個(gè)列向量構(gòu)成的矩陣是非奇異的,同時(shí)需要保證觀測(cè)矩陣和稀疏基不相干。
2 本文稀疏表示的人臉識(shí)別算法
本文將小波包變換和壓縮感知結(jié)合應(yīng)用于人臉識(shí)別,具體識(shí)別過(guò)程如圖2所示。
2.1 二層小波包分解構(gòu)成基函數(shù)字典
根據(jù)前文描述小波包變換,2D-WPT 是一維離散小波變換的擴(kuò)展,其實(shí)質(zhì)是將二維信號(hào)在不同尺度上進(jìn)行分解,得到原始信號(hào)的近似分量和細(xì)節(jié)分量。原始圖像經(jīng)過(guò)1層2D-DWT分解后圖像被分成4個(gè)部分:近似部分,水平細(xì)節(jié),垂直細(xì)節(jié)以及對(duì)角細(xì)節(jié)。
近似部分是對(duì)人臉的全局描述,主要受光照、姿態(tài)和位置影響,三個(gè)細(xì)節(jié)分量是對(duì)人臉的局部細(xì)節(jié)描述,主要受表情和遮擋飾物(如眼鏡,胡須等)的影響[11]。每部分圖像大小為原始圖像的四分之一大小,對(duì)圖像起到了降維的作用。
圖3是對(duì)一幅大小為100×100的人臉圖像進(jìn)行小波變換的結(jié)果。
圖3(a)為原始人臉圖像,圖(b)為對(duì)原始圖像進(jìn)行的一層小波分解,分別為原始圖像的低頻分量(左上)垂直高頻分量(右上)、水平高頻分量(左下)和對(duì)角高頻分量(右下),圖(c)為低頻分量進(jìn)行兩層分解。上述小波變換選取的小波基為db1,考慮了小波基的緊支撐、高階消失矩和對(duì)稱性,db1是比較適合對(duì)人臉圖像進(jìn)行小波變換的小波基,大量實(shí)驗(yàn)也證明了db1在進(jìn)行人臉重構(gòu)時(shí),平均重構(gòu)誤差是最小的,即db1更適合提取人臉特征,證明了分析的正確性。
本文進(jìn)行了小波包的分解,既完成了基于基函數(shù)字典下的稀疏表示,也提取了人臉識(shí)別的整體信息和局部細(xì)節(jié)信息。在構(gòu)成基函數(shù)字典時(shí),需將低頻、高頻分量分別構(gòu)成列向量,最后組成一個(gè)大的列向量,保留其中的結(jié)構(gòu)信息。
小波包變換采用兩層分解,取第二層分解結(jié)果作為特征,使得圖像維數(shù)得到降低,進(jìn)而也使得降維時(shí)壓縮感知的運(yùn)算量大大減少。如果小波包分解層數(shù)過(guò)多,會(huì)造成計(jì)算耗時(shí),同時(shí)圖像信息也會(huì)因?yàn)槎啻畏纸舛糠謥G失。
2.2 壓縮感知降維
人臉圖像經(jīng)小波包變換構(gòu)成基函數(shù)字典后,信息具有稀疏性,同時(shí)包含人臉表情、姿態(tài)等細(xì)節(jié)信息,從而用壓縮感知進(jìn)行進(jìn)一步的有效信息的提取和降維,將基函數(shù)字典矩陣與觀測(cè)矩陣運(yùn)算后得到一個(gè)維數(shù)較低的向量,作為人臉的最終特征向量。最后本文用訓(xùn)練圖像和測(cè)試圖像特征向量之差二范數(shù)分類器進(jìn)行分類,得到了良好的識(shí)別效果。
本文選用的觀測(cè)矩陣為哈達(dá)瑪矩陣,它是由+1和-1元素構(gòu)成的正交方陣,它的任意兩行(或兩列)都是正交的,即保證了觀測(cè)矩陣是非奇異的,符合壓縮感知對(duì)觀測(cè)矩陣的要求,同時(shí)哈達(dá)瑪矩陣也便于硬件實(shí)現(xiàn)。
本文算法應(yīng)用于人臉識(shí)別具體做法描述如下:
(1)輸入c類N個(gè)訓(xùn)練樣本,進(jìn)行二層小波包分解將訓(xùn)練樣本投映到小波域,進(jìn)而構(gòu)成基函數(shù)字典訓(xùn)練空間A;
(2)給定一個(gè)測(cè)試圖像,用二層小波包分解將其投映到小波域空間,進(jìn)而構(gòu)成測(cè)試空間x;
(3)將訓(xùn)練樣本的字典空間按結(jié)構(gòu)排成列向量,運(yùn)用壓縮感知計(jì)算 (i=1,2…N)將Yi的每一列作為最終進(jìn)行比較的特征向量;
(4)將測(cè)試圖像小波域的測(cè)試空間按結(jié)構(gòu)排成列向量,運(yùn)用壓縮感知計(jì)算:;
(5)在每個(gè)最終特征向量上用 (i=1,2…N)計(jì)算特征向量之差的二范數(shù);
(6)若,則x與第i個(gè)訓(xùn)練樣本為同一類。
3 實(shí)驗(yàn)結(jié)果
選用Yale人臉數(shù)據(jù)庫(kù)和ORL人臉數(shù)據(jù)庫(kù)[12]作為實(shí)驗(yàn)素材,其中Yale A人臉總數(shù)165,15類,大小為,影響識(shí)別因素為光照、表情、姿態(tài)、飾物。訓(xùn)練樣本為每類4幅圖片,測(cè)試圖像為每類其他7幅人臉。ORL人臉總數(shù)為400,40類,大小為,影響識(shí)別的因素為姿態(tài)。訓(xùn)練樣本為每類3幅圖片,測(cè)試圖片為每類其他7幅人臉。實(shí)驗(yàn)環(huán)境為Intel Core2 Duo CPU--E7500 2.93GHz,2.00GB RAM,matlab7.0(R2009a)。
為驗(yàn)證本文算法的識(shí)別率和運(yùn)行時(shí)間的有效性進(jìn)行了實(shí)驗(yàn),并與基于壓縮感知的FOMP人臉識(shí)別算法[1]進(jìn)行了比較。如表1所示為Yale A 人臉識(shí)別結(jié)果,其中運(yùn)行時(shí)間為105幅測(cè)試圖像運(yùn)行總時(shí)間。如表2所示為ORL人臉識(shí)別結(jié)果,其中運(yùn)行時(shí)間為240幅測(cè)試圖像運(yùn)行總時(shí)間。
(1)由表1實(shí)驗(yàn)結(jié)果,本文算法因進(jìn)行了小波包變換構(gòu)成基函數(shù)字典,提取了整體特征和局部細(xì)節(jié)特征,對(duì)表情、姿態(tài)的變化魯棒性高一些,進(jìn)而識(shí)別率有一定優(yōu)勢(shì)。雖然本文未進(jìn)行運(yùn)算量高的正交匹配算法尋找最優(yōu)稀疏解,小波包變換也能起到降維作用,但由于進(jìn)行小波包變換占用時(shí)間,使得本算法時(shí)間上仍有一定劣勢(shì)。
(2)由表2實(shí)驗(yàn)結(jié)果,得知兩個(gè)算法的識(shí)別率都有提升,說(shuō)明壓縮感知對(duì)姿態(tài)有一定的魯棒性,而本文算法識(shí)別率上仍然有一定優(yōu)勢(shì),說(shuō)明小波包變換構(gòu)成基函數(shù)字典,增強(qiáng)了算法的姿態(tài)魯棒性。
(3)通過(guò)對(duì)表1實(shí)驗(yàn)結(jié)果分析,發(fā)現(xiàn)本算法錯(cuò)誤識(shí)別的人臉圖像大多光照較弱或光照不均勻,說(shuō)明本文算法對(duì)光照的魯棒性能較差。分析其原因,在光照較差的情況下,圖像是人臉的概貌,紋理信息較弱,使得小波包變換不能有效的提取細(xì)節(jié)特征,影響了識(shí)別率。
4 結(jié)束語(yǔ)
本文提出了一種基于小波包變換和壓縮感知的人臉識(shí)別算法,與傳統(tǒng)方法相比,本文采用基函數(shù)字典表示,將小波包變換和壓縮感知相結(jié)合,充分利用了小波包變換和壓縮感知的優(yōu)勢(shì),克服其缺點(diǎn),使得識(shí)別率得到了提升,時(shí)間復(fù)雜度也得到了有效的控制。同時(shí)本算法不需要對(duì)圖片進(jìn)行預(yù)處理,對(duì)遮擋物、表情有很好的魯棒性。但本文算法對(duì)光照的魯棒性能較差,還需要進(jìn)一步研究加以改善。
參考文獻(xiàn):
[1]鄭軼,蔡體健.稀疏表示的人臉識(shí)別及其優(yōu)化算法[J].華東交通大學(xué)學(xué)報(bào),2012,29(1):10-14
[2]Wagner A,Wright J.Toward a practical face recognition system: robust alignment and illumination by sparse representation[J]. IEEE Transactions on Pattern Analysis and Mac-hine Intelligence,2012,34(2):372-386
[3]Hsieh C K,Lai S H.Expression-invariant face recognition with Constrained optical flow warping[J].IEEE Transactions on Multimedia,2009,11(4):600-610
[4]Huang J,Yuen P C.Choosing Parameters of kernel subspace LDA for recognition of face images under pose and illumination variations[J].IEEE Transactions on Cybernetics,2007,37(4):847-862
[5]Yang A Y,Zhou Z H.Fast L1-Minimization Algorithms for Robust Face Recognition[J].IEEE TRANSACTIONS ON IMAGE PROCESSING,2013,22(8):3234-3246
[6]平強(qiáng),莊連生,等.姿態(tài)魯棒的分塊稀疏表示人臉識(shí)別算法[J].中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào),2011,41(11):975-981
[7]李月琴,栗蘋,等.無(wú)線電引信信號(hào)去噪的最優(yōu)小波基選擇[J].北京理工大學(xué)學(xué)報(bào),2008,28(8):723-726
[8]Chan W L,Choi H,Baraniuk R G.Coherent multiscale image processing using dual-tree quaternion wavelets[J].IEEE Transactions on Image,2008,17(7):1069-1082
[9]Inoue K,Kuroki Y.Illumination-robust face recognition via sparse representation[C].IEEE of Visual Communications and Image Processing, 2011:1-4
[10]Donoho D.Compressed sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306
[11]Soulard R,Carre P. Quaternionic wavelets for texture classification[J]. Pattern Recognition Letters,2011,32(13)1669-1678
[12]Oliver research laboratory[DB/OL].http//www.uk.research.att.Com/data/att_faces.Zip.Cambridge
全息投影相關(guān)文章:全息投影原理
評(píng)論