基于RBF網(wǎng)絡(luò)和貝葉斯分類器融合的人臉識(shí)別方法
摘要:提出一種基于徑向基函數(shù)(RBF)網(wǎng)絡(luò)和貝葉斯分類器的人臉特征分類與識(shí)別算法,以提高小樣本人臉識(shí)別精度。通過(guò)基于聚類方法的RBF神經(jīng)網(wǎng)絡(luò)和貝葉斯分類器融合設(shè)計(jì)實(shí)現(xiàn)人臉圖像的分類識(shí)別。實(shí)驗(yàn)數(shù)據(jù)分析表明,該方法在人臉骨骼特征突出情況下具有較高的識(shí)別率。文中提出的分類器融合的識(shí)別方法具有良好的學(xué)習(xí)效率和識(shí)別精度品質(zhì)指標(biāo)。
關(guān)鍵詞:貝葉斯分類器;RBF神經(jīng)網(wǎng)絡(luò);人臉特征;分類;圖像
引言
本文基于人臉圖像分塊和奇異值壓縮,進(jìn)行RBF 神經(jīng)網(wǎng)絡(luò)和貝葉斯分類器融合的設(shè)計(jì)。將人臉圖像本身的灰度分布描述為矩陣,其奇異值特征具有轉(zhuǎn)置不變性、旋轉(zhuǎn)不變性、位移不變性、鏡像不變性等諸多重要的性質(zhì),進(jìn)行各種代數(shù)和矩陣變換后提取的代數(shù)特征是人臉的表征?;谄娈愔堤卣鬟M(jìn)行人臉識(shí)別的方法是由 Hong[1]首先提出來(lái)的。在樣本數(shù)量很大、維數(shù)很高的情況下,利用奇異值分解(SVD)壓縮降維處理,減少算法的時(shí)間復(fù)雜度,是描述人臉特征一種有效的方法。由于整體圖像的奇異值向量反映的是圖像整體的統(tǒng)計(jì)特征,對(duì)細(xì)節(jié)的描述還不夠深入,本文模擬人類識(shí)別人臉的模式,在圖像分塊和加權(quán)的基礎(chǔ)上,突出待識(shí)別人臉的骨骼特征,近似于人類在識(shí)別人臉時(shí)自動(dòng)剔除同一人臉的變化部位的差異能力。
人臉識(shí)別在本質(zhì)上是區(qū)分兩幅人臉圖像表觀上的差別是類內(nèi)變化(同一人的不同圖像)還是類間變化(不同人的不同圖像)。因此,如何對(duì)類內(nèi)變化以及類間變化精確的建模和分類成為人臉識(shí)別領(lǐng)域的重要研究?jī)?nèi)容之一。在眾多的建模、分類方法中,統(tǒng)計(jì)模型是一種主流方法,其中Moghaddam[8]提出的貝葉斯分類器得到了廣泛的認(rèn)可。
徑向基函數(shù)(RBF)網(wǎng)絡(luò)是一種性能良好的前饋型三層神經(jīng)網(wǎng)絡(luò),具有全局逼近性質(zhì)和最佳逼近性能,訓(xùn)練方法快速易行,RBF 函數(shù)還具有局部響應(yīng)的生物合理性。RBF神經(jīng)網(wǎng)絡(luò)隱含層結(jié)點(diǎn)使用了非線性傳輸函數(shù),比單層感知器網(wǎng)絡(luò)具有更強(qiáng)的分類能力。在隱含層中心確定的情況下,RBF神經(jīng)網(wǎng)絡(luò)只需對(duì)隱含層至輸出層的單層權(quán)值學(xué)習(xí)修正,比多層感知器具有更快的收斂速度,這也是本文選擇RBF神經(jīng)網(wǎng)絡(luò)作為分類器的原因。
在 RBF 神經(jīng)網(wǎng)絡(luò)構(gòu)建和初始化采取有監(jiān)督的聚類算法,在網(wǎng)絡(luò)參數(shù)的最終調(diào)整和訓(xùn)練方面采取 Hybrid學(xué)習(xí)(HLA)算法。在隱層參數(shù)固定的條件下,由線性最小二乘法計(jì)算隱層和輸出層之間的連接權(quán)值,由梯度下降法調(diào)整隱層神經(jīng)元的中心和寬度。這種混合學(xué)習(xí)算法,能使RBF網(wǎng)絡(luò)逼近Moody準(zhǔn)則下的最優(yōu)結(jié)構(gòu),即:在沒(méi)有其它先驗(yàn)知識(shí)的情況下,與給定樣本一致的規(guī)模最小的網(wǎng)絡(luò)就是最好的選擇。從而保證該網(wǎng)絡(luò)具有較好的泛化能力。
奇異值分解SVD
對(duì)于任何一個(gè)矩陣A∈Rm×n,利用奇異值分解將其轉(zhuǎn)化為對(duì)角矩陣。
設(shè)A∈Rm×n(不失一般性,設(shè)m≥n),且rank(A)=k,則存在兩個(gè)酉矩陣Um×m和Un×n及廣義對(duì)角陣Dm×m使下式成立:
其中U的列向量是AAT的特征向量,V的列向量是ATA的特征向量,T表示轉(zhuǎn)置。
稱為矩陣A的奇異值, ui(i=k+1,…,m)是AAT對(duì)應(yīng)于λi=0的特征向量,vi(i=k+1,…, n)是ATA對(duì)應(yīng)于λi=0的特征向量。如果矩陣A代表一幅人臉圖像,則式表示對(duì)該人臉圖像進(jìn)行了正交分解,將矩陣中主對(duì)角線上的奇異值元素連同中剩余的(ri-k)個(gè)0組合構(gòu)成一個(gè)n維列向量。
由于任何實(shí)矩陣A對(duì)應(yīng)唯一的奇異值對(duì)角陣,因此,一幅人臉圖像對(duì)應(yīng)于唯一的奇異值特征向量。
本文提出的人臉特征提取方法實(shí)現(xiàn)的流程如下:
?。?)從人臉數(shù)據(jù)庫(kù)選擇人臉作為識(shí)別訓(xùn)練集;
?。?)將被選入訓(xùn)練集的人臉圖像幾何歸一化處理;將被選入訓(xùn)練集的人臉圖像灰度歸一處理;
?。?)將預(yù)處理過(guò)的人臉圖像劃分成大小為的子塊;
?。?)將每一幅圖像變?yōu)橐粋€(gè)列向量(先分別將每一個(gè)子塊所有向量排成一列,再將所有子塊按順序排成一列);然后以子塊為單位進(jìn)行;
?。?)計(jì)算全部人臉圖像的均值;計(jì)算每一類人臉圖像的平均臉,同時(shí)將人臉圖像列向量與類內(nèi)平均臉做差。
基于面部骨骼特征、眼睛的分布、鼻子的形狀等結(jié)構(gòu)特征,是鑒別人臉的主要依據(jù)。將每一幅人臉圖像所形成的矩陣劃分成…等個(gè)二維矩陣分別降維為一維列向量。求訓(xùn)練集中所有對(duì)應(yīng)子塊的平均值, ;再對(duì)每一類樣本中的所有對(duì)應(yīng)子塊求平均, ;對(duì)應(yīng)子塊進(jìn)行樣本規(guī)范化,;并求協(xié)方差矩陣:,從中取 m 個(gè)較大特征值對(duì)應(yīng)的特征向量,構(gòu)成對(duì)應(yīng)子塊的特征臉空間 W1 ,即W1 =[w11,w12,…,w1 m ]T 。再對(duì)訓(xùn)練樣本進(jìn)行規(guī)范化處理 ,投影到特征臉空間,獲得投影特征為: 。對(duì)任一測(cè)試樣本對(duì)應(yīng)子塊進(jìn)行規(guī)范化處理,即,然后得到投影特征,即
用上述方法逐一對(duì)每個(gè)子塊進(jìn)行處理。得到。
基于特征分塊貝葉斯分類器設(shè)計(jì)
每個(gè)基于特征分塊的貝葉斯分類器,利用了所對(duì)應(yīng)的圖像塊包含的判別信息,為得到性能更好的分類器,需要將這些分類器融合給出最終的判別結(jié)果。每個(gè)貝葉斯分類器實(shí)際上是一個(gè)子分類器??梢杂卸喾N辦法實(shí)現(xiàn)分類器融合,如加權(quán)求和、相乘等。本文采取加權(quán)求和的方法:
其中表示兩幅圖像的相似度,L是貝葉斯分類器(FBBC)的總數(shù)(這里是9),是與的第b個(gè)特征塊之間的差值。是由第b個(gè)貝葉斯分類器計(jì)算出的類條件概率密度。是第b個(gè)貝葉斯分類器對(duì)應(yīng)的權(quán)值。
全息投影相關(guān)文章:全息投影原理
評(píng)論