基于改進(jìn)遺傳算法的支持向量機(jī)特征選擇
基于敏感度信息量的交叉、變異操作
本文引用地址:http://www.ex-cimer.com/article/105942.htm獨(dú)立敏感度信息量Q(i)指的是對(duì)在所有特征都被選中時(shí)計(jì)算所得到的適應(yīng)度值A(chǔ)llfitness以及只有特征i未被選中時(shí)計(jì)算得到的適應(yīng)度值Wfitness(i)按式(2)進(jìn)行計(jì)算得到的數(shù)值。獨(dú)立敏感度信息量刻畫(huà)了適應(yīng)度對(duì)特征i是否被選擇的敏感程度。
互敏感度信息量R(i,j)由(3)式可得,互敏感度信息量體現(xiàn)了特征i與特征j之間對(duì)適應(yīng)度的近似影響程度。
交叉操作的作用是通過(guò)交換兩個(gè)染色體之間的若干位從而生成含有部分原始優(yōu)良基因的新個(gè)體。由式(3)可知互敏感度信息量可作為不同特征之間含有相似分類(lèi)信息的一種度量,所以可以將互敏感度信息量代入式(4)計(jì)算出染色體在第位發(fā)生交叉的幾率b(i),在式(4)中i和j分別代表特征i和特征j,是染色體的長(zhǎng)度。b(i)是特征i相對(duì)于其他所有特征在互敏感度信息量上的歸一量,反映了特征與其余特征在相似信息量上的總和。由此對(duì)應(yīng)到染色體上,b(i)就可以認(rèn)為是染色體的第i位與整個(gè)染色體在基因信息上的相關(guān)性,b(i)越小則說(shuō)明相關(guān)性越大,第i位與整個(gè)染色體所含的基因信息越接近,此位為分裂點(diǎn)的幾率越小。由于b(i)是歸一化量,故可采用輪盤(pán)算法來(lái)選擇一個(gè)交叉點(diǎn)。
變異操作是引入新物種的重要手段,可以有效地增加種群個(gè)體的多樣性。本文中的變異率Pm采用相鄰兩代之間的最優(yōu)適應(yīng)度增幅比作為自變量進(jìn)行自適應(yīng)調(diào)節(jié),如式(5)所示。當(dāng)適應(yīng)度增幅比正向增大時(shí),較小的增幅比可以使變異率維持在中等水平,并且變異率隨著增幅比的增大而緩慢降低,這樣既能夠擁有一定數(shù)量的新個(gè)體也可以抑制過(guò)多不良染色體的產(chǎn)生,保證優(yōu)秀染色體的進(jìn)化足夠穩(wěn)定;而當(dāng)適應(yīng)度增幅比反向增大時(shí),由較小增幅比則可以獲得較高的變異率,并且變異率也伴隨增幅比同比緩慢升高,確保有足夠的染色體發(fā)生變異,穩(wěn)定地加快進(jìn)化速度。
評(píng)論