基于改進遺傳算法的支持向量機特征選擇
在種群規(guī)模為30,交叉率為0.8,起始變異率為0.1的條件下使用支持向量機作為分類器(懲罰參數(shù)為13.7,徑向基核函數(shù)參數(shù)為10.6)對所選數(shù)據(jù)進行分類,表1中顯示了本文算法與文獻[11]中幾種算法在分類效果上的對比,表2給出了三種數(shù)據(jù)的最終選擇結(jié)果。表1中共出現(xiàn)了四種方法:方法1:使用本文算法;方法2:使用NGA/PCA方法;方法3:使用PCA方法;方法4:使用簡單遺傳算法。
本文引用地址:http://www.ex-cimer.com/article/105942.htm由于本文算法旨在用最少的特征個數(shù)最大化分類正確率,因此從表1中可以看出本文算法在特征選擇個數(shù)和分類正確率上均比其他三種方法更具優(yōu)勢。由于NGA/PCA算法是針對簡單遺傳算法和主成分分析法的不足而做的改進,其性能優(yōu)于簡單遺傳算法和主成分分析法,所以本文算法的分類效果優(yōu)于NGA/PCA算法這一事實更能說明該算法可以較好地解決支持向量機的特征選擇問題。
結(jié)語
通過與其他方法的比較,本文算法的分類效果得到了充分的驗證,也說明了該算法具有極好的泛化能力以及在敏感度信息量地指導(dǎo)下遺傳操作的有效性。
適應(yīng)度函數(shù)的設(shè)計至關(guān)重要,它直接影響到最終結(jié)果的優(yōu)劣以及算法的收斂性,所以在適應(yīng)度函數(shù)的設(shè)計應(yīng)考慮所解決問題的側(cè)重點。
分類正確率的高低不僅取決于合理的特征選擇,而且與支持向量機的參數(shù)優(yōu)化有關(guān)。只有在合理的特征選擇和參數(shù)優(yōu)化的前提下,支持向量機分類器才能發(fā)揮出最佳的分類效果。
由于算法能夠較好地解決支持向量機的特征選擇問題,因此已被應(yīng)用在基于支持向量機的數(shù)字電路板故障診斷當中,并取得了良好的效果。
參考文獻:
[1] 張學(xué)工. 關(guān)于統(tǒng)計學(xué)習理論與支持向量機[J].自動化學(xué)報,2000,26(1):33-41
[2] Seo K K. A GA-Based Feature Subset Selection and Parameter Optimization of Support Vector Machine for Content – Based Imag Retrieval[J].ADMA2007,2007:594-604
[3] Frohlich H, et al. Feature selection for support vector machines by means of genetic algorithm [C]. In 15th IEEE . Internati onal Conference on Tools with Artificial Intelligence, 2003: 142 - 148
[4] Suna Z, Bebisa G, Millerb R. Object detection using feature subset selection [ J ]. Pattern Recognition, 2004, 37 (1) : 2165 - 2176
[5] 史東鋒,屈梁生. 遺傳算法在故障特征選擇中的應(yīng)用研究[J]. 振動、測試與診斷, 2000,20(3):171-176
[6] 劉清坤, 闕沛文, 郭華偉等. 基于支持向量機和特征選擇的超聲缺陷識別方法研究[J]. 中國機械工程, 2006,17(1):9-11
[7] 張昊, 陶然, 李志勇等. 基于自適應(yīng)模擬退火遺傳算法的特征選擇方法[J]. 兵工學(xué)報, 2009,30(1):81-85
[8] 劉素華, 侯惠芳, 李小霞. 基于遺傳算法和模擬退火算法的特征選擇方法. 計算機工程[J], 2005,31(16):157-159
[9] 楊淑瑩. 模式識別與智能計算——Matlab技術(shù)實現(xiàn)[M]. 北京:電子工業(yè)出版社, 2008
[10] 肖健華. 智能模式識別方法[M].廣州:南洋理工出版社, 2006
[11] 孫見青, 汪榮貴, 胡韋偉等. 一種新的基于NGA/PCA和SVM的特征提取方法[J]. 系統(tǒng)仿真學(xué)報, 2007,19(20):4823-4826
評論