模塊化免疫神經(jīng)網(wǎng)絡模型在計算機病毒分類檢測中的
0 引言
本文引用地址:http://www.ex-cimer.com/article/202688.htm隨著信息技術的發(fā)展和互聯(lián)網(wǎng)應用的普及,計算機系統(tǒng)受到計算機病毒的威脅。計算機病毒分類檢測,指將可疑文件作為輸入,執(zhí)行某病毒檢測算法后輸出結果(無毒、帶毒/帶何種毒)的過程,實質(zhì)上是對文件的分類。病毒分類檢測應屬于模式識別范疇。由于單一的技術無法有效地對抗計算機病毒,技術的融合并用及智能化,將是未來計算機病毒檢測的趨勢。故采用免疫算法和神經(jīng)網(wǎng)絡的新型網(wǎng)絡模型,對計算機病毒分類檢測進行研究。
1 模塊化免疫神經(jīng)網(wǎng)絡模型的提出
人工神經(jīng)網(wǎng)絡和人工免疫系統(tǒng)都是受生物學的啟發(fā)發(fā)展而來的理論和技術,兩者在生物學原理和人工原理上各有異同。研究表明,免疫原理可以應用到神經(jīng)網(wǎng)絡中,以提高神經(jīng)網(wǎng)絡的性能;反之,神經(jīng)網(wǎng)絡理論也可以應用到人工免疫系統(tǒng)中,從而產(chǎn)生一個相互之間可以受益的研究領域。
圖1中,抗原(Ag)表示神經(jīng)網(wǎng)絡中輸入神經(jīng)元到輸出神經(jīng)元的權向量Wk(由抗體Ab和自體庫集S共同作用后,基本調(diào)節(jié)好的權向量),基于計算機病毒的入侵檢測中,代表一類網(wǎng)絡數(shù)據(jù)包,以二進制串表示??贵w(Ab)表示神經(jīng)網(wǎng)絡中的輸入樣本。S代表自體庫集合。權值及輸入樣本和輸出單元都使用二進制,即只使用0和1表示,如圖2。
首先抗體庫中的向量都會和白體庫的向量進行識別。如果抗體庫中的向量一旦和自體庫中的向量匹配,則會進行剪枝操作。
沿用傳統(tǒng)的抗體網(wǎng)絡特征,規(guī)定ξj表示網(wǎng)絡中抗體j的抗原濃度,即抗體j所能識別的抗原個數(shù)。1個抗體細胞k與某種抗原細胞的親和力,由權向量與該抗體的漢明距離(Hamming)決定,可由式(1)得到與Ag可能性的最大狀態(tài)序列δ:
親和力δ越大,說明這種抗體能夠?qū)Υ丝乖M行較好的應答,保留。相反,通過剪枝的方式,從網(wǎng)絡中刪掉。把不與自身反應的抗體保留,進行對抗原的識別,進行后續(xù)的工作。
否定選擇后的抗體與抗原進行神經(jīng)網(wǎng)絡的作用,規(guī)則如上,如果抗體不匹配,按照已有的神經(jīng)網(wǎng)絡的權值算法的改進步驟進行權值的調(diào)整,以達到在給定抗體空間中擁有最大的解空間度,即2個抗體之間有最大的不相同度。
更新抗體種群,經(jīng)過若干次的疊代運算,把抗體種群訓練收斂于一個較穩(wěn)定的集合,即學習過程完畢。學習完成后,可以用于計算機病毒檢測中。
2 模型設計思路
整個網(wǎng)絡的競爭學習步驟分為2部分:
第1部分:首先從抗體庫里根據(jù)概率密度P(Ab)選擇出1個抗體進行輸入。并和自體庫S進行運算,并設定閾值ε,當滿足式(2)時:
抗體經(jīng)過了自體耐受,變?yōu)槌墒斓臋z測器,且不與自體發(fā)生免疫應答,是合格的檢測器。如果超過閾值ε,則從網(wǎng)絡中刪除此抗體節(jié)點。抗體Ab1和自體集S中的S1產(chǎn)生了免疫應答。
第2部分:經(jīng)過自體耐受的抗體分別和某個抗原Agk進行作用,在抗體內(nèi)部設定1個ξi,一旦抗原的權向量和抗體的漢明距離超過閾值ε,ξj增加1,如果ξj長時間等于0,將此抗體從網(wǎng)絡中刪去。當ξj增加到1個常值M時,不再繼續(xù)增加,啟動1個計時器,按一定的間隔時間t遞減ξj,避免了長時間未產(chǎn)生應答的抗體繼續(xù)殘留在抗體庫中。新模型中的神經(jīng)網(wǎng)絡處理單元如圖3。
評論