首頁 > 期刊 > 自然科學與工程技術 > 信息科技 > 電子信息科學綜合 > 計算機研究與發展 > 一種基于概率主題模型的惡意代碼特征提取方法 【正文】
摘要:在當前復雜網絡環境下,惡意代碼通過各種方式快速傳播,入侵用戶終端設備或網絡設備、非法竊取用戶隱私數據,對網絡和互聯網用戶造成了嚴重的安全威脅.傳統檢測方法難以檢測未知惡意代碼,而惡意代碼變體的多樣性和龐大數量也對未知惡意代碼檢測構成了巨大挑戰.提出了一種無監督的惡意代碼識別方法,通過分析反匯編PE文件給出匯編指令標準化規則,結合潛在狄立克雷分布(latent Dirichlet allocation,LDA)獲得匯編指令中潛在的“文檔主題”、“主題詞”的分布.再以“主題分布”構造惡意樣本特征,產生一個全新的惡意代碼檢測框架.結合“困惑度”和變化的步長給出了最優“主題”數目的快速評價和自動確定方法,解決了LDA模型中主題數目需要預先指定的問題.同時解析了“文檔主題”、“主題詞”聚集結果的語義可解釋性,說明了該方法獲得的樣本特征具有潛在的語義.實驗結果表明:與其他方法相比該方法具有相當的或更好的惡意代碼鑒別能力,同時能夠準確地識別惡意代碼的新變體.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社