A method and classification of Android hierarchical simhash based on malicious code detection, comprising the following steps: 1, malicious code detection and malware family training set for each family of known malicious malicious applications are layered extraction, classification model of all malicious families; use the voting algorithm to calculate the reliability of each layer and after a set number of training the credibility weights of each layer; step two, malicious code detection and malware family classification test, first tested the Android application layer extraction, and detection of malicious code, if detected as non malicious applications, the results obtained, otherwise 5 aspects and malicious the family model obtained by the simhash from a hierarchical similarity comparison, each layer of the credibility of the results of each layer Do a weighted voting analysis to get a final result. The invention has high reliability.
【技術(shù)實現(xiàn)步驟摘要】
一種基于層次式SimHash的Android惡意代碼分類方法
本專利技術(shù)涉及Android惡意代碼相檢測分類
,尤其是一種基于層次式simhash的Android惡意代碼檢測方法。
技術(shù)介紹
隨著移動互聯(lián)網(wǎng)的發(fā)展,移動智能終端越來越普及,移動應(yīng)用的種類與數(shù)量都呈現(xiàn)高速增長,智能手機已經(jīng)成為網(wǎng)民最常用的上網(wǎng)工具。來自Gartner統(tǒng)計數(shù)據(jù)顯示,2015年第4季度全球智能手機的銷售量為4億多臺,其中Android系統(tǒng)占據(jù)了80.7%。截止2016年2月1日,僅Android官方應(yīng)用市場GooglePlay上的應(yīng)用數(shù)量就接近200萬。同時,移動惡意應(yīng)用的種類與數(shù)量也呈現(xiàn)高速增長,根據(jù)阿里聚安全發(fā)布的2015移動安全病毒年報,18%的Android設(shè)備感染過病毒,95%的熱門移動應(yīng)用存在仿冒應(yīng)用,惡意應(yīng)用類型越來越多。常見手機病毒的惡意行為包括惡意扣費、信息竊取、短信劫持等,可嚴重損害手機用戶的利益,危害不容忽視。Android惡意代碼檢測方法主要有基于特征代碼和基于行為的檢測。基于行為的檢測方法則通過程序的行為與已知惡意行為模式進行匹配,判斷目標(biāo)文件是否包含惡意代碼。誤報率雖然并不理想,但可實現(xiàn)對未知惡意代碼或病毒的檢測,彌補基于特征代碼的檢測。基于行為的分析又可進一步分為動態(tài)和靜態(tài)兩種分析方法。動態(tài)分析方法是指利用“沙盒或虛擬機”來模擬運行程序,通過攔截或監(jiān)控的方式分析程序運行時的行為特征,一定程度上可繞過代碼混淆等代碼保護機制,但是計算資源和時間消耗較大,且代碼覆蓋率低。相對于重量級的動態(tài)分析,靜態(tài)分析則相對屬于輕量級的方法,通常是通過逆向工程抽取程序 ...
【技術(shù)保護點】
一種基于層次式simhash的Android惡意代碼檢測和分類方法,其特征在于:包括以下步驟:步驟一,惡意代碼檢測和惡意家族的訓(xùn)練集,過程如下:對已知各個惡意家族中的惡意應(yīng)用程序進行分層次提取,分別從xml文件、smali代碼、smali代碼指令集、java代碼、java代碼指令集這5個方面分析應(yīng)用程序,從而對每一個應(yīng)用程序建立5個特征,對每個惡意家族,建立由該家族中惡意應(yīng)用程序組成的5個特征集,從而形成各個惡意家族的分類模型;在形成設(shè)定量的惡意家族模型之后,使用投票算法計算每一層的可信度,經(jīng)過設(shè)定數(shù)量的訓(xùn)練之后,得出每一層的可信度權(quán)重;步驟二,惡意代碼檢測和惡意家族分類的測試,過程如下:首先對待測Android應(yīng)用程序進行分層提取,分別得到xml文件、smali代碼、smali代碼指令集、java代碼、java代碼指令集這5個方面的集合,然后進行惡意代碼檢測,若檢測出其為非惡意應(yīng)用程序,得出檢測結(jié)果,若檢測出為惡意的應(yīng)用程序,從分層得到的5個方面與步驟一得到的惡意家族模型進行simhash相似性對比,同時使用步驟一得到的各層的可信度,分別對每一層的對比結(jié)果做加權(quán)投票分析,綜合得出一個 ...
【技術(shù)特征摘要】
1.一種基于層次式simhash的Android惡意代碼檢測和分類方法,其特征在于:包括以下步驟:步驟一,惡意代碼檢測和惡意家族的訓(xùn)練集,過程如下:對已知各個惡意家族中的惡意應(yīng)用程序進行分層次提取,分別從xml文件、smali代碼、smali代碼指令集、java代碼、java代碼指令集這5個方面分析應(yīng)用程序,從而對每一個應(yīng)用程序建立5個特征,對每個惡意家族,建立由該家族中惡意應(yīng)用程序組成的5個特征集,從而形成各個惡意家族的分類模型;在形成設(shè)定量的惡意家族模型之后,使用投票算法計算每一層的可信度,經(jīng)過設(shè)定數(shù)量的訓(xùn)練之后,得出每一層的可信度權(quán)重;步驟二,惡意代碼檢測和惡意家族分類的測試,過程如下:首先對待測Android應(yīng)用程序進行分層提取,分別得到xml文件、smali代碼、smali代碼指令集、java代碼、java代碼指令集這5個方面的集合,然后進行惡意代碼檢測,若檢測出其為非惡意應(yīng)用程序,得出檢測結(jié)果,若檢測出為惡意的應(yīng)用程序,從分層得到的5個方面與步驟一得到的惡意家族模型進行simhash相似性對比,同時使用步驟一得到的各層的可信度,分別對每一層的對比結(jié)果做加權(quán)投票分析,綜合得出一個最終結(jié)果。2.如權(quán)利要求1所述的基于層次式simhash的Android惡意代碼檢測和分類方法,其特征在于:所述步驟一中,利用對Android惡意程序的逆向...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:陳鐵明,潘永濤,王婷,呂明琪,陳波,江頡,
申請(專利權(quán))人:浙江工業(yè)大學(xué),
類型:發(fā)明
國別省市:浙江,33
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。