"/>
【技術實現步驟摘要】
基于深度強化學習的安卓惡意軟件檢測特征提取方法
[0001]本專利技術涉及軟件與信息系統安全
,確切地說涉及一種基于深度強化學習的安卓惡意軟件檢測特征提取方法。
技術介紹
[0002]隨著新一代網絡信息技術的不斷發展,越來越多的人開始使用互聯網,互聯網開始影響著生活的方方面面,然而,互聯網的發展也加速了惡意軟件的傳播,惡意軟件是指實現了攻擊者惡意目的的軟件,經常通過互聯網傳播,是存在損害用戶利益的行為是判定軟件是否為惡意軟件的依據。
[0003]而隨智能手機的不斷發展,越來越多的人選擇使用智能手機,搭載安卓系統的智能手機始終占據了市場的很大份額,安卓系統的惡意軟件能夠求取用戶隱私信息、獲取用戶利益、遠程控制達到非法個人目的。自2013年以來,安卓操作系統一直占據著移動操作系統市場的統治地位,這個平臺的開源性和開放性是的安卓平臺成為惡意軟件攻擊的熱門目標。根據Trend Force最新發布數據,2020年智能手機的總產量為12.5億部,Android占據了78.4%的市場份額。然而,由于廣泛分布和開源特性,除了官方Android Market之外,Android應用程序還可以從未知、不受信任和潛在惡意的第三方下載和安裝,這使得該平臺成為惡意軟件攻擊的目標。根據360安全于2020年2月28日發布的2019年Android惡意軟件專項報告顯示,2019年該平臺在移動端攔截新惡意軟件樣本約180.9萬個,平均每天攔截約5000個新移動惡意軟件樣本,因此,對于惡意安卓軟件的分析研究刻不容緩。
[0004 ...
【技術保護點】
【技術特征摘要】
1.一種基于深度強化學習的安卓惡意軟件檢測特征提取方法,其特征在于:包括樣本獲取步驟、深度強化學習模型構建步驟以及模型訓練步驟;樣本獲取步驟,從Android平臺的Androzoo以及Drebin數據集中獲取若干不同的良性和惡意的APK樣本,并通過所述APK樣本進行對特征提取和特征向量化處理得到樣本集合;深度強化學習模型構建步驟,選擇Double Deep Q
?
Learning算法作為深度強化學習模型,選定基于機器學習算法的、用于檢測惡意安卓軟件的分類器模型,并定義所述深度強化學習模型的學習動作空間與狀態空間,設定獎勵機制,并初始化所述深度強化學習模型以及其決策網絡的超參數;模型訓練步驟,啟動所述深度強化學習模型進行學習訓練,訓練過程中損失深度強化學習模型按照設定數量從其經驗回放池中選取學習經驗更新其決策網絡,當深度強化學習模型觀測到在探索模式下和利用模式下選擇的特征達到設定數量后結束當前輪次的訓練,然后根據設定的訓練輪次循環對深度強化學習模型進行學習訓練,完成全部輪次的訓練后,將識別準確率最高的特征子集作為最終選取的最優特征子集。2.如權利要求1所述的基于深度強化學習的安卓惡意軟件檢測特征提取方法,其特征在于:所述樣本獲取步驟中,獲取APK樣本后還需對其進行數據清洗,具體的,是通過Androguard工具對所述APK樣本進行解析,同時通過APKTool工具對所述APK樣本進行反匯編,刪除解析失敗和反匯編失敗的樣本。3.如權利要求2所述的基于深度強化學習的安卓惡意軟件檢測特征提取方法,其特征在于:所述樣本獲取步驟中,所述特征提取,是通過AndroidManifest.xml文件提取出經過數據清洗后的APK樣本的457個重要權限特征和126個意圖特征,同時根據反匯編生成的smail格式文件語法特征,將APK樣本中Method字段基本塊所包含的Dalvik字節碼指令按照設定的轉換規則進行轉換,然后使用N
?
gram技術獲取樣本的N
?
gram特征集合,含500個N
?
gram特征。原始特征集合共1083個特征。4.如權利要求3所述的基于深度強化學習的安卓惡意軟件檢測特征提取方法,其特征在于:所述樣本獲取步驟中,特征向量化處理,是將所述APK樣本采用二進制特征向量進行表示,向量中“1”表示權限特征、意圖特征或N
?
gram特征在APK文件中存在,“0”則表示APK文件中不存在權限特征、意圖特征和/或N
?
gram特征。5.如權利要求1所述的基于深度強化學習的安...
【專利技術屬性】
技術研發人員:方智陽,李美瑾,曾琪,楊濤,伍胤瑋,程露玉,
申請(專利權)人:四川大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。