【技術實現步驟摘要】
本專利技術涉及電數字數據處理,具體涉及基于人工智能的軟件數據安全自動檢測方法。
技術介紹
1、軟件在各個領域扮演著重要的角色,其中,軟件系統中存在各種潛在的安全隱患問題,例如軟件數據自身發生異常、惡意代碼注入等問題,容易導致信息資源受損和錯誤,給用戶造成損失。因此,需要對軟件數據的安全進行檢測,獲取軟件數據中的異常軟件數據,確保傳輸信息的準確性。
2、現有方法中,比較常用的是通過箱線圖算法對軟件數據進行異常檢測,箱線圖算法提供了有關軟件數據集中位置、分散度和異常值的關鍵信息,可以確定軟件數據的分布以及異常情況。但在實際情況中,軟件數據的數據類型和頻率不同,不同數據類型的軟件數據分布可能比較分散,同時,不同異常原因導致軟件數據異常的情況不同,因此,在對軟件數據進行異常檢測時,容易出現因對軟件數據劃分不合理而導致的無法對軟件數據進行準確的異常檢測,從而無法確保傳輸信息的準確性。
技術實現思路
1、為了解決軟件數據劃分不合理而導致的無法對軟件數據進行準確的異常檢測的技術問題,本專利技術的目的在于提供一種基于人工智能的軟件數據安全自動檢測方法,所采用的技術方案具體如下:
2、本專利技術提出了一種基于人工智能的軟件數據安全自動檢測方法,該方法包括以下步驟:
3、獲取預設時間段內標記數據類型的每個軟件數據;
4、將連續相鄰的相同數據類型的軟件數據劃分為一個數據序列,根據每個軟件數據所在數據序列的時長和軟件數據數量,每個軟件數據和相鄰下一軟件數據之
5、根據每個軟件數據的異常可能值,所述預設時間段內每個軟件數據與相同數據類型的其他各軟件數據之間的距離和存在的數據序列數量,以及每個軟件數據與預設鄰域內每個鄰域軟件數據之間的響應數量差異,獲取每個軟件數據的異常得分值;
6、根據所述異常得分值對軟件數據進行聚類,獲得至少兩個初始聚類簇;根據每個初始聚類簇與預設時間段所包含的軟件數據的異常得分值的特征差異,以及每個初始聚類簇與其他初始聚類簇的異常得分值差異,獲取每個初始聚類簇的分位判斷值;
7、根據所述分位判斷值對初始聚類簇進行聚類,獲取預設數量個第二聚類簇。
8、進一步地,所述異常可能值的獲取方法為:
9、對于任一軟件數據,將該軟件數據所在的數據序列作為目標數據序列;
10、將目標數據序列中第一個軟件數據對應的時刻作為第一目標時刻;
11、將目標數據序列中最后一個軟件數據對應的時刻作為第二目標時刻;
12、獲取第二目標時刻與第一目標時刻之間的差異,作為目標數據序列的時長;
13、獲取預設時間段內所有軟件數據的數量與目標數據序列中軟件數據數量的比值,作為目標數據序列的特征放大值;
14、將該軟件數據與相鄰下一軟件數據之間對應時刻的時間間隔,作為第一時間間隔;
15、根據該軟件數據的響應數量與第一時間間隔的比值,目標數據序列的時長和特征放大值,獲取該軟件數據的異常可能值。
16、進一步地,所述異常可能值的計算公式為:
17、
18、式中,qi為第i個軟件數據的異常可能值;ti,d為第二目標時刻;ti,0為第一目標時刻;n為預設時間段內所有軟件數據的數量;ni為第i個軟件數據所在的目標數據序列中軟件數據數量;mi為第i個軟件數據的響應數量;ti為第i個軟件數據對應的時刻;ti+1為第(i+1)個軟件數據對應的時刻;α為第一預設常數,大于0;norm為歸一化函數;(ti,d-ti,0)為第i個軟件數據所在的目標數據序列的時長;ti+1-ti為第一時間間隔;為第i個軟件數據所在的目標數據序列的特征放大值。
19、進一步地,所述異常得分值的獲取方法為:
20、對于任一軟件數據,將該軟件數據與所述預設時間段內相同數據類型的其他各軟件數據之間的歐式距離,作為第一距離;
21、將該軟件數據與所述預設時間段內相同數據類型的其他各軟件數據之間存在的數據序列數量,作為第一數量;
22、根據第一距離和第一數量,獲取該軟件數據與相同數據類型的其他各軟件數據之間的第二特征值;其中,第一距離和第一數量均與第二特征值為正相關關系;
23、構建該軟件數據的預設鄰域,獲取該軟件數據與對應的每個鄰域軟件數據之間的響應數量差異,作為第一響應差異;
24、根據所述第一響應差異,所述第一數量和所述第二特征值,以及該軟件數據的異常可能值,獲取該軟件數據的異常得分值。
25、進一步地,所述異常得分值的計算公式為:
26、
27、式中,γi為第i個軟件數據的異常得分值;k為第i個軟件數據的預設鄰域內鄰域軟件數據的總數量;mi為第i個軟件數據的響應數量;mi+k為第(i+k)個軟件數據的響應數量;qi為第i個軟件數據的異常可能值;j為所述預設時間段內與第i個軟件數據相同數據類型的軟件數據的總數量;di,j為第i個軟件數據與所述預設時間段內相同數據類型的第j個軟件數據之間的第一距離;xi,j為第i個軟件數據與所述預設時間段內相同數據類型的第j個軟件數據之間的第一數量;β為第二預設常數,大于0;si為第一數量的方差;||為絕對值函數;norm為歸一化函數。
28、進一步地,所述分位判斷值的獲取方法為:
29、根據每個初始聚類簇與預設時間段所包含的軟件數據的異常得分值的中位數差異,以及每個初始聚類簇與其他初始聚類簇的異常得分值的均值差異,獲取每個初始聚類簇的分位判斷值。
30、進一步地,所述分位判斷值的計算公式為:
31、
32、式中,gl為第l個初始聚類簇的分位判斷值;γl,z為第l個初始聚類簇內異常得分值的中位數;γz為預設時間段所包含的異常得分值的中位數;a為初始聚類簇的總數量;為第l個初始聚類簇內異常得分值的均值;為第a個初始聚類簇內異常得分值的均值;exp為以自然常數e為底數的指數函數;||為絕對值函數。
33、進一步地,所述根據所述分位判斷值對初始聚類簇進行聚類,獲取預設數量個第二聚類簇的方法為:
34、根據每個初始聚類簇的分位判斷值,通過k-means聚類算法,對初始聚類簇進行聚類,獲得預設數量個第二聚類簇。
35、進一步地,所述根據所述異常得分值對軟件數據進行聚類,獲得至少兩個初始聚類簇的方法為:
36、根據每個軟件數據的異常得分值,通過層次聚類算法,對每個軟件數據進行聚類,獲得至少兩個初始聚類簇。
37、進一步地,所述將連續相鄰的相同數據類型的軟件數據劃分為一個數據序列的方法為:
38、將預設時間段內的軟件數據按照時間順序進行排序,獲得完整序列;
39、將完整序列中連續相鄰的相同數據類型的軟件數據劃分為一個數據序列;其中,當完整序列中某個軟件數據與前后本文檔來自技高網...
【技術保護點】
1.一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,該方法包括以下步驟:
2.如權利要求1所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,所述異常可能值的獲取方法為:
3.如權利要求2所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,所述異常可能值的計算公式為:
4.如權利要求1所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,所述異常得分值的獲取方法為:
5.如權利要求4所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,所述異常得分值的計算公式為:
6.如權利要求1所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,所述分位判斷值的獲取方法為:
7.如權利要求6所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,所述分位判斷值的計算公式為:
8.如權利要求1所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,所述根據所述分位判斷值對初始聚類簇進行聚類,獲取預設數量個第二聚類簇的方法為:
9.如權利要求1所述一種
10.如權利要求1所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,所述將連續相鄰的相同數據類型的軟件數據劃分為一個數據序列的方法為:
...【技術特征摘要】
1.一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,該方法包括以下步驟:
2.如權利要求1所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,所述異常可能值的獲取方法為:
3.如權利要求2所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,所述異常可能值的計算公式為:
4.如權利要求1所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,所述異常得分值的獲取方法為:
5.如權利要求4所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于,所述異常得分值的計算公式為:
6.如權利要求1所述一種基于人工智能的軟件數據安全自動檢測方法,其特征在于...
【專利技術屬性】
技術研發人員:魏軍剛,李可非,葛建新,黨一鳴,吳嘉寧,王艷敏,陳青玉,
申請(專利權)人:準檢河北檢測技術服務有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。