本發明專利技術提供了一種應用性能受影響的用戶分布檢測方法及系統,其中,所述方法包括:S1、將用戶根據IP劃分區域,形成區域樹;S2、設置訪問時間閾值,記錄超過所述閾值的超時時間;S3、獲取并處理設備日志數據;S4、將處理后的日志數據根據用戶和域名聚類匯總,獲取不同用戶訪問不同域名的平均訪問時間;S5、遍歷區域樹,對每個節點上不同域名的訪問時間進行匯總,求不同域名平均訪問時間,和所有域名的平均訪問時間;S6、遍歷區域樹,通過計算檢測受影響用戶分布。本發明專利技術可以準確的定位應用性能受影響用戶的分布情況,及時的發現網絡性能不健康或潛在不健康的用戶區域,防止網絡癱瘓。
【技術實現步驟摘要】
應用性能受影響的用戶分布檢測方法及系統
本專利技術涉及一種應用性能受影響的用戶分布檢測方法及系統,尤其是涉及一種基于數據挖掘技術的應用性能受影響的用戶分布檢測方法及系統。
技術介紹
在一個大型局域網中,經常會出現局部網速比較慢甚至癱瘓的情況,影響正常的工作和學習。然而,因當前沒有這樣一種技術,可對網絡日志進行挖掘分析,獲取應用性能受影響用戶的分布狀況,故,無法優化受影響用戶的網絡,造成受影響用戶的網絡癱瘓。
技術實現思路
為了解決上述問題,本專利技術的目的是提供一種應用性能受影響的用戶分布檢測方法。該方法基于數據挖掘技術,通過對用戶訪問日志數據的挖掘和分析,獲取網絡性能較差用戶的分布區域,以便及時優化網絡性能差分布區域用戶的網絡。本專利技術的另一目的是提供一種應用性能受影響的用戶分布檢測系統。其中,本專利技術一實施方式的應用性能受影響的用戶分布檢測方法包括以下步驟 51、將用戶根據IP劃分區域,形成區域樹; 52、設置訪問時間閾值,記錄超過所述閾值的超時時間; 53、獲取并處理設備日志數據; 54、將處理后的日志數據根據用戶和域名聚類匯總,獲取不同用戶訪問不同域名的平均訪問時間; 55、遍歷區域樹,對每個節點上不同域名的訪問時間進行匯總,求不同域名平均訪問時間,和所有域名的平均訪問時間; 56、遍歷區域樹,通過計算檢測受影響用戶分布。作為本專利技術的進一步改進,所述區域樹的的葉子節點為IP,根節點為整個局域網頂層設備。作為本專利技術的進一步改進,所述S3步驟具體包括 獲取并處理設備日志數據,清理和裁剪數據,只保留用戶信息、訪問URL,以及URL響應時間。作為本專利技術的進一步改進,所述S4步驟包括 將聚類匯總后的匯總值存儲在區域樹對應的葉子節點。作為本專利技術的進一步改進,所述S6步驟包括 根據計算結果標記所有區域樹上的節點網絡健康情況。相應地,本專利技術一實施方式的應用性能受影響的用戶分布檢測系統包括 劃分單元,用于將用戶根據IP劃分區域,形成區域樹; 設置單元,用于設置訪問時間閾值,記錄超過所述閾值的超時時間; 日志單元,用于獲取并處理設備日志數據; 聚類單元,用于將處理后的日志數據根據用戶和域名聚類匯總,獲取不同用戶訪問不同域名的平均訪問時間;統計單元,用于遍歷區域樹,對每個節點上不同域名的訪問時間進行匯總,求不同域名平均訪問時間,和所有域名的平均訪問時間; 計算單元,用于遍歷區域樹,通過計算檢測受影響用戶分布。作為本專利技術的進ー步改進,所述區域樹的的葉子節點為IP,根節點為整個局域網頂層設備。作為本專利技術的進ー步改進,所述日志単元具體用于 獲取并處理設備日志數據,清理和裁剪數據,只保留用戶信息、訪問URL,以及URL響應時間。作為本專利技術的進ー步改進,所述聚類単元還用于 將聚類匯總后的匯總值存儲在區域樹對應的葉子節點。 作為本專利技術的進ー步改進,所述計算単元還用于 根據計算結果標記所有區域樹上的節點網絡健康情況。相比于現有技術,本專利技術通過對海量日志的分析,可以準確的定位應用性能受影響用戶的分布情況,及時的發現網絡性能不健康或潛在不健康的用戶區域,防止網絡癱瘓。附圖說明 圖I是本專利技術一實施例的應用性能受影響的用戶分布檢測方法的流程 圖2是本專利技術一實施例的應用性能受影響的用戶分布檢測系統的模塊圖。具體實施方式 為了使本專利技術的目的、技術方案和優點更加清楚,下面結合附圖和具體實施例對本專利技術進行詳細描述。如圖I所示,在本專利技術ー實施方式中,應用性能受影響的用戶分布檢測方法,包括以下步驟 51、將用戶根據IP劃分區域,形成區域樹;優選地,區域標記為21,211,212,22,222···,樹的葉子節點為IP,根節點為整個局域網頂層設備,區域樹命名為ZoneTree ; 52、設置訪問時間閾值RTT(Request time threshold),如果訪問時間超過閾值,認為是網絡性能較差的用戶,記錄訪問超時時間RTO (Request time out); 53、獲取并處理設備日志數據,清理和裁剪數據,只保留用戶信息、訪問URL,以及URL響應時間,提聞下一步統計的效率,以及內存的利用率; 54、將處理后的日志數據根據用戶和域名聚類匯總,獲取不同用戶訪問不同域名的平均訪問時間,優選地,通過匯總條件的哈希算法進行數據歸類,并求平均訪問時間,將匯總值存儲在區域樹對應的葉子節點; 55、二次統計,自底向上遍歷區域樹,對每個節點上不同域名的訪問時間進行匯總,求不同域名平均訪問時間,和所有域名的平均訪問時間; 56、自頂向下遍歷區域樹,通過計算檢測受影響用戶分布,計算公式為,影響用戶區域AVG>RTT&&MAX<RT0 ;健康度(1-AVG/RTT) *100% ;標記所有區域樹上的節點網絡健康情況,如果父區域不健康且該區域的所有子區域都不健康,則標記父區域不健康,否父區域健康,標記為不健康的字區域不健康,依次遞歸查找。如圖2所示,在本專利技術ー實施方式中,應用性能受影響的用戶分布檢測系統,包括劃分單元,用于將用戶根據IP劃分區域,形成區域樹;優選地,區域標記為Z1,Zll, Z12,12, Z22···,樹的葉子節點為IP,根節點為整個局域網頂層設備,區域樹命名為ZoneTree ; 設置單元,用于設置訪問時間閾值RTT(Request time threshold),如果訪問時間超過閾值,認為是網絡性能較差的用戶,記錄訪問超時時間RTO (Request time out); 日志單元,用于獲取并處理設備日志數據,清理和裁剪數據,只保留用戶信息、訪問URL,以及URL響應時間,提高下一步統計的效率,以及內存的利用率; 聚類單元,用于將處理后的日志數據根據用戶和域名聚類匯總,獲取不同用戶訪問不同域名的平均訪問時間,優選地,通過匯總條件的哈希算法進行數據歸類,并求平均訪問時間,將匯總值存儲在區域樹對應的葉子節點; 統計單元,用于二次統計,自底向上遍歷區域樹,對每個節點上不同域名的訪問時間進行匯總,求不同域名平均訪問時間,和所有域名的平均訪問時間; 計算單元,用于自頂向下遍歷區域樹,通過計算檢測受影響用戶分布,計算公式為,影響用戶區域AVG>RTT&&MAX〈RTO ;健康度(1-AVG/RTT) *100% ;標記所有區域樹上的節點網絡健康情況,如果父區域不健康且該區域的所有子區域都不健康,則標記父區域不健康,否父區域健康,標記為不健康的字區域不健康,依次遞歸查找。綜上所述,本專利技術通過對海量日志的分析,可以準確的定位應用性能受影響用戶的分布情況,及時的發現網絡性能不健康或潛在不健康的用戶區域,防止網絡癱瘓。應當理解,雖然本說明書按照實施方式加以描述,但并非每個實施方式僅包含一個獨立的技術方案,說明書的這種敘述方式僅僅是為清楚起見,本領域技術人員應當將說明書作為一個整體,各實施方式中的技術方案也可以經適當組合,形成本領域技術人員可以理解的其他實施方式。上文所列出的一系列的詳細說明僅僅是針對本專利技術的可行性實施方式的具體說明,它們并非用以限制本專利技術的保護范圍,凡未脫離本專利技術技藝精神所作的等效實施方式或變更均應包含在本專利技術的保護范圍之內本文檔來自技高網...
【技術保護點】
一種應用性能受影響的用戶分布檢測方法,其特征在于,所述方法包括:S1、將用戶根據IP劃分區域,形成區域樹;S2、設置訪問時間閾值,記錄超過所述閾值的超時時間;S3、獲取并處理設備日志數據;S4、將處理后的日志數據根據用戶和域名聚類匯總,獲取不同用戶訪問不同域名的平均訪問時間;S5、遍歷區域樹,對每個節點上不同域名的訪問時間進行匯總,求不同域名平均訪問時間,和所有域名的平均訪問時間;S6、遍歷區域樹,通過計算檢測受影響用戶分布。
【技術特征摘要】
【專利技術屬性】
技術研發人員:高華,姚春秋,
申請(專利權)人:蘇州邁科網絡安全技術股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。