本發明專利技術公開了一種移動互聯網流量類別標記方法,涉及移動互聯網流量測量領域的流量類別標記技術領域,該方法包括:S1、移動端與服務器端建立連接;S2、服務器端采集移動端的網絡流量,移動端采集該網絡流量對應的Socket信息,服務器端接收來自移動端的Socket信息;S3、服務器端對網絡流量及與該網絡流量對應的Socket信息進行分析,根據類別標記規則標識該網絡流量所屬的移動應用。本發明專利技術還公開了一種移動互聯網流量類別標記系統。本發明專利技術實現在一個節點上采集移動端的所有網絡流量,在非管理員權限下獲取移動端通信的Socket信息,且在無需分析報文載荷內容情況下,標識網絡流量所屬移動應用,實現細粒度的流量類別標記。
【技術實現步驟摘要】
本專利技術涉及移動互聯網流量測量領域的流量類別標記
,具體涉及一種移動互聯網流量類別標記方法和系統。
技術介紹
近年來,隨著高性能智能終端的迅猛發展,以及3G、4G和WiFi等無線通信技術的飛躍發展,移動互聯網的規模急劇增長,各種基于移動互聯網的上層應用競相涌現。終端應用的豐富性,幾乎覆蓋了工作和生活的各個方面,例如即時通信、零售餐飲、大眾理財、交通出行等,極大地方便了人們的工作和生活。根據《中國互聯網發展狀況統計報告》,至2015年12月,我國手機網民規模達6.20億,在整體網民中占比達90.1%。我國移動互聯網流量數據呈現爆炸式增長,截至2015年底,月戶均移動互聯網接入流量達到389.3M,同比增長89.9%。網絡流量數據的增長速度之快,帶寬資源始終難以保障所有終端應用的通信質量,網絡延時經常發生。然而,不同網絡應用對網絡延時的要求不同,非交互式應用(例如P2P)允許網絡延時跨越較長時間;部分交互式應用(例如銀行交易)的網絡延時只有幾秒;某些交互式應用(例如語音通信、在線游戲)的網絡延時限制在幾分之一秒(劉珍,因特網流量類不平衡特性與分類方法的研究.華南理工大學,博士學位,2013)。較大的網絡延時導致交互式應用的通信速度變慢甚至引發語音報文丟包,直接影響網絡應用的服務質量(Quality of Service,QoS)和用戶體驗。此外,基于社交網絡的盛行,朋友圈的信息共享和信息傳播也給網絡病毒的蔓延提供了溫床;賬號或密碼被盜、消費欺詐等事件多次被報道,移動互聯網應用的網絡安全也受到極大的威脅。《中國互聯網發展狀況統計報告》的調查表明,2015年的總體網民中有42.7%的網民遭遇過網絡安全問題,我國個人互聯網使用的安全狀況不容樂觀。為了對大量的移動網絡應用流量實現優先級處理和鑒別出異常流量,需采用流量分類技術實現網絡流與網絡應用的映射,進而對網絡應用的流量提供區分式服務,并攔截異常流量,保障網絡安全。互聯網流量分類技術已成為QoS提供和網絡安全管理的重要基礎(Y.Wang,Y.Xiang,J.Zhang,et al.Internet traffic clustering with side information.Journal ofComputer and System Sciences,80,2014)。至今,學術界和工業界提出和發展了多種互聯網流量分類方法,特別是基于機器學習的流量分類方法成為研究熱點,這些方法在分類精度和分類效率方面取得較突出的成績(A.Dainotti,A.Pescapé.Issues and future directions in traffic classification.IEEE Network,26(1),2012)。但是,縱觀近期發表的大部分相關文獻,存在一個普遍的現象:采集的流量數據來源于有線網絡;分類的目標集中在粗粒度的流量類別,例如P2P、VoIP等。移動互聯網的環境下,網絡應用發生了較大的變化。多種新應用也相繼出現,例如微博、微信、陌陌等;而且大多數都采用HTTP協議,即它們產生的流量基于TCP的80端口,盡管它們提供的服務與傳統的Web瀏覽服務有很大的不同。這些現象表明,為實現移動互聯網的服務質量保證和網絡安全管理,需實現細粒度地分類移動終端應用。帶類別標記的移動互聯網流量使這類研究的重要基礎,但是多種新型移動網絡應用出現,無法通過傳統的L7-filter方法建立這些應用流量的真實類別(Ground Truth,GT)。建立移動互聯網基準數據集的關鍵在于采集移動互聯網流量數據和標記網絡流的真實類別。在移動互聯流量數據采集方面,移動用戶的接入網絡方式有多種,例如2G/3G/4G網絡的接入方式,WiFi接入方式,不同接入方式導致通個移動設備產生的流量經過的路有節點不同,很難在一個節點采集某個移動設備的所有上網數據。在網絡流量數據標記方面主要有三種方法:(1)基于端口號是一種簡單的流標記方法,比如Williams等人(N.Williams,S.Zander,G.Armitage.A preliminary performance comparison of five machine learning algorithms for practical IP traffic flow classification[J].ACM SIGCOMM Computer Communication Review,36(5),2006)對NLANR(National Laboratory for Advanced Network Research)組織公開的網絡流量數據,采用基于端口號的標記方法:FTP-Data(20)、Telnet(23)、SMTP(25)、DNS(53)、HTTP(80)、Game Half-life(27015)。基于端口號的流標記方法簡單、快速,但是能標記的類別數較少,標記的網絡流數目較少,無法有效標記網絡攻擊、P2P流量等使用隨機端口號的報文。(2)基于報文載荷特征字段的網絡流量標記方法可避免對端口號的依賴。Yuan等人(R.X.Yuan,Z.Li,X.H.Guan,et al.An SVM-based machine learning method for accurate Internet traffic classification[J].Information Systems Frontiers,2010,12(2))使用2006年版的L7-filter實現了基于特征字段匹配的網絡流標記。L7-filter為多種網絡應用提取了標識這些應用的正則表達式。(3)某些文獻綜合使用端口號和特征字段匹配標記法,還加入啟發式規則以提高網絡流標記的準確性。例如,Li等人(W.Li,M.Canini,A.W.Moore,et al.Efficient application identification and the temporal and spatial stability of classification schema[J].Computer Networks,53(6),2009)的流量標記方法綜合了L7-filter、熟知端口號、著名網絡地址(如ftp.kernel.org)和用戶所處網絡的背景信息(如P2P網絡)。上述流量類別標記工作主要基于端口號和L7-filter方法,進行粗粒度的流量類別標記。移動互聯網出現了大量的新型終端應用,L7-filter沒有對應的正則表達式,外加終端應用的繁多導致此類方法的有效性降低。在移動互聯網流量研究方面,大多采用實驗床方式采集移動流量(M.Conti,L.V.Mancini,R.Spolaor,and N.V.Verde.Analyzing android encrypted network traffic to identify user actions.IEEE Transactions on Information Forensics&Security,11(1),2016),即在移動設備上運行某個網絡應用,然后采集其產生的所有網絡流量,但是此方法獲取的流本文檔來自技高網...
【技術保護點】
一種移動互聯網流量類別標記方法,其特征在于,包含以下步驟:S1、移動端與服務器端建立連接;S2、服務器端采集移動端的網絡流量,移動端采集該網絡流量對應的Socket信息,服務器端接收來自移動端的Socket信息;S3、服務器端對網絡流量及與該網絡流量對應的Socket信息進行分析,根據類別標記規則標識該網絡流量所屬的移動應用。
【技術特征摘要】
1.一種移動互聯網流量類別標記方法,其特征在于,包含以下步驟:S1、移動端與服務器端建立連接;S2、服務器端采集移動端的網絡流量,移動端采集該網絡流量對應的Socket信息,服務器端接收來自移動端的Socket信息;S3、服務器端對網絡流量及與該網絡流量對應的Socket信息進行分析,根據類別標記規則標識該網絡流量所屬的移動應用。2.如權利要求1所述的移動互聯網流量類別標記方法,其特征在于,步驟S3中根據類別標記規則標識網絡流量的步驟包括:S31、針對待標記的網絡流量,根據移動端設備號和時間戳匹配與該網絡流量對應的Socket信息;S32、解析網絡流量,過濾出TCP報文和UDP報文,并對網絡流量進行組流操作;S33、針對某條網絡流,結合對應的Socket信息,根據類別標記規則查詢到此條網絡流所屬的移動應用名稱,并將其作為此條網絡流的類別標記;S34、生成帶類別標記的流記錄。3.如權利要求1或2所述的移動互聯網流量類別標記方法,其特征在于,所述網絡流量類別標記規則為:對某條網絡流,提取出網絡流的第一個報文的時間戳t0,以及該網絡流的五元組;在其對應的Socket信息中,根據如下條件找到匹配的記錄:記錄的時間戳與t0最接近,記錄的目標IP與網絡流的目標IP相同,記錄的目標端口與網絡流的目標端口相同;將滿足上述三項條件的記錄中的移動應用名稱作為該網絡流的類別。4.如權利要求2所述的移動互聯網流量類別標記方法,其特征在于,所述組流操作即:在300s之內,具有相同五元組的報文組成一條網絡流。5.如權利要求1所述的移動互聯網流量類別標記方法,其特征在于,移動端與服務器端之間建立連接的步驟包括:S11、服務器端開啟虛擬專用網絡服務,創建第一虛擬網絡設備,等待移動端的連接;S12、移動端開啟虛擬專用網絡服務,建立第二虛擬網絡設備,并根據服務器端IP地址、端口和共享密鑰,向服務器發起連接請求;S13、服務器端收到移動端連接請求后,向移動端返回參數,該參數包括:第一虛擬網絡設備的通道地址、域名系統、最大傳輸單元和轉發路由;S14、移動端接收參數后,配置第二虛擬網絡設備的通道地址、域名系統、最大傳輸單元和轉發路由,從而建立第一虛擬網絡設備與第二虛擬網絡設備之間的虛擬通道,移動端將上行報文通過該虛擬通道發送到...
【專利技術屬性】
技術研發人員:劉珍,王若愚,陳偉,楊鵬,鄧應榮,
申請(專利權)人:廣東藥科大學,
類型:發明
國別省市:廣東;44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。