The invention discloses a web page identification method and device and a setting rate determining method and device. Among them, the method includes: from the access log of the target site in the query object access log, the target access log for access to the target site of the home page of the log; analyze the target access log, extract the access to the target site's home page to access the source; judging whether a web page is to access the source in addition to other web pages the home page outside the target site; and in access to the source page is home page in other web pages outside the target site, determine the access source \is provided with a return to the home page links. The utility model solves the technical problems of low efficiency and heavy workload in the prior art to determine whether or not the page is provided with links to return home pages by manual means.
【技術實現步驟摘要】
網頁識別方法及裝置和設置率確定方法和裝置
本申請涉及互聯網領域,具體而言,涉及一種網頁識別方法及裝置和設置率確定方法和裝置。
技術介紹
在互聯網領域,為了提高網站的導航效果,通常會在網站中的網頁上設置返回首頁鏈接,用戶在瀏覽網站的過程中可以直接通過該鏈接返回到網站的首頁。網站返回首頁鏈接設置率指的是網站中設置返回首頁鏈接的網頁占全部網頁的比值。返回首頁鏈接設置率這一指標在很大程度上反應了網站的用戶體驗情況,也是評價網站績效的一項重要指標。目前,通常是通過人工搜索的方式來確定網頁上是否設置了返回首頁鏈接。具體地,通過人工登陸訪問網站,查看該網站的網頁上是否設置了返回首頁鏈接,進而統計設置了返回首頁鏈接的網頁數,用以計算返回首頁鏈接設置率。然而,由于通過人工方式來確定網頁上是否設置返回首頁鏈接,其效率低且工作量大。針對上述的問題,目前尚未提出有效的解決方案。
技術實現思路
本申請實施例提供了一種網頁識別方法及裝置和設置率確定方法和裝置,以至少解決現有技術中通過人工方式來確定網頁上是否設置返回首頁鏈接的效率低且工作量大的技術問題。根據本申請實施例的一個方面,提供了一種網頁識別方法,包括:從目標網站的訪問日志中查詢出目標訪問日志,其中,所述目標訪問日志為訪問所述目標網站的首頁頁面的日志;對所述目標訪問日志進行解析,提取出訪問所述目標網站的首頁頁面的訪問來源;判斷所述訪問來源的網頁是否為所述目標網站中除所述首頁頁面之外的其他網頁;以及在所述訪問來源的網頁是所述目標網站中除所述首頁頁面之外的其他網頁時,確定所述訪問來源的網頁上設置有返回首頁鏈接,其中,所述返回首頁鏈接為設 ...
【技術保護點】
一種網頁識別方法,其特征在于,包括:從目標網站的訪問日志中查詢出目標訪問日志,其中,所述目標訪問日志為訪問所述目標網站的首頁頁面的日志;對所述目標訪問日志進行解析,提取出訪問所述目標網站的首頁頁面的訪問來源;判斷所述訪問來源的網頁是否為所述目標網站中除所述首頁頁面之外的其他網頁;以及在所述訪問來源的網頁是所述目標網站中除所述首頁頁面之外的其他網頁時,確定所述訪問來源的網頁上設置有返回首頁鏈接,其中,所述返回首頁鏈接為設置在所述目標網站的網頁上用于跳轉回所述目標網站的首頁頁面的鏈接。
【技術特征摘要】
1.一種網頁識別方法,其特征在于,包括:從目標網站的訪問日志中查詢出目標訪問日志,其中,所述目標訪問日志為訪問所述目標網站的首頁頁面的日志;對所述目標訪問日志進行解析,提取出訪問所述目標網站的首頁頁面的訪問來源;判斷所述訪問來源的網頁是否為所述目標網站中除所述首頁頁面之外的其他網頁;以及在所述訪問來源的網頁是所述目標網站中除所述首頁頁面之外的其他網頁時,確定所述訪問來源的網頁上設置有返回首頁鏈接,其中,所述返回首頁鏈接為設置在所述目標網站的網頁上用于跳轉回所述目標網站的首頁頁面的鏈接。2.根據權利要求1所述的方法,其特征在于,判斷所述訪問來源的網頁是否為所述目標網站中除所述首頁頁面之外的其他網頁包括:判斷所述訪問來源的網頁的統一資源定位符中包含的域名是否與所述目標網站的域名相同;在所述訪問來源的網頁的統一資源定位符中包含的域名與所述目標網站的域名相同時,確定所述訪問來源的網頁是所述目標網站中除所述首頁頁面之外的其他網頁。3.根據權利要求2所述的方法,其特征在于,對所述目標訪問日志進行解析,提取出訪問所述目標網站的首頁頁面的訪問來源包括:從所述目標訪問日志中解析出目標字段,其中,所述目標字段為記錄有上一跳網頁的統一資源定位符的字段。4.根據權利要求2所述的方法,其特征在于,從目標網站的訪問日志中查詢出目標訪問日志包括:將所述目標網站的首頁頁面對應的統一資源定位符與所述目標網站的訪問日志進行匹配;將從所述目標網站的訪問日志中匹配出的包含有所述目標網站的首頁頁面對應的統一資源定位符的訪問日志作為所述目標訪問日志。5.一種設置率確定方法,其特征在于,包括:對目標網站的訪問日志進行解析,統計出所述目標網站中被訪問的網頁總數;利用權利要求1至4中任一項所述的網頁識別方法識別出目標網頁,統計所述目標網頁的數量,其中,所述目標網頁為設置有返回首頁鏈接的網頁;以及根據所述網頁總數和所述目標網頁的數量計算得到所述目標網站上的所述返回首頁鏈接的設置率。6.一種網頁識別裝...
【專利技術屬性】
技術研發人員:李新國,馮鴛鶴,吳茜,
申請(專利權)人:北京國雙科技有限公司,
類型:發明
國別省市:北京,11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。