【技術實現步驟摘要】
本專利技術涉及互聯網
,特別涉及一種點擊日志的自動生成方法及裝置,以 及利用該點擊日志進行搜索結果調整的方法及裝置。
技術介紹
在web應用領域之中,為了得到用戶的行為,往往需要在頁面上做一些監控,以記 錄用戶的點擊行為。這樣,每次點擊都將會產生一條點擊日志,并將該點擊日志發送給服務 器端。后續,服務器端就可以根據大量的用戶點擊行為進行分析,并根據分析結果獲得什么 樣的檢索結果更好,用戶更喜歡,從而提高用戶的滿意度。目前,對于驗證測試頁面中點擊統計功能是否正常,或者生成點擊日志的功能來 說,主要還是通過手工的方式。例如,首先通過人工打開待測頁面,并通過手動方式點擊待 測頁面里面的URL (Uniform Resource Locator,統一資源定位符),然后服務器端獲得相應 的點擊日志,并根據點擊日志進行分析和統計,從而改善檢索結果。現有技術存在以下缺點1、手工操作,消耗人力,且效率低下;2、雖然可以借助開源框架的 API (Application Programming Interface,應用程 序編程接口 )來點擊,但是穩定性較差,而且速度比較慢;3、目前手動方式不夠靈活,不能根據需求,點擊特定的頁面元素,產生需要的點擊 日志。
技術實現思路
本專利技術旨在至少解決現有技術中存在的技術問題之一,特別是解決目前手動點擊 生成點擊日志的方式效率低下、不夠靈活的缺陷,以及通過開源庫的API進行點擊的穩定 性差及速度慢的缺陷。本專利技術實施例第一方面提出了一種點擊日志生成方法,包括以下步驟分析待測 頁面,以獲得所述待測頁面的統一資源定位符URL ;解析 ...
【技術保護點】
一種點擊日志生成方法,其特征在于,包括以下步驟:分析待測頁面,以獲得所述待測頁面的統一資源定位符URL;通過所述待測頁面的URL以獲得所述待測頁面所對應的超文本標記語言HTML源碼;在所述待測頁面所對應的所述HTML源碼中提取js函數調用,其中,所述js函數調用之中填充有所述待測頁面中待測頁面元素的URL、題目和標簽;以及在瀏覽器之中執行所述js函數調用以生成相應的點擊日志。
【技術特征摘要】
1.一種點擊日志生成方法,其特征在于,包括以下步驟 分析待測頁面,以獲得所述待測頁面的統一資源定位符URL ; 通過所述待測頁面的URL以獲得所述待測頁面所對應的超文本標記語言HTML源碼;在所述待測頁面所對應的所述HTML源碼中提取js函數調用,其中,所述js函數調用之中填充有所述待測頁面中待測頁面元素的URL、題目和標簽;以及在瀏覽器之中執行所述js函數調用以生成相應的點擊日志。2.如權利要求1所述的點擊日志生成方法,其特征在于,還包括 通過Selenium開源庫打開所述待測頁面,并通過Selenium開源庫中的get_location函數獲得所述待測頁面所對應的URL。3.如權利要求2所述的點擊日志生成方法,其特征在于,所述通過Selenium開源庫打開待測頁面進一步包括 通過所述Selenium開源庫打開所述瀏覽器的默認頁面; 通過所述Selenium開源庫中的ap1: type函數在所述默認頁面的輸入框中輸入一個或多個檢索詞;以及 通過所述Selenium開源庫中的click函數進行點擊確認以打開所述待測頁面。4.如權利要求3所述的點擊日志生成方法,其特征在于,通過所述Selenium開源庫中的run_SCript在所述瀏覽器中執行所述js函數調用。5.如權利要求1所述的點擊日志生成方法,其特征在于,通過Ixml開源庫解析所述待測頁面所對應的URL以獲得所述URL對應的HTML源碼。6.如權利要求1所述的點擊日志生成方法,其特征在于,所述在待測頁面所對應的所述HTML源碼中提取js函數調用進一步包括 從所述HTML源碼中獲得所有css selector為a[onmousedown]或者a[onclick]的待測頁面元素,并將所述待測頁面元素添加至第一列表; 遍歷所述第一列表之中的待測頁面元素,并提取每個待測頁面元素的URL、題目和標簽,并獲取所述待測頁面元素的js函數調用;以及將所述URL、題目和標簽填充至所述js函數調用。7.如權利要求1所述的點擊日志生成方法,其特征在于,所述在待測頁面所對應的所述HTML源碼中提取js函數調用進一步包括 根據配置項從所述HTML源碼中獲得滿足所述配置項的頁面節點,并將所述頁面節點添加至第二列表; 從所述第二列表中獲得一個頁面節點; 從所述頁面節點對應的HTML源碼的標簽內部獲得所有css selector為a [onmousedown]或者a[onclick]的待測頁面元素,并將獲得的所述待測頁面元素添加至第三列表; 遍歷所述第三列表之中的待測頁面元素,提取每個待測頁面元素的URL、題目和標簽,并獲取所述待測頁面元素的js函數調用; 將所述URL、題目和標簽填充至所述js函數調用;以及 在生成點擊日志之后,繼續從所述第二列表中獲得其他頁面節點并獲得所述其他頁面節點內待測頁面元素的js函數調用。8.如權利要求1-7任一項所述的點擊日志生成方法,其特征在于,所述根據配置項從所述HTML源碼中獲得滿足所述配置項的頁面節點,并將所述頁面節點添加至第二列表進一步包括 通過所述Selenium開源庫中的getElement函數從所述HTML源碼中獲得所有滿足所述配置項中給定path或者給定css selector的頁面節點,并將所述頁面節點添加至所述第二列表。9.如權利要求1-8任一項所述的點擊日志生成方法,其特征在于,所述在待測頁面所對應的所述HTML源碼中提取js函數調用進一步包括 從所述HTML源碼中獲得所有css selector為a [onmousedown]或者a[onclick]的待測頁面元素,并將所述待測頁面元素添加至第四列表; 遍歷所述第四列表之中的待測頁面元素,并提取每個待測頁面元素的URL、題目和標簽,并獲取所述待測頁面元素的js函數調用; 根據所述js函數調用獲得所述待測頁面元素的類型; 判斷所述待測頁面元素的類型是否與配置項中指定的fm_type相同;以及 如果判斷相同,則將所述URL、題目和標簽填充至所述js函數調用。10.一種點擊日志生成裝置,其特征在于,包括 分析模塊,用于分析所述待測頁面,以獲得待測頁面的URL ; HTML源碼獲得模塊,用于解析所述待測頁面所對應的URL以獲得所述待測頁面所對應的HTML源碼; 提取模塊,用于在所述待測頁面所對應的所述HTML源碼中提取js函數調用,其中,所述js函數調用之中填充有所述待測頁面中待測頁面元素的URL、題目和標簽;以及 點擊日志生成模塊,用于在瀏覽器之中執行所述js函數調用以生成相應的點擊日志。11.如權利要求10所述的點擊日志生成裝置,其特征在于,所述待測頁面開啟模塊通過Selenium開源庫打開待測頁面,且所述分析模塊通過所述Selenium開源庫中的get_location函數獲得所述待測頁面所對應的URL。12.如權利要求11所述的點擊日志生成裝置,其特征在于,所述待測頁面開啟模塊進一步包括 開啟子模塊,用于通過所述Selenium開源庫打開所述瀏覽器的默認頁面; 輸入子模塊,用于通過所述Selenium開源庫中的ap1:type函數在所述默認頁面的輸入框中輸入一個或多個檢索詞;以及 點擊確定子模塊,用于通過所述Selenium開源庫中的click函數進行點擊確認以打開所述待測頁面。13.如權利要求12所述的點擊日志生成裝置,其特征在于,所述點擊日志生成模塊通過所述Selenium開源庫中的run_script在所述瀏覽器中執行所述js函數調用。14.如權利要求10所述的點擊日志生成裝置,其特征在于,所述HTML源碼獲得模塊通過Ixml開源庫解析所述待測頁面所對應的URL以獲得所述URL對應的HTML源碼。15.如權利要求10所述的點擊日志生成裝置,其特征在于,所述提取模塊提取所述待測頁面中所有能產生點擊日志的待測頁面元素的js函數調用。16.如權利要求10所述的點擊日志生成裝置,其特征在于,所述提取模塊提取所述待測頁面中配置項path對應的頁面節點內的所有待測頁面元素的js函數調用。17.如權利要求10所述的點擊日志生成裝置,其特征在于,所述提取模塊提取所述待測頁面中配置項fm_type對應的類型的所述待測頁面元素的js函數調用。18.一種搜索結果調整方法,其特征在于,包括以下步驟 分析待測頁面,以獲得所述待測頁面的URL ; 解析所述待測頁面所對應的URL以獲得所述待測頁面...
【專利技術屬性】
技術研發人員:金敬亭,喬敏,
申請(專利權)人:百度在線網絡技術北京有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。