• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    點擊日志的生成方法及裝置,搜索結果調整方法及裝置制造方法及圖紙

    技術編號:8532918 閱讀:222 留言:0更新日期:2013-04-04 15:56
    本發明專利技術提出了一種點擊日志生成方法及利用該點擊日志進行搜索結果調整的方法。該點擊日志生成方法包括以下步驟:分析待測頁面,以獲得所述待測頁面的URL;通過所述待測頁面的URL以獲得所述待測頁面所對應的超文本標記語言HTML源碼;在所述待測頁面所對應的所述HTML源碼中提取js函數調用;以及在瀏覽器之中執行所述js函數調用以生成相應的點擊日志。通過本發明專利技術實施例,每分鐘可生成約600條以上的點擊日志,因此大幅度地提高了測試速度。此外,在執行過程中無需人工干預,所以節約了人工成本。

    【技術實現步驟摘要】

    本專利技術涉及互聯網
    ,特別涉及一種點擊日志的自動生成方法及裝置,以 及利用該點擊日志進行搜索結果調整的方法及裝置。
    技術介紹
    在web應用領域之中,為了得到用戶的行為,往往需要在頁面上做一些監控,以記 錄用戶的點擊行為。這樣,每次點擊都將會產生一條點擊日志,并將該點擊日志發送給服務 器端。后續,服務器端就可以根據大量的用戶點擊行為進行分析,并根據分析結果獲得什么 樣的檢索結果更好,用戶更喜歡,從而提高用戶的滿意度。目前,對于驗證測試頁面中點擊統計功能是否正常,或者生成點擊日志的功能來 說,主要還是通過手工的方式。例如,首先通過人工打開待測頁面,并通過手動方式點擊待 測頁面里面的URL (Uniform Resource Locator,統一資源定位符),然后服務器端獲得相應 的點擊日志,并根據點擊日志進行分析和統計,從而改善檢索結果。現有技術存在以下缺點1、手工操作,消耗人力,且效率低下;2、雖然可以借助開源框架的 API (Application Programming Interface,應用程 序編程接口 )來點擊,但是穩定性較差,而且速度比較慢;3、目前手動方式不夠靈活,不能根據需求,點擊特定的頁面元素,產生需要的點擊 日志。
    技術實現思路
    本專利技術旨在至少解決現有技術中存在的技術問題之一,特別是解決目前手動點擊 生成點擊日志的方式效率低下、不夠靈活的缺陷,以及通過開源庫的API進行點擊的穩定 性差及速度慢的缺陷。本專利技術實施例第一方面提出了一種點擊日志生成方法,包括以下步驟分析待測 頁面,以獲得所述待測頁面的統一資源定位符URL ;解析所述待測頁面所對應的URL以獲得 所述待測頁面所對應的超文本標記語言HTML源碼;在所述待測頁面所對應的所述HTML源 碼中提取js函數調用,其中,所述js函數調用之中填充有所述待測頁面中的待測頁面元素 的URL、題目和標簽;以及在瀏覽器之中執行所述js函數調用以生成相應的點擊日志,并將 所述點擊日志發送至服務器。本專利技術實施例第二方面提出了一種點擊日志生成裝置,包括分析模塊,用于分析 待測頁面,以獲得所述待測頁面的URL ;HTML源碼獲得模塊,用于解析所述待測頁面所對應 的URL以獲得所述待測頁面所對應的HTML源碼;提取模塊,用于在所述待測頁面所對應的 所述HTML源碼中提取所述待測頁面元素對應的js函數調用,其中,所述js函數調用之中 填充有所述待測頁面中的待測頁面元素的URL、題目和標簽;點擊日志生成模塊,用于在瀏 覽器之中執行所述js函數調用以生成相應的點擊日志;以及發送模塊,用于將所述點擊日志發送至服務器。在本專利技術的一個實施例中,所述提取模塊提取所述待測頁面中所有能產生點擊日 志的待測頁面元素的js函數調用。在本專利技術的另一個實施例中,所述提取模塊提取所述待測頁面中配置項path對 應的頁面節點內的所有待測頁面元素的js函數調用。在本專利技術的再一個實施例中,所述提取模塊提取所述待測頁面中配置項fm_type 對應的類型的所述待測頁面元素的js函數調用。本專利技術實施例首先通過開源庫中的函數實現瀏覽器打開待檢測頁面,并通過開源 庫函數獲取待檢測頁面的HTML源碼。然后,解析待檢測頁面的HTML源碼,并在解析結果中 匹配待測頁面元素的特性,從而找出所有待測頁面元素的HTML源碼。最后,分別從待測頁 面元素的HTML源碼中提取出js函數調用,并在瀏覽器端執行,即進行模擬點擊,從而產生 待測頁面元素的點擊日志。通過本專利技術實施例,每分鐘可生成約600條以上的點擊日志,因 此大幅度地提高了測試速度。此外,在執行過程中無需人工干預,所以節約了人工成本。另外,由于現有技術中僅能測試少量的檢索詞,而本專利技術實施例可批量地測試大 數量的檢索詞,從而大幅度地提升了測試檢索詞的覆蓋度。更為重要地,現有技術中僅能 對搜索結果頁面元素進行抽樣點擊以生成點擊日志,而本專利技術實施例可對待測頁面的所有 待測頁面元素進行模擬點擊,或者僅針對某個頁面節點內的所有待測頁面元素進行模擬點 擊,或者,僅針對性地對某類型的待測頁面元素進行模擬點擊并生成點擊日志,因此本專利技術 實施例大幅提升了頁面內可測元素的覆蓋范圍,并且在測試對象方面具有可控性。綜上所示,本專利技術實施例可靈活地進行配置,因此能夠支持當前所有的待測頁面 元素以及未來新增的待測頁面元素。本專利技術實施例第三方面還提出了一種搜索結果調整方法,包括以下步驟分析待 測頁面,以獲得所述待測頁面的統一資源定位符URL ;解析所述待測頁面所對應的URL以獲 得所述待測頁面所對應的超文本標記語言HTML源碼;在所述待測頁面所對應的所述HTML 源碼中提取所述待測頁面元素對應的js函數調用,其中,所述js函數調用之中填充有所述 待測頁面中的待測頁面元素的URL、題目和標簽;在瀏覽器之中執行所述js函數調用以生 成相應的點擊日志,并將所述點擊日志發送至服務器;所述服務器根據所述點擊日志生成 搜索結果的權重;以及根據所述搜索結果的權重對搜索結構進行調整。本專利技術實施例第四方面還提出了一種搜索結果調整系統,包括終端,用于對待測 頁面進行分析,并在所述待測頁面所對應的HTML源碼中提取js函數調用,在所述終端的瀏 覽器之中執行所述js函數調用以生成相應的點擊日志,其中,所述js函數調用之中填充有 所述待測頁面中的待測頁面元素的URL、題目和標簽;以及所述服務器,用于接收所述終端 發送的點擊日志,并根據所述點擊日志生成搜索結果的權重,以及根據所述搜索結果的權 重對搜索結構進行調整。在本專利技術實施例之中,服務器可以根據模擬的點擊日志對搜索結果的權重進行調 整,從而使得搜索結果更準確,有效提高用戶滿意度。此外,由于本專利技術實施例采用模擬點 擊的方式生成點擊日志,具有速度快、效率高的優點,因此在此基礎上可以根據用戶的喜好 隨時對檢索詞進行調整,并生成相應的點擊日志,從而根據點擊日志對搜索權重及時進行 調整,以更有針對性及更好地滿足用戶的需求,提高用戶的滿意度。本專利技術的附加方面和優點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本專利技術的實踐了解到。附圖說明本專利技術的上述和/或附加的方面和優點從結合下面附圖對實施例的描述中將變 得明顯和容易理解,其中圖1為本專利技術實施例的點擊日志生成方法的流程圖2為本專利技術實施例打開待測頁面的流程圖3為本專利技術實施例一的js函數調用提取方法流程圖圖4為本專利技術實施例二的js函數調用提取方法流程圖圖5為本專利技術實施例三的js函數調用提取方法流程圖圖6為本專利技術實施例的點擊日志生成裝置結構圖7為本專利技術實施例的搜索結果調整方法流程圖8為本專利技術實施例的搜索結果調整系統結構圖。具體實施方式下面詳細描述本專利技術的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,僅用于解釋本專利技術,而不能理解為對本專利技術的限制。在本專利技術的描述中,術語“縱向”、“橫向”、“上”、“下”、“前”、“后”、“左”、“右”、“豎 直”、“水平”、“頂”、“底”等指示的方位或位置關系為基于附圖所示的方位或位置關系,僅是 為了便于描述本專利技術而不是要求本專利技術必須以特定的方位構造和操作,本文檔來自技高網...

    【技術保護點】
    一種點擊日志生成方法,其特征在于,包括以下步驟:分析待測頁面,以獲得所述待測頁面的統一資源定位符URL;通過所述待測頁面的URL以獲得所述待測頁面所對應的超文本標記語言HTML源碼;在所述待測頁面所對應的所述HTML源碼中提取js函數調用,其中,所述js函數調用之中填充有所述待測頁面中待測頁面元素的URL、題目和標簽;以及在瀏覽器之中執行所述js函數調用以生成相應的點擊日志。

    【技術特征摘要】
    1.一種點擊日志生成方法,其特征在于,包括以下步驟 分析待測頁面,以獲得所述待測頁面的統一資源定位符URL ; 通過所述待測頁面的URL以獲得所述待測頁面所對應的超文本標記語言HTML源碼;在所述待測頁面所對應的所述HTML源碼中提取js函數調用,其中,所述js函數調用之中填充有所述待測頁面中待測頁面元素的URL、題目和標簽;以及在瀏覽器之中執行所述js函數調用以生成相應的點擊日志。2.如權利要求1所述的點擊日志生成方法,其特征在于,還包括 通過Selenium開源庫打開所述待測頁面,并通過Selenium開源庫中的get_location函數獲得所述待測頁面所對應的URL。3.如權利要求2所述的點擊日志生成方法,其特征在于,所述通過Selenium開源庫打開待測頁面進一步包括 通過所述Selenium開源庫打開所述瀏覽器的默認頁面; 通過所述Selenium開源庫中的ap1: type函數在所述默認頁面的輸入框中輸入一個或多個檢索詞;以及 通過所述Selenium開源庫中的click函數進行點擊確認以打開所述待測頁面。4.如權利要求3所述的點擊日志生成方法,其特征在于,通過所述Selenium開源庫中的run_SCript在所述瀏覽器中執行所述js函數調用。5.如權利要求1所述的點擊日志生成方法,其特征在于,通過Ixml開源庫解析所述待測頁面所對應的URL以獲得所述URL對應的HTML源碼。6.如權利要求1所述的點擊日志生成方法,其特征在于,所述在待測頁面所對應的所述HTML源碼中提取js函數調用進一步包括 從所述HTML源碼中獲得所有css selector為a[onmousedown]或者a[onclick]的待測頁面元素,并將所述待測頁面元素添加至第一列表; 遍歷所述第一列表之中的待測頁面元素,并提取每個待測頁面元素的URL、題目和標簽,并獲取所述待測頁面元素的js函數調用;以及將所述URL、題目和標簽填充至所述js函數調用。7.如權利要求1所述的點擊日志生成方法,其特征在于,所述在待測頁面所對應的所述HTML源碼中提取js函數調用進一步包括 根據配置項從所述HTML源碼中獲得滿足所述配置項的頁面節點,并將所述頁面節點添加至第二列表; 從所述第二列表中獲得一個頁面節點; 從所述頁面節點對應的HTML源碼的標簽內部獲得所有css selector為a [onmousedown]或者a[onclick]的待測頁面元素,并將獲得的所述待測頁面元素添加至第三列表; 遍歷所述第三列表之中的待測頁面元素,提取每個待測頁面元素的URL、題目和標簽,并獲取所述待測頁面元素的js函數調用; 將所述URL、題目和標簽填充至所述js函數調用;以及 在生成點擊日志之后,繼續從所述第二列表中獲得其他頁面節點并獲得所述其他頁面節點內待測頁面元素的js函數調用。8.如權利要求1-7任一項所述的點擊日志生成方法,其特征在于,所述根據配置項從所述HTML源碼中獲得滿足所述配置項的頁面節點,并將所述頁面節點添加至第二列表進一步包括 通過所述Selenium開源庫中的getElement函數從所述HTML源碼中獲得所有滿足所述配置項中給定path或者給定css selector的頁面節點,并將所述頁面節點添加至所述第二列表。9.如權利要求1-8任一項所述的點擊日志生成方法,其特征在于,所述在待測頁面所對應的所述HTML源碼中提取js函數調用進一步包括 從所述HTML源碼中獲得所有css selector為a [onmousedown]或者a[onclick]的待測頁面元素,并將所述待測頁面元素添加至第四列表; 遍歷所述第四列表之中的待測頁面元素,并提取每個待測頁面元素的URL、題目和標簽,并獲取所述待測頁面元素的js函數調用; 根據所述js函數調用獲得所述待測頁面元素的類型; 判斷所述待測頁面元素的類型是否與配置項中指定的fm_type相同;以及 如果判斷相同,則將所述URL、題目和標簽填充至所述js函數調用。10.一種點擊日志生成裝置,其特征在于,包括 分析模塊,用于分析所述待測頁面,以獲得待測頁面的URL ; HTML源碼獲得模塊,用于解析所述待測頁面所對應的URL以獲得所述待測頁面所對應的HTML源碼; 提取模塊,用于在所述待測頁面所對應的所述HTML源碼中提取js函數調用,其中,所述js函數調用之中填充有所述待測頁面中待測頁面元素的URL、題目和標簽;以及 點擊日志生成模塊,用于在瀏覽器之中執行所述js函數調用以生成相應的點擊日志。11.如權利要求10所述的點擊日志生成裝置,其特征在于,所述待測頁面開啟模塊通過Selenium開源庫打開待測頁面,且所述分析模塊通過所述Selenium開源庫中的get_location函數獲得所述待測頁面所對應的URL。12.如權利要求11所述的點擊日志生成裝置,其特征在于,所述待測頁面開啟模塊進一步包括 開啟子模塊,用于通過所述Selenium開源庫打開所述瀏覽器的默認頁面; 輸入子模塊,用于通過所述Selenium開源庫中的ap1:type函數在所述默認頁面的輸入框中輸入一個或多個檢索詞;以及 點擊確定子模塊,用于通過所述Selenium開源庫中的click函數進行點擊確認以打開所述待測頁面。13.如權利要求12所述的點擊日志生成裝置,其特征在于,所述點擊日志生成模塊通過所述Selenium開源庫中的run_script在所述瀏覽器中執行所述js函數調用。14.如權利要求10所述的點擊日志生成裝置,其特征在于,所述HTML源碼獲得模塊通過Ixml開源庫解析所述待測頁面所對應的URL以獲得所述URL對應的HTML源碼。15.如權利要求10所述的點擊日志生成裝置,其特征在于,所述提取模塊提取所述待測頁面中所有能產生點擊日志的待測頁面元素的js函數調用。16.如權利要求10所述的點擊日志生成裝置,其特征在于,所述提取模塊提取所述待測頁面中配置項path對應的頁面節點內的所有待測頁面元素的js函數調用。17.如權利要求10所述的點擊日志生成裝置,其特征在于,所述提取模塊提取所述待測頁面中配置項fm_type對應的類型的所述待測頁面元素的js函數調用。18.一種搜索結果調整方法,其特征在于,包括以下步驟 分析待測頁面,以獲得所述待測頁面的URL ; 解析所述待測頁面所對應的URL以獲得所述待測頁面...

    【專利技術屬性】
    技術研發人員:金敬亭喬敏
    申請(專利權)人:百度在線網絡技術北京有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲youwu永久无码精品| 国产V亚洲V天堂无码久久久| 狼人无码精华AV午夜精品| mm1313亚洲精品无码又大又粗| 无码av不卡一区二区三区| 无码成人一区二区| 免费无码黄网站在线观看| 亚洲AV无码1区2区久久| 黑人无码精品又粗又大又长| 无码囯产精品一区二区免费| 精品亚洲成α人无码成α在线观看| 麻豆国产精品无码视频| 久久亚洲AV永久无码精品| 无码人妻精品一区二区三区久久久 | 国产午夜精品无码| 色欲aⅴ亚洲情无码AV| 精品高潮呻吟99av无码视频| 久久伊人中文无码| 无码任你躁久久久久久久| 在线观看无码不卡AV| 色窝窝无码一区二区三区 | 亚洲youwu永久无码精品| 免费无码毛片一区二区APP| 中文字幕丰满伦子无码| 黄A无码片内射无码视频| 亚洲中久无码不卡永久在线观看| 亚洲中文字幕无码久久2020| 日韩国产成人无码av毛片 | 精品久久久久久久无码| 亚洲av无码乱码国产精品fc2 | 亚洲AV无码国产精品色午友在线 | 国产日韩AV免费无码一区二区| 亚洲AV无码XXX麻豆艾秋| 67194成l人在线观看线路无码| 无码人妻少妇久久中文字幕蜜桃 | 最新国产精品无码| 亚洲精品无码鲁网中文电影| 亚洲一区二区三区AV无码 | 无码色偷偷亚洲国内自拍| 无码专区HEYZO色欲AV| 日韩放荡少妇无码视频|