The invention discloses a hot word with multiple data source recommendation method and device, through the screening of search engine list data in the database, which will be used in the list of data and search log data to obtain the corresponding intersection, and hot words hot words over the data on the page views. Extract page views from the hot words before the scheduled threshold. When the client is newly started, the hot words selected from the extracted hot words are pushed to the client for display. With the hot words of multi data source recommendation method and device with multiple data sources to screen hot words of the invention, to ensure the timeliness of the recommended hot words, hot words to remove a single data source recommended by the quality of search results is not high but show.
【技術實現步驟摘要】
結合多數據源的熱詞推薦方法及裝置
本專利技術涉及互聯網搜索
,具體涉及一種結合多數據源的熱詞推薦方法及裝置。
技術介紹
用戶在使用互聯網進行搜索時,進入搜索頁面,頁面通常會在搜索輸入欄下方展示一些熱詞供用戶選擇。這些熱詞即熱門的搜索詞,通常是用戶搜索時輸入最多的詞語,一般是一段時間內的各界大事或流行的話題。熱詞推薦可以使用戶更快更方便的了解最近一段時間內的熱點信息。現有熱詞推薦一般直接從搜索日志中取得,選擇搜查日志中top100的熱詞隨機展示給用戶。這種只從單一的一種數據源中提取熱詞進行推薦,會導致一些搜索結果質量并不高的熱詞也會被展示,或展示的熱詞已經不是當前熱門的搜索詞匯,其時效已經過期。
技術實現思路
鑒于上述問題,提出了本專利技術以便提供一種克服上述問題或者至少部分地解決上述問題的結合多數據源的熱詞推薦方法及裝置。根據本專利技術的一個方面,提供了一種結合多數據源的熱詞推薦方法,其包括:篩選搜索引擎數據庫中的榜單數據;將篩選得到的榜單數據與搜索日志數據做交集,獲取數據交集中的熱詞及熱詞對應的頁面瀏覽量;提取所述頁面瀏覽量排行在預定閾值前對應的熱詞;當客戶端新啟動時,從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。進一步,在所述提取所述頁面瀏覽量排行在預定閾值前對應的熱詞之后,所述方法還包括:根據熱詞對應的頁面瀏覽量,計算所述熱詞對應的權重。進一步,所述計算熱詞對應的權重值為log(頁面瀏覽量)/log2。進一步,所述從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示進一步包括:按照熱詞對應的權重,利用權重隨機算法從提取的熱詞中選取預定條數的 ...
【技術保護點】
一種結合多數據源的熱詞推薦方法,其包括:篩選搜索引擎數據庫中的榜單數據;將篩選得到的榜單數據與搜索日志數據做交集,獲取數據交集中的熱詞及熱詞對應的頁面瀏覽量;提取所述頁面瀏覽量排行在預定閾值前對應的熱詞;當客戶端新啟動時,從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。
【技術特征摘要】
1.一種結合多數據源的熱詞推薦方法,其包括:篩選搜索引擎數據庫中的榜單數據;將篩選得到的榜單數據與搜索日志數據做交集,獲取數據交集中的熱詞及熱詞對應的頁面瀏覽量;提取所述頁面瀏覽量排行在預定閾值前對應的熱詞;當客戶端新啟動時,從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。2.根據權利要求1所述的方法,其中,在所述提取所述頁面瀏覽量排行在預定閾值前對應的熱詞之后,所述方法還包括:根據熱詞對應的頁面瀏覽量,計算所述熱詞對應的權重。3.根據權利要求2所述的方法,其中,所述計算熱詞對應的權重值為log(頁面瀏覽量)/log2。4.根據權利要求2或3所述的方法,其中,所述從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示進一步包括:按照熱詞對應的權重,利用權重隨機算法從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。5.根據權利要求1-4任一項所述的方法,其中,所述篩選搜索引擎數據庫中的榜單數據進一步包括:篩選搜索引擎數據庫中的電影、電視劇、綜藝、動漫、人物...
【專利技術屬性】
技術研發人員:吳凱,王艷麗,佟思穎,高蘇丹,
申請(專利權)人:北京奇虎科技有限公司,奇智軟件北京有限公司,
類型:發明
國別省市:北京,11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。