• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    結合多數據源的熱詞推薦方法及裝置制造方法及圖紙

    技術編號:15746687 閱讀:217 留言:0更新日期:2017-07-03 02:32
    本發明專利技術公開了一種結合多數據源的熱詞推薦方法及裝置,通過篩選搜索引擎數據庫中的榜單數據,將篩選得到的榜單數據與搜索日志數據做交集,獲取數據交集中的熱詞及熱詞對應的頁面瀏覽量。提取頁面瀏覽量排行在預定閾值前對應的熱詞。當客戶端新啟動時,從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。本發明專利技術的結合多數據源的熱詞推薦方法及裝置結合多種數據源共同篩選熱詞,保證了推薦熱詞的時效性,去除了單一數據源推薦的搜索結果質量不高卻被展現的熱詞。

    Method and device for recommending hot words combined with multiple data sources

    The invention discloses a hot word with multiple data source recommendation method and device, through the screening of search engine list data in the database, which will be used in the list of data and search log data to obtain the corresponding intersection, and hot words hot words over the data on the page views. Extract page views from the hot words before the scheduled threshold. When the client is newly started, the hot words selected from the extracted hot words are pushed to the client for display. With the hot words of multi data source recommendation method and device with multiple data sources to screen hot words of the invention, to ensure the timeliness of the recommended hot words, hot words to remove a single data source recommended by the quality of search results is not high but show.

    【技術實現步驟摘要】
    結合多數據源的熱詞推薦方法及裝置
    本專利技術涉及互聯網搜索
    ,具體涉及一種結合多數據源的熱詞推薦方法及裝置。
    技術介紹
    用戶在使用互聯網進行搜索時,進入搜索頁面,頁面通常會在搜索輸入欄下方展示一些熱詞供用戶選擇。這些熱詞即熱門的搜索詞,通常是用戶搜索時輸入最多的詞語,一般是一段時間內的各界大事或流行的話題。熱詞推薦可以使用戶更快更方便的了解最近一段時間內的熱點信息。現有熱詞推薦一般直接從搜索日志中取得,選擇搜查日志中top100的熱詞隨機展示給用戶。這種只從單一的一種數據源中提取熱詞進行推薦,會導致一些搜索結果質量并不高的熱詞也會被展示,或展示的熱詞已經不是當前熱門的搜索詞匯,其時效已經過期。
    技術實現思路
    鑒于上述問題,提出了本專利技術以便提供一種克服上述問題或者至少部分地解決上述問題的結合多數據源的熱詞推薦方法及裝置。根據本專利技術的一個方面,提供了一種結合多數據源的熱詞推薦方法,其包括:篩選搜索引擎數據庫中的榜單數據;將篩選得到的榜單數據與搜索日志數據做交集,獲取數據交集中的熱詞及熱詞對應的頁面瀏覽量;提取所述頁面瀏覽量排行在預定閾值前對應的熱詞;當客戶端新啟動時,從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。進一步,在所述提取所述頁面瀏覽量排行在預定閾值前對應的熱詞之后,所述方法還包括:根據熱詞對應的頁面瀏覽量,計算所述熱詞對應的權重。進一步,所述計算熱詞對應的權重值為log(頁面瀏覽量)/log2。進一步,所述從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示進一步包括:按照熱詞對應的權重,利用權重隨機算法從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。進一步,所述篩選搜索引擎數據庫中的榜單數據進一步包括:篩選搜索引擎數據庫中的電影、電視劇、綜藝、動漫、人物以及小說的榜單數據。根據本專利技術的另一方面,提供了一種結合多數據源的熱詞推薦裝置,其包括:篩選模塊,適于篩選搜索引擎數據庫中的榜單數據;交集模塊,適于將篩選得到的榜單數據與搜索日志數據做交集,獲取數據交集中的熱詞及熱詞對應的頁面瀏覽量;提取模塊,適于提取所述頁面瀏覽量排行在預定閾值前對應的熱詞;推送模塊,適于當客戶端新啟動時,從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。進一步,還包括:計算模塊,適于根據熱詞對應的頁面瀏覽量,計算所述熱詞對應的權重。進一步,所述計算模塊進一步適于:計算熱詞對應的權重值為log(頁面瀏覽量)/log2。進一步,所述推送模塊進一步適于:按照熱詞對應的權重,利用權重隨機算法從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。進一步,所述篩選模塊進一步適于:篩選搜索引擎數據庫中的電影、電視劇、綜藝、動漫、人物以及小說的榜單數據。根據本專利技術提供的結合多數據源的熱詞推薦方法及裝置,通過篩選搜索引擎數據庫中的榜單數據,將篩選得到的榜單數據與搜索日志數據做交集,獲取數據交集中的熱詞及熱詞對應的頁面瀏覽量。提取頁面瀏覽量排行在預定閾值前對應的熱詞。當客戶端新啟動時,從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。多數據源相結合推薦熱詞,避免了單一數據源熱詞推薦而導致的熱詞時效性已失,或搜索結果質量不高的熱詞被展示。上述說明僅是本專利技術技術方案的概述,為了能夠更清楚了解本專利技術的技術手段,而可依照說明書的內容予以實施,并且為了讓本專利技術的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本專利技術的具體實施方式。附圖說明通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優選實施方式的目的,而并不認為是對本專利技術的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:圖1示出了根據本專利技術一個實施例的結合多數據源的熱詞推薦方法的流程圖;圖2示出了根據本專利技術另一個實施例的結合多數據源的熱詞推薦方法的流程圖;圖3示出了根據本專利技術一個實施例的結合多數據源的熱詞推薦裝置的功能框圖。具體實施方式下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。圖1示出了本專利技術提供的結合多數據源的熱詞推薦方法的一個實施例的流程圖,如圖1所示,本實施例的方法具體包括如下步驟:步驟S101,篩選搜索引擎數據庫中的榜單數據。搜索引擎數據庫,搜索引擎使用的數據庫,可以存放與搜索相關的數據,如搜索結果中的熱詞(即關鍵字或搜索詞),搜索結果頁的訪問數據量、熱詞搜索次數、搜索結果頁內容類型(如電影、電視劇、綜藝、動漫、人物、小說)、訪問時間等。榜單數據,根據搜索引擎數據庫中的數據,按照搜索結果頁內容的不同類型,分別選取不同類型中的搜索詞,按照搜索的次數進行排列。如電視劇榜單,根據現階段電視劇類搜索詞的搜索次數,排名第一的搜索詞為“羋月傳”,因此電視劇榜單數據第一位為“羋月傳”。電視劇榜單數據可根據電視劇名稱或電視劇熱點人物搜索次數依次排序,可以選擇如前100位搜查次數最多的電視劇進入電視劇榜單。榜單數據中包括了該榜單數據對應的熱詞(即關鍵字或搜索詞)、熱詞搜索次數、該搜索詞對應的搜索結果頁、搜索結果頁的訪問數據量、訪問時間等。從搜索引擎數據庫中篩選出各類型的榜單數據,這些榜單數據均為現階段最熱門的搜索,熱詞搜索次數最多的搜索數據。篩選搜索引擎數據庫中的榜單數據進一步包括:篩選搜索引擎數據庫中的電影、電視劇、綜藝、動漫、人物以及小說的榜單數據。搜索引擎數據庫中的榜單數據多種多樣,如電影、電視劇、綜藝、動漫、人物、小說、汽車、大學、旅游等。不同的榜單針對的用戶不同,關注點和關注用戶群體也不相同。有些榜單,如汽車,可能汽車發燒友或需要購車的用戶會更多的關注。如旅游,可能驢友或準備旅行的用戶會更多的關注。這些榜單數據具有針對性,不是大多用戶都會關注的數據。因此篩選時選擇大多用戶都會關注的數據如電影、電視劇、綜藝、動漫、人物、小說的榜單數據。步驟S102,將篩選得到的榜單數據與搜索日志數據做交集,獲取數據交集中的熱詞及熱詞對應的頁面瀏覽量。搜索日志數據,包含了每天的熱詞搜索的相關數據,如熱詞每天的搜索次數、搜索時間等。頁面瀏覽量,用來計算頁面被個體的訪客(或用戶)瀏覽的次數。如3個人瀏覽該頁面一次,又有2個人瀏覽同樣的頁面2次,這個頁面就有了7次頁面瀏覽。該頁面提供給用戶的有效信息越多,頁面內容的質量越高時,頁面瀏覽量數值就會越高,反之,頁面內容質量不高,頁面的瀏覽量數值就越低。將篩選得到的榜單數據與搜索日志數據做交集,獲取兩份數據都包含的數據交集中的熱詞和熱詞對應的頁面瀏覽量。步驟S103,提取頁面瀏覽量排行在預定閾值前對應的熱詞。執行步驟S102,得到了熱詞和熱詞對應的頁面瀏覽量。對頁面瀏覽量按照數值高低進行排列,提取頁面瀏覽量排行在預定閾值前對應的熱詞。如提取頁面瀏覽量排行前100的頁面瀏覽量對應的熱詞。步驟S104,當客戶端新啟動時,從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。當每次新啟動搜索的客戶端時,從執行步驟S103所提取的熱詞中選取預定條數的熱本文檔來自技高網...
    結合多數據源的熱詞推薦方法及裝置

    【技術保護點】
    一種結合多數據源的熱詞推薦方法,其包括:篩選搜索引擎數據庫中的榜單數據;將篩選得到的榜單數據與搜索日志數據做交集,獲取數據交集中的熱詞及熱詞對應的頁面瀏覽量;提取所述頁面瀏覽量排行在預定閾值前對應的熱詞;當客戶端新啟動時,從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。

    【技術特征摘要】
    1.一種結合多數據源的熱詞推薦方法,其包括:篩選搜索引擎數據庫中的榜單數據;將篩選得到的榜單數據與搜索日志數據做交集,獲取數據交集中的熱詞及熱詞對應的頁面瀏覽量;提取所述頁面瀏覽量排行在預定閾值前對應的熱詞;當客戶端新啟動時,從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。2.根據權利要求1所述的方法,其中,在所述提取所述頁面瀏覽量排行在預定閾值前對應的熱詞之后,所述方法還包括:根據熱詞對應的頁面瀏覽量,計算所述熱詞對應的權重。3.根據權利要求2所述的方法,其中,所述計算熱詞對應的權重值為log(頁面瀏覽量)/log2。4.根據權利要求2或3所述的方法,其中,所述從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示進一步包括:按照熱詞對應的權重,利用權重隨機算法從提取的熱詞中選取預定條數的熱詞推送給客戶端進行顯示。5.根據權利要求1-4任一項所述的方法,其中,所述篩選搜索引擎數據庫中的榜單數據進一步包括:篩選搜索引擎數據庫中的電影、電視劇、綜藝、動漫、人物...

    【專利技術屬性】
    技術研發人員:吳凱王艷麗佟思穎高蘇丹
    申請(專利權)人:北京奇虎科技有限公司奇智軟件北京有限公司
    類型:發明
    國別省市:北京,11

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲中文无码永久免| 亚洲AV综合色区无码一区 | 国产精品三级在线观看无码| 成在线人免费无码高潮喷水| 亚洲情XO亚洲色XO无码| 久久午夜无码鲁丝片直播午夜精品 | 最新中文字幕av无码专区| 国产人成无码视频在线观看| 一本加勒比HEZYO无码资源网| 无码中文字幕av免费放| 一本一道av中文字幕无码| 久久午夜无码鲁丝片秋霞| 13小箩利洗澡无码视频网站免费| 久久久无码人妻精品无码| 亚洲日产无码中文字幕| 久久亚洲精品无码av| 无码中文在线二区免费| 西西午夜无码大胆啪啪国模 | 丰满少妇人妻无码| 曰韩人妻无码一区二区三区综合部| 中文字幕无码视频专区| 无码熟熟妇丰满人妻啪啪软件 | 精品人妻系列无码一区二区三区| 日韩va中文字幕无码电影| 精品无码一区二区三区水蜜桃| 色窝窝无码一区二区三区成人网站 | 寂寞少妇做spa按摩无码| 无码任你躁久久久久久| 精品人妻无码区二区三区| 色噜噜综合亚洲av中文无码| 中文字幕精品无码久久久久久3D日动漫 | 精品无码AV无码免费专区| 亚洲AV无码1区2区久久| 高清无码视频直接看| 国产成A人亚洲精V品无码性色| h无码动漫在线观看| 亚洲大尺度无码无码专区| 中文字幕日韩精品无码内射| 中文字幕无码毛片免费看| 国产品无码一区二区三区在线蜜桃 | 国产在线无码精品无码|