【技術實現步驟摘要】
事件脈絡生成方法和裝置
本專利技術涉及網絡技術,特別涉及事件脈絡生成方法和裝置。
技術介紹
當前,用戶在使用搜索引擎等進行搜索時,如對某一事件進行搜索時,只能將與該事件相關的各個資源如新聞資源,按照預定方式進行排序等處理后,展示給用戶。而用戶如果想要了解事件進展的主要過程,則需要分別查找對應的資源并進行查看,實現起來非常困難,從而降低了用戶的信息獲取效率。
技術實現思路
有鑒于此,本專利技術提供了事件脈絡生成方法和裝置,能夠提高用戶的信息獲取效率。具體技術方案如下:一種事件脈絡生成方法,包括:針對待處理的事件,分別獲取各時間窗口內的資源;針對每個時間窗口,分別確定出所述時間窗口內的各資源的重要性評分,并從所述時間窗口內的各資源中選出重要性評分符合預定要求的資源,將選出的資源作為所述時間窗口內的代表性資源;將各時間窗口內的代表性資源按照時間順序進行組合,得到事件脈絡。一種事件脈絡生成裝置,包括:處理單元;所述處理單元,用于針對待處理的事件,分別獲取各時間窗口內的資源;針對每個時間窗口,分別確定出所述時間窗口內的各資源的重要性評分,并從所述時間窗口內的各資源中選出重要性評分符合預定要求的資源,將選出的資源作為所述時間窗口內的代表性資源;將各時間窗口內的代表性資源按照時間順序進行組合,得到事件脈絡?;谏鲜鼋榻B可以看出,采用本專利技術所述方案,針對待處理的事件,可分別獲取各時間窗口內的資源,并針對每個時間窗口,分別從中選出最能反映事件進展情況的代表性資源,進而利用所選出的各時間窗口內的代表性資源組合得到事件脈絡,這樣,當用戶使用如搜索引擎進行搜索時,可直 ...
【技術保護點】
一種事件脈絡生成方法,其特征在于,包括:針對待處理的事件,分別獲取各時間窗口內的資源;針對每個時間窗口,分別確定出所述時間窗口內的各資源的重要性評分,并從所述時間窗口內的各資源中選出重要性評分符合預定要求的資源,將選出的資源作為所述時間窗口內的代表性資源;將各時間窗口內的代表性資源按照時間順序進行組合,得到事件脈絡。
【技術特征摘要】
1.一種事件脈絡生成方法,其特征在于,包括:針對待處理的事件,分別獲取各時間窗口內的資源;針對每個時間窗口,分別確定出所述時間窗口內的各資源的重要性評分,并從所述時間窗口內的各資源中選出重要性評分符合預定要求的資源,將選出的資源作為所述時間窗口內的代表性資源;將各時間窗口內的代表性資源按照時間順序進行組合,得到事件脈絡。2.根據權利要求1所述的方法,其特征在于,該方法進一步包括:獲取訓練樣本,根據所述訓練樣本訓練得到評估模型;所述分別確定出所述時間窗口內的各資源的重要性評分包括:根據所述評估模型,分別確定出所述時間窗口內的各資源的重要性評分。3.根據權利要求2所述的方法,其特征在于,所述根據所述評估模型,分別確定出所述時間窗口內的各資源的重要性評分包括:針對所述時間窗口內的每個資源,分別進行以下處理:將所述資源作為待評估資源,將所述待評估資源與所述時間窗口內的其它每個資源分別組成一個資源對;根據所述評估模型分別獲取到每個資源對中的兩個資源孰優孰劣的判定結果;統計判定結果滿足以下條件的資源對數:所述待評估資源優于所在資源對中的另一資源;將統計結果作為所述待評估資源的重要性評分。4.根據權利要求3所述的方法,其特征在于,每個訓練樣本中包括:分別從一個資源對中的兩個資源中提取出的特征,以及,兩個資源孰優孰劣的判定結果;所述根據所述評估模型分別獲取到每個資源對中的兩個資源孰優孰劣的判定結果包括:分別提取出每個資源對中的兩個資源的特征;根據提取出的特征以及所述評估模型,分別獲取到每個資源對中的兩個資源孰優孰劣的判定結果。5.根據權利要求4所述的方法,其特征在于,所述獲取訓練樣本包括:將任一事件對應的任一時間窗口內的資源進行展示;獲取從所展示的資源中選定的優質資源;分別將每個優質資源與所展示的每個非優質資源組成一個資源對;分別生成每個資源對對應的訓練樣本。6.根據權利要求3所述的方法,其特征在于,所述評估模型的個數為一個或大于一個;所述根據所述訓練樣本訓練得到評估模型包括:分別根據所述訓練樣本訓練得到每個評估模型;所述根據所述評估模型分別獲取到每個資源對中的兩個資源孰優孰劣的判定結果包括:當所述評估模型數大于一時,針對每個資源對,分別根據每個評估模型獲取到一個判定結果,將各判定結果進行匯總,根據匯總結果確定出最終的判定結果。7.根據權利要求6所述的方法,其特征在于,所述評估模型包括以下之一或任意組合:支持向量機模型、邏輯回歸模型、隨機森林模型。8.根據權利要求4所述的方法,其特征在于,從每個資源中提取出的特征包括以下之一或任意組合:純文本特征、資源熱度特征、搜索熱度特征、相似資源數特征。9.根據權利要求1所述的方法,其特征在于,所述從所述時間窗口內的各資源中選出重要性評分符合預定要求的資源,將選出的資源作為所述時間窗口內的代表性資源包括:從所述時間窗口內的各資源中選出重要性評分最高的N個資源,N為正整數,將選出的資源作為所述時間窗口內的代表性資源;或者,從所述時間窗口內的各資源中選出重要性評分大于預定閾值的資源,將選出的資源作為所述時間窗口內的代表性資源。10.一種事件脈絡生成裝置,其特征在于,包括:處理單元;所述處理單元,用于針對待處理的事件,分別獲取各時間窗口內的資源;針對每個時間窗口,分別確定出所述時間窗口內的各資源的重要性評分,并從所述時間窗口內的各資源中選...
【專利技術屬性】
技術研發人員:莫洋,沈劍平,黃強,鄭景耀,駱金昌,
申請(專利權)人:百度在線網絡技術北京有限公司,
類型:發明
國別省市:北京,11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。