• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    需求識別模板的自動挖掘方法、需求識別方法及對應裝置制造方法及圖紙

    技術編號:8532914 閱讀:209 留言:0更新日期:2013-04-04 15:56
    本發明專利技術提供了一種需求識別模板的自動挖掘方法、需求識別方法及對應裝置,在搜索日志中確定預設類型的網頁被點擊時對應的query集合;從query集合中選擇對應預設類型的網頁被點擊的總次數超過預設次數閾值,和/或,對應預設類型的網頁點擊比超過預設點擊比閾值的query,將選擇的query作為預設類型的種子query;將各種子query分別與預設類型的詞典進行匹配,將種子query中匹配到詞典的詞語替換成詞典中對應詞語的屬性標記后,得到預設類型的模板集合;利用預設類型的模板集合確定預設類型的需求識別模板。通過本發明專利技術能夠節約人力資源,擴大搜索識別所能覆蓋到的query范圍,提高召回率。

    【技術實現步驟摘要】
    需求識別模板的自動挖掘方法、需求識別方法及對應裝置
    本專利技術涉及計算機
    ,特別涉及一種需求識別模板的自動挖掘方法和需求識別方法及對應裝置。
    技術介紹
    隨著互聯網在全球范圍內的迅速發展與成熟,網絡上的信息資源不斷豐富,信息數據量也在飛速膨脹,通過搜索引擎獲取信息已經成為現代人獲取信息的主要方式。為了向用戶提供更加便捷、準確地查詢服務是搜索引擎技術在當今和未來的發展方向。在搜索引擎技術中,對用戶的搜索需求進行識別是提高搜索準確性和有效性的重要一環,特別在結構化搜索(即垂直搜索)中作用顯著。例如,當用戶輸入“從百度大廈到五道口怎么做公交車”的query時,用戶期望得到直接從起點到終點的公交線路的地圖結果,因此,需要搜索引擎能夠識別出該query具有地圖類的搜索需求,從而在地圖類的結構化數據庫中實現公交線路的結構化搜索。在針對用戶輸入的query進行需求識別時,常用到的方式是基于已經建立的需求識別模板對用戶輸入的query進行匹配,利用匹配到的需求識別模板確定搜索需求。在現有技術中,需求識別模板通常采用人工配置的方式,即通過人為觀察常用的query結構,總結出常用的需求識別模板,例如對于地圖類,人工配置出 “從地名到地名怎么走”、“地名在哪”,“機構名在什么位置”等需求識別模板,然而,這種人工配置需求識別模板的方式具有以下缺陷其一、耗費人力資源,建立需求識別模板的效率較低。其二、對query的召回率較低,也就是說,能夠覆蓋到的query數量有限,適用范圍較窄。
    技術實現思路
    本專利技術提供了一種需求識別模板的自動挖掘方法、需求識別方法及對應裝置,以便于節約人力資源,擴大需求識別所能覆蓋到的query范圍。具體技術方案如下一種需求識別模板的自動挖掘方法,該方法包括S1、在搜索日志中確定預設類型的網頁被點擊時對應的query集合;S2、從所述query集合中選擇對應所述預設類型的網頁被點擊的總次數超過預設次數閾值,和/或,對應所述預設類型的網頁點擊比超過預設點擊比閾值的query,將選擇的query作為所述預設類型的種子query,其中query對應的所述預設類型的網頁點擊比為該query對應所述預設類型的網頁被點擊的總次數與該query對應所有網頁被點擊的總次數的比值;S3、將各種子query分別與所述預設類型的詞典進行匹配,將種子query中匹配到詞典的詞語替換成詞典中對應詞語的屬性標記后,得到所述預設類型的模板集合,所述詞典包括詞語和詞語的屬性標記;S4、利用所述預設類型的模板集合確定所述預設類型的需求識別模板。根據本專利技術一優選實施例,所述步驟SI具體包括確定搜索日志中網頁的類型,收集所述預設類型的網頁,并確定所述預設類型的 網頁被點擊時對應的所有query構成所述query集合;或者,確定預設類型的站點,將搜索日志中屬于所述預設類型的站點的網頁被點擊時對 應的所有query構成所述query集合。根據本專利技術一優選實施例,所述詞典中的詞語包括命名實體和所述預設類型的 特征詞。根據本專利技術一優選實施例,該方法還包括計算所述模板集合中各模板的準確率和/或召回率;其中,模板的準確率為該模板所覆蓋query對應所述預設類型的網頁點擊比之 和與該模板所覆蓋query的數量的比值;模板的召回率為該模板所覆蓋query的數量與所述預設類型的種子query數量 的比值。根據本專利技術一優選實施例,所述步驟S4具體包括將所述模板集合中的各模板確定為所述預設類型的需求識別模板;或者,從所述模板集合中選擇準確率高于預設準確率閾值,和/或,召回率高于預設召 回率閾值的模板,作為所述預設類型的需求識別模板。一種需求識別方法,該需求識別方法包括Al、將待識別query分別與各預設類型的詞典進行匹配,將所述待識別query中匹 配到詞典的詞語替換成詞典中對應詞語的屬性標記,得到所述待識別query的語義標注, 所述詞典包括詞語和詞語的屬性標記;A2、將所述待識別query的語義標注分別與各預設類型的需求識別模板進行匹 配,利用匹配到的需求識別模板對應的類型確定所述待識別query的需求類型;其中,各預設類型的需求識別模板是通過上述需求識別模板的自動挖掘方法自動 挖掘出的。根據本專利技術一優選實施例,所述詞典中的詞語包括命名實體和對應預設類型的 特征詞。根據本專利技術一優選實施例,在所述步驟Al中,如果所述待識別query中存在同一 個詞語匹配到多個詞典的詞語,則利用匹配到的多個詞典的詞語的屬性標記分別進行替 換,得到多個所述待識別query的語義標注。根據本專利技術一優選實施例,在所述待識別query的語義標注匹配到多個需求識別 模板時,在所述步驟A2中進一步結合匹配到的各需求識別模板的準確率和/或召回率確定 所述待識別query的需求類型。根據本專利技術一優選實施例,在所述步驟A2中確定所述待識別query的需求類型包 括將匹配到的各需求識別模板中準確率和/或召回率滿足預設要求的需求識別模 板對應的需求類型確定為所述待識別query的需求類型;或者,將匹配到的各需求識別模板中準確率和/或召回率排在前N個的需求識別模板對應的需求類型確定為所述待識別query的需求類型,所述N為預設的正整數;或者,根據匹配到的各需求識別模板的準確率和/或召回率對應的需求級別,確定所述 待識別query在各需求類型上的需求級別。一種需求識別模板的自動挖掘裝置,該裝置包括第一選擇單元,用于在搜索日志中確定預設類型的網頁被點擊時對應的query集第二選擇單元,用于從所述query集合中選擇對應所述預設類型的網頁被點擊的 總次數超過預設次數閾值,和/或,對應所述預設類型的網頁點擊比超過預設點擊比閾值 的query,將選擇的query作為所述預設類型的種子query,其中query對應的所述預設類 型的網頁點擊比為該query對應所述預設類型的網頁被點擊的總次數與該query對應所 有網頁被點擊的總次數的比值;標記替換單元,用于將各種子query分別與所述預設類型的詞典進行匹配,將種 子query中匹配到詞典的詞語替換成詞典中對應詞語的屬性標記后,得到所述預設類型的 模板集合,所述詞典包括詞語和詞語的屬性標記;模板確定單元,用于利用所述預設類型的模板集合確定所述預設類型的需求識別 模板。根據本專利技術一優選實施例,所述第一選擇單元具體確定搜索日志中網頁的類型, 收集所述預設類型的網頁,并確定所述預設類型的網頁被點擊時對應的所有query構成所 述query集合;或者,確定預設類型的站點,將搜索日志中屬于所述預設類型的站點的網頁被點擊時對 應的所有query構成所述query集合。根據本專利技術一優選實施例,所述詞典中的詞語包括命名實體和所述預設類型的 特征詞。根據本專利技術一優選實施例,該裝置還包括權值計算單元,用于計算所述模板集合 中各模板的準確率和/或召回率;其中,模板的準確率為該模板所覆蓋query對應所述預設類型的網頁點擊比之 和與該模板所覆蓋query的數量的比值;模板的召回率為該模板所覆蓋query的數量與所述預設類型的種子query數量 的比值。根據本專利技術一優選實施例,所述模板確定單元將所述模板集合中的各模板確定為 所述預設類型的需求識別模板;或者,從所述模板集合中選擇準確本文檔來自技高網...

    【技術保護點】
    一種需求識別模板的自動挖掘方法,其特征在于,該方法包括:S1、在搜索日志中確定預設類型的網頁被點擊時對應的query集合;S2、從所述query集合中選擇對應所述預設類型的網頁被點擊的總次數超過預設次數閾值,和/或,對應所述預設類型的網頁點擊比超過預設點擊比閾值的query,將選擇的query作為所述預設類型的種子query,其中query對應的所述預設類型的網頁點擊比為:該query對應所述預設類型的網頁被點擊的總次數與該query對應所有網頁被點擊的總次數的比值;S3、將各種子query分別與所述預設類型的詞典進行匹配,將種子query中匹配到詞典的詞語替換成詞典中對應詞語的屬性標記后,得到所述預設類型的模板集合,所述詞典包括詞語和詞語的屬性標記;S4、利用所述預設類型的模板集合確定所述預設類型的需求識別模板。

    【技術特征摘要】
    1.一種需求識別模板的自動挖掘方法,其特征在于,該方法包括51、在搜索日志中確定預設類型的網頁被點擊時對應的query集合;52、從所述query集合中選擇對應所述預設類型的網頁被點擊的總次數超過預設次數閾值,和/或,對應所述預設類型的網頁點擊比超過預設點擊比閾值的query,將選擇的query作為所述預設類型的種子query,其中query對應的所述預設類型的網頁點擊比為該query對應所述預設類型的網頁被點擊的總次數與該query對應所有網頁被點擊的總次數的比值;53、將各種子query分別與所述預設類型的詞典進行匹配,將種子query中匹配到詞典的詞語替換成詞典中對應詞語的屬性標記后,得到所述預設類型的模板集合,所述詞典包括詞語和詞語的屬性標記;54、利用所述預設類型的模板集合確定所述預設類型的需求識別模板。2.根據權利要求1所述的方法,其特征在于,所述步驟SI具體包括確定搜索日志中網頁的類型,收集所述預設類型的網頁,并確定所述預設類型的網頁被點擊時對應的所有query構成所述query集合;或者,確定預設類型的站點,將搜索日志中屬于所述預設類型的站點的網頁被點擊時對應的所有query構成所述query集合。3.根據權利要求1所述的方法,其特征在于,所述詞典中的詞語包括命名實體和所述預設類型的特征詞。4.根據權利要求1所述的方法,其特征在于,該方法還包括計算所述模板集合中各模板的準確率和/或召回率;其中,模板的準確率為該模板所覆蓋query對應所述預設類型的網頁點擊比之和與該模板所覆蓋query的數量的比值;模板的召回率為該模板所覆蓋query的數量與所述預設類型的種子query數量的比值。5.根據權利要求4所述的方法,其特征在于,所述步驟S4具體包括將所述模板集合中的各模板確定為所述預設類型的需求識別模板;或者,從所述模板集合中選擇準確率高于預設準確率閾值,和/或,召回率高于預設召回率閾值的模板,作為所述預設類型的需求識別模板。6.一種需求識別方法,其特征在于,該需求識別方法包括Al、將待識別query分別與各預設類型的詞典進行匹配,將所述待識別query中匹配到詞典的詞語替換成詞典中對應詞語的屬性標記,得到所述待識別query的語義標注,所述詞典包括詞語和詞語的屬性標記;A2、將所述待識別query的語義標注分別與各預設類型的需求識別模板進行匹配,利用匹配到的需求識別模板對應的類型確定所述待識別query的需求類型;其中,各預設類型的需求識別模板是通過如權利要求1至5任一權項所述的方法自動挖掘出的。7.根據權利要求6所述的需求識別方法,其特征在于,所述詞典中的詞語包括命名實體和對應預設類型的特征詞。8.根據權利要求6所述的需求識別方法,其特征在于,在所述步驟Al中,如果所述待識別query中存在同一個詞語匹配到多個詞典的詞語,則利用匹配到的多個詞典的詞語的屬性標記分別進行替換,得到多個所述待識別query的語義標注。9.根據權利要求6或8所述的需求識別方法,其特征在于,如果各預設類型的需求識別模板是通過如權利要求4所述的方法挖掘出的,則在所述待識別query的語義標注匹配到多個需求識別模板時,在所述步驟A2中進一步結合匹配到的各需求識別模板的準確率和/或召回率確定所述待識別query的需求類型。10.根據權利要求9所述的需求識別方法,其特征在于,在所述步驟A2中確定所述待識別query的需求類型包括將匹配到的各需求識別模板中準確率和/或召回率滿足預設要求的需求識別模板對應的需求類型確定為所述待識別query的需求類型;或者,將匹配到的各需求識別模板中準確率和/或召回率排在前N個的需求識別模板對應的需求類型確定為所述待識別query的需求類型,所述N為預設的正整數;或者,根據匹配到的各需求識別模板的準確率和/或召回率對應的需求級別,確定所述待識別query在各需求類型上的需求級別。11.一種需求識別模板的自動挖掘裝置,其特征在于,該裝置...

    【專利技術屬性】
    技術研發人員:黃際洲柴春光
    申請(專利權)人:北京百度網訊科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产成人午夜无码电影在线观看| 亚洲日韩精品无码专区加勒比☆| 亚洲无码高清在线观看 | 午夜福利无码不卡在线观看| 免费A级毛片无码A∨中文字幕下载 | 国产在线无码精品电影网| 日韩人妻无码中文字幕视频| 无码AV大香线蕉| 亚洲国产精品无码久久久秋霞2 | 台湾无码一区二区| 精品无码中文视频在线观看| 久久久久亚洲AV无码专区首JN| 变态SM天堂无码专区| 久久久久久99av无码免费网站 | 亚洲综合无码一区二区痴汉| 中文字幕无码AV波多野吉衣| 18禁成年无码免费网站无遮挡| 欧洲精品久久久av无码电影| 国产亚洲AV无码AV男人的天堂 | 亚洲的天堂av无码| 无码人妻精品一区二区三18禁| 国产啪亚洲国产精品无码| 国产成人无码A区精油按摩| 最新无码专区视频在线| 国产精品视频一区二区三区无码 | 无码国产精品一区二区免费模式| 国产精品热久久无码av| 国产成人无码区免费A∨视频网站| AV大片在线无码永久免费| 久久人妻内射无码一区三区| 久久无码无码久久综合综合| 少妇无码AV无码一区| 中文字幕无码第1页| 亚洲AV无码国产在丝袜线观看| 国产V亚洲V天堂无码久久久| 国产拍拍拍无码视频免费| 亚洲av中文无码乱人伦在线播放 | 成人av片无码免费天天看| 亚洲国产综合无码一区二区二三区| 国产午夜鲁丝片AV无码免费| 人妻无码一区二区三区|