本發明專利技術公開了一種語用關鍵詞模版的生成、應用方法和裝置,用于提高搜索信息的準確度。所述方法通過統計與任意語義關鍵詞相關的語用關鍵詞應用頻率,生成一個可以適用于各類信息發布、檢索的語用關鍵詞通用模版,通過語義關鍵詞和語用關鍵詞的組合發布、檢索,根本改善互聯網信息的發布、檢索效率。
【技術實現步驟摘要】
本專利技術涉及計算機及通信領域,特別是涉及生成、應用語用關鍵詞模版的方法及>J-U ρ α裝直。
技術介紹
目前,全文關鍵詞搜索是互聯網信息搜索的基本方法,但是,全文關鍵詞實際上有兩種完全不同的應用功能。例如,當用戶在全文關鍵詞檢索輸入欄中輸入“NBA籃球比賽直播時間”時,一種需求是想檢索到與“NBA籃球比賽直播時間”相關的所有信息,這時,“時間” 一詞是揭示目標信息主題的語義關鍵詞之一。另一種需求則是只想檢索到NBA籃 球比賽直播的具體時間,如“ NBA籃球比賽直播9-30-20:30 ”,這時,“時間” 一詞則是指示“9-30-20:30”功能與效用的語用關鍵詞。顯然,用戶輸入同一檢索關鍵詞的這兩種不同應用功能需求,所指向的目標信息有巨大差別。因此,在關鍵詞搜索中區別語義關鍵詞和語用關鍵詞,對提高關鍵詞檢索的精準度具有重要價值。問題在于,雖然語用關鍵詞和語義關鍵詞同是組織信息的基本要素,但如果沒有語用關鍵字標簽導航模版,信息發布方往往會忽略提供語用關鍵詞,或者不知道應該提供什么語用關鍵詞,或者發布方和檢索方提供的語用關鍵詞不一致。其結果是,關鍵詞檢索的非目標信息很可能在檢索結果中排序在前,而目標信息排序在后。例如,按照關鍵字命中率排序,“NBA籃球比賽直播時間太晚”、“沒時間看NBA比賽直播了 ”等信息會排序在前,而檢索用戶真正需要的目標信息“NBA籃球比賽直播9-30-20:30”則由于發布信息中沒有“時間” 一詞,只能排序在后。更為關鍵的問題是,即使發布用戶提供了語用關鍵字,目前的全文關鍵字搜索服務實際上也無法判別,當搜索用戶輸入同一關鍵字時到底是要的其語義功能,還是語用功能?因此,目前的全文關鍵字檢索實際上是一種不區分關鍵字語義功能和語用功能的模糊檢索。也因此,無論加上多少輔助性技術手段,也無法根本改善全文關鍵字檢索的效率。與此同時,為了提高信息搜索的效率,互聯網上提供了上萬種不同的結構化信息發布、檢索模版(如購物、訂票等結構化信息發布、檢索模版),以引導用戶在結構化標簽下發布、檢索信息。但是,各類結構化模版均不具有通用性,因此,在提高信息檢索效率的同時,也大大增加了用戶的使用難度。簡言之,目前的關鍵詞信息搜索方法仍然處在查精則不能查全,查全則不能查精的困境中。但是,經過我們的統計和研究,互聯網信息中的語用關鍵詞具有以下雙十定律輸入任意關鍵字,其相關信息的高頻應用語用關鍵詞在10X10范圍以內。例如,輸入任意搜索關鍵字(如NBA、國家發改委、智能手機、云計算、韓寒、歐美大片......),其相關信息的通用且常用分類包括新聞、告示、知識、論壇、產品、服務、人際交往、點播\下載、博客\微博、大黃頁。而各類新聞的通用語用關鍵詞包括標題、行為主體、行為、時間、地點、背景、綜述......;各類人際交往(無論是征婚、交友、招聘、應聘......)的語用關鍵詞均包括標題、交往目的、性別、年齡、職業.......依據上述雙十定律,本專利技術提供一種語用關鍵詞通用模版的生成、應用方法與裝置,用于實現語義關鍵詞和語用關鍵詞的區別檢索,以根本改善互聯網信息發布、檢索效率。
技術實現思路
一種語用關鍵詞通用模版的生成、應用方法與裝置,用于實現語義關鍵詞和語用關鍵詞的區別檢索,以根本改善互聯網信息發布、檢索效率。一種語用關鍵詞通用模版的生成方法,其主要流程步驟如下 采用隨機抽樣的方法獲得任意關鍵詞的檢索結果;統計檢索結果中的各類語用關鍵詞的應用頻率;調用高頻語用關鍵詞生成語用關鍵詞通用模版;一種統計檢索結果中的各類語用關鍵詞的應用頻率的方法,其特征在于,包括以下步驟統計結構化數據、半結構數據中的結構標簽的應用頻率;統計無結構信息中標點符號冒號與關鍵詞形成的固定搭配的應用頻率;統計語用關鍵詞的嵌套關系及應用頻率;統計不同發布主體分類下的語用關鍵詞應用頻率;統計不同語義關鍵詞與語用關鍵詞的關聯應用頻率;統計在語用關鍵詞模版中由用戶自由擴展的語用關鍵詞使用頻率。一種調用高頻語用關鍵詞生成語用關鍵詞通用模版的方法,其步驟包括當沒有獲得用戶選擇的主體分類時,生成或調用不區分發布信息主體的、包括嵌套語用關鍵詞的語用關鍵詞通用模版;當獲得用戶選擇的主體分類時,生成或調用區分發布信息主體的、包括嵌套語用關鍵詞的語用關鍵詞通用模版;當獲得用戶輸入的語義關鍵詞時,根據該語義關鍵詞與語用關鍵詞的關聯應用頻率,生成或調用不同語義關鍵詞輸入結果下的通用語用關鍵詞模版;一種采用語用關鍵詞模版發布信息的方法,其步驟包括從發布信息中獲得語義關鍵詞;生成或調用包括嵌套語用關鍵詞語用關鍵詞通用模版;獲得用戶點擊的語用關鍵詞;將該語用關鍵詞添加語用關鍵詞標示符后插入到任意文件中,或者,在該語用關鍵詞對應的信息輸入框中獲得語義關鍵詞;一種采用語用關鍵詞模版檢索信息的方法,其步驟包括調用檢索語用關鍵詞的通用模版;獲得用戶輸入的檢索用語義關鍵詞和在語用關鍵詞模版中選擇的語用關鍵詞;用用戶輸入的語義關鍵詞和選擇的語用關鍵詞匹配發布信息中的語義關鍵詞和語用關鍵詞;調用并顯示語義關鍵詞和該語用關鍵詞匹配成功的對應發布信息?!N語用關鍵詞通用模版生成和應用裝置,包括統計模塊,用于統計語用關鍵詞各類應用頻率;存儲模塊,用于存儲含有嵌套語用關鍵詞的語用關鍵詞通用模版及不同主體選擇結果、不同關鍵詞輸入結果下的語用關鍵詞通用模版;接口模塊,用于用戶調用通用語用關鍵詞模版,并在語用關鍵詞模版導航下發布、檢索相關信息。本專利技術的目的是,通過統計任意關鍵詞的語用關鍵詞應用頻率,生成一個可以適用于各類信息發布、檢索的語用關鍵詞通用模版,通過語義關鍵詞和語用關鍵詞的組合發布、檢索,根本改善互聯網信息的發布、檢索效率。 附圖說明圖I為生成語用關鍵詞通用模版的主要方法流程2為語用關鍵詞通用模版示意3為不同信息主體語用關鍵詞通用模版示意圖;圖4為嵌套語用關鍵詞模版示意5A為不同語義關鍵詞輸入結果下的語用關鍵詞模版示意圖I圖5B為不同語義關鍵詞輸入結果下的語用關鍵詞模版示意圖2圖6為語用關鍵詞及對應信息發布的主要方法流程7為為語義關鍵詞結構化輸入框示意8為在網頁信息中添加語用關鍵詞的操作結果示意9為可以由用戶自由添加語用關鍵詞的語用關鍵詞發布模版示意10為語用關鍵詞及對應信息檢索的主要方法流程流程11為語義關鍵詞與語用關鍵詞組合檢索模版示意12為檢索結果顯示界面示意13為相關裝置結構示意圖具體實施例方式本專利技術通過統計任意關鍵詞的語用關鍵詞應用頻率,生成一個可以適用于各類信息發布、檢索的語用關鍵詞通用模版,通過語義關鍵詞和語用關鍵詞的組合發布、檢索,根本改善互聯網信息的發布、檢索效率。本實施例中的“語義關鍵詞”是指指示目標信息主題的關鍵詞。并且,語義關鍵詞可以是詞、組合詞、句子、文本段落。本實施例中的“語用關鍵詞”是指指示語義關鍵詞相關信息的功能與效用的關鍵詞。本實施例中的“語用關鍵詞”既包括結構化數據的結構標簽,也包括非結構化信息中的固定搭配語用關鍵詞,如,任意語用關鍵詞和標點符號“”組合形成的固定搭配語用關鍵詞“產品說明”。本實施例中的“語用關鍵詞通用模版”,是指在全文關鍵詞檢索和結構化信息檢索欄中隨機輸入任意關鍵詞,獲得檢索結果鏈接網頁,在網頁信息中統計語用關鍵詞使用頻率,從統計結果中抽本文檔來自技高網...
【技術保護點】
一種語用關鍵詞通用模版的生成、應用方法與裝置,其特征在于,統計網頁信息檢索結果中的各類語用關鍵詞的應用頻率;調用高頻語用關鍵詞生成語用關鍵詞通用模版;采用語用關鍵詞通用模版發布信息;采用語用關鍵詞通用模版檢索信息;
【技術特征摘要】
1.一種語用關鍵詞通用模版的生成、應用方法與裝置,其特征在于, 統計網頁信息檢索結果中的各類語用關鍵詞的應用頻率; 調用高頻語用關鍵詞生成語用關鍵詞通用模版; 采用語用關鍵詞通用模版發布信息; 采用語用關鍵詞通用模版檢索信息;2.如權利要求I所述的統計檢索結果中的各類語用關鍵詞的應用頻率的 方法,其特征在于,包括以下步驟 統計結構化數據、半結構數據中的結構標簽的應用頻率; 統計無結構信息中標點符號冒號與關鍵詞形成的固定搭配的應用頻率; 統計語用關鍵詞的嵌套關系及應用頻率; 統計不同發布主體分類下的語用關鍵詞應用頻率; 統計不同語義關鍵詞與語用關鍵詞的關聯應用頻率; 統計在語用關鍵詞模版中由用戶自由擴展的語用關鍵詞使用頻率。3.如權利要求I所述的調用高頻語用關鍵詞生成語用關鍵詞通用模版的方法,其特征在于,包括以下步驟 當沒有獲得用戶選擇的主體分類時,生成或調用不區分發布信息主體的、包括嵌套語用關鍵詞的語用關鍵詞通用模版; 當獲得用戶選擇的主體分類時,生成或調用區分發布信息主體的、包括嵌套語用關鍵詞的語用關鍵詞通用模版; 當獲得語義關鍵詞時,根據該語義關鍵詞與語用關鍵詞的關聯應用頻率,生成或調用不同語義關鍵詞輸入結果下的通用語用關鍵詞模版;4.如權利要求I所述的一種采用語用關鍵詞通用模版發布信息的方法, 其特征在于,包括以下步驟 從發布信息中獲得語義關鍵詞; 調用語用關鍵詞通用模版; 獲得用戶點擊的語用關鍵詞; 將該語用關鍵詞加上語用關鍵詞標示符添加到任意文件中,或者, 在該語用關鍵詞對應的信息輸入框中獲得...
【專利技術屬性】
技術研發人員:劉莎,
申請(專利權)人:劉莎,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。