• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>谷歌公司專利>正文

    基于原始用戶輸入建議和細分用戶輸入的系統和方法技術方案

    技術編號:8366774 閱讀:199 留言:0更新日期:2013-02-28 05:19
    本發明專利技術提供了一種基于原始用戶輸入建議和細分用戶輸入的系統和方法。該方法可以針對基于羅馬語系的語言和/或諸如漢語的基于非羅馬語系的語言來實現。該方法通常可以包括:接收原始用戶輸入并識別其中的核心詞語;通過根據相似矩陣用另一詞語替代原始輸入中的核心詞語和/或通過根據擴展/縮略表用另一個字序列代替原始輸入中的字序列來確定潛在可選輸入,其中,一個字序列是另一個字序列的子串;計算每個潛在可選輸入的似然;以及根據預定標準(例如,可選輸入的似然至少是原始輸入的似然)來選擇最有可能的可選輸入。可以提供包含預計算的原始用戶輸入和相應的可選輸入的高速緩沖存儲器。

    【技術實現步驟摘要】
    本申請是分案申請,其原案申請的申請號為200680021940.2,申請日為2006年5 月4日,專利技術名稱為“基于原始用戶輸入建議和細分用戶輸入”。
    本專利技術總的來說涉及生成可選用戶輸入。更具體地,公開了基于諸如搜索查詢的原始用戶輸入生成更改和細分的用戶輸入的系統和方法。
    技術介紹
    在給定的搜索會話(session)期間,許多用戶常常,有時重復地,更改或細分其原始搜索查詢。例如,用戶可以將原始搜索查詢更改為更具體的搜索查詢、更寬泛的搜索查詢、和/或使用可選的查詢詞語(term)的搜索查詢,直到生成期望的搜索結果。用戶搜索查詢細分通過基于羅馬語系語言(例如,英語)的查詢、以及通過基于非羅馬語系語言(例如, 漢語、日語、韓語(CJK)、泰國語等)來產生。當原始搜索查詢未產生一組好的搜索結果時(例如,如果搜索查詢太具體或太寬泛,或者如果搜索查詢使用不合適的詞語),用戶通常更改或細分他們的搜索查詢。例如,當一個或多個搜索詞語有多種意思且一些返回文檔涉及不同于用戶想要的多義搜索詞語的一個意思時、和/或用戶僅對搜索詞語的許多方面中給定搜索詞語的一個方面感興趣時,原始用戶搜索查詢可能產生許多不相關的結果。當用戶僅探究關于所指定搜索詞語的概念時,原始用戶搜索查詢也可能產生很多不相關的結果。許多搜索引擎提供與用戶原始搜索查詢相關的一系列建議的搜索查詢。例如, 如果用戶的原始搜索查詢是“Amazon”,則搜索引擎可以建議其它相關的搜索查詢,例如, “Amazon, com”、“Amazon Rainforest”、以及“Amazon River”。搜索查詢建議對于基于非羅馬語系語言用戶(例如,CJK用戶)特別有用。具體地,因為基于非羅馬語系語言通常具有一組大量的字符且每個字符可能都需要多次按下使用傳統基于羅馬語系的鍵盤的按鍵,所以基于非羅馬語系語言用戶可以優選單擊或選擇全部鍵入的更改搜索查詢中的一個建議的搜索查詢。例如,許多漢語用戶使用拼音(語音拼寫法)來輸入漢語字符。典型地,傳統拼音輸入系統轉換拼音輸入,并提供用戶可以從中選擇期望的漢語字符集的一組候選的漢語字符集。明顯的是,多步輸入處理將是繁重且耗時的。搜索查詢建議也將對基于羅馬語系的語言用戶有用。許多搜索引擎(例如,Yahoo、 Teoma、Alta Vista>Askjeeves>AlITheffeb以及Baidu)都提供例如以相關搜索、查詢細分、 或查詢分簇形式的特征。
    技術實現思路
    公開了一種基于原始用戶輸入(例如,搜索查詢)來生成更改或細分的用戶輸入的系統和方法。應當理解,本專利技術可以多種方式來實施,這些方式包括諸如處理、設備、系統、 裝置、方法、或其中的程序指令通過光通信線路或電子通信線路來發送的計算機可讀介質 (例如,計算機可讀存儲介質或計算機網絡)。術語計算機通常指具有計算能力的任何裝置,例如,個人數字助理(PDA)、蜂窩式電話、和網絡交換機。以下將描述本專利技術的幾個創造性實施例。該方法可以被應用于基于非羅馬語系語言(例如,漢語)的查詢。該方法通常可以包括接收和識別原始用戶輸入中的核心詞語;通過根據相似矩陣用另一詞語代替原始輸入中的核心詞語、和/或根據擴展/縮略表用另一個字序列替代原始輸入中的字序列來確定潛在可選的用戶輸入,其中,一個序列是另一個序列的子串;計算潛在可選的用戶輸入的似然;以及根據預定標準(例如,每個所選的可選用戶輸入的似然至少為原始用戶輸入的似然)來選擇最可能的可選用戶輸入。該方法還可以包括確定原始用戶輸入是否在所建議的可選用戶輸入的預計算高速緩沖存儲器中,如果在,則輸出存儲在預計算高速緩沖存儲器中的預計算的最可能的可選用戶輸入。相似矩陣可以利用語料庫生成,且可以具有兩個相似詞語(包括例如“New York” 和“Los Angeles”的短語詞)之間的相似值,盡管每個對應詞語對(New和Los和York和 Angeles)不具有高相似性,但這些短語詞可以具有非常高的相似性。在一個實施例中,可以通過構建對于語料庫中的字的特征向量并利用他們的特征向量來確定兩個字/短語之間的相似值來生成相似矩陣。可以從用戶輸入數據庫中生成擴展/縮略表,且可以具有與每對詞語序列相關的頻率值。在一個實施例中,可以通過確定常用的字序列、濾出非短語字序列、以及使計數與每個術語序列相關作為頻率值來生成擴展/縮略表。僅為了示出,擴展/縮略表中的項的實例可以為 “The United State of America” 和 “United States,,。可以通過確定以下的至少一項來計算潛在可選用戶輸入的似然(a)原始用戶輸入和潛在可選用戶輸入之間的關聯性,(b)用戶將選擇潛在可選用戶輸入的概率,以及(C) 潛在可選用戶輸入的位置分數(score)。具體地,可以使用原始輸入和潛在可選用戶輸入的調整(align)詞語之間的相關值來確定原始用戶輸入和潛在可選用戶輸入之間的關聯性。在另一實施例中,用于建議可選用戶輸入的系統通常包括建議/細分服務器,被配置為接收具有至少一個核心詞語的原始用戶輸入;從原始用戶輸入中識別出核心詞語; 通過執行以下中的至少一項來確定潛在可選用戶輸入(a)根據相似矩陣用另一詞語來代替原始用戶輸入中的至少一個核心詞語,該相似矩陣具有兩個詞語之間的相似值,(b)根據擴展/縮略表用另一個字序列來替代原始用戶輸入中的字序列,其中,一個序列是另一個序列的子串,該擴展/縮略表具有與每個詞語序列相關聯的頻率值,計算潛在可選用戶輸入的似然;以及根據預定標準來選擇和輸出最可能的可選用戶輸入。在又一實施例中,用于建議可選用戶輸入的計算機程序產品和計算機系統一起使用,該計算機程序產品包括在其上存儲有在計算機處理器上可執行的指令的計算機可讀存儲介質。該指令通常可以包括接收和識別原始用戶輸入中的核心詞語;通過根據相似矩陣用另一個詞語代替在原始輸入中的核心詞語、和/或根據擴展/縮略表用另一個字序列代替原始輸入中的字序列來確定潛在可選用戶輸入,一個序列是另一個序列的子串;用潛在可選用戶輸入計算潛在可選用戶輸入的似然和可選地計算預測用戶滿意度;以及根據預定標準(例如,每個所選的可選用戶輸入的似然至少為原始用戶輸入的似然)來選擇最可能的可選用戶輸入。實現系統和方法的應用可以在服務器站點(例如,在搜索引擎上)上實現,或者可以在客戶端站點上(例如,用戶計算機)被實現(例如,下載),以提出建議的可選輸入或與遠程服務器(例如,搜索引擎)連接。下面將通過下列詳細描述和附圖更詳細地呈現本專利技術的這些和其它特征以及優點,其中,以本專利技術的實例原理的方式示出了附圖。附圖說明 結合附圖,通過下面詳細的描述,將更好地理解本專利技術,其中,相同的參考標號表示相同的結構元件。圖IA是用于生成諸如用戶搜索查詢的建議的更改/細分的用戶輸入的示例性系統的框圖。圖IB是示出用于通過建議一細分服務器的相似字提取器生成相似矩陣的過程的框圖。圖IC是示出用于通過建議一細分服務器的擴展/縮略表生成器生成擴展/縮略表的過程的框圖。圖ID是示出用于通過建議一細分服務器的會話語法分析器生成初始的更改/細分高速緩沖存儲器的過程的框圖。圖2A是示出用于生成如可以由圖IA所示的系統實現的更改/細分用戶輸入高速緩沖存儲器的示例性本文檔來自技高網
    ...

    【技術保護點】
    一種方法,包括:接收輸入,所述輸入包括一個或多個核心詞語;識別所述輸入中的第一核心詞語;確定所述第一核心詞語的替代詞語,包括:構建出現在語料庫中的一個或多個詞語中的每個詞語的特征矢量,其中,所述一個或多個詞語包括所述第一核心詞語,確定所述第一核心詞語的第一特征矢量與所述出現在語料庫中的一個或多個詞語的各個特征矢量中的每個特征矢量之間的各個相似性測度,使用所確定的所述第一核心詞語的特征矢量與所述出現在語料庫中的一個或多個詞語的各個特征矢量之間的相似性測度來構建相似性矩陣,以及基于所確定的所述相似性矩陣中的相似性測度,選擇替代詞語;生成可選輸入,包括用所選擇的替代詞語來替換所述輸入中的所述第一核心詞語;以及建議所述可選輸入。

    【技術特征摘要】
    ...

    【專利技術屬性】
    技術研發人員:吳軍林德康錢哲周杰
    申請(專利權)人:谷歌公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲av激情无码专区在线播放| 无码熟妇αⅴ人妻又粗又大| 天堂Aⅴ无码一区二区三区| 无码av不卡一区二区三区| 国产精品无码成人午夜电影| 亚洲无码一区二区三区| 亚洲精品无码午夜福利中文字幕| 久久精品中文字幕无码绿巨人 | 精品久久久久久无码人妻中文字幕| 精品无码黑人又粗又大又长 | 无码人妻AⅤ一区二区三区水密桃 无码欧精品亚洲日韩一区夜夜嗨 无码免费又爽又高潮喷水的视频 无码毛片一区二区三区中文字幕 无码毛片一区二区三区视频免费播放 | 无码人妻精品一区二区蜜桃百度 | 日韩精品无码久久久久久| 久久美利坚合众国AV无码| 无码丰满熟妇juliaann与黑人| 久久无码AV中文出轨人妻| 久久国产精品成人无码网站| 无码人妻熟妇AV又粗又大 | 日韩AV无码不卡网站| 久久亚洲精品无码aⅴ大香| 亚洲自偷自偷偷色无码中文 | 97久久精品无码一区二区| 亚洲精品成人无码中文毛片不卡| 99久无码中文字幕一本久道| 日本无码WWW在线视频观看| 无码少妇一区二区三区浪潮AV| 国产丰满乱子伦无码专区| 激情无码人妻又粗又大| 精品久久久久久无码人妻| 孕妇特级毛片WW无码内射| 精品无码人妻夜人多侵犯18| 无码一区二区三区在线观看| 国产成A人亚洲精V品无码性色 | 久久精品aⅴ无码中文字字幕| V一区无码内射国产| 影院无码人妻精品一区二区| 无码精品人妻一区二区三区AV| 人妻丰满熟妇A v无码区不卡| 激情无码人妻又粗又大| 久久综合一区二区无码| 精品无码人妻一区二区三区不卡|