• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    檢索方法、檢索系統以及自然語言理解系統技術方案

    技術編號:8594071 閱讀:170 留言:0更新日期:2013-04-18 07:16
    一種檢索方法、檢索系統以及自然語言理解系統,此檢索系統包括:結構化數據庫以及搜尋引擎。結構化數據庫包含多個記錄,其中每個記錄包括標題欄以及內容欄,而標題欄內包括至少一分欄,每一分欄包括指引欄以及數值欄。前述記錄的指引欄儲存指引數據、數值欄儲存數值數據、內容欄則儲存內容細節數據。搜尋引擎針對用戶請求信息所產生的關鍵字,對結構化數據庫的記錄進行全文檢索,并將檢索結果傳送至一知識輔助理解模塊以確定用戶的意圖,并在確認用戶意圖后將用戶所要的信息回傳給用戶。

    【技術實現步驟摘要】

    本專利技術涉及一種檢索技術,特別是涉及一種對結構化數據庫進行全文檢索的檢索方法、檢索系統以及自然語言理解系統
    技術介紹
    在計算機的自然語言理解(Nature Language Understanding)中,通常會使用特定的語法來抓取用戶的輸入語句的意圖或信息。因此,若數據庫中儲存有足夠多的用戶輸入語句的數據,便能做到合理的判斷。在現有的作法中,有一種是利用內置的固定詞列表來抓取用戶的輸入語句,而固定詞列表中包含了特定的意圖或信息所使用的特定用語,而用戶需依照此特定用語來表達其意圖或信息,其意圖或信息才能被系統正確識別。然而,迫使用戶去記住固定詞列表的每個特定用語是相當不人性化的作法。例如現有技術使用固定詞列表的實施方式,要求用戶在詢問天氣的時候必須說“上海(或北京)明天(或后天)天氣如何? ”,而若用戶使用其他比較自然的口語化表達也想詢問天氣狀況時,比如是“上海明天怎么樣啊?”,因為語句中未出現“天氣”,所以現有技術就會理解成“上海有個叫明天的地方”,這樣顯然沒有抓到用戶的真正意圖。另外,用戶所使用的語句種類是十分復雜的,并且又時常有所變化,甚至有時用戶可能會輸入錯誤的語句,在此情況下必須要藉由模糊匹配的方式來抓取用戶的輸入語句。因此,僅提供僵化輸入規則的固定詞列表所能達到的效果就更差了。此外,當利用自然語言理解來處理多種類型的用戶意圖時,有些相異的意圖的語法結構卻是相同的,例如當用戶的輸入語句為我要看三國演義,其用戶意圖有可能是想看三國演義的電影,或是想看三國演義的書,因此通常在此情況中,便會匹配到兩種可能意圖來讓用戶做選擇。然而,在很多情況下,提供不必要的可能意圖來讓用戶做選擇是十分多余且沒效率的。例如,當用戶的輸入語句為〃我想看超級星光大道〃時,將使用者的意圖匹配為看超級星光大道的書或者畫作是十分沒必要的(因為超級星光大道是電視節目)。再者,一般而言,在全文檢索中所獲得的搜尋結果是非結構化的數據。非結構化數據內的信息是分散且不具關聯的,例如,在google或百度等搜尋引擎輸入關鍵字后,所獲得的網頁搜尋結果就是非結構化數據,因為搜尋結果必須通過人為的逐項閱讀才能找到當中的有用信息,而這樣的作法不僅浪費用戶的時間,而且可能漏失想要的信息,所以在實用性上會受到很大的限制。
    技術實現思路
    本專利技術提供一種檢索方法以及檢索系統,其對結構化數據庫進行全文檢索,而使全文檢索所獲得的搜尋結果是非常有意義的結構化的數據。本專利技術又提供一種自然語言理解系統,藉由對結構化數據庫進行全文檢索來輔助判斷用戶的請求信息所表示的意圖。本專利技術提出一種檢索系統,其包括結構化數據庫以及搜尋引擎。結構化數據庫儲存多個記錄。搜尋引擎對結構化數據庫進行全文檢索,其中結構化數據庫每個記錄內部的所包含的數值數據相互間具有關聯性,且數值數據共同用以表達來自用戶的請求信息對該記錄的意圖。該搜尋引擎用以對該結構化數據庫進行一全文檢索,其中在該數值數據被匹配時,對應于該數值數據的指引數據被輸出以確認該請求信息的意圖。本專利技術提出一種自然語言理解系統,其包括自然語言處理器、知識輔助理解模塊以及檢索系統。自然語言處理器將用戶的請求信息,分析成至少一可能意圖語法數據,每一可能意圖語法數據包括至少一關鍵字及意圖數據。耦接至自然語言處理器的知識輔助理解模塊用以求得至少一可能意圖語法數據中的確定意圖語法數據,以表達用戶的請求信息的意圖。前述檢索系統包括結構化數據庫以及搜尋引擎。結構化數據庫儲存多個記錄。搜尋引擎對結構化數據庫進行全文檢索。知識輔助理解模塊傳送關鍵字給檢索系統,藉由檢索系統的回應,以輔助求得確定意圖語法數據。本專利技術提出一種檢索方法,此方法首先提供結構化數據庫,此結構化數據庫儲存多個記錄。而后,對結構化數據庫進行全文檢索。根據本專利技術的一實施例中,前述的每個記錄包括了標題欄,此標題欄內包括至少一分欄,每一分欄包括指引欄以及數值欄,前述記錄的指引欄儲存指引數據,前述記錄的數值欄儲存數值數據。根據本專利技術的一實施例中,前述的每個記錄還包括內容欄,前述記錄的內容欄儲存前述記錄的內容細節數據。根據本專利技術的一實施例中,當前述記錄的標題欄中儲存有多個分欄的數據時,于各分欄的數據間儲存第一特殊字符,用以分隔各分欄的數據,于指引欄與數值欄的數據間儲存第二特殊字符,用以分隔指引欄與數值欄的數據。根據本專利技術的一實施例中,標題欄中的分欄具有固定位數。基于上述,本專利技術藉由將用戶的請求信息所包括的關鍵字,來對結構化數據庫中具有特定數據結構的記錄進行全文檢索,以輔助判斷出用戶在請求信息中所表示的意圖。為使本專利技術的上述特征和優點能更明顯易懂,下文特舉實施例,并結合附圖詳細說明如下。附圖說明圖1為根據本專利技術的一實施例的自然語言理解系統的方塊圖。圖2為根據本專利技術的一實施例的自然語言處理器對用戶的各種請求信息的分析結果的示意圖。圖3A是根據本專利技術的一實施例的結構化數據庫所儲存的具有特定數據結構的多個記錄的示意圖。圖3B是根據本專利技術的另一實施例的結構化數據庫所儲存的具有特定數據結構的多個記錄的示意圖。圖3C是根據本專利技術的另一實施例的指引數據儲存表格所儲存的指引數據的示意圖。圖4A為根據本專利技術的一實施例的檢索方法的流程圖。圖4B為根據本專利技術的另一實施例的自然語言理解系統工作過程的流程圖。圖5A是依照本專利技術一實施例所繪示的自然語言對話系統的方塊圖。圖5B是依照本專利技術一實施例所繪示的自然語言理解模塊的方塊圖。圖5C是依照本專利技術另一實施例所繪示的自然語言對話系統的方塊圖。圖6是依照本專利技術一實施例所繪示的修正語音應答的方法流程圖。圖7A是依照本專利技術一實施例所繪示的自然語言對話系統的方塊圖。圖7B是依照本專利技術另一實施例所繪示的自然語言對話系統的方塊圖。圖8是依照本專利技術一實施例所繪示的自然語言對話方法流程圖。圖9為依據本專利技術一實施例的移動終端裝置的系統示意圖。圖10為依據本專利技術一實施例的信息系統的系統示意圖。圖11為依據本專利技術一實施例的基于語音識別的選擇方法的流程圖。圖12是依照本專利技術一實施例所繪示的語音操控系統的方塊圖。圖13所示是語音操控系統的方塊圖。圖14是依照本專利技術一實施例所繪示的語音操控方法的流程圖。附圖符號說明100 自然語言理解系統102,505,705 :請求信息104 :分析結果106:可能意圖語法數據108 :關鍵字110:回應結果112:意圖數據114:確定意圖語法數據116 :分析結果輸出模塊200 :檢索系統220 :結構化數據庫240 :搜尋引擎260:檢索接口單元280:指引數據儲存表格300 自然語言處理器302 :記錄304 :標題欄306:內容欄308 :分欄310:指引欄312 :數值欄314 :來源欄316 :熱度欄400 :知識輔助理解模塊S41(TS450 :根據本專利技術一實施例的檢索方法的步驟S51(TS570 :根據本專利技術一實施例的自然語言理解系統工作過程的步驟500、500’、700、700’ 自然語言對話系統501、701 :語首輸入503,703 :解析結果507,707 :語音應答5O9JO9 :特征語義510、710 :語音取樣模塊511、711 :候選列表520、520’、720、720’ 自然語言理解模塊522、722 :語音識別模塊52本文檔來自技高網
    ...

    【技術保護點】
    一種檢索系統,包括:一結構化數據庫,用以儲存具有一數據結構的多個記錄;以及一搜尋引擎,用以對該結構化數據庫進行一全文檢索,其中該數據結構包括一標題欄,該標題欄內包括至少一分欄,每一分欄包括一指引欄以及一數值欄,該些記錄的該指引欄儲存一指引數據,該些記錄的該數值欄儲存一數值數據。

    【技術特征摘要】
    1.一種檢索系統,包括 一結構化數據庫,用以儲存具有一數據結構的多個記錄;以及 ー搜尋引擎,用以對該結構化數據庫進行一全文檢索, 其中該數據結構包括一標題欄,該標題欄內包括至少一分欄,每一分欄包括一指引欄以及ー數值欄,該些記錄的該指引欄儲存一指引數據,該些記錄的該數值欄儲存一數值數據。2.如權利要求1所述的檢索系統,其中該數據結構還包括一內容欄,該些記錄的該內容欄儲存各該些記錄的內容細節數據。3.如權利要求1所述的檢索系統,其中當該些記錄的該標題欄中儲存有多個該分欄的數據時,于各該分欄的數據間儲存ー第一特殊字符,用以分隔各該分欄的數據,于該指引欄與該數值欄的數據間儲存ー第二特殊字符,用以分隔該指引欄與該數值欄的數據。4.如權利要求1所述的檢索系統,其中該標題欄中的該分欄具有固定位數。5.如權利要求1所述的檢索系統,還包括一檢索接ロ単元,耦接該搜尋引擎,用以接收至少ー關鍵字來傳送給該搜尋引擎,藉以讓該搜尋引擎對該些記錄的該標題欄進行該全文檢索,以及反應該搜尋引擎的一匹配結果,輸出該些記錄中的至少ー檢索匹配記錄。6.如權利要求5所述的檢索系統,其中該檢索匹配記錄為與該至少一關鍵字完全匹配的一全匹配記錄或與該至少一關鍵字部分匹配的一部分匹配記錄。7.如權利要求6所述的檢索系統,其中當該檢索接ロ單元輸出多個檢索匹配記錄吋,其依序輸出該全匹配記錄及該部分匹配記錄,其中該全匹配記錄的優先順序大于該部分匹配記錄的優先順序。8.ー種自然語言理解系統,包括 一自然語言處理器,用以將ー用戶的一請求信息,分析成至少一可能意圖語法數據,每一可能意圖語法數據包括至少ー關鍵字及一意圖數據; 一知識輔助理解模塊,耦接該自然語言處理器,用以求得該至少一可能意圖語法數據中的一確定意圖語法數據,以表達該用戶的該請求信息的意圖;以及 一檢索系統,包括 一結構化數據庫,用以儲存具有一數據結構的多個記錄;以及 ー搜尋引擎,用以對該結構化數據庫進行一全文檢索,該數據結構包括ー標題欄,該標題欄內包括至少一分欄,每一分欄包括一指引欄以及一數值欄,該些記錄的該指引欄儲存一指引數據,該些記錄的該數值欄儲存ー數值數據, 其中,該知識輔助理解模塊傳送該關鍵字給該檢索系統,藉由該檢索系統的回應,以輔助求得該確定意圖語法數據。9.如權利要求8所述的自然語言理解系統,其中該數據結構還包括一內容欄,該些記錄的該內容欄儲存各該些記錄的內容細節數據。10.如權利要求8所述的自然語言理解系統,其中當該些記錄的該標題欄中儲存有多個該分欄的數據時,于各該分欄的數據間儲存ー第一特殊字符,用以分隔各該分欄的數據,于該指引欄與該數值欄的數據間儲存ー第二特殊字符,用以分隔該指引欄與該數值欄的數據。11.如權利要求8所述的自然語言理解系統,其中該標題欄中的該分欄具有固定位數。12.如權利要求8所述的自然語言理解系統,其中該檢索系統還包括一檢索接ロ単元,耦接該搜尋引擎以及該知識輔助理解模塊,用以接收該關鍵字來傳送給該搜尋引擎,藉以讓該搜尋引擎對該些記錄的該標題欄進行該全文檢索,以及反應該搜尋引擎的一匹配結果,輸出該些記錄中的至少ー檢索匹配記錄,該知識輔助理解模塊藉由比對該至少ー檢索匹配記錄中該標題欄所儲存的該指引數據與該至少一可能意圖語法數據所包括的該意圖數據,從而判斷出該用戶的該請求信息的意圖。13.如權利要求12所述的自然語言理解系統,其中該檢索匹配記錄為與該關鍵字完全匹配的一全匹配記錄或與該關鍵字部分匹配的一部分匹配記錄。1...

    【專利技術屬性】
    技術研發人員:張國峰朱逸斐
    申請(專利權)人:威盛電子股份有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 日韩精品无码区免费专区| 少妇无码AV无码专区线| 国产精品亚洲а∨无码播放不卡| 无码国产精成人午夜视频不卡 | 中文字幕日韩精品无码内射| 国产成人无码av| 亚洲av无码专区在线| 亚洲AV无码乱码在线观看性色扶| 无码国产乱人伦偷精品视频 | 久久久久亚洲av无码专区| 亚洲精品9999久久久久无码| 潮喷大喷水系列无码久久精品| 人妻少妇看A偷人无码电影| 黄A无码片内射无码视频| 无码里番纯肉h在线网站| 亚洲AV无码成人精品区蜜桃| 国产精品亚洲а∨无码播放不卡| 日韩免费无码视频一区二区三区| 欧日韩国产无码专区| 亚洲AV永久无码精品一福利 | 国产成人年无码AV片在线观看| 无码人妻精品一区二区三区99仓本| 国产aⅴ激情无码久久久无码| 亚洲视频无码高清在线| 无码专区久久综合久中文字幕 | 无码国产精品一区二区免费| 中文字幕丰满乱孑伦无码专区| 精品无码中出一区二区| 午夜爽喷水无码成人18禁三级| 免费人妻无码不卡中文字幕系| 国产成人AV一区二区三区无码| 无码国模国产在线无码精品国产自在久国产 | av潮喷大喷水系列无码| 亚洲AV无码一区二区乱孑伦AS | 精品无码人妻一区二区免费蜜桃 | 精品国产一区二区三区无码 | 在线无码视频观看草草视频| 亚洲国产精品无码第一区二区三区 | 无码少妇一区二区三区| 无码精品前田一区二区| 性色av无码免费一区二区三区 |