【技術實現步驟摘要】
本專利技術涉及一種檢索技術,特別是涉及一種對結構化數據庫進行全文檢索的檢索方法、檢索系統以及自然語言理解系統。
技術介紹
在計算機的自然語言理解(Nature Language Understanding)中,通常會使用特定的語法來抓取用戶的輸入語句的意圖或信息。因此,若數據庫中儲存有足夠多的用戶輸入語句的數據,便能做到合理的判斷。在現有的作法中,有一種是利用內置的固定詞列表來抓取用戶的輸入語句,而固定詞列表中包含了特定的意圖或信息所使用的特定用語,而用戶需依照此特定用語來表達其意圖或信息,其意圖或信息才能被系統正確識別。然而,迫使用戶去記住固定詞列表的每個特定用語是相當不人性化的作法。例如現有技術使用固定詞列表的實施方式,要求用戶在詢問天氣的時候必須說“上海(或北京)明天(或后天)天氣如何? ”,而若用戶使用其他比較自然的口語化表達也想詢問天氣狀況時,比如是“上海明天怎么樣啊?”,因為語句中未出現“天氣”,所以現有技術就會理解成“上海有個叫明天的地方”,這樣顯然沒有抓到用戶的真正意圖。另外,用戶所使用的語句種類是十分復雜的,并且又時常有所變化,甚至有時用戶可能會輸入錯誤的語句,在此情況下必須要藉由模糊匹配的方式來抓取用戶的輸入語句。因此,僅提供僵化輸入規則的固定詞列表所能達到的效果就更差了。此外,當利用自然語言理解來處理多種類型的用戶意圖時,有些相異的意圖的語法結構卻是相同的,例如當用戶的輸入語句為我要看三國演義,其用戶意圖有可能是想看三國演義的電影,或是想看三國演義的書,因此通常在此情況中,便會匹配到兩種可能意圖來讓用戶做選擇。然而,在很多情況下,提 ...
【技術保護點】
一種檢索系統,包括:一結構化數據庫,用以儲存具有一數據結構的多個記錄;以及一搜尋引擎,用以對該結構化數據庫進行一全文檢索,其中該數據結構包括一標題欄,該標題欄內包括至少一分欄,每一分欄包括一指引欄以及一數值欄,該些記錄的該指引欄儲存一指引數據,該些記錄的該數值欄儲存一數值數據。
【技術特征摘要】
1.一種檢索系統,包括 一結構化數據庫,用以儲存具有一數據結構的多個記錄;以及 ー搜尋引擎,用以對該結構化數據庫進行一全文檢索, 其中該數據結構包括一標題欄,該標題欄內包括至少一分欄,每一分欄包括一指引欄以及ー數值欄,該些記錄的該指引欄儲存一指引數據,該些記錄的該數值欄儲存一數值數據。2.如權利要求1所述的檢索系統,其中該數據結構還包括一內容欄,該些記錄的該內容欄儲存各該些記錄的內容細節數據。3.如權利要求1所述的檢索系統,其中當該些記錄的該標題欄中儲存有多個該分欄的數據時,于各該分欄的數據間儲存ー第一特殊字符,用以分隔各該分欄的數據,于該指引欄與該數值欄的數據間儲存ー第二特殊字符,用以分隔該指引欄與該數值欄的數據。4.如權利要求1所述的檢索系統,其中該標題欄中的該分欄具有固定位數。5.如權利要求1所述的檢索系統,還包括一檢索接ロ単元,耦接該搜尋引擎,用以接收至少ー關鍵字來傳送給該搜尋引擎,藉以讓該搜尋引擎對該些記錄的該標題欄進行該全文檢索,以及反應該搜尋引擎的一匹配結果,輸出該些記錄中的至少ー檢索匹配記錄。6.如權利要求5所述的檢索系統,其中該檢索匹配記錄為與該至少一關鍵字完全匹配的一全匹配記錄或與該至少一關鍵字部分匹配的一部分匹配記錄。7.如權利要求6所述的檢索系統,其中當該檢索接ロ單元輸出多個檢索匹配記錄吋,其依序輸出該全匹配記錄及該部分匹配記錄,其中該全匹配記錄的優先順序大于該部分匹配記錄的優先順序。8.ー種自然語言理解系統,包括 一自然語言處理器,用以將ー用戶的一請求信息,分析成至少一可能意圖語法數據,每一可能意圖語法數據包括至少ー關鍵字及一意圖數據; 一知識輔助理解模塊,耦接該自然語言處理器,用以求得該至少一可能意圖語法數據中的一確定意圖語法數據,以表達該用戶的該請求信息的意圖;以及 一檢索系統,包括 一結構化數據庫,用以儲存具有一數據結構的多個記錄;以及 ー搜尋引擎,用以對該結構化數據庫進行一全文檢索,該數據結構包括ー標題欄,該標題欄內包括至少一分欄,每一分欄包括一指引欄以及一數值欄,該些記錄的該指引欄儲存一指引數據,該些記錄的該數值欄儲存ー數值數據, 其中,該知識輔助理解模塊傳送該關鍵字給該檢索系統,藉由該檢索系統的回應,以輔助求得該確定意圖語法數據。9.如權利要求8所述的自然語言理解系統,其中該數據結構還包括一內容欄,該些記錄的該內容欄儲存各該些記錄的內容細節數據。10.如權利要求8所述的自然語言理解系統,其中當該些記錄的該標題欄中儲存有多個該分欄的數據時,于各該分欄的數據間儲存ー第一特殊字符,用以分隔各該分欄的數據,于該指引欄與該數值欄的數據間儲存ー第二特殊字符,用以分隔該指引欄與該數值欄的數據。11.如權利要求8所述的自然語言理解系統,其中該標題欄中的該分欄具有固定位數。12.如權利要求8所述的自然語言理解系統,其中該檢索系統還包括一檢索接ロ単元,耦接該搜尋引擎以及該知識輔助理解模塊,用以接收該關鍵字來傳送給該搜尋引擎,藉以讓該搜尋引擎對該些記錄的該標題欄進行該全文檢索,以及反應該搜尋引擎的一匹配結果,輸出該些記錄中的至少ー檢索匹配記錄,該知識輔助理解模塊藉由比對該至少ー檢索匹配記錄中該標題欄所儲存的該指引數據與該至少一可能意圖語法數據所包括的該意圖數據,從而判斷出該用戶的該請求信息的意圖。13.如權利要求12所述的自然語言理解系統,其中該檢索匹配記錄為與該關鍵字完全匹配的一全匹配記錄或與該關鍵字部分匹配的一部分匹配記錄。1...
【專利技術屬性】
技術研發人員:張國峰,朱逸斐,
申請(專利權)人:威盛電子股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。