本發明專利技術的聲音識別裝置及導航裝置對從作為聲音識別對象詞匯的地址數據中分割出來的單詞的出現頻度在規定值以上的單詞生成聲音識別詞典,并將輸入聲音的聲學特征的時間序列與聲音識別詞典進行對照,并從聲音識別詞典中確定出最有可能成為輸入聲音的單詞序列,并對確定出的單詞序列與地址數據進行部分一致的對照,將部分一致的語句作為聲音識別結果。
【技術實現步驟摘要】
【國外來華專利技術】
本專利技術涉及一種車載用的導航裝置等所使用的聲音識別裝置以及具備該聲音識別裝置的導航裝置。
技術介紹
例如,在專利文獻I中公開了一種基于大規模語法的聲音識別方法。在該聲音識別方法中,將輸入聲音轉換成聲學特征的序列,并將該序列與由規定的語法所規定的單詞序列的聲學特征的集合進行比較,從而將與由該語法所定義的語句最一致的序列識別為是所發出的輸入聲音。現有技術文獻專利文獻專利文獻1:日本專利特開平7-219578號公報
技術實現思路
專利技術所要解決的技術問題在日本、中國等,由于使用漢字等,文字較為多樣,另外,由于在對地址進行聲音識別時,有時會在地址中使用建筑物所固有的公寓名稱,因此,若將所有地址均包括到識別詞典中,識別詞典的容量會變大,從而會導致識別性能變差,還會產生識別時間變長的問題。另外,在專利文獻I所代表的現有技術中,在所使用的文字較為多樣、或識別對象中包含有公寓名稱等固有名詞時,語法存儲單元及單詞詞典存儲單元的容量會變得非常大,對這些單元進行訪問的次數也會增多,使得識別時間變長。本專利技術是為了解決上述問題而完成的,其目的在于,得到一種聲音識別裝置及包括該聲音識別裝置的導航裝置,該聲音識別裝置能夠減小聲音識別詞典的容量,并能夠由此來實現識別處理的高速化。解決技術問題所采用的技術方案本專利技術所涉及的聲音識別裝置,包括:聲學分析部,該聲學分析部對輸入聲音的聲音信號進行聲學分析,并將其轉換成聲學特征的時間序列;詞匯存儲部,該詞匯存儲部存儲聲音識別對象的詞匯;單詞分割部,該單詞分割部從存儲在詞匯存儲部中的詞匯中分割出單詞;出現頻度計算部,該出現頻度計算部對由單詞分割部分割出來的單詞的出現頻度進行計算;識別詞典生成部,該識別詞典生成部對由出現頻度計算部所計算出的出現頻度在規定值以上的單詞生成聲音識別詞典;聲學數據匹配部,該聲學數據匹配部對由聲學分析部獲取到的輸入聲音的聲學特征的時間序列與由識別詞典生成部生成的聲音識別詞典進行對照,并從聲音識別詞典中確定出最有可能成為輸入聲音的單詞序列;以及部分一致對照部,該部分一致對照部將由聲學 數據匹配部確定出的單詞序列與詞匯存儲部所存儲的詞匯進行部分一致的對照,并將詞匯存儲部所存儲的詞匯中、與由聲學數據匹配部所確定出的單詞序列部分一致的語句作為聲音識別結果。專利技術效果根據本專利技術,具有如下效果:能減小聲音識別詞典的容量,由此能實現識別處理的高速化。附圖說明圖1是表示本專利技術的實施方式I所涉及的聲音識別裝置的結構的框圖。圖2是表示實施方式I所涉及的聲音識別詞典的生成處理的流程的流程圖以及在各處理中所處理的數據示例的圖。圖3是表示實施方式I中的聲音識別裝置所使用的聲音識別詞典的一個示例的圖。圖4是表示實施方式I所涉及的聲音識別處理的流程的流程圖以及在各處理中所處理的數據示例的圖。圖5是表示本專利技術的實施方式2所涉及的聲音識別裝置的結構的框圖。圖6是表示實 施方式2所涉及的聲音識別詞典的生成處理的流程的流程圖以及在各處理中所處理的數據示例的圖。圖7是表示實施方式2所涉及的聲音識別裝置所使用的聲音識別詞典的一個示例的圖。圖8是表示實施方式2所涉及的聲音識別處理的流程的流程圖以及在各處理中所處理的數據示例的圖。圖9是用于對在實施方式2所涉及的聲音識別裝置的聲音識別詞典中所進行的路徑搜索的一個示例進行說明的圖。圖10是表示實施方式2所涉及的聲音識別處理的其它示例的流程圖以及在各處理中所處理的數據示例的圖。圖11是用于對在實施方式2所涉及的聲音識別裝置的聲音識別詞典中所進行的路徑搜索的另一個示例進行說明的圖。圖12是表示本專利技術的實施方式3所涉及的聲音識別裝置的結構的框圖。圖13是表不實施方式3中的聲音識別詞典的一個不例的圖。圖14是表示實施方式3所涉及的聲音識別處理的流程的流程圖以及在各處理中所處理的數據示例的圖。圖15是表示本專利技術的實施方式4所涉及的聲音識別裝置的結構的框圖。圖16是對實施方式4所涉及的聲音識別裝置中所使用的特征矩陣的一個示例進行說明的圖。圖17是對實施方式4所涉及的聲音識別裝置中所使用的特征矩陣的另一個示例進行說明的圖。圖18是表示實施方式4所涉及的聲音識別處理的流程的流程圖以及在各處理中所處理的數據示例的圖。圖19是用于對在實施方式4所涉及的聲音識別裝置的聲音識別詞典中所進行的路徑搜索進行說明的圖。圖20是表示本專利技術的實施方式5所涉及的聲音識別裝置的結構的框圖。圖21是表示實施方式5所涉及的聲音識別裝置中所使用的由音節構成的聲音識別詞典的一個示例的圖。圖22是表示實施方式5所涉及的音節化后的地址數據的生成處理流程的流程圖以及在各處理中所處理的數據示例的圖。圖23是表示實施方式5所涉及的聲音識別處理的流程的流程圖以及在各處理中所處理的數據示例的圖。具體實施例方式下面,為了對本專利技術進行更詳細的說明,參照附圖對用于實施本專利技術的實施方式進行說明。實施方式I圖1是表示本專利技術的實施方式I所涉及的聲音識別裝置的結構的框圖,示出了一種對用戶所說出的地址進行聲音識別的裝置。圖1中,實施方式I所涉及的聲音識別裝置I包括聲音識別處理部2以及聲音識別詞典生成部3。聲音識別處理部2是對由麥克風21所獲取到的聲音進行聲音識別的結構部,包括:麥克風21、聲音獲取部22、聲學分析部23、聲學數據匹配部24、聲音識別詞典存儲部25、地址數據對照部26、地址數據存儲部27、以及結果輸出首28。另外,聲音識別詞典生成部3是生成聲音識別詞典存儲部25中所存儲的聲音識別詞典的結構部,該聲音識別詞典生成部3具有聲音識別詞典存儲部25及地址數據存儲部27以作為與聲音識別處理部2共用的結構,作為其它結構,還包括單詞分割部31、出現頻度計算部32、以及識別詞典生成部33。用戶所說出的表示 地址的聲音被麥克風21獲取,并由聲音獲取部22將其轉換成數字信號的聲音信號。聲學分析部23中,對從聲音獲取部22輸出的聲音信號進行聲學分析,并將其轉換成輸入聲音聲學特征的時間序列。聲學數據匹配部24對由聲學分析部23獲取到的輸入聲音的聲學特征的時間序列、與存儲在聲音識別詞典存儲部25中的聲音識別詞典進行對照,并輸出最有可能的識別結果。聲音識別詞典存儲部25是儲存聲音識別詞典的存儲部,該聲音識別詞典表現為與輸入聲音聲學特征的時間序列進行對照的單詞網絡。地址數據對照部26對由聲學數據匹配部24獲取到的識別結果與存儲在地址數據存儲部27中的地址數據進行開頭部分一致的對照。地址數據存儲部27中存儲有地址數據,該地址數據表示聲音識別的對象、即地址的單詞序列。將在地址數據對照部26所進行的對照中部分一致的地址數據輸入結果輸出部28,并將該地址數據所表示的地址作為最終識別結果進行輸出。單詞分割部31是從存儲于詞匯存儲部即地址數據存儲部27中的地址數據中分割出單詞的結構部。出現頻度計算部32是對單詞分割部31所分割出的單詞的頻度進行計算的結構部。識別詞典生成部33對由單詞分割部31分割出的單詞中、由出現頻度計算部32計算出的出現頻度較高(規定閾值以上)的單詞生成聲音識別詞典,并將其儲存到聲音識別詞典存儲部25中。接下來對動作進行說明。(I)聲音識別詞典的生成圖2是表示實施方式I所涉及的聲音識別詞典的生成處理流程的流程圖以及在各處理中所處理的數據示例的圖,本文檔來自技高網...
【技術保護點】
【技術特征摘要】
【國外來華專利技術】
【專利技術屬性】
技術研發人員:丸田裕三,石井純,
申請(專利權)人:三菱電機株式會社,
類型:
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。