本發明專利技術涉及識別裝置、識別方法、生成裝置和生成方法。根據本發明專利技術的識別裝置包括存儲器、第一計算單元、第二計算單元和確定單元。存儲器存儲語句中包括的詞和指示詞在語句中的位置的位置信息。第一計算單元將輸入語音信號與連接存儲器中存儲的多個詞的字符串的閱讀信息相比較以計算相似度。第二計算單元基于存儲器中存儲的詞的位置信息來計算指示多個連接的詞之間接近度的連接得分。確定單元基于相似度和連接得分來確定對應于語音信號的字符串。
【技術實現步驟摘要】
在此討論的實施例針對的是識別裝置、識別程序、識別方法、生成裝置、生成程序和生成方法。
技術介紹
存在使用文件或網絡頁面中包括的文本來識別輸入語音的裝置。上述裝置的例子包括這樣一種裝置,該裝置計算指示輸入語音的語音信號和文本中包括的詞或其中詞被連接的字符串之間的相似度,并且將計算的相似度超過閾值時的詞或字符串判斷為對應于語音信號的詞或字符串。進一步,使用文本來識別輸入語音的裝置的另一個例子包括這樣一種裝置,該裝置生成文本中包括的詞的所有連接模式,并且將生成的連接模式登記在詞典(dictionary)中,所述詞典可以用來識別語音以生成詞典。生成詞典的裝置將詞典中登記的連接模式與指示輸入語音的語音信號相比較以識別語音。另外,當文本中包括的詞的數目為η時,生成詞典的裝置生成多至I至η之和的連接模式。進而,使用文本來識別輸入語 音的裝置的另一個例子包括通過N元語法(N-gram)來重新訓練語言模型的裝置。相對于從語料庫訓練的語言模型,重新訓練語言模型的裝置增加了文本中的連接詞相對于其中詞被連接的詞串的概率。在這種情況下,重新訓練語言模型的裝置生成了多至文本中出現的詞的數目的N次冪的模式,并且使用生成的模式增加了相對于語言模型連接的詞的概率。專利文件1:日本公開專利公布第2002-41081號專利文件2 :日本公開專利公布第2002-342323號然而,根據現有技術的裝置沒有精確地識別語音。根據特定的例子,當沒有登記在詞典中作為連接模式的語音被輸入時,上面提到的生成詞典的裝置的輸入語音的識別結果的精確度低。這是因為即使文本中包括的相鄰詞的組合的模式包括在詞典中登記的連接模式中,包括在文本中但不彼此相鄰的詞的組合的模式并沒有包括在詞典中登記的連接模式中。進一步,在上面提到的重新訓練語言的裝置中,由于模式被生成得多至文本中出現的詞的數目的N次冪,所以將要生成的模式的信息量很大。因此,本專利技術的實施例的一方面的目標是要提供能夠精確地識別語音的識別裝置、識別程序、識別方法、生成裝置、生成程序和生成方法。
技術實現思路
根據實施例的一方面,一種識別裝置包括存儲器和耦合到存儲器的處理器。存儲器存儲語句中包括的詞和指示詞在語句中的位置的位置信息。處理器執行包括以下步驟的過程將輸入語音信號與連接存儲器中存儲的多個詞的字符串的閱讀信息相比較以計算相似度;基于存儲器中存儲的詞的位置信息,計算指示多個連接的詞之間接近度的連接得分; 以及基于相似度和連接得分,確定對應于語音信號的字符串。附圖說明圖1是圖示根據第一實施例的包括識別裝置和生成裝置的系統的配置例子的示圖;圖2是圖示根據第一實施例的生成裝置的功能配置例子的示圖;圖3是圖示詞典的例子的示圖;圖4是圖示根據第一實施例的識別裝置的功能配置例子的示圖;圖5是圖示根據第一實施例的生成處理序列的流程圖;圖6是圖示根據第一實施例的識別處理序列的流程圖;圖7是圖示根據第二實施例的生成裝置的功能配置例子的示圖;圖8是圖示詞典的例子的示圖;圖9是圖示根據第二實施例的識別裝置的功能配置例子的示圖;圖10是圖示根據第二實施例的生成處理序列的流程圖;圖11是圖示根據第二實施例的識別處理序列的流程圖;圖12是圖示根據第三實施例的識別裝置的功能例子的示圖;圖13是圖示語言模型的例子的示圖;圖14是圖不詞詞典(word dictionary)的例子的不圖;圖15是圖示根據第三實施例的識別處理序列的流程圖;圖16是圖示根據第四實施例的生成裝置的配置例子的示圖;圖17是圖示詞類號碼表的例子的示圖;圖18是圖示詞典的例子的示圖;圖19是圖示根據第四實施例的識別裝置的配置例子的示圖;圖20是圖示概率表的例子的示圖;圖21是圖示根據第四實施例的生成處理序列的流程圖;圖22是圖示根據第四實施例的識別處理序列的流程圖;圖23是圖示執行生成程序的計算機的示圖;以及圖24是圖示執行識別程序的計算機的示圖。具體實施例方式參考附圖來說明本專利技術的優選實施例。然而,實施例沒有限制公開的技術。因此,在實施例中,處理可以被適當地組合而沒有抵觸。[第一實施例]描述根據第一實施例的識別裝置和生成裝置。圖1是圖示根據第一實施例的包括識別裝置和生成裝置的系統的配置例子的示圖。根據本實施例的系統I包括生成裝置10和識別裝置20。生成裝置10和識別裝置20經由網絡30連接。生成裝置10可以與識別裝置20通信。在圖1的例子中,在系統I中包括一個生成裝置10和一個識別裝置20。然而,生成裝置10的數目和識別裝置20的數目不限于此。例如,可以提供多個生成裝置10和多個識別裝置20。生成裝置10生成詞典,語句中包括的詞被登記在所述詞典中,以便與指示詞在語句中的位置的位置信息相關聯。例如,首先生成裝置10將輸入文本文件所指示的語句分割成詞。語句也被稱為文本。因此,生成裝置10生成指示分割的詞在語句中的位置的位置信息。接著,生成裝置10生成詞典,詞被登記在所述詞典中,以便與指示詞在語句中的位置的位置信息相關聯。生成裝置10將生成的詞典傳送到識別裝置20。識別裝置20接收從生成裝置10傳送的詞典。識別裝置20將輸入語音信號與連接詞典中登記的多個詞的字符串的閱讀信息相比較以計算相似度。接著,基于詞典中登記的詞的位置信息,識別裝置20計算指示多個連接詞之間接近度的連接得分。因此,基于相似度和連接得分,識別裝置20確定對應于輸入語音信號的字符串。進一步,識別裝置20輸出確定的字符串。如上所述,識別裝置20計算指示被用來計算相似度的字符串的多個詞之間的接近度的連接得分。例如,識別裝置20計算連接得分,以便隨著被用來計算相似度的字符串的多個詞彼此越接近而越高。因此,識別裝置20通過不僅相加相似度而且還相加連接得分來確定對應于輸入語音信號的字符串。例如,識別裝置20將與通過相加相似度和連接得分而獲得的值中超過閾值的值相對于的字符串確定為對應于輸入語音信號的字符串。因此,即使當發聲者發出具有多個連接詞的字符串,所述連接詞包括在語句中但在語句中沒有彼此相鄰,并且字符串被輸入作為語音信號時,識別裝置20也可以識別發聲者發出的語音。因此,識別裝置20允許對語音的精確識別。進一步,如上所述,生成裝置10可以生成詞典,所述詞典允許對語音的精確識別。生成裝置的功能配置的例子圖2是圖示根據第一實施例的生成裝置的功能配置例子的示圖。在圖2的例子中,生成裝置10包括輸入單元11、輸出單元12、通信單元13、存儲器單元14和控制器15。輸入單元11將各種信息輸入到控制器15。例如,輸入單元11接收用戶的指令,以從別的裝置獲得包括與預定主題相關的語句的文本文件,并且將接收的指令輸入到控制器15。輸入單元11的裝置的例子包括鼠標或鍵盤。輸出單元12輸出各種信息。例如,當從控制器15輸入圖像時,輸出單元12顯示圖像。輸出單元12的裝置的例子包括陰極射線管(CRT)或液晶顯示器。通信單元13是網絡接口,用于與識別裝置20和外部裝置通信。例如,當從控制器15接收到關于將包括與預定主題相關的語句的文本文件傳送到生成裝置10的外部裝置的指令時,通信單元13經由網絡30將接收到的指令傳送到外部裝置。進一步,當從外部裝置接收到文本文件時,通信單元13將接收到的文本文件傳送到控制器15。存儲器單元14存儲本文檔來自技高網...
【技術保護點】
一種識別裝置,包括:存儲器,其存儲語句中包括的詞和指示所述詞在所述語句中的位置的位置信息;第一計算單元,其將輸入的語音信號與連接所述存儲器中存儲的多個詞的字符串的閱讀信息相比較以計算相似度;第二計算單元,其基于所述存儲器中存儲的詞的位置信息來計算指示多個連接的詞之間接近度的連接得分;以及確定單元,其基于所述相似度和所述連接得分來確定對應于所述語音信號的字符串。
【技術特征摘要】
2011.10.12 JP 2011-2253441.一種識別裝置,包括 存儲器,其存儲語句中包括的詞和指示所述詞在所述語句中的位置的位置信息; 第一計算單元,其將輸入的語音信號與連接所述存儲器中存儲的多個詞的字符串的閱讀信息相比較以計算相似度; 第二計算單元,其基于所述存儲器中存儲的詞的位置信息來計算指示多個連接的詞之間接近度的連接得分;以及 確定單元,其基于所述相似度和所述連接得分來確定對應于所述語音信號的字符串。2.根據權利要求1所述的識別裝置,其中,所述存儲器進一步存儲其中多個詞被耦合的詞串和指示所述詞串在所述語句中的位置的位置信息, 所述第一計算單元使用所述詞串作為詞來計算所述相似度,并且 所述第二計算單元使用所述詞串作為詞來計算所述連接得分。3.根據權利要求1或2所述的識別裝置,其中,所述存儲器進一步存儲用于標識短語的標識信息,以便與所述語句中包括的短語相關聯,并且 基于所述存儲器中存儲的詞的位置信息和標識信息,所述第二計算單元針對每一個短語計算指示多個連接的詞之間接近度的連接得分。4.根據權利要求1所述的識別裝置,其中,所述存儲器進一步存儲指示第二詞連接到第一詞的概率的信息,并且 基于所述存儲器中存儲的指示第二詞連接到第一詞的概率的信息,所述第二計算單元進一步校正所述連接得分。5.根據權利要求2所述的識別裝置,其中,所述存儲器進一步存儲指示第二詞連接到第一詞的概率的信息,并且 基于所述存儲器中存儲的指示第二詞連接到第一詞的概率的信息,所述第二計算單元進一步校正所述連接得分。6.根據權利要求3所述的識別裝置,其中,所述存儲器進一步存儲指示第二詞連接到第一詞的概率的信息,并且 基于所述存儲器中存儲的指示第二詞連接到第一詞的概率的信息,所述第二計算單元進一步校正所述連接得分。7.根據權利要求1所述的識別裝置,其中,所述存儲器進一步存儲關于多個連接的詞的詞類組合適合性的信息,并且 基于所述存儲器中存儲的關于多...
【專利技術屬性】
技術研發人員:原田將治,
申請(專利權)人:富士通株式會社,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。