The invention discloses a speech recognition method comprises the steps of: cleaning, the original speech information acquiring user input; the first voice processing method for speech enhancement and filtering of the original speech information, get voice information processing; acoustic characteristics of speech information processing after the recognition of the second voice processing method according to the acoustics; feature extraction, first identify the speech recognition results; the first speech recognition results for error correction by cleaning the language model, second speech recognition results; second speech recognition results as speech recognition results are output. The invention improves the cleaning and error correcting capability of the computer to each stage of the speech recognition, and makes the processing result of the speech recognition more accurate.
【技術實現步驟摘要】
語音智能識別清洗方法
本專利技術涉及語音識別
,特別涉及語音智能識別清洗方法。
技術介紹
在近年來,語音識別技術取得顯著進步,已經從實驗室走向市場。在實際應用中,例如智能助理Siri,通過識別用戶的語音輸入信息,自動完成和用戶的交互。目前,進行語音識別時,環境噪聲對語音識別的識別率影響很大,同時,對原始語音信息的處理方法也會對識別結果有一定的影響,除此之外,不同的人還有發音習慣上的差別,使用單一聲學特征進行識別會是語音識別的識別率受到明顯影響。由于語音識別的識別率不夠高,導致使用語音進行大數據分析面臨較大的困難。
技術實現思路
為解決以上問題,本專利技術提供一種語音智能識別清洗方法,用以解決語音識別的識別率不高的問題,包括步驟:獲取用戶輸入的原始語音信息;利用第一語音處理方法對原始語音信息進行語音增強和濾波,得到處理后的語音信息;利用第二語音處理方法對處理后的語音信息中的聲學特征進行識別提?。桓鶕崛〉穆晫W特征,識別出第一語音識別結果;通過語言模型對第一語音識別結果進行清洗糾錯,得到第二語音識別結果;將第二語音識別結果作為語音識別結果進行輸出。優選的,所述第一語音處理方法,包括對原始語音信息進行語音增強,所用增強方法為減譜法,所用減譜公式為:PS(ω)=max{0,Py(ω)-[αPn1(ω)+(1-α)Pn2(ω)]}其中,PS(ω)為輸出語音信息的功率譜,Py(ω)為原始語音信息的功率譜,Pn1(ω)為發聲前的“寂靜段”的功率譜,Pn2(ω)為發聲結束后的“寂靜段”的功率譜,α為值在0到1之間的權重系數,t1為發聲前的“寂靜段”結束時的時間點,t2為 ...
【技術保護點】
一種語音智能識別清洗方法,其特征在于,包括如下步驟:獲取用戶輸入的原始語音信息;利用第一語音處理方法對原始語音信息進行語音增強和濾波,得到處理后的語音信息;利用第二語音處理方法對處理后的語音信息中的聲學特征進行識別提??;根據提取的聲學特征,識別出第一語音識別結果;通過語言模型對第一語音識別結果進行清洗糾錯,得到第二語音識別結果;將第二語音識別結果作為語音識別結果進行輸出。
【技術特征摘要】
1.一種語音智能識別清洗方法,其特征在于,包括如下步驟:獲取用戶輸入的原始語音信息;利用第一語音處理方法對原始語音信息進行語音增強和濾波,得到處理后的語音信息;利用第二語音處理方法對處理后的語音信息中的聲學特征進行識別提??;根據提取的聲學特征,識別出第一語音識別結果;通過語言模型對第一語音識別結果進行清洗糾錯,得到第二語音識別結果;將第二語音識別結果作為語音識別結果進行輸出。2.根據權利要求1所述的方法,其特征在于,包括:所述第一語音處理方法,包括對原始語音信息進行語音增強,所用增強方法為減譜法,所用減譜公式為:PS(ω)=max{0,Py(ω)-[αPn1(ω)+(1-α)Pn2(ω)]}其中,PS(ω)為輸出語音信息的功率譜,Py(ω)為原始語音信息的功率譜,Pn1(ω)為發聲前的寂靜段的功率譜,Pn2(ω)為發聲結束后的寂靜段的功率譜,α為值在0到1之間的權重系數,t1為發聲前的寂靜段結束時的時間點,t2為發聲結束后的寂靜段開始時的時間點,t為當前所要處理的語音信息的時間點。3.根據權利要求1所述的方法,其特征在于,包括:所述第一語音處理方法,包括對語音增強后...
【專利技術屬性】
技術研發人員:劉春明,
申請(專利權)人:上海云信留客信息科技有限公司,
類型:發明
國別省市:上海,31
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。