本實用新型專利技術涉及一種語音數據的測評裝置,語音數據的測評裝置包括:采集單元、提取單元、處理單元和映射單元;采集單元與提取單元相連接,提取單元與處理單元相連接,處理單元與映射單元相連接;采集單元采集測評漢語語音的測評發音數據;提取單元從測評發音數據中按照專家知識數據庫中的專家知識數據提取特征參數,從特征參數中查詢典型偏誤特征;處理單元根據特征參數得到客觀測評結果數據;映射單元將客觀測評結果數據利用評分映射關系進行映射處理得到主觀測評結果數據。語音數據的測評裝置利用語言生態學的方法,實現非漢語母語語音數據的準確的檢測和測評,從而有效的指導檢測者的發音。(*該技術在2022年保護過期,可自由使用*)
【技術實現步驟摘要】
本技術涉及ー種語音數據的測評裝置,尤其涉及ー種基于語言生態學的語音數據的測評裝置。
技術介紹
近年來,隨著語音識別等語音技術的進歩,計算機輔助語言學習技術作為ー個全新的交叉學科研究課題逐漸受到學術界和教育界的關注。現有的運用計算機進行普通話水平測試和指導學習的方法采用了以音段為單位建立普通話水平測試評分機制,采用語音識別的方法,計算參加普通話水平考試考生的得分,井指出考生的發音錯誤。但是現有技術有如下缺陷該技術主要針對我國的普通話水平考試應用,考生的母語基本為漢語,漢語發音水平很高,其方法不適合母語非漢語的漢語學習者的發音水平評價和發音指導;該技術過多的依賴于隱馬爾科夫模型等統計學方法,沒有針對漢語普通話學習者的母語(或方言)背景進行語音生態分析和相應的系統設計;該技術提出了發音錯誤分析和指導,但沒有給出具體的實現方法,導致系統功能并不能實現。
技術實現思路
本技術的目的是針對現有技術的缺陷,提供了ー種語音數據的測評裝置,可以有效的利用語言生態學來實現非漢語母語語音數據的檢測和測評,有效的分類得出不同情況的測評結果,指導發音。為實現上述目的,本技術提供了ー種語音數據的測評裝置,所述語音數據的測評裝置包括采集單元、提取單元、處理單元和映射単元;所述采集単元與所述提取単元相連接,所述提取単元與所述處理単元相連接,所述處理単元與所述映射単元相連接;所述采集單元采集測評漢語語音的測評發音數據;所述提取単元從所述測評發音數據中按照專家知識數據庫中的專家知識數據提取特征參數,從所述特征參數中查詢典型偏誤特征;所述處理単元根據所述特征參數得到客觀測評結果數據;所述映射単元將所述客觀測評結果數據利用評分映射關系進行映射處理得到主觀測評結果數據。所述語音數據的測評裝置還包括,用于根據所述主觀測評結果數據,依照所述典型偏誤特征,得到發音練習數據的生成単元,與所述映射単元相連接。本技術語音數據的測評裝置利用語言生態學的方法,實現非漢語母語語音數據的準確的檢測和測評,從而有效的指導檢測者的發音。附圖說明圖1為本技術語音數據的測評裝置的示意圖;圖2為本技術語音數據的測評裝置的處理方法流程圖;圖3為本技術語音數據的測評裝置的處理方法的示意圖;圖4為本技術語音數據的測評裝置中切除清音和靜音方法的示意圖;圖5為本技術語音數據的測評裝置中基音周期估計方法的示意圖;圖6為本技術語音數據的測評裝置中基音失真度計算方法的示意圖;圖7為本技術語音數據的測評裝置中共振峰失真度計算方法的示意圖;圖8為本技術語音數據的測評裝置中發音指導示意圖之ー;圖9為本技術語音數據的測評裝置中發音指導示意圖之ニ。具體實施方式下面通過附圖和實施例,對本技術的技術方案做進ー步的詳細描述。本技術是ー種利用計算機輔助下的漢語學習裝置,計算機輔助漢語學習方法分為前期準備和發音教學兩個階段第一個階段是基于語言生態調查的前期準備階段工作,對非漢語母語的漢語學習者的教學,起決定性的作用,包含了語音數據采集,語音數據分析和特征提取,獲取當地人學習漢語發音時的典型偏誤特征和專家知識。選取部分當地人漢語普通話語音庫語音和標準語音庫語音作為評分語音庫數據,最后利用評分語音庫中的特征向量,建立起特征向量與打分之間的評分映射。第二個階段是發音教學階段,首先對測試者的發音錄音進行處理,先進行特征提取、然后通過偏誤分析,客觀評分,在最后的發音教學単元中結合專家知識對測試者進行有針對性的教學。本技術就是所謂的第二個階段的具體過程,圖1為本技術語音數據的測評裝置的示意圖,如圖所示,本技術包括采集單元11、提取單元12、處理單元13和映射單元14。采集單元11與提取單元12相連接,提取單元12與處理單元13相連接,處理單元13與映射單元14相連接;采集單元11采集測評漢語語音的測評發音數據;提取單元12從測評發音數據中按照專家知識數據庫中的專家知識數據提取特征參數,從特征參數中查詢典型偏誤特征;處理單元13根據特征參數得到客觀測評結果數據;映射単元14將客觀測評結果數據利用評分映射關系進行映射處理得到主觀測評結果數據。再如圖1所示,本技術的語音數據的測評裝置還包括生成単元15,用于根據所述主觀測評結果數據,依照所述典型偏誤特征,得到發音練習數據的,與映射単元14相連接圖2為本技術語音數據的測評裝置的處理方法流程圖,圖3為本技術語音數據的測評裝置的處理方法的示意圖,如圖所示,具體包括如下步驟步驟101,采集單元采集測評漢語語音的測評發音數據;即采集非漢語母語的漢語語音測評發音數據,并且將該測評發音數據按照年齡和性別歸類。首先由發音測試者選擇屬于自己的地區,進而確定適用于測試者的計算機輔助漢語學習系統。然后對測試者的漢語測評發音數據進行采集。步驟102,提取單元從所述測評發音數據中按照專家知識數據庫中的專家知識數據提取特征參數,從所述特征參數中查詢典型偏誤特征;即據不同年齡和性別按照語音測評標準,從所述測評發音數據中提取特征參數,將所述特征參數進行統計和匹配得到所述典型偏誤特征。依據數據分析階段語音生態分析得到的專家知識進行特征參數選擇和權重設置,然后提取測試者語音數據特征參數。從所述測評發音數據中提取-MFCC信息、基音信息和共振峰信息。 由于語音信號是ー種典型的非平穩信號,加之呼吸氣流、外部噪音、電流干擾等使得語音信號不能直接用于提取特征,而要進行前期的預處理。經過預處理的語音數據就可以進行特征參數提取。預處理模塊包括預采樣和量化、預加重濾波、加窗分幀、端點檢測。預加重濾波器是ー個ー階高通濾波器。目的是濾除低頻干擾,提升語音信號的高頻部分,使信號的頻譜變得平坦,便于進行頻譜分析或聲道參數的分析。預加重濾波器一般形式如下H(z) = 1-uz ベ(1)其中,u的值接近于1,在本系統中u的值取為0. 97。語音信號在10_30ms內保持相對平穩,因此巾貞長一般取10_30ms,巾貞移通常為巾貞長的0 1/2。本系統巾貞長取25ms,巾貞移取5ms。加窗可以保持語音信號的短時平穩性,減少截斷導致的吉布斯效應。本系統采用漢明窗,窗函數如下 0.5-0.46 cos I-1 , 0<n<N-\Whm=\VN-IJ(2) 0, other端點檢測的基本參數主要有短時能量及平均幅度和過零率。設經加窗處理后得到的第η幀語音信號為xn(m),則xn(m)滿足下式xn(m) = w(m) x (n+m),N = 0,T,2T,L ;0 ^ m ^ N_1 (3)式中w(m)是窗函數,N是窗長;下標η = 0,1, L表示巾貞號。那么xn(m)的短時能量可以表示為 1 N-1Εη = —Σχ 2( )⑷ ゾ V m=0短時過零率(ZCR)表示ー幀語音信號波形穿過零點電平的次數,可通過如下公式計算ZCR = — Σ I sgn - sgn |(5)2 Π=1式中sgn 口是符號函數,即 r η [1 , X > 0sgn IXI = <{ L J い,x<0端點檢測算法采用雙門限算法,雙門限端點檢測包括短時能量檢測和短時過零率檢測,檢測之前分別為短時能量和過零率各設置ー個較高門限和本文檔來自技高網...
【技術保護點】
一種語音數據的測評裝置,其特征在于,所述語音數據的測評裝置包括:采集單元、提取單元、處理單元和映射單元;所述采集單元與所述提取單元相連接,所述提取單元與所述處理單元相連接,所述處理單元與所述映射單元相連接;所述采集單元采集測評漢語語音的測評發音數據;所述提取單元從所述測評發音數據中按照專家知識數據庫中的專家知識數據提取特征參數,從所述特征參數中查詢典型偏誤特征;所述處理單元根據所述特征參數得到客觀測評結果數據;所述映射單元將所述客觀測評結果數據利用評分映射關系進行映射處理得到主觀測評結果數據。
【技術特征摘要】
【專利技術屬性】
技術研發人員:孟子厚,韓衛生,謝凌云,潘興德,章斯宇,
申請(專利權)人:北京中傳天籟數字技術有限公司,
類型:實用新型
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。