【技術實現步驟摘要】
本專利技術涉及通信領域,特別是涉及一種語音基音頻率檢測方法和裝置。
技術介紹
人類語音由清音和濁音構成。清音是氣流通過口徑縮小的聲門,氣流高速沖過產生湍流引起的摩擦音,這種音在語音中占的比例較少,發聲時聲帶不振動,因此沒有周期性,類似于寬帶噪音;濁音呼氣使聲帶靠攏發聲顫動時發出的具有周期性的聲音,這種聲音在頻率構成上由一個基音和一系列諧音構成,基音的頻率就是聲音周期的倒數。音頻頻率在語音信號處理中是最基本的參數之一,它在語音信號的分析、合成、編碼、識別等各項應用中起著非常重要的作用。在語音的基音頻率檢測方面,已經有很多相關研究成果,這些成果大多基于相關性的檢測,即通過時域、頻域或者信號的預測殘差的自相關函數來得到相關性峰值所在的延遲采樣數或者離散頻率數。基于自相關的方法有以下幾個缺陷,首先是自相關的計算量較大;其次檢測出的周期采樣數是整數,其對應的頻率便是一組離散數,精度不足,這在基音頻率較高時問題突出;三,自相關函數的峰值判斷困難,多數情況下會有多個峰對應著基頻、諧頻或干擾噪聲,這常常導致基頻判斷錯誤。
技術實現思路
本專利技術要解決的技術問題是提供一種語音基音頻率檢測方法和裝置。通過利用具有較大能量的單調分量作為基音檢測的基礎,能夠提高基音檢測在有噪環境下的準確率。根據本專利技術的一個方面,提供一種語音基音頻率檢測方法,包括:檢測語音信號幀中的單調分量;利用頻譜幅值 ...
【技術保護點】
一種語音基音頻率檢測方法,其特征在于,包括:檢測語音信號幀中的單調分量;利用頻譜幅值最大的M個單調分量的頻率確定候選基頻,并將候選基頻放置在候選基頻集合中;計算候選基頻集合中每個候選基頻的和諧判據;將具有最大和諧判據的候選基頻作為所述語音信號幀的基頻。
【技術特征摘要】
1.一種語音基音頻率檢測方法,其特征在于,包括:
檢測語音信號幀中的單調分量;
利用頻譜幅值最大的M個單調分量的頻率確定候選基頻,并將候
選基頻放置在候選基頻集合中;
計算候選基頻集合中每個候選基頻的和諧判據;
將具有最大和諧判據的候選基頻作為所述語音信號幀的基頻。
2.根據權利要求1所述的方法,其特征在于:
檢測語音信號幀中的單調分量的步驟包括:
針對語音信號幀中的每一個頻譜幅值XA[k],若XA[k]同時大于
XA[k-1]和XA[k+1],則將XA[k]作為單調分量,其中k為頻譜序號索
引。
3.根據權利要求2所述的方法,其特征在于:
若XA[k]同時大于XA[k-1]和XA[k+1],進一步判斷XA[k]與所述語
音信號幀中的最大頻譜幅值的比值是否大于幅度閾值;
若XA[k]與所述語音信號幀中的最大頻譜幅值的比值大于幅度閾
值,則執行將XA[k]作為單調分量的步驟。
4.根據權利要求2或3所述的方法,其特征在于:
頻譜序號索引k的取值范圍為大于索引下限int[flowN/fs],小于索引
上限int[fhi...
【專利技術屬性】
技術研發人員:吳晟,林福輝,徐晶明,蔣斌,
申請(專利權)人:展訊通信上海有限公司,
類型:發明
國別省市:上海;31
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。