【技術實現步驟摘要】
本專利技術涉及一種基音檢測的方法和裝置,尤其涉及一種高精確度、運算復雜度較低的基音檢測方法和裝置。
技術介紹
在數字通信領域,語音、圖像、音頻、視頻的傳輸有著非常廣泛的應用需求,如手機通話、音視頻會議、廣播電視、多媒體娛樂等。為了降低音視頻信號存儲或者傳輸過程中占用的資源,音視頻壓縮編碼技術應運而生。在語音與音頻信號處理中,基音檢測是各種語音與音頻實際應用中的關鍵技術之一,在語音編碼,語音識別,音調檢索中基音都是重要的提取參數,基音檢測的準確性直接影響最后編碼的性能。對于基音周期的檢測,現有技術中,一般采用兩種方法一種方法是時域法,通過對語音信號進行預處理后,在時域對輸入信號進行分析和計算,確定基音周期。因為語音信號在時域內對語音信號進行基音檢測,大多采用的是相關函數法,只在時域內對語音信號的相關值進行檢測,而語音信號在真正基音周期整數倍上的相關值都會很大,很難進行準確區分檢測,容易出現基音周期加倍錯誤,從而降低了基音參數檢測的精度。另一種方法是頻域法,是將時域信號轉換到頻域,并在頻域上進行峰值檢測;根據檢測到的峰值和基音跟蹤算法,得到基音頻率;對該基音頻率進行相應的轉換,獲得基音周期。在此過程中,將時域信號轉換到頻域并在頻域進行基音搜索的運算復雜度較高,在實際應用中很難被采用。
技術實現思路
本專利技術的實施例提供一種精確度高、運算復雜度較低的基音檢測方法和裝置。為達到上述目的,本專利技術的實施例采用如下技術方案一種基音檢測的方法,包括在時域對所述語音信號進行基音檢測,得到初始基音周期;將所述語音信號轉換到頻域,獲得語音信號的頻譜,該頻譜包括頻譜的幅度譜; ...
【技術保護點】
一種基音檢測的方法,其特征在于,包括:在時域對所述語音信號進行基音檢測,得到初始基音周期;將所述語音信號轉換到頻域,獲得語音信號的頻譜,該頻譜包括頻譜的幅度譜;根據初始基音周期和所述語音信號的頻譜提取特征參數;根據初始基音周期和特征參數進行精細基音周期檢測,得到精細基音周期。
【技術特征摘要】
1.一種基音檢測的方法,其特征在于,包括 在時域對所述語音信號進行基音檢測,得到初始基音周期; 將所述語音信號轉換到頻域,獲得語音信號的頻譜,該頻譜包括頻譜的幅度譜; 根據初始基音周期和所述語音信號的頻譜提取特征參數; 根據初始基音周期和特征參數進行精細基音周期檢測,得到精細基音周期。2.根據權利要求I所述的一種基音檢測的方法,其特征在于,所述特征參數,包括平均幅度參數,平均幅度與頻點幅度的比值參數和峰值位置參數。3.根據權利要求I所述的一種基音檢測的方法,其特征在于,所述根據初始基音周期和特征參數進行精細基音周期檢測,得到精細基音周期,還包括根據平均幅度與頻點幅度的比值參數值大小和平均幅度參數值大小進行判斷或者根據平均幅度與頻點幅度的比值參數值大小和緩存中所存儲的當前幀之前倍頻的判斷結果進行判斷。4.根據權利要求3所述的一種基音檢測的方法,其特征在于,所述根據平均幅度與頻點幅度的比值參數值大小和平均幅度參數值大小進行判斷,包括 判斷基頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第一默認值; 如果基頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值大于第一默認值,則判斷二倍頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第二默認值; 如果二倍頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值大于第二默認值,則判斷三倍頻點平均幅度參數值與基頻點平均幅度參數值的差值是否大于第三默認值; 如果三倍頻點平均幅度參數值與基頻點平均幅度參數值的差值大于第三默認值,則確定三倍頻為所需要的精細基音頻率。5.根據權利要求3所述的一種基音檢測的方法,其特征在于,所述根據平均幅度與頻點幅度的比值參數值大小和緩存中所存儲的當前幀之前倍頻的判斷結果進行判斷,包括 判斷基頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第四默認值; 如果基頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值大于第四默認值,則判斷二倍頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第五默認值; 如果二倍頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值大于第五默認值,則判斷前一幀是否發生基音周期三倍錯誤; 如果前一幀發生基音周期三倍錯誤,則判斷當前幀之前發生基音周期三倍錯誤的次數是否大于第六默認值; 如果當前幀之前發生基音周期三倍錯誤的次數大于第六默認值,則確定三倍頻為所需要的精細基音周期。6.根據權利要求3所述的一種基音檢測的方法,其特征在于,所述根據平均幅度與頻點幅度的比值參數值大小和平均幅度參數值大小進行判斷,還包括 判斷基頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第七默認值; 如果基頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值大于第七默認值,則判斷三倍頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第八默認值; 如果三倍頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值大于第八默認值,則判斷二倍頻點平均幅度參數值與基頻點平均幅度參數值的差值是否大于第九默認值; 如果二倍頻點平均幅度參數值與基頻點平均幅度參數值的差值大于第九默認值,則確定二倍頻為所需要的精細基音頻率。7.根據權利要求3所述的一種基音檢測的方法,其特征在于,所述根據平均幅度與頻點幅度的比值參數值大小和緩存中所存儲的當前幀之前倍頻的判斷結果進行判斷,還包括 判斷基頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第十默認值; 如果基頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值大于第十默認值,則判斷三倍頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第十一默認值; 如果三倍頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值大于第十一默認值,則判斷前一幀是否發生基音周期二倍錯誤; 如果前一幀發生基音周期二倍錯誤,則判斷當前幀之前發生基音周期二倍錯誤的次數是否大于第十二默認值; 如果當前幀的之前發生基音周期二倍錯誤的次數大于第十二默認值,則確定二倍頻為所需要檢測的精細基音頻率。8.根據權利要求I所述的一種基音檢測的方法,其特征在于,在所述根據初始基音周期和所述語音信號的頻譜提取特征參數之前,包括 為所述頻譜的幅度譜進行插值,獲取所述語音信號的高密度幅度譜。9.根據權利要求8所述的一種基音檢測的方法,其特征在于,所述插值,包括三次B樣條插值 /(X)=[唞V^3(X-A),其中f(x)為待插值信號,c(k)為三次B樣插值系數,β3(χ)k^Z為三次B樣條基函數。10.根據權利要求9所述的一種基音檢測的方法,其特征在于,在...
【專利技術屬性】
技術研發人員:齊峰巖,苗磊,阿里斯·塔勒布,
申請(專利權)人:華為技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。