• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基音檢測的方法和裝置制造方法及圖紙

    技術編號:8131492 閱讀:160 留言:0更新日期:2012-12-27 04:04
    本發明專利技術公開了一種基音檢測的方法和裝置,屬于語音與音頻領域。該基音檢測的方法,包括:在時域對所述語音信號進行基音檢測,得到初始基音周期;將所述語音信號轉換到頻域,獲得語音信號的頻譜,該頻譜包括頻譜的幅度譜;根據初始基音周期和所述語音信號的頻譜提取特征參數;根據初始基音周期和特征參數進行精細基音周期檢測,得到精細基音周期。

    【技術實現步驟摘要】

    本專利技術涉及一種基音檢測的方法和裝置,尤其涉及一種高精確度、運算復雜度較低的基音檢測方法和裝置。
    技術介紹
    在數字通信領域,語音、圖像、音頻、視頻的傳輸有著非常廣泛的應用需求,如手機通話、音視頻會議、廣播電視、多媒體娛樂等。為了降低音視頻信號存儲或者傳輸過程中占用的資源,音視頻壓縮編碼技術應運而生。在語音與音頻信號處理中,基音檢測是各種語音與音頻實際應用中的關鍵技術之一,在語音編碼,語音識別,音調檢索中基音都是重要的提取參數,基音檢測的準確性直接影響最后編碼的性能。對于基音周期的檢測,現有技術中,一般采用兩種方法一種方法是時域法,通過對語音信號進行預處理后,在時域對輸入信號進行分析和計算,確定基音周期。因為語音信號在時域內對語音信號進行基音檢測,大多采用的是相關函數法,只在時域內對語音信號的相關值進行檢測,而語音信號在真正基音周期整數倍上的相關值都會很大,很難進行準確區分檢測,容易出現基音周期加倍錯誤,從而降低了基音參數檢測的精度。另一種方法是頻域法,是將時域信號轉換到頻域,并在頻域上進行峰值檢測;根據檢測到的峰值和基音跟蹤算法,得到基音頻率;對該基音頻率進行相應的轉換,獲得基音周期。在此過程中,將時域信號轉換到頻域并在頻域進行基音搜索的運算復雜度較高,在實際應用中很難被采用。
    技術實現思路
    本專利技術的實施例提供一種精確度高、運算復雜度較低的基音檢測方法和裝置。為達到上述目的,本專利技術的實施例采用如下技術方案一種基音檢測的方法,包括在時域對所述語音信號進行基音檢測,得到初始基音周期;將所述語音信號轉換到頻域,獲得語音信號的頻譜,該頻譜包括頻譜的幅度譜;根據初始基音周期和所述語音信號的頻譜提取特征參數;根據初始基音周期和特征參數進行精細基音周期檢測,得到精細基音周期。一種基音檢測的裝置,包括初始基音周期獲取模塊用于在時域對所述語音信號進行基音檢測,得到初始基音周期;時頻轉換模塊用于將所述語音信號轉換到頻域,獲得語音信號的頻譜,該頻譜包括頻譜的幅度譜;特征參數提取模塊用于根據初始基音周期和所述語音信號的頻譜提取特征參數;精細基音周期獲取模塊用于根據初始基音周期和特征參數進行精細基音周期檢測,得到精細基音周期。本專利技術實施例提供的一種基音檢測的方法和裝置,根據在時域上獲取的初始基音周期和頻域中所提取的特征參數對基音周期進行檢測,避免基音周期加倍錯誤的出現,提高了基音周期檢測的精確度。附圖說明圖I為本專利技術實施例一種基音檢測的方法的流程 圖2為為本專利技術實施例一種基音檢測的方法語音信息加窗的結構示意圖;圖3為本專利技術實施例一種基音檢測的方法時頻轉換的流程圖;圖4為本專利技術實施例一種基音檢測的方法根據頻點平均幅度與頻點幅度的比值參數值和平均幅度參數值對三倍頻進行倍頻檢測的流程圖;圖5為本專利技術實施例一種基音檢測的方法根據頻點平均幅度與頻點幅度的比值參數值和平均幅度參數值對二倍頻進行倍頻檢測的流程圖;圖6為本專利技術實施例一種基音檢測的方法根據頻點平均幅度與頻點幅度的比值參數值和緩存數據對三倍頻進行倍頻檢測的流程圖;圖7為本專利技術實施例一種基音檢測的方法根據頻點平均幅度與頻點幅度的比值參數值和緩存數據對二倍頻進行倍頻檢測的流程圖;圖8為本專利技術實施例一種基音檢測的方法對幅度譜進行插值的流程圖;圖9為本專利技術實施例一種基音檢測的方法對語音信號進行補零的流程圖;圖10為本專利技術實施例一種基音檢測的方法對全頻域進行檢測的流程圖。圖11為本專利技術實施例一種基音檢測裝置的結構示意圖;圖12為本專利技術實施例2—種基音檢測的裝置時頻轉換模塊的結構示意圖;圖13為本專利技術實施例3—種基音檢測的裝置時頻轉換模塊的結構示意圖。具體實施例方式數字信號處理領域,音頻編解碼器、視頻編解碼器廣泛應用于各種電子設備中,例如移動電話,無線裝置,個人數據助理(PDA),手持式或便攜式計算機,GPS接收機/導航器,照相機,音頻/視頻播放器,攝像機,錄像機,監控設備等。通常,這類電子設備中包括音頻編碼器或音頻解碼器,音頻編碼器或者解碼器可以直接由數字電路或芯片例如DSP (digital signal processor)實現,或者由軟件代碼驅動處理器執行軟件代碼中的流程而實現。音頻編碼器中通常會有基音檢測的流程。下面結合附圖對本專利技術實施例一種基音檢測的方法進行詳細描述。實施例I一種基音檢測的方法,如圖I所示,包括步驟100、在時域對所述語音信號進行基音檢測,得到初始基音周期在時域中,可根據感知加權后的語音信號進行開環基音檢測,得到初始基因周期T,。步驟101、對所述語音信號進行預處理。對語音信號s (η)進行預處理,例如預加重處理,以加重語音信號中的高頻成分,提高語音編碼的精確度。完成對于語音信號的預處理后,得到預處理語音信號spM(η)。為將所述語音信號轉換到頻域,使基音檢測更加精確,則需要對該語音信號進行前期處理。步驟102、為所述預處理后的幀信號加分析窗。根據完成預處理的語音信號Spre (η),為所述預處理后的幀信號加分析窗,該分析窗函數為本文檔來自技高網...

    【技術保護點】
    一種基音檢測的方法,其特征在于,包括:在時域對所述語音信號進行基音檢測,得到初始基音周期;將所述語音信號轉換到頻域,獲得語音信號的頻譜,該頻譜包括頻譜的幅度譜;根據初始基音周期和所述語音信號的頻譜提取特征參數;根據初始基音周期和特征參數進行精細基音周期檢測,得到精細基音周期。

    【技術特征摘要】
    1.一種基音檢測的方法,其特征在于,包括 在時域對所述語音信號進行基音檢測,得到初始基音周期; 將所述語音信號轉換到頻域,獲得語音信號的頻譜,該頻譜包括頻譜的幅度譜; 根據初始基音周期和所述語音信號的頻譜提取特征參數; 根據初始基音周期和特征參數進行精細基音周期檢測,得到精細基音周期。2.根據權利要求I所述的一種基音檢測的方法,其特征在于,所述特征參數,包括平均幅度參數,平均幅度與頻點幅度的比值參數和峰值位置參數。3.根據權利要求I所述的一種基音檢測的方法,其特征在于,所述根據初始基音周期和特征參數進行精細基音周期檢測,得到精細基音周期,還包括根據平均幅度與頻點幅度的比值參數值大小和平均幅度參數值大小進行判斷或者根據平均幅度與頻點幅度的比值參數值大小和緩存中所存儲的當前幀之前倍頻的判斷結果進行判斷。4.根據權利要求3所述的一種基音檢測的方法,其特征在于,所述根據平均幅度與頻點幅度的比值參數值大小和平均幅度參數值大小進行判斷,包括 判斷基頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第一默認值; 如果基頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值大于第一默認值,則判斷二倍頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第二默認值; 如果二倍頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值大于第二默認值,則判斷三倍頻點平均幅度參數值與基頻點平均幅度參數值的差值是否大于第三默認值; 如果三倍頻點平均幅度參數值與基頻點平均幅度參數值的差值大于第三默認值,則確定三倍頻為所需要的精細基音頻率。5.根據權利要求3所述的一種基音檢測的方法,其特征在于,所述根據平均幅度與頻點幅度的比值參數值大小和緩存中所存儲的當前幀之前倍頻的判斷結果進行判斷,包括 判斷基頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第四默認值; 如果基頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值大于第四默認值,則判斷二倍頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第五默認值; 如果二倍頻點平均幅度與頻點幅度的比值參數值和三倍頻點平均幅度與頻點幅度的比值參數值的比值大于第五默認值,則判斷前一幀是否發生基音周期三倍錯誤; 如果前一幀發生基音周期三倍錯誤,則判斷當前幀之前發生基音周期三倍錯誤的次數是否大于第六默認值; 如果當前幀之前發生基音周期三倍錯誤的次數大于第六默認值,則確定三倍頻為所需要的精細基音周期。6.根據權利要求3所述的一種基音檢測的方法,其特征在于,所述根據平均幅度與頻點幅度的比值參數值大小和平均幅度參數值大小進行判斷,還包括 判斷基頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第七默認值; 如果基頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值大于第七默認值,則判斷三倍頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第八默認值; 如果三倍頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值大于第八默認值,則判斷二倍頻點平均幅度參數值與基頻點平均幅度參數值的差值是否大于第九默認值; 如果二倍頻點平均幅度參數值與基頻點平均幅度參數值的差值大于第九默認值,則確定二倍頻為所需要的精細基音頻率。7.根據權利要求3所述的一種基音檢測的方法,其特征在于,所述根據平均幅度與頻點幅度的比值參數值大小和緩存中所存儲的當前幀之前倍頻的判斷結果進行判斷,還包括 判斷基頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第十默認值; 如果基頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值大于第十默認值,則判斷三倍頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值是否大于第十一默認值; 如果三倍頻點平均幅度與頻點幅度的比值參數值和二倍頻點平均幅度與頻點幅度的比值參數值的比值大于第十一默認值,則判斷前一幀是否發生基音周期二倍錯誤; 如果前一幀發生基音周期二倍錯誤,則判斷當前幀之前發生基音周期二倍錯誤的次數是否大于第十二默認值; 如果當前幀的之前發生基音周期二倍錯誤的次數大于第十二默認值,則確定二倍頻為所需要檢測的精細基音頻率。8.根據權利要求I所述的一種基音檢測的方法,其特征在于,在所述根據初始基音周期和所述語音信號的頻譜提取特征參數之前,包括 為所述頻譜的幅度譜進行插值,獲取所述語音信號的高密度幅度譜。9.根據權利要求8所述的一種基音檢測的方法,其特征在于,所述插值,包括三次B樣條插值 /(X)=[唞V^3(X-A),其中f(x)為待插值信號,c(k)為三次B樣插值系數,β3(χ)k^Z為三次B樣條基函數。10.根據權利要求9所述的一種基音檢測的方法,其特征在于,在...

    【專利技術屬性】
    技術研發人員:齊峰巖苗磊阿里斯·塔勒布
    申請(專利權)人:華為技術有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲欧洲无码一区二区三区| 无码区日韩特区永久免费系列| 精品无码无人网站免费视频| 亚洲av无码片在线观看| 国产裸模视频免费区无码| 国产av无码专区亚洲av桃花庵| 亚洲AV无码一区二区三区久久精品| 无码专区6080yy国产电影| 亚洲av无码精品网站| 亚洲成a人在线看天堂无码| 久久久久亚洲?V成人无码| 国产免费无码一区二区| 无码人妻丝袜在线视频| 免费无码一区二区| 亚洲性无码AV中文字幕| 亚洲日韩精品一区二区三区无码| 亚洲最大av资源站无码av网址| 一本加勒比HEZYO无码人妻| 加勒比无码一区二区三区| 人妻无码αv中文字幕久久| 中文字幕无码人妻AAA片| 亚洲成av人片在线观看天堂无码| 亚洲av中文无码字幕色不卡| 亚洲AV无码一区二区三区人| 亚洲色偷拍另类无码专区| 国产在线观看无码免费视频| 无码人妻一区二区三区精品视频| 国产成人无码AV片在线观看| 中日韩亚洲人成无码网站| 久久久久久国产精品无码超碰| 亚洲av无码片在线播放| 无码人妻少妇久久中文字幕蜜桃 | 无码一区二区三区老色鬼| 久久精品无码专区免费| 免费无码又爽又黄又刺激网站| 国产成人无码av| 久久精品?ⅴ无码中文字幕| 亚洲AV无码一区二区一二区| 亚洲国产精品无码久久98| 亚洲无码一区二区三区| 亚洲AV无码一区二区三区网址|