對由多個幀構成的音頻信號進行編碼的編碼部具有:音頻編碼部,其對音頻信號進行編碼;以及輔助信息編碼部,其估計輔助信息并進行編碼,該輔助信息被用于解碼音頻信號時的分組丟失的掩藏,并與音頻信號的功率的時間變化相關。在與上述功率的時間變化相關的輔助信息中,可以包含有對多個比1幀短的子幀的功率進行函數近似而得到的參數,還可以包含有與對多個比1幀短的子幀的功率進行矢量量化而得到的矢量相關的信息。
【技術實現步驟摘要】
【國外來華專利技術】
本專利技術涉及經由IP網和移動通信網傳輸包含對由多個幀構成的音頻信號進行編碼而得到的音頻碼的音頻分組時的錯誤掩藏,更具體而言,涉及用于實現錯誤掩藏的音頻編碼裝置、音頻編碼方法和音頻編碼程序以及音頻解碼裝置、音頻解碼方法和音頻解碼程序。
技術介紹
在IP網和移動通信中傳輸音頻/聲音信號(以下稱作“音頻信號”)時,對音頻信號進行編碼而以較小的比特數來表現并分割為音頻分組,經由通信網傳輸該音頻分組。通過通信網接收到的音頻分組在接收側的服務器、MCU、終端等中被解碼,從而得到解碼音頻信號。在通過通信網傳輸音頻分組時,由于通信網的擁擠狀態等,可能會產生丟失一部分音頻分組或在寫入到音頻分組中的一部分信息中產生錯誤的現象(所謂的分組丟失)。在這種情況下,無法在接收側對音頻分組進行正確解碼,因此不能得到期望的解碼音頻信號。此外,由于與產生分組丟失的音頻分組對應的解碼音頻信號被感知為噪音,因此顯著損壞對收聽的人賦予的主觀品質。 為了消除上述那樣的不良情況,存在“接收側中的掩藏技術”和“發送側中的掩藏技術”,作為對由于分組丟失而丟失的部分的音頻聲音信號進行插值的分組丟失掩藏技術。在其中的“接收側中的掩藏技術”中,例如非專利文獻I的技術那樣,通過在以音調(pitch)為單位復制了之前正常接收到的分組所包含的解碼音頻信號后,乘以預先確定的衰減系數,生成與分組丟失的部分對應的音頻信號。但是,“接收側中的掩藏技術”以分組丟失的部分的音頻性質與分組丟失緊之前的音頻相似為前提,因此在分組丟失的部分與丟失緊之前的音頻具有不同性質的情況、和功率急劇變化的情況下不能充分發揮掩藏效果。此外,在“接收側中的掩藏技術”中存在專利文獻I的技術作為更高級的技術。在該專利文獻I的技術中,復制之前正常接收到的分組所包含的解碼音頻來生成掩藏信號,但以下方法與上述非專利文獻I的技術不同:通過乘以根據復制源的音頻性質(功率譜的形狀)而發生變化的衰減系數,進行異常聲音少且高音質的掩藏信號的整形。另一方面,存在專利文獻2的技術和專利文獻3的技術作為“發送側中的掩藏技術”。在其中的專利文獻2的技術中,將之前正常接收到的分組所包含的音頻信號蓄積到緩沖器中,并且將表示在丟失分組時從緩沖器的哪個位置復制音頻信號的位置信息編碼為輔助信息并進行傳輸。并 且 ,除了位置信息以外,還在輔助信息中包含表示分組丟失部分是否為無聲區間這樣的振幅信息,由此防止在產生了分組丟失的部分本來是無聲區間的情況下混入不必要的聲音的情況。此外,在專利文獻3的技術中,解碼裝置具有:掩藏分組丟失的第一掩藏裝置;根據輔助信息修正第一掩藏裝置輸出的第一掩藏信號的第二掩藏裝置;以及對輔助信息進行解碼的輔助信息解碼裝置。在第一掩藏裝置中不能充分發揮掩藏效果的情況下,第二掩藏裝置使用輔助信息解碼裝置生成的輔助信息來修正第一掩藏信號,生成第二掩藏信號。作為輔助信息,利用功率譜包絡、根據相鄰的幀的功率譜包絡預測的值和對輸入功率譜包絡的誤差進行編碼得到的值。第二掩藏裝置在具有能夠用作輔助信息的功率譜包絡的頻域中對第一掩藏信號乘以增益,生成比第一掩藏信號精度更高的第二掩藏信號。現有技術文獻專利文獻專利文獻1:日本再公表特許W02007/000988號公報專利文獻2:日本特開2003 - 316670號公報專利文獻3:日本特開2008 - 111991號公報非專利文獻非專利文獻1:1TU — TG.71 IAppendixI
技術實現思路
專利技術所要解決的課題但是,專利文獻I的技術是根據之前正常接收到的解碼信號,通過預測生成掩藏信號的方法,因此難以根據之前的信號高精度地生成例如響板的拍打聲那樣具有與預測結果偏離較大的功率變化的掩藏信號。此外,專利文獻2的技術在發送側生成與無聲區間相關的振幅信息,防止在分組丟失的部分為無聲區間的情況下生成掩藏信號,但對于上述的響板的拍打聲那樣的伴隨突發的功率變化的聲音不具有足夠的掩藏效果。此外,專利文獻3的技術是在以幀為單位進行時頻變換后進行頻域中的處理的方法,因此處理的單位是幀單位,難以處理幀內的急劇的功率變化。此外,以之前的信號和分組丟失的信號的相關性高為前提對分組丟失部分的解碼音頻進行高精度化,因此在功率急劇變化的部分產生分組丟失的情況下,信號的相關性變低,因此功率譜包絡的預測誤差變大,所以難以利用較少的比特數來進行編碼,難以生成高精度的解碼音頻。如上所述,在現有技術中,具有如下問題:對拍手和響板的拍打聲那樣的伴隨有在時間上較快的功率變化的信號(以下稱作“瞬態信號”)不具有足夠的錯誤掩藏效果。即,在接收側,要根據通過解碼由緊之前正常接收到的音頻分組而得到的解碼信號,正確預測在音頻信號中的哪個時刻產生瞬態信號是極為困難的。本專利技術的目的在于解決上述問題,給出能夠高精度地掩藏難以根據前后信號來預測的瞬態信號中的分組丟失的錯誤掩藏技術。用于解決課題的手段本專利技術的一個方面涉及音頻解碼,能夠包含以下的音頻解碼裝置、音頻解碼方法和音頻解碼程序。本專利技術的一個方面的音頻解碼裝置根據包含音頻碼和輔助信息碼的音頻分組對音頻碼進行解碼,所述輔助信息碼被用于解碼音頻碼時的分組丟失的掩藏,并與音頻信號的功率的時間變化相關,該音頻解碼裝置的特征在于,具有:錯誤/丟失檢測部,其檢測音頻分組中的分組錯誤或分組丟失,并輸出表示檢測結果的錯誤標志;音頻解碼部,其對音頻分組所包含的音頻碼進行解碼來求出解碼信號;輔助信息解碼部,其對音頻分組所包含的輔助信息碼進行解碼來求出輔助信息;第一掩藏信號生成部,其在所述錯誤標志表示音頻分組的異常的情況下,根據已經求出的解碼信號,生成用于掩藏分組丟失的第一掩藏信號;以及掩藏信號修正部,其根據所述輔助信息,修正第一掩藏信號。本專利技術的一個方面的音頻解碼方法由音頻解碼裝置執行,該音頻解碼裝置根據包含音頻碼和輔助信息碼的音頻分組對音頻碼進行解碼,所述輔助信息碼被用于解碼音頻碼時的分組丟失的掩藏,并與音頻信號的功率的時間變化相關,該音頻解碼方法的特征在于,具有:錯誤/丟失檢測步驟,檢測音頻分組中的分組錯誤或分組丟失,并輸出表示檢測結果的錯誤標志;音頻解碼步驟,對音頻分組所包含的音頻碼進行解碼來求出解碼信號;輔助信息解碼步驟,對音頻分組所包含的輔助信息碼進行解碼來求出輔助信息;第一掩藏信號生成步驟,在所述錯誤標志表示音頻分組的異常的情況下,根據已經求出的解碼信號,生成用于掩藏分組丟失的第一掩藏信號;以及掩藏信號修正步驟,根據所述輔助信息,修正第一掩藏信號。本專利技術的一個方面的音頻解碼程序的特征在于,使計算機作為如下各部發揮功能:錯誤/丟失檢測部,其檢測包含音頻碼和輔助信息碼的音頻分組中的分組錯誤或分組丟失,并輸出表示檢測結果的錯誤標志,所述輔助信息碼被用于解碼音頻碼時的分組丟失的掩藏,并與音頻信號的功率的時間變化相關;音頻解碼部,其對音頻分組所包含的音頻碼進行解碼來求出解碼信號;輔助信息解碼部,其對音頻分組所包含的輔助信息碼進行解碼來求出輔助信息; 第一掩藏信號生成部,其在所述錯誤標志表示音頻分組的異常的情況下,根據已經求出的解碼信號,生成用于掩藏分組丟失的第一掩藏信號;以及掩藏信號修正部,其根據所述輔助信息,修正第一掩藏信號。在一個實施方式中,可以在與功率的時間變化相關的輔助信息碼中,包含有對本文檔來自技高網...
【技術保護點】
【技術特征摘要】
【國外來華專利技術】...
【專利技術屬性】
技術研發人員:堤公孝,菊入圭,
申請(專利權)人:株式會社NTT都科摩,
類型:
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。