• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    提供時間扭曲激活信號以及使用該時間扭曲激活信號對音頻信號編碼制造技術(shù)

    技術(shù)編號:8656494 閱讀:176 留言:0更新日期:2013-05-02 00:14
    音頻編碼器包括窗口函數(shù)控制器(504)、加窗器(502)、具有最終質(zhì)量檢查功能的時間扭曲器(506)、時間/頻率轉(zhuǎn)換器(508)、TNS級(510)或量化器編碼器(512),由時間扭曲分析器(516)或信號分類器(520)獲得的信號分析結(jié)果來控制所述窗口函數(shù)控制器(504)、所述時間扭曲器(506)、所述TNS級(510)或附加的噪聲填充分析器(524)。此外,解碼器使用取決于音頻信號的諧波或語音特性的經(jīng)操縱的噪聲填充估計(jì)來應(yīng)用噪聲填充操作。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)涉及音頻編碼和解碼,并且具體地針對具有諧波或語音內(nèi)容的、可受到時間扭曲處理的音頻信號的編碼/解碼。
    技術(shù)介紹
    在下文中,將給出對時間扭曲音頻編碼的領(lǐng)域的簡要說明,該編碼的概念可結(jié)合本專利技術(shù)的一些實(shí)施例一起應(yīng)用。近年來,技術(shù)上的發(fā)展可將音頻信號變換為頻域表示,并且例如考慮到感知屏蔽閾值,可以對該頻域表示進(jìn)行有效地編碼。如果發(fā)送編碼頻譜系數(shù)組的塊長度很長,且如果僅相當(dāng)小數(shù)目的頻譜系數(shù)遠(yuǎn)在該全局屏蔽閾值之上,同時很大數(shù)目的頻譜系數(shù)在該全局屏蔽閾值附近或之下并可能因而被忽略(或以最小碼長進(jìn)行編碼)時,該音頻信號編碼的概念特別有效。例如,基于余弦或基于正弦的調(diào)制的重疊變換通常由于它們的能量壓縮性質(zhì)而用于源編碼的應(yīng)用。即,對于具有恒定基本頻率(音調(diào))的諧音而言,它們將信號能量濃縮于小數(shù)目的頻譜分量(子頻帶)中,這導(dǎo)致了有效的信號表示。大體而言,應(yīng)當(dāng)將信號的(基本)音調(diào)理解為可與該信號頻譜相區(qū)別的最低主頻率。在普通語音模型中,該音調(diào)是由人類喉嚨調(diào)制的激勵信號的頻率。如果僅一個單一基本頻率存在,該頻譜將極其簡單,僅包括該基本頻率及泛音??梢愿咝У貙@種頻譜編碼。然而,對于具有變化音調(diào)的信號,對應(yīng)于每個諧波分量的能量散布于若干變換系數(shù)上,因而導(dǎo)致編碼效率的減少。為了克服編碼效率的減少,在不均勻時間網(wǎng)格上對要編碼的音頻信號有效地重新采樣。在隨后的處理中,對通過不均勻重新采樣所獲得的采樣位置就好像它們表示均勻時間網(wǎng)格上的值一樣進(jìn)行處理。該操作一般由短語“時間扭曲”來表示??扇Q于該音調(diào)的時間變化來有利地選擇采樣時間,使得該音頻信號的時間扭曲版本中的音調(diào)變化小于該音頻信號的原始版本(時間扭曲前)中的音調(diào)變化。該音調(diào)變化也可用短語“時間扭曲輪廓”表示。在音頻信號的時間扭曲之后,將該音頻信號的時間扭曲版本轉(zhuǎn)換為頻域。該依賴于音調(diào)的時間扭曲具有如下效果時間扭曲音頻信號的頻域表示一般地顯示出將能量壓縮成遠(yuǎn)遠(yuǎn)小于該原始音頻信號(未被時間扭曲)的頻域表示的頻譜分量數(shù)目。在解碼器側(cè),將該時間扭曲音頻信號的頻域表示轉(zhuǎn)換回時域,使得該時間扭曲音頻信號的時域表示在解碼器側(cè)可用。然而,在解碼器側(cè)重建時間扭曲音頻信號的時域表示中,不包括該編碼器側(cè)輸入音頻信號的原始音調(diào)變化。因此,通過對時間扭曲音頻信號的解碼器側(cè)重建時域表示進(jìn)行重新采樣,來應(yīng)用另一時間扭曲。為了在解碼器處獲得對編碼器側(cè)輸入音頻信號的良好重建,需要解碼器側(cè)時間扭曲至少近似編碼器側(cè)時間扭曲的反操作。為了獲得恰當(dāng)?shù)臅r間扭曲,需要讓允許調(diào)整解碼器側(cè)時間扭曲的信息在解碼器處可用。因?yàn)橐话阋髮⑦@種信息從音頻信號編碼器傳輸至音頻信號解碼器,需要將該發(fā)送所需的比特率保持為小,同時仍允許在解碼器側(cè)可靠重建所需的時間扭曲信息。鑒于上述討論,需要創(chuàng)建一種概念,其允許有效應(yīng)用音頻編碼器中時間扭曲概念的比特率。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)的目的是創(chuàng)建以下概念基于在時間扭曲音頻信號編碼器或時間扭曲音頻信號解碼器中可用的信息,來增強(qiáng)由編碼音頻信號所提供的聽覺印象。由根據(jù)權(quán)利要求1所述的用于基于音頻信號的表示來提供時間扭曲激活信號的時間扭曲激活信號提供器、根據(jù)權(quán)利要求12所述的用于對輸入音頻信號編碼的音頻信號編碼器、根據(jù)權(quán)利要求14所述的用于提供時間扭曲激活信號的方法、根據(jù)權(quán)利要求15所述的用于提供輸入音頻信號的編碼表示的方法、或根據(jù)權(quán)利要求16所述的計(jì)算機(jī)程序來達(dá)成該目的。本專利技術(shù)的另一目的是提供一種增強(qiáng)的音頻編碼/解碼方案,該方案提供較高的質(zhì)量或較低的比特率。由根據(jù)權(quán)利要求17、26、32、37所述的音頻編碼器、根據(jù)權(quán)利要求20所述的音頻解碼器、根據(jù)權(quán)利要求23、30、35或37所述的音頻編碼方法、根據(jù)權(quán)利要求24所述的解碼方法、或根據(jù)權(quán)利要求25、31、36或43所述的計(jì)算機(jī)程序來達(dá)成該目的。根據(jù)本專利技術(shù)的實(shí)施例與用于時間扭曲MDCT變換編碼器的方法相關(guān)。一些實(shí)施例僅與編碼器工具相關(guān)。然而,其它實(shí)施例還與解碼器工具相關(guān)。本專利技術(shù)的實(shí)施例創(chuàng)建時間扭曲激活信號提供器,其用于基于音頻信號的表示來提供時間扭曲激活信號。該時間扭曲激活信號提供器包括能量壓縮信息提供器,被配置為提供能量壓縮信息,該信息描述音頻信號的時間扭曲變換頻譜表示中的能量壓縮。該時間扭曲激活信號提供器還包括比較器,該比較器被配置為將能量壓縮信息與參考值相比較,且取決于比較結(jié)果來提供時間扭曲激活信號。該實(shí)施例基于如下發(fā)現(xiàn)如果音頻信號的時間扭曲變換頻譜表示由于將能量濃縮于一個或多個頻譜區(qū)域(或頻譜線)而包括充分壓縮的能量分布,則從編碼音頻信號的比特率減少的意義上來說,音頻信號編碼器中的時間扭曲功能性的使用一般帶來增強(qiáng)。這是由于如下的事實(shí)通過將模糊頻譜(例如音頻幀的模糊頻譜)變換為具有一個或多個可辨別波峰的頻譜,且因此變換為具有比原始(未時間扭曲)音頻信號的頻譜更高的能量壓縮的頻譜,則成功的時間扭曲帶來減少比特率的效果。關(guān)于此問題,應(yīng)理解音頻信號幀(在該幀中音頻信號的音調(diào)顯著地變化)包括模糊頻譜。音頻信號的時間變化音調(diào)具有如下效果在音頻信號幀上執(zhí)行的時域到頻域的變換導(dǎo)致信號能量在頻域,具體地在較高頻域,上的模糊分布。因此,這種原始(未時間扭曲)音頻信號的頻譜表示包括低能量壓縮,且一般在該頻譜的較高頻率部分不顯示頻譜波峰,或僅在頻譜中較高頻率部分顯示相對小的頻譜波峰。相對地,如果時間扭曲成功(就提供該編碼效率的增強(qiáng)而言),該原始音頻信號的時間扭曲產(chǎn)生具有相對較高且清晰的波峰的頻譜(具體地在該頻譜的較高頻率部分中)的時間扭曲音頻信號。這是由于以下事實(shí)將具有時間變化音調(diào)的音頻信號變換為具有較小音調(diào)變化或甚至近似恒定音調(diào)的時間扭曲音頻信號。因此,該時間扭曲音頻信號的頻譜表示(可以將其視為該音頻信號的時間扭曲變換頻譜表示)包括一個或多個清晰頻譜波峰。換言之,通過成功的時間扭曲操作來減少該原始音頻信號(具有在時間上變化的音調(diào))頻譜的模糊,使得該音頻信號的時間扭曲變換頻譜表示包括比原始音頻信號的頻譜更高的能量壓縮。然而,時間扭曲在增強(qiáng)編碼效率中并不總是成功。例如,如果輸入音頻信號包括大的噪聲分量,或如果所提取的時間扭曲輪廓不精確,則時間扭曲不增強(qiáng)編碼效率。鑒于該情況,由能量壓縮信息提供器提供的能量壓縮信息就減少比特率而言是判定該時間扭曲是否成功的有價值指示符。本專利技術(shù)的實(shí)施例創(chuàng)建時間扭曲激活信號提供器,用于基于音頻信號的表示提供時間扭曲激活信號。該時間扭曲激活提供器包括兩個時間扭曲表示提供器,所述兩個時間扭曲標(biāo)識提供器被配置為使用不同的時間扭曲輪廓信息來提供該相同音頻信號的兩個時間扭曲表示。因此,該時間扭曲表示提供器可以用相同的方式配置(在結(jié)構(gòu)上或功能上),且使用相同音頻信號但是不同的時間扭曲輪廓信息。該時間扭曲激活信號提供器還包括兩個能量壓縮信息提供器,所述兩個能量壓縮信息提供器被配置為基于第一時間扭曲表示提供第一能量壓縮信息,且基于第二時間扭曲表示提供第二能量壓縮信息。該能量壓縮信息提供器可以用相同方式配置,但是使用不同的時間扭曲表示。此外,該時間扭曲激活信號提供器包括比較器,以將兩個不同能量壓縮信息進(jìn)行比較,且提供取決于比較結(jié)果的時間扭曲激活信號。在優(yōu)選實(shí)施例中,該能量壓縮信息提供器被配置為提供作為能量壓縮信息的頻譜平坦度度量,該頻譜平坦度度量描述該音頻信號的本文檔來自技高網(wǎng)
    ...

    【技術(shù)保護(hù)點(diǎn)】
    一種用于基于音頻信號的表示(110;234e;234k)來提供時間扭曲激活信號(112;232;234p)的時間扭曲激活信號提供器(100;230;234),所述時間扭曲激活信號提供器包括:能量壓縮信息提供器(120;234f;234l;325;370),被配置為提供能量壓縮信息(122;234m;234n;326;374),所述能量壓縮信息描述所述音頻信號的時間扭曲變換頻譜表示(222)的能量壓縮;以及比較器(130;234o),被配置為將所述能量壓縮信息(122;234m;234n;326;374)與參考值相比較,以及被配置為取決于比較結(jié)果提供時間扭曲激活信號(112;232;234p)。

    【技術(shù)特征摘要】
    2008.07.11 US 61/079,8731.一種用于基于音頻信號的表不(110 ;234e ;234k)來提供時間扭曲激活信號(112 ;232 ;234p)的時間扭曲激活信號提供器(100 ;230 ;234),所述時間扭曲激活信號提供器包括:能量壓縮信息提供器(120 ;234f ;2341 ;325 ;370),被配置為提供能量壓縮信息(122 ;234m ;234n ;326 ;374),所述能量壓縮信息描述所述音頻信號的時間扭曲變換頻譜表示(222)的能量壓縮;以及比較器(130 ;234o),被配置為將所述能量壓縮信息(122 ;234m ;234n ;326 ;374)與參考值相比較,以及被配置為取決于比較結(jié)果提供時間扭曲激活信號(112 ;232 ;234p)。2.根據(jù)權(quán)利要求1所述的時間扭曲激活信號提供器(100;230;234),其中,所述能量壓縮信息提供器(120 ;234f ;2341)被配置為提供作為所述能量壓縮信息(122 ;234m ;234η)的頻譜平坦度度量,所述頻譜平坦度度量描述所述音頻信號的時間扭曲變換頻譜表示(234e ;234k)。3.根據(jù)權(quán)利要求2所述的時間扭曲激活信號提供器(100;230 ;234),其中,所述能量壓縮信息提供器(120 ;234f ;2341)被配置為計(jì)算所述音頻信號的時間扭曲變換功率頻譜(234e ;234k)的幾何平均與所述音頻信號的時間扭曲變換功率頻譜(234e ;234k)的算術(shù)平均的商,以獲得所述頻譜平坦度度量。4.根據(jù)權(quán)利要求1所述的時間扭曲激活信號提供器(100;230 ;234),其中,所述能量壓縮信息提供器(120 ;234f ;2341)被配置為:與所述時間扭曲變換頻譜表示(234e ;234k)的較低頻率部分相比時,強(qiáng)調(diào)所述時間扭曲變換頻譜表示(234e ;234k)的較高頻率部分,以獲得所述能量壓縮信息(122 ;234m ;234n)。5.根據(jù)權(quán)利要求1所述的時間扭曲激活信號提供器(100;230 ;234),其中,所述能量壓縮信息提供器(120 ;234m;234η)被配置為獲得頻譜平坦度的多個逐頻帶度量,以及被配置為計(jì)算所述頻譜平坦 度的多個逐頻帶度量的平均值,以獲得所述能量壓縮信息(122,234m ;234n)。6.根據(jù)權(quán)利要求1所述的時間扭曲激活信號提供器(100;230 ;234),其中,所述能量壓縮信息提供器(120 ;234f ;2341 ;325)被配置為提供作為所述能量壓縮信息(122 ;234m ;234η)的感知熵(pe)度量,所述感知熵(pe)度量描述所述音頻信號的時間扭曲變換頻譜表示(234e ;234k)。7.根據(jù)權(quán)利要求6所述的時間扭曲激活信號提供器(100;230 ;234 ;235),其中,所述能量壓縮信息提供器(120 ;234f ;2341 ;325)被配置為基于擴(kuò)縮因子頻帶的波形因子信息(ffac(n)),計(jì)算所述音頻信號的時間扭曲變換頻譜表示(234e;234k)的一個或多個擴(kuò)縮因子頻帶的非零線的估計(jì)數(shù)目(nl),以及被配置為將非零線的所述估計(jì)數(shù)目(nl)與在考察的擴(kuò)縮因子頻帶的能量度量相乘,來計(jì)算所考察的所述擴(kuò)縮因子頻帶的感知熵(326)度量。8.根據(jù)權(quán)利要求1所述的時間扭曲激活信號提供器(100;230;234),其中,所述能量壓縮信息提供器(120 ;234f ;2341 ;370)被配置為提供作為所述能量壓縮信息的自相關(guān)度量(374),所述自相關(guān)度量(374)描述所述音頻信號的時間扭曲時域表示(234e ;234k)的自相關(guān)。9.根據(jù)權(quán)利要求...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:斯特凡·拜爾,薩沙·迪施,拉爾夫·蓋格爾紀(jì)堯姆·??怂?/a>,馬克斯·諾伊恩多夫,杰拉爾德·舒勒貝恩德·埃德勒,
    申請(專利權(quán))人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會,
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲∧v久久久无码精品| 国精品无码一区二区三区左线| 亚洲综合一区无码精品| 无码丰满熟妇一区二区| 免费无码又爽又刺激高潮| 国产成人无码精品久久久性色| 一本加勒比hezyo无码专区| 人妻无码一区二区不卡无码av| 国模无码视频一区| 精品无码人妻夜人多侵犯18| 久久美利坚合众国AV无码| 亚洲AV无码第一区二区三区| 国产综合无码一区二区色蜜蜜 | 精品人妻无码区在线视频| 无码精品前田一区二区| 亚洲精品无码人妻无码| 亚洲AV无码成人网站久久精品大| 久久美利坚合众国AV无码| 亚洲精品无码av片| av潮喷大喷水系列无码| 无码孕妇孕交在线观看| 亚洲中文字幕无码一区二区三区| 国产精品无码久久综合网| 亚洲heyzo专区无码综合| 日韩精品无码一区二区三区| 日韩精品无码一区二区三区四区| 精品人妻无码一区二区三区蜜桃一 | a级毛片免费全部播放无码| 国模无码一区二区三区| 亚洲AV成人无码网天堂| 亚洲av中文无码乱人伦在线r▽ | 国产亚洲大尺度无码无码专线| 亚洲中文字幕无码久久| 亚洲天堂2017无码中文| AV无码人妻中文字幕| 在人线av无码免费高潮喷水| 精品无码人妻一区二区免费蜜桃 | 无码日韩AV一区二区三区| 亚洲中文字幕无码av永久| 亚洲AV永久无码精品网站在线观看| 久久精品亚洲中文字幕无码网站|