【技術實現步驟摘要】
【國外來華專利技術】具有并行架構的音頻編碼器相關申請的交叉引用本申請要求于2011年11月30日提交的美國臨時專利申請第61/565,037號的優先權,在此通過引用將其全部內容合并到本申請中。
本文獻涉及用于音頻編碼的方法及系統。具體地,本文獻涉及使用并行編碼器架構的快速音頻編碼的方法及系統。
技術介紹
當今的媒體播放器支持各種不同的音頻格式比如mp3、mp4、WMA(Windows媒體音頻)、AAC (高級音頻編碼)>HE-AAC (高效率的AAC)等。另一方面,媒體數據庫(比如Simfy)提供數以百萬計的音頻文件以供下載。通常,以各種不同的音頻格式以及可以由不同媒體播放器支持的各種不同比特率對這些數以百萬計的音頻文件進行編碼以及存儲是不經濟的。如此,提供如下快速音頻編碼方案是有利的:該方案使得音頻文件的編碼能夠“實時(on the fly) ”,從而使得媒體數據庫當被請求時能夠產生特定編碼的音頻文件(以特定的音頻格式,以特定的比特率)。
技術實現思路
根據一個方面,描述了一種基于幀的音頻編碼器。該音頻編碼器可以被配置成:將包括多個時域樣本的音頻信號劃分成幀的序列,其中,每個幀通常包括預定數目的樣本。作為示例,幀可以包括固定數目M個樣本(例如M= 1024)。在一種實施方式中,音頻編碼器被配置成進行高級音頻編碼(AAC)。音頻編碼器可以包括對音頻信號的K個幀(例如音頻信號的K個連續的幀)并行地進行處理的K個并行變換單元。K個并行變換單元可以在K個不同的處理單元(例如圖形處理單元)上實現,從而(與對K個幀的順序處理相比)將變換處理加速了因子K。變換單元可以被配置 ...
【技術保護點】
一種基于幀的音頻編碼器(300,400,500,600),包括K個并行變換單元(303,403);其中,所述K個并行變換單元(303,403)中的每一個被配置成:將音頻信號(101)的K個幀(305)的組中的相應幀變換成K個頻率系數集合中的相應集合;其中K>1;其中,所述K個幀(305)中的每一個包括所述音頻信號(101)的多個樣本。
【技術特征摘要】
【國外來華專利技術】2011.12.21 US 61/578,3761.一種基于幀的音頻編碼器(300,400,500,600),包括 K個并行變換單元(303,403);其中,所述K個并行變換單元(303,403)中的每一個被配置成:將音頻信號(101)的K個幀(305)的組中的相應幀變換成K個頻率系數集合中的相應集合;其中K>1 ;其中,所述K個幀(305)中的每一個包括所述音頻信號(101)的多個樣本。2.根據權利要求1所述的音頻編碼器(300,400,500,600),其中,所述K個并行變換單元(303,403)中的每一個被配置成:向所述K個幀(305)中的相應幀應用修正離散余弦變換。3.根據任一前述權利要求所述的音頻編碼器(300,400,500,600),其中,所述K個并行變換單元(303,403)中的每一個被配置成:向所述K個幀(305)中的相應幀應用窗函數。4.根據任一前述權利要求所述的音頻編碼器(300,400,500,600),其中,所述K個并行變換單元(303,403)中的每一個被配置成:將所述K個幀(305)中的相應幀變換成取決于幀類型的頻率系數集合。5.根據權利要求4所述的音頻編碼器(300,400,500,600),還包括: K個并行信號起奏檢測單元(301),其中,每個信號起奏檢測單元(301)被配置成:基于所述K個幀(305)中的相應幀中聲音起奏的有或無,對所述K個幀(305)中的相應幀進行分類。6.根據權利要求5所 述的音頻編碼器(300,400,500,600),還包括: 幀類型檢測單元(304),被配置成:基于對所述K個幀的分類來確定所述K個幀(305)中的每一個幀的幀類型。7.根據權利要求6所述的音頻編碼器(300,400,500,600),其中,所述幀類型是短塊類型、長塊類型、開始塊類型和停止類型之一。8.根據權利要求6至7中任一項所述的音頻編碼器(300,400,500,600),其中,所述幀類型檢測單元(304)被配置成:還基于幀k-Ι的幀類型確定所述K個幀(305)中的每個幀k的幀類型,其中k = 1,…,K。9.根據權利要求6至8中任一項所述的音頻編碼器(400),其中,所述K個并行變換單元(403)與所述K個并行信號起奏檢測單元(301)和所述幀類型檢測單元(304)并行操作。10.根據權利要求6至9中任一項所述的音頻編碼器(400),其中 所述K個并行變換單元(303、403)中的每一個被配置成:將所述K個幀(305)中的相應幀變換為多個取決于幀類型的頻率系數集合;以及 所述編碼器(400)還包括選擇單元(406),所述選擇單元(406)被配置成:從所述多個取決于幀類型的頻率系數集合中為所述K個幀(305)中的每一幀選擇頻率系數集合,其中,所選擇的集合與所述相應幀的幀類型對應。11.根據權利要求6至8中任一項所述的音頻編碼器(400),其中,所述K個并行信號起奏檢測單元(301)與所述幀類型檢測單元(304)順序地操作,所述幀類型檢測單元(304)與所述K個并行變換單元(403)順序地操作。12.根據權利要求6至8以及11中任一項所述的音頻編碼器(300,500,600),其中,所述K個并行變換單元(303)的每一個被配置成:將所述K個幀(305)中的相應幀變換成與所述幀類型檢測單元(304)所確定的所述相應幀的幀類型對應的頻率系數集合。13.根據任一前述權利要求所述的音頻編碼器(300,400,500,600),還包括: K個并行量化與編碼單元(508,608);其中,所述K個并行量化與編碼單元(508,608)中的每一個被配置成:考慮相應的所分配比特數目來對所述K個頻率系數集合中的相應集合進行量化和熵編碼。14.根據權利要求13所述的音頻編碼器(300,400,500,600),還包括: K個并行心理聲學單兀(506);其中,所述K個并行心理聲學單兀(506)中的每一個被配置成:基于所述K個頻率系數集合中的相應集合來確定一個或更多個取決于幀的掩蔽閾值。15.根據權利要求14所述的音頻編碼器(300,400,500,600),其中,所述K個并行心理聲學單元(506)中的每一個被配置成:對表示所述K個幀(305)中的相應幀的信息內容的感知熵值進行確定。16.根據權利要求14至15中任一項所述的音頻編碼器(300,400,500,600),其中,所述K個并行量化與編碼單元(508、608)中的每一個被配置成:考慮相應的一個或更多個取決于幀的掩蔽閾值來對所述K個頻率系數集合中的相應集合進行量化和熵編碼。17.根據權利要求13至16中任一項所述的音頻編碼器(300,400,500,600),還包括: 比特分配單元(507,607),被配置成:向所述K個并行量化與編碼單元(508,608)中的每一個分配相應的比特數目。18.根據從屬于權 利要求6的權利要求17所述的音頻編碼器(300,400,500,600),其中,所述比特分配單元(507,607)被配置成:考慮所述K個幀(305)的幀類型來分配相應的比特數目。19.根據權利要求15所述的音頻編碼器(300,400,500,600),其中,所述比特分配單元(507,607)被配置成:考慮所述K個幀(305)的感知熵值來分配相應的比特數目。20.根據權利要求17至19中任一項所述的音頻編碼器(300,400,500,600),還包括: 比特儲存器跟蹤單元(509,609),被配置成:對用于對所述音頻信號(101)的在所述K個幀(305)之前的幀進行編碼的先前消耗的比特數目進行跟蹤。21.根據權利要求20所述的音頻編碼器(300,400,500,600),其中,所述比特儲存器跟蹤單元(509,609)被配置成:用被所述K個并行量化與編碼單元(508,608)用于對所述頻率系數集合進行編碼的比特數目來更新先前消耗的比特數目,從而產生當前消耗的比特數目。22.根據權利要求20至21中任一項所述的音頻編碼器(300,400,500,600),其中,所述比特分配單元(507,607)被配置成:考慮先前消耗的比特數目來分配相應的比特數目。23.根據權利要求20至22中任一項所述的音頻編碼器(300,400,500,600),其中,所述比特分配單元(507,607)被配置成:考慮用于...
【專利技術屬性】
技術研發人員:沃爾夫岡·席爾德巴赫,
申請(專利權)人:杜比國際公司,
類型:發明
國別省市:荷蘭;NL
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。