【技術(shù)實現(xiàn)步驟摘要】
本公開內(nèi)容涉及處理音頻數(shù)據(jù)。更具體而言,本公開內(nèi)容涉及處理對應(yīng)于彌漫性(diffuse)或空間上的大音頻對象的音頻數(shù)據(jù)。
技術(shù)介紹
1、自1927年在電影中引入聲音開始,用來捕獲運動畫面聲軌的藝術(shù)意圖并且再現(xiàn)這種內(nèi)容的技術(shù)一直穩(wěn)步發(fā)展。在20世紀70年代,杜比(dolby)推出了利用3個屏幕通道和一個單環(huán)繞聲道編碼和分布混合的成本有效手段。在20世紀90年代,杜比利用5.1通道格式將數(shù)字聲音帶到電影院,該5.1通道格式提供分立的左、中、右屏幕通道,左和右環(huán)繞聲陣列以及用于低頻效果的低音炮通道。在2010年推出的杜比環(huán)繞7.1通過將現(xiàn)有的左和右環(huán)繞通道分為四個“區(qū)”,增加了環(huán)繞通道的數(shù)量。
2、電影院和家庭影院音頻重放系統(tǒng)正變得越來越多功能和復(fù)雜。家庭影院音頻重放系統(tǒng)包括越來越多數(shù)量的揚聲器。隨著通道數(shù)量增加并且喇叭布局從平面二維(2d)陣列變遷到包括仰角(elevation)的三維(3d)陣列,在重放環(huán)境中再現(xiàn)聲音正成為更加復(fù)雜的過程。改進的音頻處理方法將是期望的。
技術(shù)實現(xiàn)思路
1、提供了用于處理彌漫性或空間上的大音頻對象的改進方法。如本文所使用的,術(shù)語“音頻對象”指音頻信號(本文也稱為“音頻對象信號”)和無需參照任何特定的重放環(huán)境就可被創(chuàng)建或“創(chuàng)作”的關(guān)聯(lián)的元數(shù)據(jù)。關(guān)聯(lián)的元數(shù)據(jù)可以包括音頻對象位置數(shù)據(jù)、音頻對象增益數(shù)據(jù)、音頻對象尺寸數(shù)據(jù)、音頻對象軌跡數(shù)據(jù),等等。如本文所使用的,術(shù)語“渲染”指將音頻對象變換成用于特定重放環(huán)境的揚聲器饋送信號的過程。渲染過程可以至少部分
2、空間上的大音頻對象不是要被感知為點聲源,而是應(yīng)當被感知為覆蓋大的空間區(qū)域。在一些情況下,大音頻對象應(yīng)當被感知為圍繞聽者。這種音頻效果可能無法僅僅通過平移(panning)來實現(xiàn),而是可能需要另外的處理。為了創(chuàng)建令人信服的空間對象尺寸,或空間彌漫性,重放環(huán)境中顯著比例的揚聲器信號應(yīng)當相互獨立,或至少不相關(guān)(例如,就一階交叉相關(guān)或協(xié)方差而言是獨立的)。足夠復(fù)雜的渲染系統(tǒng),諸如用于劇院的渲染系統(tǒng),可以能夠提供這種去相關(guān)。但是,不太復(fù)雜的渲染系統(tǒng),諸如要用于家庭影院系統(tǒng)的那些,可能不能夠提供足夠的去相關(guān)。
3、本文所描述的一些實施方式可以涉及識別彌漫性或空間上的大音頻對象以進行特殊處理。去相關(guān)過程可以對對應(yīng)于大音頻對象的音頻信號執(zhí)行,以產(chǎn)生去相關(guān)的大音頻對象音頻信號。這些去相關(guān)的大音頻對象音頻信號可以與對象位置關(guān)聯(lián),對象位置可以是靜止的或隨時間變化的位置。關(guān)聯(lián)過程可以獨立于實際重放揚聲器配置。例如,去相關(guān)的大音頻對象音頻信號可以被渲染到虛擬揚聲器位置。在一些實施方式中,這種渲染過程的輸出可以被輸入到場景簡化過程。
4、因此,本公開內(nèi)容的至少一些方面可以在可以涉及接收包括音頻對象的音頻數(shù)據(jù)的方法中實現(xiàn)。音頻對象可以包括音頻對象信號和關(guān)聯(lián)的元數(shù)據(jù)。元數(shù)據(jù)可以至少包括音頻對象尺寸數(shù)據(jù)。
5、該方法可以涉及,基于音頻對象尺寸數(shù)據(jù),確定音頻對象尺寸大于閾值尺寸的大音頻對象并且對大音頻對象的音頻信號執(zhí)行去相關(guān)過程,以產(chǎn)生去相關(guān)的大音頻對象音頻信號。該方法可以涉及將去相關(guān)的大音頻對象音頻信號與對象位置關(guān)聯(lián)。關(guān)聯(lián)過程可以獨立于實際重放揚聲器配置。實際重放揚聲器配置可以最終被用來向重放環(huán)境的揚聲器渲染去相關(guān)的大音頻對象音頻信號。
6、該方法可以涉及接收用于大音頻對象的去相關(guān)元數(shù)據(jù)。去相關(guān)過程可以至少部分地根據(jù)該去相關(guān)元數(shù)據(jù)來執(zhí)行。該方法可以涉及編碼從關(guān)聯(lián)過程輸出的音頻數(shù)據(jù)。在一些實施方式中,編碼過程可以不涉及編碼用于大音頻對象的去相關(guān)元數(shù)據(jù)。
7、對象位置可以包括對應(yīng)于接收的音頻對象的至少一些音頻對象位置數(shù)據(jù)的位置。至少一些對象位置可以是固定的。但是,在一些實施方式中,至少一些對象位置可以隨時間變化。
8、關(guān)聯(lián)過程可以涉及根據(jù)虛擬揚聲器位置渲染去相關(guān)的大音頻對象音頻信號。在一些例子中,接收過程可以涉及接收對應(yīng)于揚聲器位置的一個或多個音頻床(bed)信號。該方法可以涉及混合接收的音頻床信號或接收的音頻對象信號當中至少一些與去相關(guān)的大音頻對象音頻信號。該方法可以涉及輸出去相關(guān)的大音頻對象音頻信號,作為另外的音頻床信號或音頻對象信號。
9、該方法可以涉及向去相關(guān)的大音頻對象音頻信號應(yīng)用電平調(diào)節(jié)過程。在一些實施方式中,大音頻對象元數(shù)據(jù)可以包括音頻對象位置元數(shù)據(jù)并且電平調(diào)節(jié)過程可以至少部分地依賴于大音頻對象的音頻對象尺寸元數(shù)據(jù)和音頻對象位置元數(shù)據(jù)。
10、該方法可以涉及在執(zhí)行去相關(guān)過程之后衰減或刪除大音頻對象的音頻信號。但是,在一些實施方式中,該方法可以涉及在執(zhí)行去相關(guān)過程之后保留對應(yīng)于大音頻對象的點源貢獻的音頻信號。
11、大音頻對象元數(shù)據(jù)可以包括音頻對象位置元數(shù)據(jù)。在一些這樣的實施方式中,該方法可以涉及計算來自由大音頻對象位置數(shù)據(jù)和大音頻對象尺寸數(shù)據(jù)定義的音頻對象面積或體積內(nèi)的虛擬源的貢獻。該方法還可以涉及至少部分地基于計算的貢獻為多個輸出通道當中每一個確定音頻對象增益值的集合。該方法可以涉及混合去相關(guān)的大音頻對象音頻信號與用于在空間上與該大音頻對象分開的距離為閾值量的音頻對象的音頻信號。
12、在一些實施方式中,該方法可以涉及在去相關(guān)過程之后執(zhí)行音頻對象群集過程。在一些這樣的實施方式中,音頻對象群集過程可以在關(guān)聯(lián)過程之后執(zhí)行。
13、該方法可以涉及評估音頻數(shù)據(jù),以確定內(nèi)容類型。在一些這樣的實施方式中,去相關(guān)過程可以根據(jù)內(nèi)容類型被有選擇地執(zhí)行。例如,要執(zhí)行的去相關(guān)的量可以依賴于內(nèi)容類型。去相關(guān)過程可以涉及延遲、全通濾波器、偽隨機濾波器和/或混響(reverberation)算法。
14、在本文中公開的方法可以經(jīng)由硬件、固件、存儲在一個或多個非暫態(tài)介質(zhì)中的軟件和/或其組合來實現(xiàn)。例如,本公開內(nèi)容的至少一些方面可以在包括接口系統(tǒng)和邏輯系統(tǒng)的裝置中實現(xiàn)。接口系統(tǒng)可以包括用戶接口和/或網(wǎng)絡(luò)接口。在一些實施方式中,該裝置可以包括存儲器系統(tǒng)。接口系統(tǒng)可以包括邏輯系統(tǒng)與存儲器系統(tǒng)之間的至少一個接口。
15、邏輯系統(tǒng)可以包括至少一個處理器,諸如通用單芯片或多芯片處理器、數(shù)字信號處理器(dsp)、專用集成電路(asic)、現(xiàn)場可編程門陣列(fpga)或其它可編程邏輯器件、分立的門或晶體管邏輯、分立的硬件組件,和/或其組合。
16、在一些實施方式中,邏輯系統(tǒng)可以能夠經(jīng)由接口系統(tǒng)接收包括音頻對象的音頻數(shù)據(jù)。音頻對象可以包括音頻對象信號和關(guān)聯(lián)的元數(shù)據(jù)。在一些實施方式中,元數(shù)據(jù)至少包括音頻對象尺寸數(shù)據(jù)。邏輯系統(tǒng)可以能夠基于音頻對象尺寸數(shù)據(jù)確定音頻對象尺寸大于閾值尺寸的大音頻對象并且對大音頻對象的音頻信號執(zhí)行去相關(guān)過程,以產(chǎn)生去相關(guān)的大音頻對象音頻信號。邏輯系統(tǒng)可以能夠?qū)⑷ハ嚓P(guān)的大音頻對象音頻信號與對象位置關(guān)聯(lián)。
17、關(guān)聯(lián)過程可以獨立于實際重放揚聲器配置。例如,關(guān)聯(lián)過程可本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種音頻處理方法,包括:
2.如權(quán)利要求1所述的方法,其中所述至少一個音頻對象與至少一個對象位置相關(guān)聯(lián),其中所述至少一個對象位置中的至少一個是固定的。
3.如權(quán)利要求1所述的方法,其中所述至少一個音頻對象與至少一個對象位置相關(guān)聯(lián),其中所述至少一個對象位置中的至少一個隨時間變化。
4.如權(quán)利要求1所述的方法,還包括向所述去相關(guān)的音頻對象音頻信號應(yīng)用電平調(diào)節(jié)過程。
5.如權(quán)利要求1所述的方法,其中執(zhí)行去相關(guān)濾波包括延遲和濾波中的至少一個。
6.如權(quán)利要求1所述的方法,其中執(zhí)行去相關(guān)濾波包括全通濾波和偽隨機濾波中的至少一個。
7.如權(quán)利要求1所述的方法,其中執(zhí)行去相關(guān)濾波包括混響過程。
8.一種計算機程序產(chǎn)品,包括物理、非暫態(tài)計算機可讀介質(zhì),存儲有指令,所述指令用于執(zhí)行如權(quán)利要求1-7中任一項所述的方法。
9.一種音頻處理裝置,包括:
10.一種非暫態(tài)存儲介質(zhì),其上存儲有包含指令的軟件,所述指令在被至少一個處理器執(zhí)行時使得執(zhí)行如權(quán)利要求1-7中任一項所述的方法。
12.一種包含用于執(zhí)行如權(quán)利要求1-7中任一項所述的方法的部件的裝置。
13.一種計算機程序產(chǎn)品,具有指令,所述指令在由計算設(shè)備或系統(tǒng)執(zhí)行時使得所述計算設(shè)備或系統(tǒng)實行如權(quán)利要求1-7中任一項所述的方法。
14.一種用于處理音頻數(shù)據(jù)的方法,包括:
15.一種能夠在自適應(yīng)音頻處理系統(tǒng)中群集對象和/或床的系統(tǒng),包括:
...【技術(shù)特征摘要】
1.一種音頻處理方法,包括:
2.如權(quán)利要求1所述的方法,其中所述至少一個音頻對象與至少一個對象位置相關(guān)聯(lián),其中所述至少一個對象位置中的至少一個是固定的。
3.如權(quán)利要求1所述的方法,其中所述至少一個音頻對象與至少一個對象位置相關(guān)聯(lián),其中所述至少一個對象位置中的至少一個隨時間變化。
4.如權(quán)利要求1所述的方法,還包括向所述去相關(guān)的音頻對象音頻信號應(yīng)用電平調(diào)節(jié)過程。
5.如權(quán)利要求1所述的方法,其中執(zhí)行去相關(guān)濾波包括延遲和濾波中的至少一個。
6.如權(quán)利要求1所述的方法,其中執(zhí)行去相關(guān)濾波包括全通濾波和偽隨機濾波中的至少一個。
7.如權(quán)利要求1所述的方法,其中執(zhí)行去相關(guān)濾波包括混響過程。
8.一種計算機...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:D·J·布瑞巴特,蘆烈,N·R·清格斯,A·瑪?shù)賷W斯索爾,
申請(專利權(quán))人:杜比實驗室特許公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。