本申請(qǐng)公開了解碼器、解碼方法、編碼器以及編碼方法。該解碼器包括:一提取器,其被配置為自一數(shù)據(jù)流提取一最大區(qū)域尺寸以及多樹型次分割信息;一次分割器,其被配置為空間地分割表示一空間取樣信息信號(hào)的一信息取樣數(shù)組成為一最大區(qū)域尺寸的樹根區(qū)域,并且依照一多樹型次分割信息,通過遞歸式多分隔這些樹根區(qū)域的子集,至少次分割這些樹根區(qū)域的一子集成為不同尺寸的較小簡(jiǎn)單連接區(qū)域;以及一重建器,其被配置為自使用次分割成為較小簡(jiǎn)單連接區(qū)域的數(shù)據(jù)流重建該取樣數(shù)組。
Decoder, decoding method, coder and coding method
The invention discloses a decoder, a decoding method, an encoder and an encoding method. The decoder includes an extractor, which is configured to extract a data stream from a maximum area size and multi tree segmentation information; a splitter, which is configured as a space segment represents a sampling array spatial sampling information signal becomes a maximum area size of root region, and in accordance with a the tree type segmentation information subset by recursive multiple separate the root area, at least a subset of these roots region segmentation into smaller sizes and a simple connected region; reconstruction device, which is configured to use a split into smaller data from simple connected regions of the sampling array flow reconstruction.
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)是分案申請(qǐng),其原案申請(qǐng)的申請(qǐng)?zhí)枮?01180024833.6,申請(qǐng)日為2011年4月8日,專利技術(shù)名稱為“使用次分割的二維信息信號(hào)的空間取樣的編碼”。
本專利技術(shù)有關(guān)使用次分割(sub-division)技術(shù)以編碼空間取樣信息信號(hào)的編碼結(jié)構(gòu)以及用以編碼次分割或多樹結(jié)構(gòu)的編碼結(jié)構(gòu),其中代表性實(shí)施例有關(guān)圖像及/或視頻編碼應(yīng)用。
技術(shù)介紹
于影像以及視頻編碼中,圖像或?qū)τ趫D像的取樣數(shù)組的特定組集通常被分解成為與特定編碼參數(shù)關(guān)聯(lián)的方塊。這些圖像通常由多個(gè)取樣數(shù)組組成。此外,一圖像也可以是與另外的輔助取樣數(shù)組相關(guān)聯(lián)的,這些另外的輔助取樣數(shù)組可以是,例如,指示透明信息或深度圖。一圖像的取樣數(shù)組(包含輔助取樣數(shù)組)可被群集成為一個(gè)或多個(gè)所謂的平面群組,其中各平面群組包含一個(gè)或多個(gè)取樣數(shù)組。一圖像平面群組可單獨(dú)地被編碼,或如果該圖像被關(guān)聯(lián)于一個(gè)以上的平面群組,則可具有來自相同圖像的其它平面群組的預(yù)測(cè)。各平面群組通常被分解成為方塊。這些方塊(或取樣數(shù)組的對(duì)應(yīng)方塊)通過圖像間預(yù)測(cè)或圖像內(nèi)預(yù)測(cè)的一者被預(yù)測(cè)。這些方塊可具有不同的尺寸并且可以是正方形或矩形的一者。成為方塊的圖像的分割可利用語法被固定,或其可以(至少部分地)在比特流內(nèi)部被發(fā)信。通常語法元素被發(fā)送而發(fā)信供用于預(yù)定尺寸方塊的次分割。此些語法元素可指明一方塊是否以及如何被次分割為較小的方塊以及關(guān)聯(lián)的編碼參數(shù),例如,用于預(yù)測(cè)目的。對(duì)于所有方塊取樣(或取樣數(shù)組的對(duì)應(yīng)方塊),相關(guān)編碼參數(shù)的解碼以某種方式明確地被指明。在這個(gè)范例中,在一方塊中的所有取樣使用相同組集的預(yù)測(cè)參數(shù)被預(yù)測(cè),例如,參考指針(辨認(rèn)已被編碼的圖像組集中的一參考圖像)、移動(dòng)參數(shù)(指明用于在一參考圖像以及目前圖像之間的方塊移動(dòng)的測(cè)量)、用以指明插值濾波器及圖像內(nèi)預(yù)測(cè)模式等等的參數(shù)。移動(dòng)參數(shù)可通過具有水平以及垂直分量的位移向量或通過較高階移動(dòng)參數(shù)(例如,由六個(gè)分量組成的仿射移動(dòng)參數(shù))被表示。其也有可能是,一組以上的特定預(yù)測(cè)參數(shù)(例如,參考指標(biāo)以及移動(dòng)參數(shù))被關(guān)聯(lián)于一單一方塊。因此,對(duì)于這些特定預(yù)測(cè)參數(shù)的各組參數(shù),對(duì)于方塊(或取樣數(shù)組的對(duì)應(yīng)方塊)的一單一中間預(yù)測(cè)信號(hào)被產(chǎn)生,并且最后的預(yù)測(cè)信號(hào)通過包含迭加中間預(yù)測(cè)信號(hào)的組合被建立。對(duì)應(yīng)的加權(quán)參數(shù)并且也可有一固定偏移量(其被加到加權(quán)和上)可被固定于一圖像、或一參考圖像、或一組參考圖像,或它們可被包含在供用于對(duì)應(yīng)方塊的該組預(yù)測(cè)參數(shù)中。在原始方塊(或取樣數(shù)組的對(duì)應(yīng)方塊)以及它們的預(yù)測(cè)信號(hào)之間的差量,同時(shí)也稱為殘差信號(hào),通常被轉(zhuǎn)換并且被量化。通常,一種二維轉(zhuǎn)換技術(shù)被施加至該殘差信號(hào)(或?qū)τ跉埐罘綁K的對(duì)應(yīng)取樣數(shù)組)上。對(duì)于轉(zhuǎn)換編碼,一特定組集的預(yù)測(cè)參數(shù)已被使用其上的方塊(或取樣數(shù)組的對(duì)應(yīng)方塊),可在施加轉(zhuǎn)換之前進(jìn)一步地被切割。轉(zhuǎn)換方塊可以是等于或較小于被使用于預(yù)測(cè)的方塊。其也有可能是,一轉(zhuǎn)換方塊被包含在被使用于預(yù)測(cè)的一個(gè)以上的方塊中。不同的轉(zhuǎn)換方塊可具有不同的尺寸并且這些轉(zhuǎn)換方塊可被表示為正方形或矩形方塊。在轉(zhuǎn)換之后,產(chǎn)生的轉(zhuǎn)換系數(shù)被量化并且所謂的轉(zhuǎn)換系數(shù)等級(jí)被取得。轉(zhuǎn)換系數(shù)等級(jí)以及預(yù)測(cè)參數(shù),并且如果存在的話,則次分割信息被進(jìn)行熵編碼。于影像以及視頻編碼規(guī)格中,對(duì)于次分割一圖像(或一平面群組)成為通過語法提供的方塊的可能性是非常有限的。通常,其可能僅被指明一預(yù)定尺寸方塊是否以及(可能如何地)可被次分割為較小的方塊。如一范例,H.264中的最大方塊尺寸是16×16。這些16×16方塊同時(shí)也被稱為巨方塊,并且于第一步驟中,各圖像被分隔為巨方塊。對(duì)于各個(gè)16×16的巨方塊,其可被發(fā)信(signal)關(guān)于其被編碼為16×16方塊,或?yàn)槎€(gè)16×8方塊,或?yàn)槎€(gè)8×16方塊,或?yàn)樗膫€(gè)8×8方塊。如果一16×16方塊被次分割為四個(gè)8×8方塊,則這些8×8方塊各可被編碼為下列的一者:被編碼為一8×8方塊、或?yàn)槎€(gè)8×4方塊、或?yàn)槎€(gè)4×8方塊、或?yàn)樗膫€(gè)4×4方塊。于目前影像以及視頻編碼規(guī)格中,用以指明分割為方塊的可能的小組集具有用以發(fā)信次分割信息的邊信息率可被保留為小量的優(yōu)點(diǎn),但其亦具有下面的缺點(diǎn):用以發(fā)送用于方塊的預(yù)測(cè)參數(shù)的必須位率可能如下面所說明地成為顯著。用以發(fā)信預(yù)測(cè)信息的邊信息率通常表示對(duì)于一方塊的所有位率的一重要數(shù)量。并且當(dāng)這邊信息被縮小時(shí),編碼效率將可被增加,例如,其將可通過使用較大的方塊尺寸而被實(shí)現(xiàn)。真實(shí)的影像或視頻序列圖像是由具有特定性質(zhì)的任意形狀對(duì)象組成。如于一范例中,此些對(duì)象或?qū)ο蟛糠志哂歇?dú)特條理或一獨(dú)特移動(dòng)的特征。并且通常,相同組集的預(yù)測(cè)參數(shù)可被應(yīng)用于此一對(duì)象或?qū)ο蟛糠帧5菍?duì)于大的預(yù)測(cè)方塊(例如,H.264中的16×16巨方塊),對(duì)象邊界通常不重迭于可能的方塊邊界。一編碼器通常決定次分割(在可能的有限組集之中),那將導(dǎo)致最小量的特定率失真成本測(cè)量。對(duì)于任意形狀的對(duì)象,這可能導(dǎo)致大量的小方塊。并且由于這些小方塊各者被關(guān)聯(lián)于一組預(yù)測(cè)參數(shù),其將需要被傳送,因此邊信息率可能成為所有位率的一重要部分。但是由于數(shù)個(gè)小方塊仍然表示相同對(duì)象或?qū)ο蟛糠值膮^(qū)域,對(duì)于一些被取得的方塊的預(yù)測(cè)參數(shù)是相同的或非常相似的。亦即,次分割或鋪排一圖像成為較小部分或如瓷磚塊或方塊,大體上將會(huì)影響編碼效率以及編碼復(fù)雜性。如上所述,使一圖像次分割為較高數(shù)量的較小方塊,將使編碼參數(shù)有一空間較細(xì)設(shè)定,因而可使得這些編碼參數(shù)對(duì)圖像/視頻素材有較佳的調(diào)適性。另一方面,為了告知解碼器關(guān)于必要的設(shè)定,將以一較細(xì)的方塊尺寸設(shè)定編碼參數(shù),將在必要的邊信息數(shù)量上造成較高的負(fù)擔(dān)。更進(jìn)一步地,應(yīng)注意到,對(duì)于使編碼器(進(jìn)一步地)空間次分割圖像/視頻成為方塊的任何自由度,將極端地增大可能的編碼參數(shù)設(shè)定的數(shù)量,并且因此大體上使得對(duì)于導(dǎo)致最佳率/失真折衷的搜查甚至更困難者。
技術(shù)實(shí)現(xiàn)思路
依據(jù)本申請(qǐng)的第一方面,其目的是用以提供一編碼結(jié)構(gòu),例如,用以編碼表示空間取樣信息信號(hào),例如,但是并不限定于,視頻的圖像或靜態(tài)圖像,的一信息取樣數(shù)組,其將可實(shí)現(xiàn)在編碼復(fù)雜性以及可實(shí)現(xiàn)率/失真比之間的較佳折衷,及/或?qū)崿F(xiàn)一較佳率/失真比。這目的通過根據(jù)權(quán)利要求1的解碼器、根據(jù)權(quán)利要求18的編碼器、根據(jù)權(quán)利要求17或19的方法、根據(jù)權(quán)利要求20的計(jì)算機(jī)程序以及根據(jù)權(quán)利要求21的數(shù)據(jù)流被實(shí)現(xiàn)。依據(jù)第一方面,本申請(qǐng)是依據(jù)空間地分割表示一空間取樣信息信號(hào)的一信息取樣數(shù)組使首先成為樹根區(qū)域,接著依據(jù)自一數(shù)據(jù)流提取的多樹型次分割信息,通過遞歸式多分隔這些樹根區(qū)域的子集,次分割這些樹根區(qū)域的至少一子集使成為不同尺寸的較小簡(jiǎn)單連接區(qū)域,使得當(dāng)信息取樣數(shù)組空間地被分割成為樹根區(qū)域的最大區(qū)域尺寸,被包含在數(shù)據(jù)流之內(nèi)并且在解碼側(cè)自數(shù)據(jù)流被提取時(shí),則將可在失真率意義上于一非常細(xì)的次分割以及一非常粗的次分割之間找到具有適當(dāng)編碼復(fù)雜性的好的折衷。因此,依據(jù)本專利技術(shù)第一方面,一解碼器包括一提取器,該提取器被配置為自一數(shù)據(jù)流提取一最大區(qū)域尺寸以及多樹型次分割信息;一次分割器被配置為空間地分割表示空間取樣信息信號(hào)的一信息取樣數(shù)組成為最大區(qū)域尺寸的樹根區(qū)域,并且依據(jù)多樹型次分割信息,通過遞歸式多分隔這些樹根區(qū)域的子集,次分割樹根區(qū)域的至少一子集成為不同尺寸的較小的簡(jiǎn)單連接區(qū)域;以及一重建器被配置為,自使用該次分割使成為較小的簡(jiǎn)單連接區(qū)域的數(shù)據(jù)流而重建這些信息取樣數(shù)組。依據(jù)本文檔來自技高網(wǎng)...

【技術(shù)保護(hù)點(diǎn)】
一種解碼器,其包括:一提取器,其被配置為自一數(shù)據(jù)流提取一最大區(qū)域尺寸以及多樹型次分割信息;一次分割器,其被配置為空間地分割表示一空間取樣信息信號(hào)的一信息取樣數(shù)組成為一最大區(qū)域尺寸的樹根區(qū)域,并且依照一多樹型次分割信息,通過遞歸式多分隔這些樹根區(qū)域的子集,至少次分割這些樹根區(qū)域的一子集成為不同尺寸的較小簡(jiǎn)單連接區(qū)域;以及一重建器,其被配置為自使用次分割成為較小簡(jiǎn)單連接區(qū)域的數(shù)據(jù)流重建該取樣數(shù)組。
【技術(shù)特征摘要】
2010.04.13 EP PCT/EP2010/054843;2010.04.13 EP 10151.一種解碼器,其包括:一提取器,其被配置為自一數(shù)據(jù)流提取一最大區(qū)域尺寸以及多樹型次分割信息;一次分割器,其被配置為空間地分割表示一空間取樣信息信號(hào)的一信息取樣數(shù)組成為一最大區(qū)域尺寸的樹根區(qū)域,并且依照一多樹型次分割信息,通過遞歸式多分隔這些樹根區(qū)域的子集,至少次分割這些樹根區(qū)域的一子集成為不同尺寸的較小簡(jiǎn)單連接區(qū)域;以及一重建器,其被配置為自使用次分割成為較小簡(jiǎn)單連接區(qū)域的數(shù)據(jù)流重建該取樣數(shù)組。2.根據(jù)權(quán)利要求1所述的解碼器,其中,該次分割器被配置為進(jìn)行使這些信息取樣數(shù)組成為樹根區(qū)域的分割,使得這些樹根區(qū)域是通過規(guī)則地排列以便無間隔地覆蓋這些信息取樣數(shù)組的最大區(qū)域尺寸的矩形方塊尺寸而被決定。3.根據(jù)權(quán)利要求1或2所述的解碼器,其中,該次分割器被配置為在次分割這些樹根區(qū)域的子集時(shí),進(jìn)行下列步驟:對(duì)于各樹根區(qū)域,檢查關(guān)于各樹根區(qū)域是否被分隔的多樹型次分割信息,并且如果該各樹根區(qū)域被分隔的話,則依據(jù)關(guān)聯(lián)于第一層次等級(jí)的一分隔規(guī)則,而將該各樹根區(qū)域分隔進(jìn)入一第一層次等級(jí)的區(qū)域,并且對(duì)于這些第一層次等級(jí)的區(qū)域,遞歸式重復(fù)該檢查以及分隔,以便使用與之關(guān)聯(lián)的分隔規(guī)則而取得較高階的層次等級(jí)區(qū)域,當(dāng)依據(jù)該多樹型次分割信息而無進(jìn)一步的分隔將被進(jìn)行,或達(dá)到一最大層次等級(jí)時(shí),則停止該遞歸式重復(fù),其中,依照該多樹型次分割信息,在樹根區(qū)域的子集區(qū)域不進(jìn)一步地被分隔時(shí),分別地表示較小的簡(jiǎn)單連接區(qū)域以及多樹型次分割的葉區(qū)域。4.根據(jù)權(quán)利要求3所述的解碼器,其中,該提取器被配置為同時(shí)也自該數(shù)據(jù)流提取最大層次等級(jí)。5.根據(jù)權(quán)利要求3或4所述的解碼器,其中,該次分割器被配置為依照關(guān)聯(lián)于該第一以及較高階的層次...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:海納·基希霍弗爾,馬丁·溫肯,菲利普·海勒,德特勒夫·馬佩,海科·施瓦茨,托馬斯·維甘徳,
申請(qǐng)(專利權(quán))人:GE視頻壓縮有限責(zé)任公司,
類型:發(fā)明
國(guó)別省市:美國(guó);US