本發(fā)明專利技術(shù)提供一種數(shù)字圖像中多物體檢測(cè)的分離方法,屬于圖像處理技術(shù)領(lǐng)域。步驟如下:(1)采用局部特征對(duì)數(shù)字圖像進(jìn)行檢測(cè),并分離檢測(cè)窗口;(2)根據(jù)分離的窗口信息構(gòu)建并擴(kuò)展空間特征,采用交叉驗(yàn)證選擇最佳參數(shù),并使用支撐向量機(jī)進(jìn)行訓(xùn)練和測(cè)試。本發(fā)明專利技術(shù)方法不僅有效利用了圖像中物體之間的空間關(guān)系,降低了計(jì)算的復(fù)雜度;而且由于窗口與窗口的分離,不會(huì)因?yàn)樯倭康腻e(cuò)誤結(jié)果而惡化所有的檢測(cè)結(jié)果;同時(shí),可以引入更多的空間關(guān)系特征,有效的提升了物體檢測(cè)的結(jié)果。本發(fā)明專利技術(shù)優(yōu)于已有的各種物體檢測(cè)方法。
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及的是一種多物體檢測(cè)的方法,特別涉及一種,屬于圖像處理
技術(shù)介紹
近年來,隨著多媒體技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)的飛速發(fā)展,每天都有海量的數(shù)字圖像產(chǎn)生和傳播。自動(dòng)識(shí)別這些數(shù)字圖像的內(nèi)容,從而高效的進(jìn)行組織、管理,已經(jīng)成為了目前研究的熱點(diǎn)和難點(diǎn)。對(duì)數(shù)字圖像的物體檢測(cè)是解決圖像內(nèi)容識(shí)別的關(guān)鍵技術(shù)之一。在傳統(tǒng)的物體檢測(cè)方案中,很多都是基于圖像的局部特征,如圖像的顏色、形狀、邊緣紋理等進(jìn)行檢測(cè),而并沒有考慮圖像中物體與物體之間的關(guān)系。這種方式依賴于局部特征的不變性,對(duì)于姿態(tài)可變的物體檢測(cè)效果較差。在考慮了空間關(guān)系的物體檢測(cè)方案中,首先通過局部特征的檢測(cè)得到了圖像中物體可能存在的位置和物體的類別,并標(biāo)記為窗口。局部特征檢測(cè)可以為每個(gè)窗口打分,分?jǐn)?shù)的大小將反映窗口中存在物體的可能性大小。然后定義一系列物體和物體間的空間關(guān)系,并對(duì)圖像中存在的這種空間關(guān)系進(jìn)行鑒別。通過空間關(guān)系以及窗口的分?jǐn)?shù)作出綜合判斷??臻g關(guān)系在多種物體檢測(cè)方案中都顯示出了良好的效果。經(jīng)對(duì)現(xiàn)有技術(shù)文獻(xiàn)的檢索發(fā)現(xiàn),Desai等人在IEEE 12thInternationalConference on Computer Vision, 2009 (IEEE 第 12 屆國際計(jì)算機(jī)視覺大會(huì))上發(fā)表的文章“Discriminative models for mult1-class object layout”(“多類物體布局的判別式模型”)中,提出了一種新的空間關(guān)系模型。這種空間模型預(yù)先定義了 7種空間關(guān)系,并使用了結(jié)構(gòu)化支撐向量機(jī)(SSVM)進(jìn)行訓(xùn)練和測(cè)試。在空間關(guān)系模型的訓(xùn)練和測(cè)試中,由于對(duì)每一個(gè)窗口分?jǐn)?shù)的調(diào)整均會(huì)對(duì)圖像中所有窗口產(chǎn)生影響,因此,通常難以得到一個(gè)全局最優(yōu)解。在以上方法中,采用了 Greedy ForwardSearch (貪婪算法),在算法的每一步迭代中尋找分?jǐn)?shù)最高的窗口,并使用此窗口的分?jǐn)?shù)和之前迭代得到的空間信息,對(duì)此窗口進(jìn)行判斷,從而得到一個(gè)局部最優(yōu)解。這種方法存在一定缺陷。由于貪婪算法在每一步迭代中均假定,對(duì)分?jǐn)?shù)最高的窗口進(jìn)行判斷后,其余窗口分?jǐn)?shù)的變化將不再影響此窗口的判斷結(jié)果。如果在局部特征識(shí)別得到的所有窗口中,分?jǐn)?shù)最高的窗口中并不含任何物體,這種算法很有可能會(huì)在第一步迭代中將分?jǐn)?shù)最高的窗口誤認(rèn)為存在物體,并基于此信息對(duì)之后的迭代進(jìn)行判斷。因此,這種算法可能會(huì)產(chǎn)生惡化的檢測(cè)結(jié)果。同時(shí),在空間模型的訓(xùn)練過程中,結(jié)構(gòu)化支撐向量機(jī)需要對(duì)所有圖片中的所有物體進(jìn)行優(yōu)化,以得到最終的模型,因此計(jì)算速度較慢。
技術(shù)實(shí)現(xiàn)思路
針對(duì)現(xiàn)有技術(shù)中的缺陷,本專利技術(shù)的目的是提供一種多物體檢測(cè)的分離方法,降低物體檢測(cè)的計(jì)算復(fù)雜度,極大減少了計(jì)算時(shí)間,提高檢測(cè)速度。為實(shí)現(xiàn)上述目的,本專利技術(shù)采用的技術(shù)方案是本專利技術(shù)通過對(duì)圖像局部特征檢測(cè)結(jié)果進(jìn)行分析,將每幅圖像通過閾值法和極大值法計(jì)算分離為孤立的窗口。這些孤立的窗口僅攜帶自身的信息,以及少量其他窗口的信息。然后計(jì)算每個(gè)窗口與其他窗口的空間關(guān)系。這種方法不僅有效利用了圖像中物體之間的空間關(guān)系,降低了計(jì)算的復(fù)雜度;而且由于窗口與窗口的分離,不會(huì)因?yàn)樯倭康腻e(cuò)誤結(jié)果而惡化所有的檢測(cè)結(jié)果;同時(shí),可以引入更多的空間關(guān)系特征,有效的提升了物體檢測(cè)的結(jié)果。本專利技術(shù)優(yōu)于已有的各種物體檢測(cè)方法。具體的,本專利技術(shù)所述,具體步驟如下(I)采用局部特征對(duì)數(shù)字圖像進(jìn)行檢測(cè),并分離檢測(cè)窗口由于數(shù)字圖像中通常存在多類物體,且每類物體的局部特征相對(duì)較為固定,因此可以通過局部特征對(duì)每一類物體進(jìn)行檢測(cè)。檢測(cè)結(jié)果為不同尺度、位置的窗口。首先設(shè)定局部特征的閾值Tl,隨后對(duì)檢測(cè)出的所有窗口進(jìn)行分析,保留分?jǐn)?shù)超過閾值Tl的窗口,去除分?jǐn)?shù)低于閾值Tl的窗口。然后,定義七種不同的空間關(guān)系,分別為“覆蓋”、“在上”、“在下”、“左右相鄰”、“鄰近”、“遠(yuǎn)離”、“重疊”。隨后對(duì)保留的所有窗口,采用閾值法,或極大值法進(jìn)行分離。其中閾值法和極大值法的具體步驟分別闡述如下①閾值法對(duì)于保留的每一個(gè)窗口,也稱為當(dāng)前窗口,我們首先增加它的鄰域。鄰域的長度取窗口長度的3倍,且寬度去窗口長度的3倍。鄰域的中心與當(dāng)前窗口中心重合。其次設(shè)定分離閾值T2,且T2大于Tl。對(duì)于鄰域中所有的窗口,也稱為鄰域窗口,如果分?jǐn)?shù)大于T2,則保留此鄰域窗口,如果分?jǐn)?shù)小于T2,則去除此鄰域窗口。不同的窗口 -鄰域組合之間相互獨(dú)立。②極大值法對(duì)保留的每一個(gè)當(dāng)前窗口,與閾值法類似設(shè)定鄰域,但鄰域的大小為整張圖片。鄰域中的其他窗口,即鄰域窗口可能屬于多種物體類別。對(duì)每一類別,分別計(jì)算屬于該類別的鄰域窗口與當(dāng)前窗口之間的空間關(guān)系。對(duì)屬于這一類別、且與當(dāng)前窗口構(gòu)成某種空間關(guān)系的所有鄰域窗口,僅保留其中分?jǐn)?shù)最大的,并去除其余的。采用極大值法分離后的不同的窗口-鄰域組合之間依然相互獨(dú)立。(2)根據(jù)分離的窗口信息構(gòu)建空間特征,采用交叉驗(yàn)證選擇最佳參數(shù),并使用支撐向量機(jī)進(jìn)行訓(xùn)練和測(cè)試對(duì)于分離后的每個(gè)窗口-鄰域組合,分別構(gòu)建空間特征。由于不同的組合相互獨(dú)立,即一個(gè)窗口-鄰域組合的檢測(cè)結(jié)果并不影響另一個(gè)窗口-鄰域組合的檢測(cè)結(jié)果,僅需要分別對(duì)每個(gè)組合進(jìn)行檢測(cè),判斷窗口中是否存在物體。在本專利技術(shù)中,對(duì)窗口-鄰域組合的檢測(cè)和判斷分別從構(gòu)建空間關(guān)系特征、支撐向量機(jī)學(xué)習(xí)和判別兩個(gè)方面描述如下①構(gòu)建空間關(guān)系特征在本專利技術(shù)中,對(duì)每一個(gè)窗口 -鄰域組合均計(jì)算其空間特征??臻g關(guān)系特征為定長的數(shù)字向量,且由兩部分組成,第一部分表示了當(dāng)前窗口和鄰域窗口之間的空間關(guān)系,標(biāo)記為,另一部分表示了圖像中當(dāng)前窗口在局部模型的可信度,標(biāo)記為02。對(duì)于前一部分,計(jì)算方法如下對(duì)于所有的物體類別,分別初始化長度為7維的零向量0i扃i的每一維均為O。統(tǒng)計(jì)在鄰域中屬于該類別的鄰域窗口,并計(jì)算這些窗口和當(dāng)前窗口之間的空間關(guān)系。建立從實(shí)數(shù)集合到正實(shí)數(shù)集合的映射函數(shù)V (x) = eAx,其中,入為選取的參數(shù),且滿足入>0。如果鄰域窗口屬于第k種空間關(guān)系,且鄰域窗口的分?jǐn)?shù)為S,則將Ia1的第k維增加v(s)。按不同的物體類別,將②^衣次組合為一個(gè)大向量,此向量即為。后一部分02為一維向量,即為圖像中當(dāng)前窗口在局部模型的可信度。組合O1 02則得到空間關(guān)系特征。②支撐向量機(jī)訓(xùn)練和測(cè)試對(duì)圖像中分離的每一個(gè)窗口 -鄰域組合,均可計(jì)算其空間關(guān)系特征。本專利技術(shù)采用線性模型來對(duì)這些特征進(jìn)行建模和識(shí)別。在訓(xùn)練集合上,使用支撐向量機(jī)學(xué)習(xí)空間關(guān)系特征每一維的權(quán)重,使得權(quán)重向量乘以特征向量的結(jié)果盡量符合真實(shí)值。然后在測(cè)試集合中,提取窗口-鄰域組合的空間關(guān)系特征向量,然后將權(quán)重向量與特征向量相乘,如果大于某個(gè)閾值,則判斷此窗口 -鄰域組合的當(dāng)前窗口包含物體。對(duì)圖像中的每一類物體,均做以上的學(xué)習(xí)和判別步驟,然后根據(jù)判別的結(jié)果融合為最終的檢測(cè)結(jié)果。③選擇最佳參數(shù)使用交叉驗(yàn)證的方法選擇最優(yōu)參數(shù)入。 (3)增加新的特征在本專利技術(shù)中采用了閾值法和極大值法對(duì)窗口進(jìn)行分離。由于在極大值法的分離過程中,屬于每一個(gè)類、每一種空間關(guān)系的鄰域窗口僅保留了分?jǐn)?shù)最大的窗口,可以計(jì)算此鄰域窗口和當(dāng)前窗口的更多特征,如長寬比和重疊百分比。這些特征對(duì)多物體的檢測(cè)也是有益的。引入新的特征后,空間關(guān)系特征的部分將會(huì)得到擴(kuò)展。具體實(shí)施過程如下對(duì)于所有的物體類別C以及空間關(guān)系S,分別初始化長度為3維的零向量01。0扣勺每一維均本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
一種數(shù)字圖像中多物體檢測(cè)的分離方法,其特征在于,步驟如下:(1)采用局部特征對(duì)數(shù)字圖像進(jìn)行檢測(cè),并分離檢測(cè)窗口采用局部特征對(duì)所有可能存在的物體進(jìn)行檢測(cè),去掉低于局部特征閾值T1的窗口,定義七種不同的空間關(guān)系,分別為“覆蓋”、“在上”、“在下”、“左右相鄰”、“鄰近”、“遠(yuǎn)離”、“重疊”;然后選擇圖像數(shù)據(jù)庫中的一類物體,對(duì)保留的每一個(gè)當(dāng)前窗口,采用閾值法或極大值法進(jìn)行分離,分離后不同的窗口?鄰域組合之間相互獨(dú)立;(2)根據(jù)分離的窗口信息構(gòu)建空間特征,采用交叉驗(yàn)證選擇最佳參數(shù),并使用支撐向量機(jī)進(jìn)行訓(xùn)練和測(cè)試;①構(gòu)建空間關(guān)系特征:對(duì)于分離后的每一個(gè)窗口?鄰域組合均計(jì)算并構(gòu)建空間關(guān)系特征;②支撐向量機(jī)訓(xùn)練和測(cè)試:對(duì)每個(gè)窗口?鄰域組合的空間關(guān)系特征,采用支撐向量機(jī)在訓(xùn)練集合上進(jìn)行訓(xùn)練,得到的權(quán)重向量;在測(cè)試集合中將權(quán)重向量與提取出的空間關(guān)系特征向量相乘,如果大于閾值,則判斷此窗口?鄰域組合的當(dāng)前窗口中含有物體;對(duì)圖像中的每一類物體,均做以上的學(xué)習(xí)和判別步驟,然后根據(jù)判別的結(jié)果融合為最終的檢測(cè)結(jié)果;③選擇最佳參數(shù):使用交叉驗(yàn)證的方法選擇最優(yōu)參數(shù)λ。
【技術(shù)特征摘要】
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:張瑞,朱玉琨,朱俊,鄒維嘉,仇媛媛,付賽男,
申請(qǐng)(專利權(quán))人:上海交通大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。