一種基于聚類的多物體檢測方法,屬于模式識別技術領域。步驟如下:(1)統計圖像中物體與視覺習語之間的關系并聚類,并使用局部模型得到物體和視覺習語的窗口;(2)根據原型構建空間關系特征,并使用結構化支撐向量機進行訓練和測試。本發明專利技術優于已有的各種物體檢測方法,且計算復雜度略有降低。
【技術實現步驟摘要】
本專利技術涉及的是一種多物體檢測的方法,特別涉及一種圖像中基于聚類的多物體檢測方,屬于模式識別
技術介紹
在傳統的物體檢測方案中,很多都是基于圖像的局部特征進行識別,而并沒有考慮圖像中物體與物體之間的關系。這種方式依賴于物體本身的不變性,對于姿態可變的物體檢測效果較差。在考慮了空間關系的物體檢測方案中,首先通過局部特征識別得到了圖像中物體可能存在的位置,并標記為窗口,為窗口指定權重。然后定義一系列物體和物體間的空間關系,并對圖像中存在的這種空間關系進行鑒別。通過空間關系來提高某些窗口的權重。最終權重大于閾值的窗口將被標記為檢測到的物體。空間關系在多種物體檢測方案中都顯示出了良好的效果。經對現有技術文獻的檢索發現,Desai等人在IEEE 12thInternationalConference on Computer Vision, 2009 (IEEE 第 12 屆國際計算機視覺大會)上發表的文章“Discriminative models for mult1-class object layout”(“多類物體布局的判別式模型”)中,提出了一種新的空間關系模型。這種空間模型預先定義了 7種空間關系,并使用了結構化支撐向量機(SSVM)進行訓練和測試。另外,Sadeghi等人在IEEEConference on Computer Vision and Pattern Recognition, 2011( IEEE 國際計算機視覺與模式識別會議,2011年)上發表的文章“Recognition usingvisual phrases”(“采用視覺習語進行識別”)中,提出了采用視覺習語提升物體檢測結果的方案。視覺習語是圖像中的物體按照一定的空間關系進行組合而形成的,該方案定義了視覺習語和物體之間的3種空間關系,并采用這3種空間關系優化物體檢測的結果。這兩種方法均存在一定缺陷。由于空間關系的定義沒有參考圖像中物體的分布情況,所以一些空間關系對于物體檢測是無效的,甚至會惡化物體檢測的結果。這種預先定義的空間關系并不能很好的表達圖像中真實存在的空間關系。另,在第一種方法中并沒有利用視覺習語,但視覺習語對于物體檢測的結果是有很大幫助的。在第二種方法中的空間關系定義過于簡單,從而沒有有效提升物體的檢測結果。
技術實現思路
針對現有技術中的缺陷,本專利技術的目的是提供一種基于聚類的多物體檢測方法(SCP)0使其不僅充分利用了圖像中物體之間的空間關系;而且可以基于圖像自身的特性,自動尋找并定義最佳的空間關系;同時有效的提升了物體檢測的結果。為實現上述目的,本專利技術采用以下技術方案一種基于聚類的多物體檢測方法,包括步驟如下(I)統計圖像中物體與視覺習語之間的關系并聚類,并使用局部模型得到物體和視覺習語的窗口; ΦΛ( -1)*其中M表示物體類的數量,N表示視覺習語類的數量,而k表示物體-視覺習語組合原型的最大數量;λ為選取的參數,且滿足>0 ;i表示物體的類為第i類,而j表示視覺習語的類為第j類;dt(l)表示在第t個組合中,物體和視覺習語之間的相對位置到第I個原型的歐氏距離,且I(t,I)=代指第t個組合中,物體和視覺習語之間的相對位置和第I個原型的距離dt (I)小于第I個原型的半徑,否則I (t,I) =O5(M)e-j^w表示第t個組合與第I個原型的相似度,除以對相似度進行歸一化;圖像中的所有t和第I個原型的相似度之和作為特征的第(1-l)*N*k+(j-l)*k+l維;對于后一部分02的第(1-1) *2+1維為第i類物體窗口可信度之和,而第(i_l)*2+2維為I ;且向量的第M*2+(j-l)*2+l維為第j類視覺習語窗口可信度之和,而第(i_l)*2+2維為1,^、02兩部分組合起來即構成最終的空間關系特征。 與現有的多物體檢測方法相比,本專利技術方法充分利用了物體和視覺習語之間的空間關系,這也是本專利技術的核心思想;本專利技術充分利用了物體和視覺習語之間相對位置呈現出的聚類特性,采用這種聚類特性優化了物體檢測的最終結果;本專利技術還采用了一種健壯選擇圖像數據庫中的一類物體,對于每一個物體-視覺習語組合,計算物體的中心點到視覺習語中心點的相對水平位置和垂直位置,然后對相對位置做歸一化;采用健壯的聚類方法對相對水平位置和相對垂直位置進行聚類,得到的聚類中心為每個原型(即每一個聚類稱為一種空間關系的原型)的中心,而方法中每個聚類中心的半徑為每個原型的半徑;同時,使用基于圖像局部特征的檢測方法對圖像進行檢測,得到一系列物體和視覺習語的窗口及窗口的可信度;(2)根據原型構建空間關系特征,并使用結構化支撐向量機進行訓練和測試;①最佳參數的選取使用交叉驗證的方法選擇最優參數λ和參數k,k表示物體-視覺習語組合原型的最大數量;②構建空間關系特征根據(I)得到的物體及視覺習語的窗口,以及(I)得到的原型,采用最優參數λ和參數k,對每幅圖像計算其空間關系特征;③結構化支撐向量機學習和判別使用結構化的支撐向量機學習空間關系特征每一維的權重,然后在測試集合中對空間關系特征進行判別,根據特征向量計算出正確的窗口 ;對圖像中的每一類物體,均做以上的學習和判別步驟,然后去掉視覺習語的檢測結果,再進一步融合為最終的檢測結果。優選地,所述健壯的聚類方法,步驟如下首先使用普通的聚類方法得到聚類中心,然后對每一個聚類中心均初始化一個半徑。對于二維空間中的每個點,均搜索離它最近的聚類中心,如果點和聚類中心的距離大于此聚類中心的半徑,則相應增加聚類中心的半徑。而若點和聚類中心的距離小于聚類中心的半徑,則不對半徑進行任何修改。反復迭代直到85%的點和最近聚類中心的距離小于聚類中心的半徑。隨后刪除半徑內僅有少量點的聚類中心,剩下的聚類中心則為輸出結果。優選地,所述的構建空間關系特征,具體為所述空間特征由兩部分組成,前一部分A的第(1-ι) *N*k+(j-l)*k+l維計算方法如下式的聚類方法,實驗證明對于描述物體和視覺習語之間的空間關系非常有效。本專利技術優于已有的各種物體檢測方法,且運算復雜度有所降低。附圖說明通過閱讀參照以下附圖對非限制性實施例所作的詳細描述,本專利技術的其它特征、目的和優點將會變得更明顯圖1為本專利技術流程圖。具體實施例方式下面結合具體實施例對本專利技術進行詳細說明。以下實施例將有助于本領域的技術人員進一步理解本專利技術,但不以任何形式限制本專利技術。應當指出的是,對本領域的普通技術人員來說,在不脫離本專利技術構思的前提下,還可以做出若干變形和改進。這些都屬于本專利技術的保護范圍。如圖1所示,本實施例可以分為以下幾個步驟。(I)統計圖像中物體與視覺習語之間的關系并聚類,并使用局部模型得到物體和視覺習語的窗口由于視覺習語一般包含兩種物體,且這兩種物體相比于視覺習語的相對位置基本固定。因此統計視覺習語中包含物體的相對水平位置和垂直位置。相對水平位置和相對垂直位置均使用視覺習語的中心距離物體中心的歐氏距離進行計算,且由于視覺習語的大小各有不同,對相對位置做了歸一化,即將相對水平位置除以視覺習語的寬度,且相對豎直位置除以視覺習語的高度。這樣對于任意的一個物體-視覺習語組合,均可以得到一系列歸一化后的相對水平位置和垂直位置。在本實施例中,對于每一個物體-視覺習語本文檔來自技高網...
【技術保護點】
一種圖像中基于聚類的多物體檢測方法,其特征是,步驟如下:(1)統計圖像中物體與視覺習語之間的關系并聚類,并使用局部模型得到物體和視覺習語的窗口;選擇圖像數據庫中的一類物體,對于每一個物體?視覺習語組合,計算物體的中心點到視覺習語中心點的相對水平位置和垂直位置,然后對相對位置做歸一化;采用健壯的聚類方法對相對水平位置和相對垂直位置進行聚類,得到的聚類中心為每個原型的中心,而方法中每個聚類中心的半徑為每個原型的半徑;同時,使用基于圖像局部特征的檢測方法對圖像進行檢測,得到一系列物體和視覺習語的窗口及窗口的可信度;(2)根據原型構建空間關系特征,并使用結構化支撐向量機進行訓練和測試;①最佳參數的選取:使用交叉驗證的方法選擇最優參數λ和參數k,k表示物體?視覺習語組合原型的最大數量;②構建空間關系特征:根據(1)得到的物體及視覺習語的窗口,以及(1)得到的原型,采用最優參數λ和參數k,對每幅圖像計算其空間關系特征;③結構化支撐向量機學習和判別:使用結構化的支撐向量機學習空間關系特征每一維的權重,然后在測試集合中對空間關系特征進行判別,根據特征向量計算出正確的窗口;對圖像中的每一類物體,均做以上的學習和判別步驟,然后去掉視覺習語的檢測結果,再進一步融合為最終的檢測結果。...
【技術特征摘要】
【專利技術屬性】
技術研發人員:張瑞,朱玉琨,朱俊,鄒維嘉,仇媛媛,付賽男,
申請(專利權)人:上海交通大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。