本發明專利技術公開了一種廣義圖像目標檢測方法,屬于圖像分析處理技術領域。本發明專利技術方法結合圖像特征提取與學習過程中的樣例方法和多實例方法的優勢,在此基礎上擴展成為多核多實例相似度特征(MKMIS),能夠為同一類中具有不同外觀的目標進行很好的描述,并能接受一定范圍內的配準誤差;其次,針對MKMIS特征的弱勢,即圖像特征維度過高、計算量大的情況,在分類器學習過程中,使用推廣的前向特征選擇方法,使其能夠滿足任意條件的損失和約束函數,使分類器可以選擇到少量并且有效的圖像特征,當進行在線目標檢測時,只計算和使用這些特征即可,從而加快目標檢測的速度。
【技術實現步驟摘要】
本專利技術涉及一種圖像目標檢測方法,尤其涉及一種多核多實例相似度特征與前向特征選擇的廣義圖像目標檢測方法,屬于圖像分析處理
技術介紹
在圖像分析領域中,目標檢測是ー項重要的工作。通常的方法是利用模式識別技術,通過滑動窗ロ對圖像進行遍歷實現。在遍歷窗ロ的過程中,分類器對每個當前窗ロ進行決策,判斷它是目標或是背景。近些年的研究對于某些類型目標的檢測(例如,人臉,行人,車輛等)取得了一定的成果。然而,廣義目標類型的檢測仍然是個有待解決的問題。解決該問題的難點在于,語言上關于ー個類的概念,跟圖像中實際觀察到的該類的特征之間存在著差距,很難精確給出ー個概念對應的特征的分布。這ー現象通常稱為語義鴻溝。直觀來看即是,基于語義的目標類能表現出風格迥異的外觀。例如,車輛類包含了多種亞類巴士、轎車、卡車等。對于復合結構或者復雜結構的目標,其視覺外觀會受到其各個部件設置的影響。例如,每個部件具有不同的位置,每個部件還可以包含自己的亞類。這些變化條件使目標類的潛在外觀設置數目以指數級增長。還有ー些外在因素,如視角、光照進ー步加劇了目標的外觀變化范圍。為解決這ー問題,許多研究工作致力于設計出具有高區分度的特征,為目標檢測提供更有效的信息。然而,由于目標類在其特征空間中往往具有多模型分布的特點,即分類邊界具有不規則性,如何為這種分布找到合理的分類邊界,是模式識別工作面臨的ー個難題。目前,解決多模型分布問題的最直觀、最廣泛使用的技術是利用分治思想,將目標實例通過人工或者機器自動分成亞類。由于每個亞類中目標具有相似的外觀特征分布,因此從每一類中可以學習到ー個模型。如果ー個測試實例屬于該目標的某個亞類,那么該測試實例被分類器判定屬于該目標類,也有方法將該實例與在每個亞類中的計分(score)作為特征應用到更高ー層的分類器中。但是,在目標亞類決策問題上,一些目標亞類是模棱兩可和難以定義的。例如,一個亞類可以為目標的任何部件進行定義,但是因為對多個部件的多種亞類情況進行組合吋,目標數目出現爆炸,因此不能為整個目標進行定義??勺冃尾考P秃驼Z法模型方法,構建了 “部件-整體”模型和“整體亞類-部件亞類”模型。它包含了 ー套豐富的語法,用來描述目標的種類,并可以很好的與目標部件的幾何構造配合使用。然而,語法模型的參數過多,訓練比較困難,而且復雜的語法模型對于解決目標檢測這樣的問題也不必要。目前,目標的部件檢測仍然是語法模型中最薄弱的環節?;跇永姆椒ㄈ〈@式的亞分類,通過隱式的亞分類方法,使用目標與樣例集相似度作為分類特征,捕獲多模型分布。與從傳感器信號直接提取的低層特征相比,相似度特征是ー種中層特征,具有一定的語義信息。使用相似度特征訓練分類器的方法,與使用亞分類計分作為特征訓練高級模型是相似的。相似度特征空間能夠有效解決在特征空間多模型分布的分類問題。另外,在目標檢測中,不管在訓練集還是測試集中,目標常常不能得到很好的配準。造成這種現象的原因包括對訓練集標注不準確性,以及目標存在形變(如人體的關節變化)。因此,目標部件與一個樣例中的匹配最好的長方形區域,與另ー個樣例中匹配最好的長方形,很可能位于不同的位置。例如,ー套行人的采樣集中,人體頭部可以位于目標包圍盒中的不同位置。多實例學習方法(MIL)可以解決訓練集中的配準不準確性和目標的局部幾何變換問題。在訓練過程中,對給定訓練樣本的不精確的包圍盒抖動得到ー個訓練實例包。MIL方法從一系列已標記的實例包中學習。標記是僅對實例包的標記,如果ー個包中至少含有一個目標實例,那么將該包標記成為“正”;如果ー個包中沒有ー個實例是目標實例,則將該包標記為“負”。本工作將多實例方法應用在特征提取的級別。在訓練和測試時,通過計算樣例與錨點處部件實例包的相似度,并提取出相似度最大的那個值作為該部件的特征。此方法不僅簡單,而且比其它復雜方法(例如,可變形部件模型和Hough變換方法)的實驗效果更理想。然而,不管是樣例特征還是多實例相似度特征,都面臨了ー些學習時的難點,如特征向量的長度是樣例數目與核數目的乘積,會很容易產生上10萬級的特征長度,給分類器的訓練造成了很大的計算消耗和分類困難。
技術實現思路
本專利技術的目的是為了在廣義圖像目標檢測實現過程中,能夠接受圖像中待測目標更大范圍內的形變,并解決目標配準問題,提出一種新的廣義圖像目標檢測方法。本專利技術方法的基本原理是,首先,結合圖像特征提取與學習過程中的樣例方法和多實例方法的優勢,在此基礎上擴展成為多核多實例相似度特征(MKMIS),能夠為同一類中具有不同外觀的目標進行很好的描述,井能接受一定范圍內的配準誤差;其次,針對MKMIS特征的弱勢,即圖像特征維度過高、計算量大的情況,在分類器學習過程中,使用推廣的前向特征選擇方法,使其能夠滿足任意條件的損失和約束函數,使分類器可以選擇到少量并且有效的圖像特征,如此一來,當進行在線目標檢測時,只計算和使用這些特征即可,從而加快目標檢測的速度。為實現上述目的,本專利技術所采用的技術方案如下,包括以下步驟步驟一、讀取訓練集圖像和樣例集圖像,提取出它們的低層圖像特征。具體如下所述訓練圖像和樣例圖像,具有統ー的圖像尺寸,目標在圖像中所占的比例應保持尺度相當。特征提取是基于統一大小的固定網格進行的,圖像被網格劃分為M個矩形塊,每個矩形塊對應于ー個圖像特征通道,M為正整數。首先,定義每個矩形塊的位置為ー個錨點,錨點鄰域內的若干矩形塊為該錨點的支撐集。錨點的支撐集對應于多實例學習方法(MIL)中的實例包。然后,根據已設置的M個錨點處的矩形塊,對訓練集圖像提取低層多實例圖像特征。每ー個圖像采樣Sampi的低層特征向量是A =·{ ,.L,其中i表示訓練圖像的序號,為正整數。x|,x,2,...,xf分別表示第i個圖像上I至M個矩形塊上的圖像特征向量。其中=(Xjj)ieZm,m e {I, 2,... ,Μ}, Im表示錨點m處的支撐集,j表示支撐集Im中的實例序號。之后,根據已設置的錨點位置,對樣例集圖像提取低層圖像特征Xた=X^, ...,X^LeXe表示樣例圖像的特征向量,k表示樣例圖像的序號。步驟ニ、對經步驟ー提取出的訓練集圖像與樣例集圖像的低層特征進行相似度比較,獲取訓練集圖像的MKMIS特征。具體如下令訓練集特征ろ=8ズ,...,1"和樣例特征3^=ト^,1^,...,1^^的相似度特征表示為S(Xek,Xi )。首先,按矩形區域進行分塊比較,如X,1和Xし、X,2和 < 進行比較,即外υ.) = 0(χ し,x!),s(xLx ),…メ (x2,xf)}然后,計算多核相似度*S(X;%X;i)。計算兩個實例之間的相似度S(Xi,Xj)可以使用多種相似度函數,均適用于低層特征空間上的幾何分布。例如,I-范數、2-范數、基于多種協方差矩陣的馬氏距離,或者是不同帶寬下的RBF核。訓練圖像與樣例圖像在錨點m處的多核相似度特征,是通過不同相似度函數計算得到的特征連接起來構成的多核相似度_] SW,0呢xk)”..,SKyf(O其中,*^(ΧΓ,Χ=) ,…, ,ぬ)是P種不同的相似度函數,P取正整數。T是轉置符號。之后,計算多實例相似度辦Xf,X;;D。訓練圖像錨點m的支撐集Im與樣例集圖像對應錨點m處矩形塊的相本文檔來自技高網...
【技術保護點】
一種廣義圖像目標檢測方法,其特征在于包括以下步驟:步驟一、讀取訓練集圖像和樣例集圖像,提取出它們的低層圖像特征,具體如下:所述訓練圖像和樣例圖像,具有統一的圖像尺寸,目標在圖像中所占的比例應保持尺度相當;特征提取是基于統一大小的固定網格進行的,圖像被網格劃分為M個矩形塊,每個矩形塊對應于一個圖像特征通道,M為正整數;首先,定義每個矩形塊的位置為一個錨點,錨點鄰域內的若干矩形塊為該錨點的支撐集,錨點的支撐集對應于多實例學習方法中的實例包;然后,根據已設置的M個錨點處的矩形塊,對訓練集圖像提取低層多實例圖像特征;每一個圖像采樣sampi的低層特征向量是?其中i表示訓練圖像的序號,為正整數;?分別表示第i個圖像上1至M個矩形塊上的圖像特征向量,其中?m∈{1,2,...,M},Im表示錨點m處的支撐集,j表示支撐集Im中的實例序號;之后,根據已設置的錨點位置,對樣例集圖像提取低層圖像特征?其中,xe表示樣例圖像的特征向量,k表示樣例圖像的序號;步驟二、對經步驟一提取出的訓練集圖像與樣例集圖像的低層特征進行相似度比較,獲取訓練集圖像的MKMIS特征;具體如下:令訓練集特征和樣例特征的相似度特征表示為S(xek,xi);首先按矩形區域進行分塊比較,然后計算多核相似度?所述訓練圖像與樣例圖像在錨點m處的多核相似度特征,是通過不同相似度函數計算得到的特征連接起來構成的多核相似度:其中,?是P種不同的相似度函數,P取正整數;T是轉置符號;之后,計算多實例相似度?訓練圖像錨點m的支撐集Im與樣例集圖像對應錨點m處矩形塊的相似度比較結果的集合為?由于存在配準誤差,目標部件與樣例集中的最好配準將會出現在該錨點支撐集中;理想的情況是,正樣例與正錨點支撐集中至少有一個長方形塊具有很高的相似度值,與負樣例的錨點支撐集具有很低的相似度值;負樣例與負錨點支撐集中至少一個長方形塊具有很高的相似度值,與正標記錨點支撐集具有很低的相似度;多實例學習通過取錨點支撐集中的最大值作為該錨點的相似度值:以上的形式不是對稱的;若相似度函數是半正定的,則設計一個匹配核k:k這個核函數忽略較小的配準誤差,只要誤差在支持集的范圍之內;最后,構成MKMIS特征:對于訓練集的一幅圖像,將它所有錨點處計算得到的相似度值?連接起來,構成整個相似度特征向量:其中,T是轉置符號;步驟三、使用經步驟二得到的MKMIS特征,訓練基于前向特征選擇的SVM分類器,實現過程如下:首先,初始化每個訓練樣本的權重βi為1;之后,迭代如下過程,直到分類器性能符合要求:(1)根據當前樣本權重βi,對特征d=1,...,D,D是一個特征向量的維度,計算?的值,其中R是二次約束或者一次約束,根據實際情況自由設定;ωd是第d維特征的權值,初始化為0,SVM將為每個維度的特征學習到其權重值;λ是求解線性SVM問題時在規范項跟經驗損失之間做平衡的數值,根據經驗結果選定,通常跟訓練樣本大小和用的kernel類型都有關系,具體選擇時可按照一個指數的序列進行選擇,找到使分類效果最好的作為λ;xi,d表示第i個樣本的第d維的特征值;N是樣本總數目;將令此值最大的一個或若干個特征加入到選中的特征集中,訓練線性SVM,得到到新的樣本權重βi;?(2)當訓練完分類器后,利用梯度下降法,優化碼書中的碼字,即迭代如下步驟:首先,計算損失函數對每個樣例的梯度:?其中f是SVM的計分函數,sik表示第i個圖像和第k個樣例圖像的相似度,xek第k個樣例圖像的特征;然后,更新樣例:?其中σ為在梯度方向上的步長,通過如下的線性搜索方法確定步長:取步長σ為序列?中的每一個值,計算(LOld?LNew)/gσ,其中g為梯度?的大小,LOld為使用原樣例xek的損失函數大小,LNew為使用了更新的樣例?的損失函數大??;取令(LOld?LNew)/gσ值大于某一預設的閾值的第一個σ;步驟四、利用訓練好的分類器,使用滑動窗口檢測圖像中的目標;對于一幅任意大小的測試圖像,提取圖像上滑動窗口內的低層特征,計算與選中的樣例集的MKMIS特征;使用步驟三中訓練好的分類器進行分類決策。?FDA00002031915300011.jpg,FDA00002031915300012.jpg,FDA00002031915300013.jpg,FDA00002031915300014.jpg,FDA00002031915300015.jpg,FDA00002031915300016.jpg,FDA00002031915300017.jpg,FDA00002031915300018...
【技術特征摘要】
【專利技術屬性】
技術研發人員:趙三元,李鳳霞,李仲軍,陳宇峰,王清云,孫晨升,
申請(專利權)人:北京理工大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。