本發(fā)明專利技術實施例公開了一種獲取圖像描述信息的方法及裝置以及分類器訓練方法。獲取圖像描述信息的方法包括:分割所述多幅圖像,獲得所述多幅圖像的子圖像;基于所述子圖像相互之間的特征相似性,獲得所述子圖像的相似度因子;基于所述子圖像的相似度因子計算所述子圖像所對應的圖像的描述信息。本發(fā)明專利技術實施例在獲得圖像的描述信息時,可以根據該圖像的特征及其對應的相似度因子進行計算,從而使圖像中重要度大的區(qū)域的特征占有較大的比重,而重要度小的區(qū)域的特征占有較小的比重,例如使圖像中前景對象在最終的特征中占有較大的比重,而背景內容占有較小的比重,有效的減小了背景噪聲的影響,獲得了更準確的圖像描述信息。
【技術實現(xiàn)步驟摘要】
本專利技術一般地涉及圖像處理
,尤其是一種獲取圖像描述信息的方法及裝置,分類器訓練方法,以及圖像識別方法和裝置。
技術介紹
隨著計算機技術和互聯(lián)網的迅速發(fā)展,在許多領域中,數字圖像的數量和復雜度都呈現(xiàn)出爆炸性的增長趨勢。因此,如何對這些海量圖像進行快速有效的管理自然而然成為我們面臨的ー個挑戰(zhàn)課題,主要包括對這些圖像的訪問、存取、組織、檢索等。為了滿足這ー需求,自上個世紀九十年代以來,各個領域的研究人員和學者已經投入了很多精力對圖像識別技術進行研究,并開發(fā)出一些有效的技術和系統(tǒng)。·在圖像識別系統(tǒng)中,根據圖像中的特征,如顔色、紋理和形狀特征,計算圖像間的距離,即確定圖像之間的相似度,完成圖像識別的功能。例如,對10類對象Cl. . . ClO進行識另IJ,那么首先需要為每ー個類別(從Cl到C10)準備ー些圖像,即訓練圖像集(訓練樣本),包含對象Cl的圖像組成Cl的訓練圖像集,包含對象C2的圖像組成C2的訓練圖像集...;然后,從這些訓練圖像集中提取圖像特征;最后,根據這些圖像特征構建模型。在識別階段,當給定ー個待識別圖像時,首先從該圖像中提取圖像特征,然后,利用之前構建的模型判斷該圖像的類別,完成識別功能。然而,一幅圖像往往包含復雜的內容,如包括前景對象和背景部分,而在圖像識別時往往只是針對前景對象,如果在識別過程提取圖像特征時,對于整個圖像中的前景對象和背景部分毫無差別,會導致圖像識別的準確度下降。因此,在提取圖像特征之前,如何盡可能的減小背景部分的影響,獲得更準確的圖像描述信息是非常重要的。
技術實現(xiàn)思路
有鑒于此,本專利技術實施例提供了一種圖像描述信息的獲取方法及裝置,能夠減小圖像中背景部分的影響,獲得更準確的圖像描述信息。根據本專利技術實施例的ー個方面,提供一種基于多幅圖像獲取圖像描述信息的方法,包括分割所述多幅圖像,獲得所述多幅圖像的子圖像;基于所述子圖像相互之間的特征相似性,獲得所述子圖像的相似度因子;基于所述子圖像的相似度因子計算所述子圖像所對應的圖像的描述信息。根據本專利技術實施例的另ー個方面,提供一種分類器訓練方法,包括利用上述基于多幅圖像獲取圖像描述信息的方法,將訓練圖像作為所述多幅圖像,計算所述訓練圖像的圖像描述信息;基于所述訓練圖像的圖像描述信息訓練分類器。根據本專利技術實施例的再ー個方面,提供ー種圖像識別方法,包括利用上述基于多幅圖像獲取圖像描述信息的方法,將待識別圖像與訓練圖像共同作為所述多幅圖像,計算所述待識別圖像的圖像描述信息;基于所述待識別圖像的圖像描述信息,利用基于上述分類器訓練方法訓練的分類器,對所述待識別圖像進行識別分類。根據本專利技術實施例的另ー個方面,提供一種基于多幅圖像獲取圖像描述信息的裝置,包括圖像分割単元,被配置成分割所述多幅圖像,獲得所述多幅圖像的子圖像;因子獲取單元,被配置成基于所述子圖像相互之間的特征相似性,獲得所述子圖像的相似度因子;信息獲取單元,被配置成基于所述子圖像的相似度因子計算所述子圖像所對應的圖像的描述信息。根據本專利技術實施例的另ー個方面,提供ー種圖像識別裝置,包括 如上所述的圖像描述信息獲取裝置,用于獲取待識別圖像的圖像描述信息;分類器,被配置為基于所述待識別圖像的圖像描述信息,對所述待識別圖像進行識別分類。另外,根據本專利技術的另一方面,還提供了ー種存儲介質。所述存儲介質包括機器可讀的程序代碼,當在信息處理設備上執(zhí)行所述程序代碼時,所述程序代碼使得所述信息處理設備執(zhí)行根據本專利技術的上述基于多幅圖像獲取圖像描述信息的方法。此外,根據本專利技術的再一方面,還提供了 ー種程序產品。所述程序產品包括機器可執(zhí)行的指令,當在信息處理設備上執(zhí)行所述指令吋,所述指令使得所述信息處理設備執(zhí)行根據本專利技術的上述基于多幅圖像獲取圖像描述信息的方法。根據本專利技術實施例的上述ー種方法,通過計算每一幅圖像中不同區(qū)域的子圖像的相似度因子,標明了該圖像中各區(qū)域的重要度,從而在獲得圖像的描述信息時,可以根據該圖像的特征及其對應的相似度因子進行計算,從而使圖像中重要度大的區(qū)域的特征占有較大的比重,而重要度小的區(qū)域的特征占有較小的比重,例如使圖像中前景對象在最終的特征中占有較大的比重,而背景內容占有較小的比重,有效的減小了背景噪聲的影響,獲得了更準確的圖像描述信息。在下面的說明書部分中給出本專利技術實施例的其他方面,其中,詳細說明用于充分地公開本專利技術實施例的優(yōu)選實施例,而不對其施加限定。附圖說明下面結合具體的實施例,并參照附圖,對本專利技術實施例的上述和其它目的和優(yōu)點做進ー步的描述。在附圖中,相同的或對應的技術特征或部件將采用相同或對應的附圖標記來表示。圖I是示出作為本專利技術實施例提供一種基于多幅圖像獲取圖像描述信息的方法的流程圖;圖2是示出作為本專利技術實施例提供的分割圖像的方法流程圖;圖3是示出作為本專利技術實施例提供的ー種分割方式下獲得的圖像的示意圖;圖4是示出作為本專利技術實施例提供的另ー種分割方式下獲得的圖像的示意圖;圖5是示出作為本專利技術實施例提供的各子圖像的相似度因子的獲得方法流程圖6是示出作為本專利技術實施例提供的ー種分割方式下獲得的圖像權值矩陣的示意圖;圖7是示出作為本專利技術實施例提供的另ー種分割方式下獲得的圖像權值矩陣的示意圖 ;圖8是示出作為本專利技術實施例提供基于子圖像的相似度因子計算子圖像所對應的圖像的描述信息的方法流程圖;圖9是示出作為本專利技術實施例提供的兩種分割方式下最終獲得的圖像權值矩陣的不意圖;圖10是示出作為本專利技術實施例提供的圖像特征點的示意圖;圖11是示出作為本專利技術實施例提供的一種基于多幅圖像獲取圖像描述信息的裝置的不意圖;圖12是示出作為本專利技術實施例提供的ー種圖像識別裝置的結構示意圖;圖13是示出作為本專利技術的實施例中所采用的信息處理設備的個人計算機的示例性結構的框圖。具體實施例方式下面參照附圖來說明本專利技術的實施例。參見圖1,本專利技術實施例提供的一種基于多幅圖像獲取圖像描述信息的方法包括SlOl :分割多幅圖像,獲得多幅圖像的子圖像。本專利技術實施例中,該多幅圖像可以是ー個訓練圖像集。在獲取各圖像的描述信息時,首先對該多幅圖像進行分割獲得多幅圖像的子圖像,該分割過程可以采用ー種分割方式對每幅圖像進行一次分割,也可以采用多種不同的分割方式對每幅圖像進行多次分割。具體分割時,可以采用網格劃分的方法進行分割,將圖像分割成NXM的矩形區(qū)域,或者是三角形或多邊形網格,而且網格不要求是均勻的;此外,也可以采用各種現(xiàn)有的或者未來開發(fā)出的圖像分割算法,按圖像的內容和/或視覺特征和/或其他特征進行分割。其中,采用多種分割方式分割圖像時,對同一圖像的分割方式盡量不同,在對多幅圖像的同一次分割中,不同圖像盡量采用相同的分割方式。S102:基于子圖像相互之間的特征相似性,獲得子圖像的相似度因子。在獲得各圖像的子圖像后,可以對每個子圖像提取特征,例如,顔色、形狀和紋理特征,然后計算該多幅圖像中各子圖像的特征之間的相似性,獲得各子圖像的相似度因子,某一子圖像與其它子圖像的相似度越高,該子圖像的相似度因子值也就越大。對于同一訓練圖像集中的各圖像,相似度因子高的子圖像更有可能是其圖像中的關鍵區(qū)域,例如圖像中的前景對象。其中,用于計算子圖像相似度因子的方法有多種,例如采用排序(ranking)的方法對該多幅圖像中的所有子圖像進行處本文檔來自技高網...
【技術保護點】
一種基于多幅圖像獲取圖像描述信息的方法,包括:分割所述多幅圖像,獲得所述多幅圖像的子圖像;基于所述子圖像相互之間的特征相似性,獲得所述子圖像的相似度因子;基于所述子圖像的相似度因子計算所述子圖像所對應的圖像的描述信息。
【技術特征摘要】
【專利技術屬性】
技術研發(fā)人員:劉汝杰,中村秋吾,上原祐介,
申請(專利權)人:富士通株式會社,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。