本發明專利技術公開了一種基于大規模圖像數據的人臉特征提取方法及人臉識別方法,本方法為:1)建立一人臉圖像數據庫A,其中每人具有多種表情、姿態、光照的人臉圖像;和一人臉圖像數據庫B;2)對數據庫A和B中的每一圖像進行人臉檢測,并輸出一包容人臉的矩形框和兩眼像素坐標;3)將每一人臉圖像進行矯正和縮放,生成一設定標準格式圖像,并提取底層紋理特征向量;4)對于數據庫A中的每一人a,利用支持向量機算法訓練一可識別該人a的分類器;5)將新人臉圖像生成設定標準格式圖像,然后利用每一分類器對該新人臉的底層紋理特征向量進行判別,并據判別分數建立一向量,作為該新人臉圖像的特征向量。本發明專利技術大大提升了所提取人臉特征的魯棒性。
【技術實現步驟摘要】
本專利技術屬于圖像識別
,涉及一種人臉圖像分析和處理方法,尤其涉及一種,可應用于人臉識別/人臉驗證/人臉搜索等應用場合作為基礎人臉特征提取單元。
技術介紹
人臉圖像的特征提取是計算機視覺研究的熱點,其技術研究成果廣泛應用于各種人臉識別/人臉驗證/人臉搜索/人臉表情分析等任務。其基本任務是對于輸入的人臉圖像產生一個向量表示,使得可以很好的保留人臉身份的信息而剔除與人臉身份無關的信息。其基本目標是同一個人的人臉圖像輸入產生盡量相似的,彼此距離較小的向量輸出,而不同人的人臉圖像輸入產生較為顯著的差異輸出。 人臉圖像研究領域的研究人員提出了多種人臉特征的提取方法。Matthew Turk 和 Alex Pentland 在”Face Recognition Using Eigenfaces,,提出了先將人臉圖像像素值拉伸成的向量,然后在事先收集的一個人臉數據庫上計算這些向量的主成分方向。最后新人臉圖像的特征即為圖像像素值向量在這些主成分方向上的投影分量。Peter N. Belhumeur 等人在 “Eigenfaces vs. Fisherfaces !Recognition UsingClassSpecific Linear Projection”提出了 Fisherface的特征提取方法。該方法同樣使用人臉圖像的像素值向量作為基本特征,使用線性判別規則提取出一組線性投影方向,最終的人臉圖像特征就是在得到的那組線性投影方向上的分量。Wiskott等人在“Face recognition by elastic bunch graph matching”中使用一組Gabor濾波器得到一些人臉的關鍵點的響應作為描述人臉紋理的特征。這種方法仍然是在利用圖像局部的紋理特征描述人臉。T. Ahonen 等人在,,Face Recognition with Local Binary Patterns,,描述了這樣的技術使用局部二值化模板在圖像的每個像素點做編碼量化,得到一個0到255的量化值來表示這個像素點局部的灰度值結構,然后將整張人臉圖像劃分網格狀圖像片,再在每一個圖像片中提取量化值的直方圖,最終將所有圖像片的直方圖串聯在一起作為人臉圖像的特征。這種方法比較精細的刻畫了人臉圖像的局部像素灰度結構,但是對于人臉的姿態表情的變化很敏感。因此該方法主要試用于拍攝人臉處于正面,表情中性的情況。這些經典的人臉特征提取算法,都是基于圖像的局部紋理特征結構的分析表示。比如基于圖像像素灰度值向量的主成分分析,基于圖像像素灰度值的向量。又如Gabor分析技術只提取輸入人臉在一組Gabor濾波器下的響應作為特征向量輸出。再如LBP特征提取,也只是分析了輸入人臉的局部像素灰度值的相對大小關系,將這種大小關系進行編碼從而產生直方圖輸出。由于上述人臉特征提取算法只利用了輸入人臉圖像的局部紋理特征,因此它們的特征提取算法受人臉圖像的光照/表情以及拍攝時的人臉姿態影響很大。同一個人的人臉圖像,如果拍攝時的光照/表情/姿態不同,輸出的特征向量將有很大的差別,這是影響這些方法應用于人臉識別/人臉驗證/人臉搜索應用的基本瓶頸。
技術實現思路
本專利技術的目的就在于克服上述經典人臉圖像特征提取方法對于人臉姿態和表情的嚴重相關性的問題,提出一種,從而得到一種更加魯棒的適用于各種場景和應用場合的人臉圖像特征。本專利技術首先建立兩個人臉圖像數據庫,即如下基于互聯網圖像數據建立名人人臉庫和“背景”人臉庫。首先收集各種名人的姓名作為互聯網人臉圖像的搜索關鍵詞,作為構建名人人臉圖像數據庫的基礎。本專利技術共搜集了N個名人的檢索關鍵詞。名人人臉圖像數據庫中的每一人都具有多種表情、姿態、光照的大約η張人臉圖片。 同時通過互聯網收集不屬于所收集的名人人臉圖像數據庫中任一個名人的人臉圖像數據,構建一個作為后續訓練負樣本的“背景“人臉圖像庫,在本專利技術中該庫的規模在M張人臉數據左右。背景人臉圖像數據庫中包括多種表情/姿態/光照的人臉圖像。M、m、N均為自然數,其具體數字可以根據實際需要進行選取。利用人臉檢測算法對于名人人臉圖像庫和“背景”人臉圖像庫中的每一張人臉圖像數據進行檢測,從而定位人臉的標準位置和大小。將上述檢測到的每一張人臉幾何矯正到設定的標準位置并且歸一化到固定大小,即將每一張人臉幾何矯正和縮放為固定分辨率的標準人臉圖片格式。本專利技術采用X * Y的標準圖像大小,并且保證將人臉的眼睛位置置于標準圖像的事先規定的位置。該過程稱之為標定。用任一種經典人臉特征提取算法提取所有名人人臉圖像庫和“背景”人臉圖像庫中經過標定的所有人臉圖像的底層紋理特征向量。本專利技術實驗了 LBP, HOG (Histogram OfGradients)以及Gabor等三種經典特征。對于名人庫中的每一個名人,將屬于該名人的人臉圖像的底層紋理特征向量作為正樣本,將“背景“人臉庫中的人臉圖像的底層紋理特征向量作為負樣本,利用SVM算法(支持向量機算法)訓練一個可以識別該名人的分類器,并將結果存入數據庫待用。在完成上述每一名人人臉分類器的訓練建庫后,本專利技術使用如下步驟計算一張新人臉圖像的特征。將該新人臉圖像使用上述相同的人臉檢測算法,幾何矯正和歸一化方法產生和名人人臉庫/ “背景”人臉庫同樣規格的標準圖像。用任一種經典人臉特征提取算法提取標定過的新人臉圖像的底層紋理特征向量。將提取的新人臉圖像的底層紋理特征向量應用于名人分類器中的每一個名人分類器,將得到的所有分類器判別分數輸出排列成一個新的向量(由于名人庫有N人,該向量共有N維)。這樣產生的向量包含的不再是原始人臉圖像的局部紋理特征,而是該人臉和名人數據庫中每一個名人的相似程度。由于構建名人數據庫中每一個名人的分類器時使用了各種表情/姿態/光照的正樣本(該名人的圖像)和各種表情/姿態/光照的負樣本,所以這樣得到的分類器就會自動的專注于人和人之間不變的本質的區別,而忽略存在各種變化的表情/姿態/光照,因此這樣的N維向量是魯棒的。向量維度沒有硬性要求。利用該新人臉圖像的最終特征便可對該新人進行人臉識別/人臉驗證/人臉搜索等處理。與現有技術相比,本專利技術的積極效果為本專利技術使用互聯網圖像數據建立名人人臉圖像分類器庫,最終實現了基于互聯網圖像數據的人臉特征提取算法。本專利技術與經典方法相比,其優點在于,使用多個SVM訓練的魯棒人臉分類器的輸出作為人臉特征的構建基本模塊,可以很好地減少產生的最終特征向量對于人臉光照/表情/姿態的相關性,從而最終提升采用本專利技術人臉特征的各種人臉識別/驗證/搜索算法的準確性。另外注意到本專利技術的在計算各個名人人臉分類器的輸出時,可以很方便的進行并行計算,從而大大提升提取最終人臉特征的速度。附圖說明圖I為人臉圖像數據庫構建流程圖; 圖2為定位人臉圖像的標準位置和大小圖;圖3為提取人臉圖像的底層紋理特征向量流程圖;圖4為新人臉圖像的人臉特征提取流程圖。具體實施例方式下面結合附圖和具體實例對本專利技術進行詳細說明。首先描述本專利技術建立名人人臉庫和“背景”人臉庫的兩個數據庫建立過程。詳細過程包括附圖I中描述的如下步驟。步驟Sll :收集N條比較有關注度的名人姓名作為搜索引擎的關鍵字。步驟S12 :使用收集的名人姓名在互聯網上搜索人臉圖像,將每一個關鍵字得到本文檔來自技高網...
【技術保護點】
一種基于大規模圖像數據的人臉特征提取方法,其步驟為:1)建立一人臉圖像數據庫A,其中每一人分別具有多種不同表情、姿態、光照的多張人臉圖像;建立一人臉圖像數據庫B,其包括多種不同表情、姿態、光照的人臉圖像;2)利用人臉檢測算法對人臉圖像數據庫A和人臉圖像數據庫B中的每一張人臉圖像數據進行人臉檢測,并輸出一包容人臉的矩形框和兩眼像素坐標;3)利用檢測到的每一張人臉圖像對應的矩形框和兩眼像素坐標對人臉圖像進行矯正和縮放,生成一設定標準格式圖像;4)利用人臉檢測算法提取3)中生成的每一張標準格式人臉圖像的底層紋理特征向量;5)對于人臉圖像數據庫A中的每一人a,將其人臉圖像的底層紋理特征向量作為正樣本,將所有屬于人臉圖像數據庫B中人的人臉圖像底層紋理特征向量作為負樣本,利用支持向量機算法訓練一個可識別該人a的分類器;6)對于一新人臉圖像,利用步驟2)、3)的人臉檢測和矯正、縮放方法,生成一設定標準格式圖像,并提取該標準格式圖像的底層紋理特征向量;7)利用步驟5)得到的每一分類器對該新人臉圖像的底層紋理特征向量進行判別,分別得到一個分類器判別分數;8)根據所有分類器判別分數建立一向量,作為該新人臉圖像的特征向量。...
【技術特征摘要】
【專利技術屬性】
技術研發人員:印奇,曹志敏,唐文斌,楊沐,
申請(專利權)人:北京曠視科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。