一種基于深度信賴網(wǎng)絡(luò)的超分辨率人臉識別方法,涉及人臉識別技術(shù)領(lǐng)域。本發(fā)明專利技術(shù)從認知的角度出發(fā),認為相互對應的高低分辨率人臉圖像存在著內(nèi)在本質(zhì)的關(guān)聯(lián)。而以往的研究表明,采用線性近似的方法來表達這種內(nèi)在的關(guān)聯(lián)效果受到線性近似地制約。因此認為這種內(nèi)在的關(guān)聯(lián)是非線性的。鑒于人工神經(jīng)網(wǎng)絡(luò)在非線性分類問題上的出色表現(xiàn),本發(fā)明專利技術(shù)采用神經(jīng)網(wǎng)絡(luò)算法來捕獲姿態(tài)變化下相互對應的高低分辨率人臉圖像的非線性關(guān)聯(lián)。理論研究和神經(jīng)生理學的研究表明,要構(gòu)建一個智能的處理系統(tǒng),需要構(gòu)建深度的結(jié)構(gòu),如多層非線性處理單元構(gòu)建的系統(tǒng)。本發(fā)明專利技術(shù)利用深度信賴網(wǎng)絡(luò)(deep?belief?networks)來挖掘相互對應的高低分辨率人臉圖像存在的共有的非線性結(jié)構(gòu)。
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及人臉識別
,涉及到一種基于深度信賴網(wǎng)絡(luò)的超分辨率人臉識別方法。
技術(shù)介紹
人臉識別是一種重要的生物認證技術(shù),是計算視覺和模式識別最重要的問題之一。近幾十年來,研究人員提出了大量的方法,并已廣泛用于視頻監(jiān)控等安全保障系統(tǒng)中。但是,由于距離和硬件條件等的限制,在大場景視頻監(jiān)控系統(tǒng)中拍攝的感興趣人臉圖像分辨率往往比較低,從而降低了人臉識別的性能。如何在低分辨率條件下提高識別效果,是目前人臉識別需要解決的問題。圖像超分辨率(super-resolution, SR)是指利用某種算法從一幅或者一系列低分辨率(low resolution, LR)圖像中獲得一幅或者一系列高分辨率(high resolution, HR)·圖像的技術(shù)。因此,人臉圖像超分辨率算法很自然地被作為提高低分辨率圖像人臉識別效果的解決方案之一。申請?zhí)枮镃N200810096054. 7的專利單幀圖象超分辨方法,首先對圖象進行分析,通過頻率混疊參數(shù)判定是否采用單幀頻域解混疊超分辨方法進行處理;然后通過傅立葉變換、頻域解混疊算法及傅立葉反變換,豐富圖象的紋理與細節(jié),提高圖象的清晰度、對比度和分辨率,并抑制振鈴假象。此專利只適用于衛(wèi)星遙感圖象處理、醫(yī)學圖象和地震圖象等圖像的重建并非為了提高識別能力而設(shè)。這類方案將識別過程分解為人臉圖像超分辨率重建和高分辨率人臉識別兩步進行。然而人臉圖像超分辨率重建的目標是盡可能地恢復高分辨率人臉圖像的細節(jié)特征,以提高視覺效果,而影響人臉識別性能的特征可能既包括全局特征,又包括細節(jié)特征,兩個步驟的目標不一致,導致最終的識別效果受到限制。基于以上原因,B. K. Gunturk 和 A. U. Batur 在 “Image Processing” (IEEE Trans. 2003, vol. 12,no. 5,pp. 597-606)發(fā)表的 “Eigen-face-domainsuper-resolution for facerecognition”等人提出了在特征域進行人臉超分辨率重建的方法,該方法超分辨率重建得到的特征可以直接用于人臉識別。該方法提供了一種很好的直接利用超分辨率算法進行人臉識別的框架,但計算復雜度較高,且該方法使用的概率模型對數(shù)據(jù)的一致性要求較高,當人臉姿態(tài)變化較大,算法的效果大幅度下降。B. Li, H. Chang, S. Shan and X. Chen在“SignalProcessing Letters,,( IEEE, 2010,vol. 17, no. 1,pp. 20-23)發(fā)表的“Low-resolution facerecognition via coupled locality preservingmappings” 提出了局部保持的f禹合變換算法,利用局部保持對數(shù)據(jù)進行限定,耦合高低分辨率圖像,從高低分辨率圖像中抽取耦合特征。在姿態(tài)變化較大時,高低分辨率圖像的局部保持性質(zhì)差異較大,大大影響了其算法效果。專利申請?zhí)朇N200910207562. 2的專利一種基于典型相關(guān)分析空間超分辨率的人臉識別方法,在典型相關(guān)分析變換得到的相關(guān)子空間內(nèi)利用鄰域重構(gòu)獲得測試低分辨率人臉圖像對應的高分辨率人臉圖像識別特征,最后利用此特征識別人臉。該方法在特征提取上仍然采用的是線性提取因子,其典型相關(guān)分析也是一種線性的變換方法,當存有較大姿態(tài)變化時,該方法性能大大降低。
技術(shù)實現(xiàn)思路
本專利技術(shù)克服上述現(xiàn)有技術(shù)的缺點,提出了一種基于深度信賴網(wǎng)絡(luò)的超分辨率人臉識別方法。為了達到上述目的,本專利技術(shù)采用的技術(shù)方案是本專利技術(shù)從認知的角度出發(fā),認為相互對應的高低分辨率人臉圖像存在著內(nèi)在本質(zhì)的關(guān)聯(lián)。而以往的研究表明,采用線性近似的方法來表達這種內(nèi)在的關(guān)聯(lián)效果受到線性近似地制約。因此認為這種內(nèi)在的關(guān)聯(lián)是非線性的。鑒于人工神經(jīng)網(wǎng)絡(luò)在非線性分類問題上的出色表現(xiàn),本專利技術(shù)采用神經(jīng)網(wǎng)絡(luò)算法來捕獲姿態(tài)變化下相互對應的高低分辨率人臉圖像的非線性關(guān)聯(lián)。理論研究和神經(jīng)生理學的研究表明,要構(gòu)建一個智能的處理系統(tǒng),需要構(gòu)建深度的結(jié)構(gòu),如多層非線性處理單元構(gòu)建的系統(tǒng)。對于構(gòu)建深度網(wǎng)絡(luò),BP (back-propagation)算法是一種常用的神經(jīng)網(wǎng)絡(luò)算法。但是當網(wǎng)絡(luò)的層數(shù)增加時,BP算 法受到算法的局限,不能得到較好的結(jié)果。Hinton等人提出了快速地學習深度多層結(jié)構(gòu)的概率模型的神經(jīng)網(wǎng)絡(luò)算法,將之命名為深度信賴網(wǎng)絡(luò)(de印belief networks)。這種類型的神經(jīng)網(wǎng)絡(luò)不僅能作為分類器,而且可以表示非線性特征。基于此,本專利技術(shù)利用深度信賴網(wǎng)絡(luò)(deep belief networks)來挖掘相互對應的高低分辨率人臉圖像存在的共有的非線性結(jié)構(gòu)。附圖說明圖I(a)是波爾茲曼機。圖I(b)是受限的波爾茲曼機。圖2Ca)是貪婪算法求得的受限的玻爾茲曼機。圖2(b)是深度信賴網(wǎng)絡(luò)。圖2(C)是受限的波爾茲曼機構(gòu)成的深度信賴網(wǎng)絡(luò)。圖3(a)是UMIST圖庫中訓練高分辨率56*46的人臉圖像。圖3(b)是訓練低分辨率14*11的人臉圖像。圖3(C)是測試低分辨率14*11的人臉圖像。圖4是超分辨率人臉識別算法示意圖。具體實施例方式為使本專利技術(shù)的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及具體實例,對本專利技術(shù)做進一步詳細說明。這些實例僅僅是說明性的,而并非對本專利技術(shù)的限制。本專利技術(shù)提出了一種基于深度信賴網(wǎng)絡(luò)的超分辨率人臉識別方法,該方法可以包括a.受限的波爾茲曼機。受限的波爾茲曼機是一種馬爾科夫隨機場或者一種雙層圖結(jié)構(gòu),一種特殊結(jié)構(gòu)的波爾茲曼機。如圖I所示,圖(a)為一般的波爾茲曼機,波爾茲曼機為一種滿秩的雙層圖結(jié)構(gòu),可將下層稱為可視層,上層稱為隱層。(b)為受限的波爾茲曼機,受限的波爾茲曼機與一般的波爾茲曼機相比,不允許可視層各點之間或者是隱層各點之間存在關(guān)聯(lián)。受限的波爾茲曼機是一種特殊的神經(jīng)網(wǎng)絡(luò)模型,具有對稱的連接權(quán)系數(shù)。網(wǎng)絡(luò)由可視單元V e {0,1}D和隱層單元he {0,1}F構(gòu)成。可視單元由輸入、輸出部分組成。每個單元節(jié)點只取I或O兩種狀態(tài)。I代表接通或接受,O表示斷開或拒絕。當神經(jīng)元的輸入加權(quán)和發(fā)生變化時,神經(jīng)元的狀態(tài)隨之更新。各單元之間狀態(tài)的更新是異步的。可用概率來描述。狀態(tài)Iv,h}的能量方程可以定義為E (V, h; Θ ) =-vTffh-bTv-aTh(I)其中Θ ={ff, a, b}為參數(shù),W可視層和隱層之間對稱的連接權(quán)系數(shù),a和b為基矩陣。可見向量與隱層向量的聯(lián)合分布矩陣為本文檔來自技高網(wǎng)...
【技術(shù)保護點】
一種基于深度信賴網(wǎng)絡(luò)的超分辨率人臉識別方法,其特征在于包含以下步驟:1)對低分辨率圖像進行最近鄰插值、雙線性插值或者雙三次插值,使得高低分辨率圖像的維度一致;2)將維度一致的帶有姿態(tài)差異的高低分辨率人臉圖像灰度歸一到(0,1)之間,并作為深度信賴網(wǎng)絡(luò)的可視向量v輸入到網(wǎng)絡(luò)中,深度信賴網(wǎng)絡(luò)由多層的受限的波爾茲曼機構(gòu)成;所述的受限的波爾茲曼機是一種特殊的神經(jīng)網(wǎng)絡(luò)模型,具有對稱的連接權(quán)系數(shù),網(wǎng)絡(luò)由可視單元v∈{0,1}D和隱層單元h∈{0,1}F構(gòu)成;3)然后,訓練深度信賴網(wǎng)絡(luò);4)將經(jīng)過最近鄰插值、雙線性插值或者雙三次插值的測試低分辨率圖像輸入到深度信賴網(wǎng)絡(luò),由深度信賴網(wǎng)絡(luò)給出最終的識別結(jié)果。
【技術(shù)特征摘要】
1.一種基于深度信賴網(wǎng)絡(luò)的超分辨率人臉識別方法,其特征在于包含以下步驟 1)對低分辨率圖像進行最近鄰插值、雙線性插值或者雙三次插值,使得高低分辨率圖像的維度一致; 2)將維度一致的帶有姿態(tài)差異的高低分辨率人臉圖像灰度歸一到(O,I)之間,并作為深度信賴網(wǎng)絡(luò)的可視向量V輸入到網(wǎng)絡(luò)中,深度信賴網(wǎng)絡(luò)由多層的受限的波爾茲曼機構(gòu)成;所述的受限的波爾茲曼機是一種特殊的神經(jīng)網(wǎng)絡(luò)模型,具有對稱的連接權(quán)系數(shù),網(wǎng)絡(luò)由可視單元V e {0,1}D和隱層單元h e {0,1}F構(gòu)成; 3)然后,訓練深度信賴網(wǎng)絡(luò); 4)將經(jīng)過最近鄰插值、雙線性插值或者雙三次插值的測試低分辨率圖像輸入到深度信賴網(wǎng)絡(luò),由深度信賴網(wǎng)絡(luò)給出最終的識別結(jié)果。2.如權(quán)利要求I所述的超分辨率人臉識別方法,其特征在于所述的步驟2)是指帶有姿態(tài)差異的高低分辨率人臉圖像其分辨率為hXw,將其展開成為一行長度為hXw的向量,并將其灰度強度歸一到(O,...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:樊鑫,林妙真,
申請(專利權(quán))人:大連理工大學,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。