本發明專利技術公開了一種基于分布式處理和SVM分類器的室外海量物體識別方案,該方案預先對城市版圖進行區域劃分,在每個區域中對各場景進行圖像采集,并訓練區域的詞典和場景的SVM分類器;識別時,終端將拍攝的圖像和當前GPS信息打包發送給調度處理集群;調度處理集群根據GPS信息判斷與待識別圖像相關的詞典和分類器是否已經加載到計算節點,如果沒有,再確定加載范圍,將范圍內的詞典和分類器分攤加載到計算節點;計算節點利用詞典得到待識別圖像的統計直方圖向量,再用SVM進行打分;所有計算節點打分最高的SVM對應的場景最后識別結果,反饋給終端。使用本發明專利技術能夠實現智能終端的大規模圖像識別和檢索,而且減少了數據運算量,提高了圖像識別和檢索的速度。
【技術實現步驟摘要】
本專利技術屬于移動增強現實
,具體涉及一種基于分布式處理和SVM分類器的室外海量物體識別方法和系統。
技術介紹
在近幾年,將圖像內容表示為特定“視覺單詞”出現次數直方圖的Bag-of-words模型,展示了其在圖像內容分類方面的強大優勢,在通過SVM分類器進行學習,能實現高精度的圖像識別。物體識別的本質就是建立一個能夠識別出圖像中感興趣物體類別的計算系統,在現實生活中有著廣泛的應用需求,具有相當高的應用價值和研究意義。隨著互聯網的發展,人類正在步入一個信息化的社會,互聯網已經成為人類發布、獲取、交換信息的重要平臺。互聯網上信息量的指數級增長,使得如何讓用戶能夠快速準確地在海量的數據中找到其所需信息成為了一個重要的課題。近些年來,隨著數字攝影和存儲設備的進步和普及,室外的圖像數量在互聯網上的飛速增長,也已經達到成千上萬了。如 何有效的利用這些數據信息,給當前處于相同位置的用戶提供這些已有的信息,是商業界和學術界的一個重要研究方向。然而,隨著圖像庫規模的極大增長,要保證圖像搜索的實時性,相應的數據庫索引技術和圖像檢索技術也必須做相應的調整或加速。同時計算機軟、硬件技術的迅猛發展,為增強現實技術走出室內應用進而支持復雜的分析、決策和管理打下了堅實的基礎。一些移動終端設備(像PDA、智能手機等)的功能也越來越豐富,并且擁有了嵌入式操作系統、觸摸屏、GPS定位、視頻攝像頭等功能,同時也具備了較強的計算和處理能力。這些功能的集成為開發基于移動終端的增強現實系統奠定了基礎。據有關資料,截止到2010年我國移動電話用戶可達7. 4億,其中擁有智能手機的用戶占了相當的比重,智能手機作為增強現實的應用平臺將具有很大的應用潛力。3G網的逐步開通、運行,意味著移動增值業務全新時代的開始,增強現實技術和LBS相結合可以實現信息的實時交互、三維動態顯示,可使人機界面更加友好和具有智能性。基于上述分析,結合具有攝像頭的終端以及基于視覺單詞的圖像識別技術,可以將海量物體的在線識別變為可能,而且結合分布式處理技術可以大大縮短在線識別時間。
技術實現思路
有鑒于此,本專利技術提供一種基于分布式處理和SVM分類器的室外海量物體識別方案,該方案將分布式處理技術與計算機視覺技術相結合使智能終端具備大規模圖像的識別功能,實現智能終端的大規模圖像識別和檢索,進而實現移動增強現實的多種應用。而且,本專利技術利用GPS信息縮小數據匹配范圍,減少了數據運算量,從而進一步提高了圖像識別和檢索的速度,實現了在線實時的室外海量物體識別。該方案是這樣實現的一種基于分布式處理和SVM分類器的室外海量物體識別方法,該方法包括將室外建筑整體區劃分為多個矩形的區域;針對每個區域,選取多個場景,為每個場景采集多幅圖像,從每幅圖像中提取特征點并轉化為描述符,利用聚類算法對一個區域內所有場景的所有描述符進行聚類,每個聚類中心作為一個單詞,一個區域內的所有單詞形成一個詞典;每個區域采用區域中心處GPS信息和四個角的GPS信息表示區域位置,存儲帶區域位置的詞典到樣本文件系統中;以區域為單位,對區域內每個場景所有圖像的描述符進行訓練,形成一個支持向量機SVM分類器,一個場景對應一個分類器;將區域位置、SVM分類器和場景信息對應存儲到樣本文件系統中;所述的識別方法包括如下步驟步驟I :終端采集當前場景的待識別圖像以及GPS信息; 步驟2 :提取所述待識別圖像的局部特征,并轉化為描述符特征向量;步驟3 :將待識別圖像的GPS信息以及描述符特征向量打包成一個描述符文件,發送給分布式處理系統;步驟4:分布式處理系統中設有調度處理集群、多個計算節點和所述樣本文件系統;調度處理集群接收到所述描述符文件后,為所述終端建立一個新的匹配任務A,從該描述符文件中提取GPS信息作為匹配任務A的標識,查詢當前正在處理的匹配任務中是否存在與匹配任務A相同或相似的匹配任務,如果是,說明已經將與待識別圖像相關的詞典和SVM分類器加載到各計算節點中,則將描述符文件發送給每個計算節點,然后執行步驟6 ;否則,執行步驟5;所述相同或相似的匹配任務的查詢標準為如果當前正在處理的匹配任務對應的GPS信息與待識別圖像的GPS信息一致或者相差一個預設閾值,則認為存在相同的匹配任務;步驟5 :調度處理集群為匹配任務A加載相關的詞典和SVM分類器以待識別圖像的GPS信息為圓心,按照預先設定的篩選半徑確定一個圓形,根據區域位置從樣本文件系統中篩選出與該圓形相交的區域,將篩選出區域的詞典和區域內所有SVM分類器分攤加載到各個計算節點中;同時,調度處理集群還將描述符文件發送給每個計算節點;步驟6 :每個計算節點從描述符文件中解析出待匹配描述符特征向量;針對每個區域,利用距離關系查找每個待匹配描述符特征向量在詞典中對應的單詞,并對每個單詞的出現頻率進行統計,得到統計直方圖向量;再將統計直方圖向量輸入該區域對應所有SVM分類器進行打分,找出分數最高的SVM分類器;將各區域的匹配結果匯總到調度處理集群;步驟7 :調度處理集群統計各個計算節點的匹配結果,選出打分最高的SVM分類器,輸出該SVM分類器對應的場景信息給終端。當所述區域的劃分為將室外建筑整體區劃分為互不重疊的多個小區域,每4個上下左右相鄰的小區域構成一個所述區域時,步驟5中,所述根據區域位置從樣本文件系統中篩選出與該圓形相交的區域為僅篩選出包含所述圓形的區域。本專利技術還提供了一種基于分布式處理和SVM分類器的室外海量物體識別系統,其特征在于,包括分布式處理系統、無線網絡和具有圖像采集和GPS定位功能的終端;分布式處理系統包括交換設備、調度處理集群、樣本文件系統和至少2個計算節點;調度處理集群通過交換設備接入無線網絡,并且與樣本文件系統、所有的計算節點連接;樣本文件系統,用于存儲詞典和SVM分類器;存儲方式為將室外建筑整體區劃分為多個矩形的區域;針對每個區域,選取多個場景,為每個場景采集多幅圖像,從每幅圖像中提取特征點并轉化為描述符,利用聚類算法對一個區域內所有場景的所有描述符進行聚類,每個聚類中心作為一個單詞,一個區域內的所有單詞形成一個詞典;每個區域采用區域中心處GPS信息和四個角的GPS信息表示區域位置,存儲帶區域位置的詞典到樣本文件系統中;以區域為單位,對區域內每個場景所有圖像的描述符進行訓練,形成一個支持向量機SVM分類器,一個場景對應一個分類器;將區域位置、SVM分類器和場景信息對應存儲到樣本文件系統中;所述終端,用于采集當前場景的待識別圖像以及GPS信息,提取所述待識別圖像 的局部特征,并轉換為描述符特征向量;將待識別圖像的GPS信息以及描述符特征向量打包成一個描述符文件,發送給調度處理集群;調度處理集群,用于在接收到來自終端的所述描述符文件后,為所述終端建立一個新的匹配任務A,從該描述符文件中提取GPS信息作為匹配任務A的標識,查詢當前正在處理的匹配任務中是否存在與匹配任務A相同或相似的匹配任務,如果是,說明已經將與待識別圖像相關的詞典和SVM分類器加載到各計算節點中,則將描述符文件發送給每個計算節點;否則,為匹配任務A加載相關的詞典和SVM分類器;所述相同或相似的匹配任務的查詢標準為如果當前正在處理的匹配任務對應的GPS信息與待識別圖像的GPS信息一致或者相差本文檔來自技高網...
【技術保護點】
一種基于分布式處理和SVM分類器的室外海量物體識別方法,其特征在于,該方法包括:將室外建筑整體區劃分為多個矩形的區域;針對每個區域,選取多個場景,為每個場景采集多幅圖像,從每幅圖像中提取特征點并轉化為描述符,利用聚類算法對一個區域內所有場景的所有描述符進行聚類,每個聚類中心作為一個單詞,一個區域內的所有單詞形成一個詞典;每個區域采用區域中心處GPS信息和四個角的GPS信息表示區域位置,存儲帶區域位置的詞典到樣本文件系統中;以區域為單位,對區域內每個場景所有圖像的描述符進行訓練,形成一個支持向量機SVM分類器,一個場景對應一個分類器;將區域位置、SVM分類器和場景信息對應存儲到樣本文件系統中;所述的識別方法包括如下步驟:步驟1:終端采集當前場景的待識別圖像以及GPS信息;步驟2:提取所述待識別圖像的局部特征,并轉化為描述符特征向量;步驟3:將待識別圖像的GPS信息以及描述符特征向量打包成一個描述符文件,發送給分布式處理系統;步驟4:分布式處理系統中設有調度處理集群、多個計算節點和所述樣本文件系統;調度處理集群接收到所述描述符文件后,為所述終端建立一個新的匹配任務A,從該描述符文件中提取GPS信息作為匹配任務A的標識,查詢當前正在處理的匹配任務中是否存在與匹配任務A相同或相似的匹配任務,如果是,說明已經將與待識別圖像相關的詞典和SVM分類器加載到各計算節點中,則將描述符文件發送給每個計算節點,然后執行步驟6;否則,執行步驟5;所述相同或相似的匹配任務的查詢標準為:如果當前正在處理的匹配任務對應的GPS信息與待識別圖像的GPS信息一致或者相差一個預設閾值,則認為存在相同的匹配任務;步驟5:調度處理集群為匹配任務A加載相關的詞典和SVM分類器:以待識別圖像的GPS信息為圓心,按照預先設定的篩選半徑確定一個圓形,根據區域位置從樣本文件系統中篩選出與該圓形相交的區域,將篩選出區域的詞典和區域內所有SVM分類器分攤加載到各個計算節點中;同時,調度處理集群還將描述符文件發送給每個計算節點;步驟6:每個計算節點從描述符文件中解析出待匹配描述符特征向量;針對每個區域,利用距離關系查找每個待匹配描述符特征向量在詞典中對應的單詞,并對每個單詞的出現頻率進行統計,得到統計直方圖向量;再將統計直方圖向量輸入該區域對應所有SVM分類器進行打分,找出分數最高的SVM分類器;將各區域的匹配結果匯總到調度處理集群;步驟7:調度處理集群統計各個計算節點的匹配結果,選出打分最高的SVM分類器,輸出該SVM分類器對應的場景信息給終端。...
【技術特征摘要】
【專利技術屬性】
技術研發人員:王涌天,桂振文,劉越,陳靖,
申請(專利權)人:北京理工大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。