The invention discloses a robot target recognition and positioning method and system based on D RGB video, through the target candidate extraction and recognition, based on confidence estimation, target segmentation, optimal position estimation steps such as time consistency, determine the target class in the scene and the space location and accurate. Using the depth information of the scene in the invention, enhances the spatial level perception recognition and localization algorithm, based on key frame length when the temporal consistency constraints in video processing to improve efficiency and ensure the goal of long time series of object recognition and localization tasks in the same sex and relevance. In the localization process, the cooperative target localization in multi information mode is achieved by precisely segmenting the target in the plane space and evaluating the location consistency of the same target in the depth information space. With small computation, good real-time, high accuracy of recognition and localization, it can be applied to the robot task based on online visual information analysis and understanding technology.
【技術實現步驟摘要】
基于RGB-D視頻的機器人目標識別與定位方法及系統
本專利技術屬于計算機視覺
,更具體地,涉及一種基于RGB-D視頻的機器人目標識別與定位方法及系統。
技術介紹
近年來,隨著機器人技術的快速發展,面向機器人任務的機器視覺技術也得到了研究者的廣泛關注。其中,目標的識別與精確定位是機器人視覺問題的重要一環,是執行后續任務的前提條件。現有的目標識別方法一般包括提取待識別目標信息作為識別依據和與待識別場景的匹配兩個步驟。傳統的待識別目標的表達一般包括幾何形狀、目標外觀、提取局部特征等方法,這類方法往往存在通用性差、穩定性不足、目標抽象化能力差等不足。以上目標表達的缺陷也給后續的匹配過程帶來了難以克服的困難。獲取待識別目標的表達后,目標匹配是指將獲得該目標表達與待識別場景特征進行比較,以識別目標。總體上講,現有的方法包括基于區域匹配和特征匹配的兩類方法。基于區域的匹配是指提取圖像局部子區域的信息進行比對,其計算量與待匹配的子區域個數成正比;基于特征的方法對圖像中的典型特征進行匹配,其匹配準確率與特征表達有效性密切相關。以上兩類方法對候選區域的獲取以及特征表達提出了較高的要求,但由于二維平面圖像信息和設計特征的局限性,在面向機器人的復雜環境識別任務中往往效果較差。目標定位廣泛存在于工業生產生活中,如戶外運動中的GPS、軍事雷達監控、艦艇聲納設備等等,此類設備定位準確、作業距離范圍很廣,但價格高昂。基于視覺的定位系統是近年來新的研究熱點。根據視覺傳感器的不同,大致可分為基于單目視覺傳感器、雙目及深度傳感器、全景視覺傳感器的定位方法。單目視覺傳感器價格低、結構簡單、 ...
【技術保護點】
一種基于RGB?D視頻的機器人目標識別與定位方法,其特征在于,包括:(1)獲取待識別定位目標所在場景的RGB?D視頻幀序列;(2)提取所述RGB?D視頻幀序列中的關鍵視頻幀,并對所述關鍵視頻幀提取目標候選區域,根據各關鍵視頻幀對應的深度信息對所述目標候選區域進行過濾篩選;(3)基于深度網絡對過濾篩選后的目標候選區域進行識別,通過長時序時空關聯約束及多幀識別一致性估計,對目標識別結果進行置信度排序;(4)對過濾篩選后的目標候選區域進行局部快速分割,根據目標識別結果的置信度及各關鍵視頻幀的時序間隔關系,從所述關鍵視頻幀中選取主要關鍵視頻幀,并對分割區域進行前后相鄰幀擴展及協同優化;(5)在場景中確定關鍵特征點作為定位參照點,進而估計相機視角及相機運動估計值,通過對主要關鍵視頻幀識別分割結果進行目標特征一致性約束和目標位置一致性約束,估計待識別定位目標的協同置信度并進行空間精確定位。
【技術特征摘要】
1.一種基于RGB-D視頻的機器人目標識別與定位方法,其特征在于,包括:(1)獲取待識別定位目標所在場景的RGB-D視頻幀序列;(2)提取所述RGB-D視頻幀序列中的關鍵視頻幀,并對所述關鍵視頻幀提取目標候選區域,根據各關鍵視頻幀對應的深度信息對所述目標候選區域進行過濾篩選;(3)基于深度網絡對過濾篩選后的目標候選區域進行識別,通過長時序時空關聯約束及多幀識別一致性估計,對目標識別結果進行置信度排序;(4)對過濾篩選后的目標候選區域進行局部快速分割,根據目標識別結果的置信度及各關鍵視頻幀的時序間隔關系,從所述關鍵視頻幀中選取主要關鍵視頻幀,并對分割區域進行前后相鄰幀擴展及協同優化;(5)在場景中確定關鍵特征點作為定位參照點,進而估計相機視角及相機運動估計值,通過對主要關鍵視頻幀識別分割結果進行目標特征一致性約束和目標位置一致性約束,估計待識別定位目標的協同置信度并進行空間精確定位。2.根據權利要求1所述的方法,其特征在于,所述步驟(2)具體包括:(2.1)以間隔采樣或關鍵幀選取方法,確定用于識別待識別定位目標的關鍵視頻幀;(2.2)采用基于似物性先驗的置信度排序方法獲取所述關鍵視頻幀中的目標候選區域組成目標候選區域集合,利用各關鍵視頻幀對應的深度信息,獲取各目標候選區域的內部及其鄰域內的層次屬性,對所述目標候選區域集合進行優化篩選、再排序。3.根據權利要求2所述的方法,其特征在于,所述步驟(3)具體包括:(3.1)將經過步驟(2)篩選后的目標候選區域送入已訓練好的目標識別深度網絡,獲取各篩選后的目標候選區域對應的關鍵視頻幀的目標識別預測結果及各目標識別預測結果的第一置信度;(3.2)根據長時序的時空關聯約束,對關鍵視頻幀的目標識別預測結果進行特征一致性評價,評價各目標識別預測結果的第二置信度,將由所述第一置信度與所述第二置信度得到的累積置信度進行排序,進一步過濾掉累積置信度低于預設置信度閾值的目標候選區域。4.根據權利要求3所述的方法,其特征在于,所述步驟(4)具體包括:(4.1)對于步驟(3.2)獲得的目標候選區域及其擴展鄰域,進行快速的目標分割操作,獲得目標的初始分割,確定目標邊界;(4.2)以短時時空一致性為約...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。