The present invention in a 3D shape classification method of depth based on convolutional neural network, its main contents include: data input, initial convolution neural network, cluster search, knowledge transfer, the process is that it uses convolutional neural network, first select the convolutional neural network structure is relatively simple as the root node of the search tree, more the complex model and using beam search method from the root node to explore candidate; when the new generation of candidate convolutional neural networks, by properly transmitted to the offspring from the parent convolutional neural network, the cluster search results, finally obtained the optimal convolutional neural network. The performance is better than the existing method of the invention in the popular three-dimensional shape data set, successfully parameters to reduce the total number of 98%; at the same time as a result of the beam search method to transfer knowledge, other issues of robustness and can be easily applied to training in small data sets on the in-depth study of the.
【技術實現步驟摘要】
一種基于深度卷積神經網絡的三維形狀分類方法
本專利技術涉及計算機視覺領域,尤其是涉及了一種基于深度卷積神經網絡的三維形狀分類方法。
技術介紹
隨著科技技術迅速發展,已經廣泛使用卷積神經網絡實現三維形狀分類。預測給定三維形狀的對象類是計算機視覺中的一個基本問題,因為三維形狀是圖像理解的重要視覺線索。但是,目前可用的三維形狀數據集比其他常用數據集小了一個數量級,還不足以訓練模型。即使采用了很多微調方法處理小型該數據集,但需要非常長的時間。而如果采用基于深度卷積神經網絡的三維形狀分類方法,則可以通過集束搜索,得到最佳卷積神經網絡架構和參數,從而更好地預測三維形狀。同時,這種方法在自動導航、自動檢測、機器人抓取物件及裝配任務等中有許多實際的需要。本專利技術提出了一種基于深度卷積神經網絡的三維形狀分類方法,它利用卷積神經網絡,首先選擇相對簡單的卷積神經網絡結構作為搜索樹的根節點,并利用集束搜索方法從根節點開始探索候選的更復雜的模型;當生成新的候選卷積神經網絡時,通過從母卷積神經網絡適當地傳送到其后代,使得集束搜索的結果有效,最終得到最佳的卷積神經網絡。本專利技術在流行的三維形狀數據集上的性能優于現有方法,還成功地將參數總數減少了98%左右;同時由于采用了集束搜索方法再進行知識遷移,還可以容易地應用于需要在小型訓練數據集上的魯棒性深入學習的其他問題。
技術實現思路
針對三維形狀數據集太小和現有分類模型處理圖像耗時的問題,本專利技術的目的在于提供一種基于深度卷積神經網絡的三維形狀分類方法。為解決上述問題,本專利技術提供一種基于深度卷積神經網絡的三維形狀分類方法,其主要內容包 ...
【技術保護點】
一種基于深度卷積神經網絡的三維形狀分類方法,其特征在于,主要包括數據輸入(一);初始卷積神經網絡(二);集束搜索(三);知識遷移(四)。
【技術特征摘要】
1.一種基于深度卷積神經網絡的三維形狀分類方法,其特征在于,主要包括數據輸入(一);初始卷積神經網絡(二);集束搜索(三);知識遷移(四)。2.基于權利要求書1所述的一種基于深度卷積神經網絡的三維形狀分類方法,其特征在于,每個形狀被表示為與以形狀為中心的均勻三維網格的三維像素對應的一組二進制指示符;選擇相對簡單的卷積神經網絡結構作為搜索樹的根節點,并利用集束搜索方法從根節點開始探索候選的更復雜的模型,直到不能進一步減少訓練誤差;當生成新的候選卷積神經網絡時,通過從母卷積神經網絡向后傳送合適的參數值,使得集束搜索的結果有效,最終得到最佳的卷積神經網絡。3.基于權利要求書1所述的圖像輸入(一),其特征在于,采用三維實體集作為數據集,其包括40個各種類型的實物對象類,如椅子、桌子、廁所、沙發等;每個類有100個獨特的CAD模型,代表最常見的三維形狀,在整個數據集中總共有151128個三維像素化模型。4.基于權利要求書1所述的初始卷積神經網絡(二),其特征在于,選擇相對簡單的初始卷積神經網絡,初始模型僅由兩個卷積層和一個完全連接的層組成;第一卷積層具有16個大小為6和步長2的濾波器,第二卷積層具有32個大小為5和步長2的濾波器;最后,完全連接的層具有400個隱藏單元。5.基于權利要求書1所述的集束搜索(三),其特征在于,集束搜索包括后繼函數,啟發式函數以及前瞻和回溯策略;狀態空間被定義為Ω={s},其中狀態s表示一個網絡配置;卷積神經網絡的網絡配置指定卷積和完全連接的層的數量,在每個層中使用的隱藏單元或三維卷積濾波器的數量,以及哪些層具有最大池;約束集束搜索,使得完全連接的層的大小保持與初始卷積神經網絡中相同。6.基于權利要求書5所述的后繼函數,其特征在于,通過從一組可能的動作A中應用動作a(a∈A),從而從s中產生新的狀態s′:Γ:s→s′;將A定義為包括兩種類型的動作:(1)在所有卷積層的頂部添加新的卷積層,其中新添加的層具有與頂部卷積層相同數量的濾波器,濾波器大小和步長和(2)使頂部卷積層中的濾波器的數量加倍。7.基于權利要求書5所述的啟發式函數,其特征在于,定義為訓練數據在s和s′之間的分類精度的差異;在給出s′的母狀態的情...
【專利技術屬性】
技術研發人員:夏春秋,
申請(專利權)人:深圳市唯特視科技有限公司,
類型:發明
國別省市:廣東,44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。