The present invention provides a method for detecting food, which comprises the following steps: 1) image input to be detected; 2) image feature extraction using convolutional neural network training in advance; 3) with each feature map elements in the original image corresponding to the position as the center, proposed area; 4) to judge whether the area is the object according to the feature vector for each region corresponding to the center of the proposal; 5) if the proposed area is the object, is the feature extraction of the region using SPPNET regression; 6) according to the regional characteristics, the more accurate calculation of the bounding box, at the same time to determine whether the area for food. The method of the invention can effectively reduce the error rate of output and obtain better use experience.
【技術實現步驟摘要】
一種菜品檢測方法
本專利技術屬于計算機圖像處理領域,具體來說涉及一種快速檢測圖像中的菜品區域的技術。
技術介紹
在使用圖像識別菜品種類的任務中,通常識別系統的返回結果只限定于菜品種類,并且局限于菜品這一大類,對于并不包含菜品的圖片其返回結果也僅限于識別程序所包含的種類。如果提交給識別系統的圖像并不包含菜品,系統并不能對圖像是否包含菜品做出判斷,仍會返回最有可能的菜品種類,從而產生錯誤的結果。
技術實現思路
因此,本專利技術提供一種從圖像中檢測菜品所在區域的方案,可檢測出圖像中包含的一個或多個菜品,并分別給出每個菜品所在區域的左上角坐標x,y以及寬度w和高度h,在圖像中不包含菜品的情況下則無返回結果。具體來說,本專利技術采用了以下技術方案:一種菜品檢測方法,其特征在于,所述方法包括以下步驟:1)輸入待檢測的圖像;2)使用預先訓練的卷積神經網絡提取圖像特征;3)以特征圖中每個元素在原圖中對應位置為中心,給出提議區域;4)根據每個提議區域中心對應的特征向量判斷該區域是否為物體;5)如果提議區域是物體,則使用SPPNET提取該區域的特征;6)根據區域特征做回歸,計算更準確的boundingbox,同時判斷該區域是否為菜品。在以上方法中,步驟2)提取圖像特征的步驟包括:首先將待檢測圖像轉換為224*224像素作為特征提取網絡的輸入,然后做5層卷積,每層卷積核分別為7*7、5*5、3*3、3*3、3*3,并且對每層提取的特征圖的局部區域做最大值池化,得到大小為51*39,每個位置256維的特征圖,該256維向量即為該位置對應原圖局部區域的特征向量。進一步,步驟3)給出提議 ...
【技術保護點】
一種菜品檢測方法,其特征在于,所述方法包括以下步驟:1)輸入待檢測的圖像;2)使用預先訓練的卷積神經網絡提取圖像特征;3)以特征圖中每個元素在原圖中對應位置為中心,給出提議區域;4)根據每個提議區域中心對應的特征向量判斷該區域是否為物體;5)如果提議區域是物體,則使用SPPNET提取該區域的特征;6)根據區域特征做回歸,計算更準確的bounding?box,同時判斷該區域是否為菜品。
【技術特征摘要】
1.一種菜品檢測方法,其特征在于,所述方法包括以下步驟:1)輸入待檢測的圖像;2)使用預先訓練的卷積神經網絡提取圖像特征;3)以特征圖中每個元素在原圖中對應位置為中心,給出提議區域;4)根據每個提議區域中心對應的特征向量判斷該區域是否為物體;5)如果提議區域是物體,則使用SPPNET提取該區域的特征;6)根據區域特征做回歸,計算更準確的boundingbox,同時判斷該區域是否為菜品。2.如權利要求1所述的菜品檢測方法,其特征在于,步驟2)提取圖像特征的步驟包括:首先將待檢測圖像轉換為224*224像素作為特征提取網絡的輸入,然后做5層卷積,每層卷積核分別為7*7、5*5、3*3、3*3、3*3,并且對每層提取的特征圖的局部區域做最大值池化,得到大小為51*39,每個位置256維的特征圖,該256維向量即為該位置對應原圖局部區域的特征向量。3.如權利要求2所述的菜品檢測方法,其特征在于,步驟3)給出提議區域的步驟包括:以特征圖中每個元素在原圖中的對應位置為中心,以原圖大小為1000*600為標準,給出三種尺度128、256、512,三種比例1:1、1:2、2:1...
【專利技術屬性】
技術研發人員:吳斌,歐烈川,劉瀟,
申請(專利權)人:南京江南博睿高新技術研究院有限公司,
類型:發明
國別省市:江蘇,32
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。