System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 国产精品无码无需播放器,久久青青草原亚洲AV无码麻豆,亚洲AV无码一区二三区
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于深度學習的圖像處理方法和裝置制造方法及圖紙

    技術(shù)編號:42966565 閱讀:18 留言:0更新日期:2024-10-15 13:11
    本發(fā)明專利技術(shù)提供一種基于深度學習的圖像處理方法和裝置,所述方法包括:獲取待檢測的圖像數(shù)據(jù),將所述圖像數(shù)據(jù)與輸入的提示信息相融合,以得到輸入數(shù)據(jù);將所述輸入數(shù)據(jù)輸入預先構(gòu)建的目標檢測模型,以得到所述目標檢測模型輸出的目標檢測結(jié)果;其中,所述目標檢測模型是基于預先構(gòu)建的深度學習網(wǎng)絡,利用自然圖像樣本、與所述自然圖像樣本對應的提示信息,以及標簽信息進行訓練得到的。解決了現(xiàn)有技術(shù)中圖像處理過程中目標檢測缺少交互能力,圖像處理效果受限的技術(shù)問題。

    【技術(shù)實現(xiàn)步驟摘要】

    本專利技術(shù)涉及圖像處理,尤其涉及一種基于深度學習的圖像處理方法和裝置


    技術(shù)介紹

    1、目標檢測是圖像處理的重要手段之一,例如,在醫(yī)學領域,傳統(tǒng)的目標檢測采用rcnn等two-stage目標檢測模型或者yolo等one-stage目標檢測模型。在目標檢測時,rcnn等two-stage目標檢測模型利用一階段產(chǎn)生的候選區(qū)域,并在二階段對每一個候選區(qū)域進行分類與邊界回歸,yolo等one-stage目標檢測模型采用一階段的模型結(jié)構(gòu)。在目標檢測過程中,已有技術(shù)在對圖像目標進行檢測時缺少交互能力,無法實現(xiàn)基于提示目標的檢測,限制了圖像處理的效果和適用范圍。


    技術(shù)實現(xiàn)思路

    1、本專利技術(shù)提供一種基于深度學習的圖像處理方法和裝置,以解決現(xiàn)有技術(shù)中圖像處理過程中目標檢測缺少交互能力,圖像處理效果受限的技術(shù)問題。

    2、本專利技術(shù)提供一種基于深度學習的圖像處理方法,所述方法包括:

    3、獲取待檢測的圖像數(shù)據(jù),將所述圖像數(shù)據(jù)與輸入的提示信息相融合,以得到輸入數(shù)據(jù);

    4、將所述輸入數(shù)據(jù)輸入預先構(gòu)建的目標檢測模型,以得到所述目標檢測模型輸出的目標檢測結(jié)果;

    5、其中,所述目標檢測模型是基于預先構(gòu)建的深度學習網(wǎng)絡,利用自然圖像樣本、與所述自然圖像樣本對應的提示信息,以及標簽信息進行訓練得到的。

    6、在一些實施例中,基于預先構(gòu)建的深度學習網(wǎng)絡,利用自然圖像樣本、與所述自然圖像樣本對應的提示信息,以及標簽信息進行訓練,以得到所述目標檢測模型,具體包括:p>

    7、構(gòu)建數(shù)據(jù)集,所述數(shù)據(jù)集包括自然圖像樣本、與所述自然圖像樣本對應的提示信息,以及標簽信息;

    8、將所述數(shù)據(jù)集劃分為訓練集、驗證集和測試集;

    9、將所述訓練集中的樣本輸入預先構(gòu)建的深度學習網(wǎng)絡進行訓練,以得到初始檢測模型;

    10、利用驗證集和測試集分別對所述初始檢測模型進行驗證和測試,以得到所述目標檢測模型。

    11、在一些實施例中,所述構(gòu)建數(shù)據(jù)集具體包括:

    12、采集海量自然圖像樣本,以建立圖庫;

    13、基于每個所述自然圖像樣本生成等分辨率的掩碼圖像,以建立掩碼庫;

    14、在自然圖像樣本上標注非掩碼區(qū)域的待標注目標,生成標簽信息;

    15、將自然圖像樣本、自然圖像樣本所對應的掩碼圖像和其非掩碼區(qū)域的標簽信息作為一個單元,以構(gòu)建具有多個單元的數(shù)據(jù)集。

    16、在一些實施例中,所述深度學習網(wǎng)絡的網(wǎng)絡架構(gòu)包括:

    17、圖像編碼器,所述圖像編碼器用于在輸入的自然圖像樣本中提取語義信息,并經(jīng)過多次下采樣得到自然圖像樣本的特征圖;

    18、提示信息編碼器,所述提示信息編碼器用于在輸入的提示信息中提取語義信息,并經(jīng)過信息融合和處理,以得到融合有提示信息的特征圖;

    19、特征融合模塊,所述特征融合模塊用于將多尺寸的特征圖進行特征融合;

    20、標簽匹配模塊,所述標簽匹配模塊利用最小代價損失確定樣本的標簽信息,使用對比學習建立圖像信息和文本描述之間的關(guān)系。

    21、在一些實施例中,所述提示信息包括掩碼信息和文本信息,所述提示信息編碼器包括:

    22、掩碼編碼器,所述掩碼編碼器用于在輸入的掩碼圖像中提取語義信息,并經(jīng)過多次下采樣得到掩碼圖像的特征圖;

    23、融合層,所述融合層用于將自然圖像樣本的特征圖與掩碼圖像的特征圖進行融合;

    24、文本編碼器,所述文本編碼器用于提取輸入的文本信息的高級語義信息,通過對比學習建立圖像特征和文本特征之間的關(guān)聯(lián);

    25、在一些實施例中,所述特征融合模塊包括同尺度特征融合和跨尺度特征融合。

    26、本專利技術(shù)還提供一種基于深度學習的圖像處理裝置,所述裝置包括:

    27、數(shù)據(jù)采集單元,用于獲取待檢測的圖像數(shù)據(jù),將所述圖像數(shù)據(jù)與輸入的提示信息相融合,以得到輸入數(shù)據(jù);

    28、結(jié)果生成單元,用于將所述輸入數(shù)據(jù)輸入預先構(gòu)建的目標檢測模型,以得到所述目標檢測模型輸出的目標檢測結(jié)果;

    29、其中,所述目標檢測模型是基于預先構(gòu)建的深度學習網(wǎng)絡,利用自然圖像樣本、與所述自然圖像樣本對應的提示信息,以及標簽信息進行訓練得到的。

    30、本專利技術(shù)還提供一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)如上所述的方法。

    31、本專利技術(shù)還提供一種非暫態(tài)計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上所述的方法。

    32、本專利技術(shù)還提供一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上所述的方法。

    33、本專利技術(shù)提供的基于深度學習的圖像處理方法和裝置,通過獲取待檢測的圖像數(shù)據(jù),將所述圖像數(shù)據(jù)與輸入的提示信息相融合,以得到輸入數(shù)據(jù);將所述輸入數(shù)據(jù)輸入預先構(gòu)建的目標檢測模型,即可得到所述目標檢測模型輸出的目標檢測結(jié)果;其中,所述目標檢測模型是基于預先構(gòu)建的深度學習網(wǎng)絡,利用自然圖像樣本、與所述自然圖像樣本對應的提示信息,以及標簽信息進行訓練得到的。本專利技術(shù)所提供的方法和裝置,通過在模型訓練中融合了提示信息,能夠顯著提高檢測模型基于提示信息實現(xiàn)與人類交互的能力,具有一定的實際使用價值,解決了現(xiàn)有技術(shù)中圖像處理過程中目標檢測缺少交互能力,圖像處理效果受限的技術(shù)問題。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護點】

    1.一種基于深度學習的圖像處理方法,其特征在于,所述方法包括:

    2.根據(jù)權(quán)利要求1所述的基于深度學習的圖像處理方法,其特征在于,基于預先構(gòu)建的深度學習網(wǎng)絡,利用自然圖像樣本、與所述自然圖像樣本對應的提示信息,以及標簽信息進行訓練,以得到所述目標檢測模型,具體包括:

    3.根據(jù)權(quán)利要求2所述的基于深度學習的圖像處理方法,其特征在于,所述構(gòu)建數(shù)據(jù)集具體包括:

    4.根據(jù)權(quán)利要求2所述的基于深度學習的圖像處理方法,其特征在于,所述深度學習網(wǎng)絡的網(wǎng)絡架構(gòu)包括:

    5.根據(jù)權(quán)利要求4所述的基于深度學習的圖像處理方法,其特征在于,所述提示信息包括掩碼信息和文本信息,所述提示信息編碼器包括:

    6.根據(jù)權(quán)利要求4所述的基于深度學習的圖像處理方法,其特征在于,所述特征融合模塊包括同尺度特征融合和跨尺度特征融合。

    7.一種基于深度學習的圖像處理裝置,其特征在于,所述裝置包括:

    8.一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)如權(quán)利要求1至6任一項所述的方法。

    9.一種非暫態(tài)計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至6任一項所述的方法。

    10.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至6任一項所述的方法。

    ...

    【技術(shù)特征摘要】

    1.一種基于深度學習的圖像處理方法,其特征在于,所述方法包括:

    2.根據(jù)權(quán)利要求1所述的基于深度學習的圖像處理方法,其特征在于,基于預先構(gòu)建的深度學習網(wǎng)絡,利用自然圖像樣本、與所述自然圖像樣本對應的提示信息,以及標簽信息進行訓練,以得到所述目標檢測模型,具體包括:

    3.根據(jù)權(quán)利要求2所述的基于深度學習的圖像處理方法,其特征在于,所述構(gòu)建數(shù)據(jù)集具體包括:

    4.根據(jù)權(quán)利要求2所述的基于深度學習的圖像處理方法,其特征在于,所述深度學習網(wǎng)絡的網(wǎng)絡架構(gòu)包括:

    5.根據(jù)權(quán)利要求4所述的基于深度學習的圖像處理方法,其特征在于,所述提示信息包括掩碼信息和文本信息,所述提示信息編碼器包括:

    6.根據(jù)...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:李柏蕤,連荷清,武靜威,
    申請(專利權(quán))人:北京小蠅科技有限責任公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲中文字幕在线无码一区二区| 无码精品A∨在线观看免费| 国精品无码一区二区三区在线蜜臀| 精品无码一级毛片免费视频观看| 国产午夜精华无码网站| 日韩人妻无码精品一专区 | 亚洲av无码专区在线观看亚| 人妻老妇乱子伦精品无码专区| 日日麻批免费40分钟无码| 亚洲AV无码国产剧情| 国产亚洲人成无码网在线观看| 日本精品无码一区二区三区久久久| YW尤物AV无码国产在线观看| 精品无码AV无码免费专区| 超清无码一区二区三区| 无码人妻av一区二区三区蜜臀 | 人妻无码αv中文字幕久久| 永久免费无码网站在线观看| 无码人妻视频一区二区三区| 亚洲无码视频在线| 亚洲大尺度无码无码专线一区 | 亚洲人成无码网站| 无码国模国产在线无码精品国产自在久国产 | 色综合热无码热国产| 久久久久亚洲av无码专区喷水| 中文无码vs无码人妻| 亚洲国产综合无码一区二区二三区| 无码国产精品一区二区免费式影视| 国产V亚洲V天堂A无码| 国产成年无码AV片在线韩国| 亚洲精品无码AV中文字幕电影网站| 中文字幕无码中文字幕有码| 欧洲成人午夜精品无码区久久 | 精品人妻系列无码人妻漫画| 成人毛片无码一区二区| 最新中文字幕av无码专区| 久久av无码专区亚洲av桃花岛| 无码精品久久久久久人妻中字| 无码人妻丰满熟妇区免费| 日韩精品无码免费一区二区三区| 亚洲Av综合色区无码专区桃色|