A convolutional neural network based on Poisson noise removal method is proposed in the present invention, the main contents include: network architecture, network training, supervision framework, process for the removal of Poisson noise, noise, with gray image as input, through the depth of convolutional neural network DeNet in each layer are 3 x 3 check the output of a layer of convolution convolution, and then extract the last channel and the input image combination forecasting clear images of the original image to produce estimates of the original image, the clear image of the final output. The invention breaks through the dependence of the data model, easy to adapt to a data type by training, in addition, height can be fast parallel computing on GPU, which can more quickly get more accurate image, promote the research and development of the follow-up work of medicine and Astronomy and etc..
【技術實現步驟摘要】
一種基于深度卷積神經網絡去除泊松噪聲的方法
本專利技術涉及圖像去噪領域,尤其是涉及了一種基于深度卷積神經網絡去除泊松噪聲的方法。
技術介紹
圖像去噪常用于視頻監控、醫學、天文圖像等領域,還原噪聲圖像并保留圖像關鍵信息,即去除影響對圖像源信息進行理解分析的因素,獲得視覺更清晰的效果。具體地安全領域內可以在模糊視頻中是幀中目標輪廓清晰以助于辨別特定人或物,而醫學上,由于醫學成像系統的復雜性常產生噪聲導致醫學圖像質量下降,進而影響醫學分析診斷系統分析的精確性,故去除泊松噪聲可以使得醫學分析診斷能夠得到精確的圖像利于醫學后續工作。故盡可能的減少噪聲、提高圖像的質量,選用適當的方法盡可能地去除噪聲干擾是一個非常重要的圖像預處理步驟,換句話說圖像去噪算法研究是一切圖像處理的前提,具有相當重要的意義。本專利技術提出了一種基于深度卷積神經網絡去除泊松噪聲的方法,采取監督的方法,并使用由深度神經網絡所表現的強大表示能力,在沒有明確依賴一個模型的情況下,學習去除泊松噪聲。通過構建一個深度神經網絡DeNet,接收噪聲灰度圖像作為輸入,網絡每一層均用3×3的卷積核對上一層輸出進行卷積,然后提取最后一個通道與輸入圖像組合預測原圖的清晰圖像,產生對原始清晰圖像的估計,最終輸出所得清晰圖像。本專利技術突破了對數據模型的依賴,易于通過訓練適應某種數據類型,此外,高度可并行化可在GPU上進行快速運算,使得能夠更快速得到更精確的圖像,推動了醫學和天文等領域后續工作的研究和發展。
技術實現思路
針對現有方法多需要更有效的對比推動研究的問題,本專利技術的目的在于提供一種基于深度卷積神經網絡去除泊松噪 ...
【技術保護點】
一種基于深度卷積神經網絡去除泊松噪聲的方法,其特征在于,主要包括網絡架構(一);訓練網絡(二);監督框架(三);去除泊松噪聲(四)。
【技術特征摘要】
1.一種基于深度卷積神經網絡去除泊松噪聲的方法,其特征在于,主要包括網絡架構(一);訓練網絡(二);監督框架(三);去除泊松噪聲(四)。2.基于權利要求書1所述的網絡架構(一),其特征在于,是一個深度神經網絡,用于將被泊松噪聲污染的圖像恢復成清晰圖像,即去除泊松噪聲,表示為DeNet,當網絡估計噪聲圖像與清晰圖像之間的差異時是以超分辨率為目的,并且與殘差網絡相似的是其權重梯度也是要通過后面的層并且直接從損失函數傳播到每一層。3.基于權利要求書1所述的DeNet,其特征在于,DeNet網絡接收噪聲灰度圖像作為輸入,產生對原始清晰圖像的估計,在每一層上,利用64個尺寸為3×3的卷積核在上一層輸出上以步長為1做卷積,第63個輸出通道用于計算后續步驟,而最后一個通道被提取出來直接與輸入圖像組合來預測清晰輸出,這些提取層可以被視為負噪聲成分因為它們的和抵銷了噪聲,網絡包括20個卷積層,其中第18層使用非線性修正線性單元(ReLU),而最后兩層完全保持線性。4.基于權利要求書1所述的訓練網絡(二),其特征在于,在采用數據流圖用于數值計算的開源軟件庫中執行網絡,對5000幅圖像做240K次迭代,采用了64個尺寸為128×128的圖像塊,圖像被轉換為YCbCr,Y通道在經過峰值縮放并偏移后,用作輸入灰度圖像,為擴張數據,在訓練過程中,隨機對訓練圖像進行裁剪和翻轉垂直軸得到新的圖像塊,此外,噪聲實現也是隨機的。5.基于權利要求書4所述的訓練過程,其特征在于,使用自適應矩估計(ADAM)優化器完成訓練,分別用不同的峰值單獨訓練網絡,為避免卷積在圖像塊的邊界產生偽圖像,在訓練期間使用l2損失在圖像塊的中心部分裁減了外部的21個像素,在測試時,將使用對稱映射的21個像素在其通過網絡傳遞之前用于填充圖像,然后裁剪回原來的大小輸出最終結果。6.基于權利要求書5所述的自適應矩估計(ADAM),其特征在于,利用梯度的一階矩估計和二階矩估計動態調整每個參數的學習率,學習率為α=10...
【專利技術屬性】
技術研發人員:夏春秋,
申請(專利權)人:深圳市唯特視科技有限公司,
類型:發明
國別省市:廣東,44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。