【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)屬于圖像壓縮,具體涉及一種基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法。
技術(shù)介紹
1、目前,ct、mri等數(shù)字圖像在臨床輔助診斷上已經(jīng)獲得了廣泛的應(yīng)用。而隨著數(shù)字圖像技術(shù)的發(fā)展,醫(yī)療器械設(shè)備精度的提升,數(shù)字圖像的尺寸和位深都在逐漸變大,對醫(yī)學(xué)圖像的存儲和傳輸都帶來了巨大的挑戰(zhàn)。在三維醫(yī)學(xué)圖像壓縮領(lǐng)域中,圖像細(xì)節(jié)的損失和畸變?nèi)菀讓?dǎo)致臨床診斷出現(xiàn)偏差,因此基于無損壓縮的三維醫(yī)學(xué)圖像算法研究具有重要的意義。
2、而現(xiàn)如今的三維醫(yī)學(xué)圖像壓縮算法可以分為:傳統(tǒng)圖像壓縮方法的三維擴(kuò)展(如jp3d,extensions?for?three-dimensional?data?in?jpeg-2000,jpeg-2000標(biāo)準(zhǔn)的三維圖像擴(kuò)展),視頻壓縮方法(如h.265又稱為hevc,high?efficiency?video?coding,高效率視頻編碼),以及基于深度學(xué)習(xí)的可學(xué)習(xí)壓縮方法。
3、其中jp3d運(yùn)用了波小波變換和位平面編碼等技術(shù),hevc運(yùn)用了幀內(nèi)預(yù)測、幀間預(yù)測,以及視頻壓縮方法典型的運(yùn)動估計和運(yùn)動補(bǔ)償策略。盡管傳統(tǒng)圖像壓縮算法和視頻編碼方法具有一定的壓縮效果,其最大的問題在于需要手工設(shè)計復(fù)雜的壓縮流程,并且不能對特定的數(shù)據(jù)集做自適應(yīng)優(yōu)化,不能充分利用圖像數(shù)據(jù)間的冗余信息,難以達(dá)到最佳的圖像壓縮比。
4、相比而言,基于深度學(xué)習(xí)的圖像壓縮算法通常使用卷積神經(jīng)網(wǎng)絡(luò)(cnn,convolutional?neural?network)等結(jié)構(gòu),通過學(xué)習(xí)數(shù)據(jù)的表示來實現(xiàn)壓縮。基于深度學(xué)習(xí)的方法可以端到
技術(shù)實現(xiàn)思路
1、本專利技術(shù)提供了一種基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法解決上述提到的技術(shù)問題,具體采用如下的技術(shù)方案:
2、一種基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,包含:
3、對原始的三維醫(yī)學(xué)圖像數(shù)據(jù)進(jìn)行預(yù)處理;
4、將預(yù)處理后的圖像輸入到基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型中,使用圖像處理器gpu進(jìn)行訓(xùn)練;
5、將訓(xùn)練得到的所述神經(jīng)網(wǎng)絡(luò)模型進(jìn)行量化處理后部署到fpga平臺上;
6、在fpga平臺上部署算術(shù)編碼模塊,所述算術(shù)編碼模塊與所述神經(jīng)網(wǎng)絡(luò)模型相結(jié)合對輸入的三維醫(yī)學(xué)圖像進(jìn)行壓縮。
7、進(jìn)一步地,所述對原始的三維醫(yī)學(xué)圖像數(shù)據(jù)進(jìn)行預(yù)處理的具體方法為:
8、對原始的三維醫(yī)學(xué)圖像數(shù)據(jù)進(jìn)行歸一化,并且裁剪至預(yù)設(shè)大小。
9、進(jìn)一步地,所述神經(jīng)網(wǎng)絡(luò)模型包含:幀內(nèi)預(yù)測網(wǎng)絡(luò)、幀間預(yù)測網(wǎng)絡(luò)、記憶融合門和混合邏輯斯蒂預(yù)測網(wǎng)絡(luò);
10、所述幀內(nèi)預(yù)測網(wǎng)絡(luò)用于提取當(dāng)前圖像幀的特征信息;
11、所述幀間預(yù)測網(wǎng)絡(luò)用于提取先前圖像幀的隱藏特征的隱藏信息;
12、所述記憶融合門用于融合特征信息和隱藏信息,并輸出結(jié)合后的特征信息;
13、所述混合邏輯斯蒂預(yù)測網(wǎng)絡(luò)用于根據(jù)結(jié)合后的特征信息生成混合邏輯斯蒂分布的參數(shù),對于每個需要的壓縮的像素點,最后輸出通道數(shù)為k*3的參數(shù),其中k代表混合分布中的分布個數(shù),3代表每個分布需要的參數(shù)量,包括均值參數(shù)u,尺度參數(shù)s以及概率參數(shù)π。
14、進(jìn)一步地,所述幀內(nèi)預(yù)測網(wǎng)絡(luò)為帶掩碼的卷積神經(jīng)網(wǎng)絡(luò)。
15、進(jìn)一步地,所述幀內(nèi)預(yù)測網(wǎng)絡(luò)包含一層帶掩碼的卷積層。
16、進(jìn)一步地,所述幀間預(yù)測網(wǎng)絡(luò)包含深度可分離卷積層、激活函數(shù)層和逐點卷積網(wǎng)絡(luò)層。
17、進(jìn)一步地,結(jié)合后的特征信息還作為更新后的隱藏特征。
18、進(jìn)一步地,所述將訓(xùn)練得到的網(wǎng)絡(luò)模型進(jìn)行量化處理后部署到fpga平臺上的具體方法為:
19、將所述神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù)量化成16位;
20、將歸一化后的圖像輸入也量化成16位。
21、進(jìn)一步地,所述算術(shù)編碼模塊包含量化模塊、累積分布計算器和算數(shù)編碼器;
22、所述量化模塊對所述神經(jīng)網(wǎng)絡(luò)模塊輸出的均值參數(shù)u,尺度參數(shù)s和概率參數(shù)π分別做量化處理,得到量化后的邏輯斯蒂分布參數(shù),輸入所述累積分布計算器中計算當(dāng)前像素點的頻率范圍,再輸入到所述算數(shù)編碼器中得到編碼后的二進(jìn)制碼流。
23、進(jìn)一步地,所述量化模塊對所述神經(jīng)網(wǎng)絡(luò)模塊輸出的均值參數(shù)u,尺度參數(shù)s和概率參數(shù)π分別做量化處理的具體方法為:
24、對均值參數(shù)u量化成下列公式,
25、
26、其中,r代表四舍五入操作,而t代表向下取整的截斷操作,n代表輸入圖像的位深;
27、所述神經(jīng)網(wǎng)絡(luò)模塊輸出對數(shù)尺度參數(shù),即log(s),采用量化加查表的方式計算尺度參數(shù)s,過程公式如下,
28、
29、其中,e代表對所述神經(jīng)網(wǎng)絡(luò)模塊輸出的log(s)進(jìn)行量化的分度,而lut表示查詢表;
30、對概率參數(shù)π做截取操作,將輸出值限定在(0,1)之間。
31、一種基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮系統(tǒng),包含根據(jù)前述的基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法形成的fpga平臺,所述基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮系統(tǒng)能夠基于fpga平臺對輸入的三維醫(yī)學(xué)圖像進(jìn)行壓縮。
32、本專利技術(shù)的有益之處在于所提供的基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,將可學(xué)習(xí)壓縮算法及算術(shù)編碼器實現(xiàn)fpga系統(tǒng)平臺的部署,減小功耗,降低算法延時。
33、本專利技術(shù)的有益之處在于所提供的基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,使用了神經(jīng)網(wǎng)絡(luò)中序列的結(jié)構(gòu),通過記憶門融合了幀間信息和幀內(nèi)信息,進(jìn)一步減少了數(shù)據(jù)冗余,從而達(dá)到最優(yōu)的壓縮比。在幀內(nèi)信息的預(yù)測流程中,所述算法使用了帶掩碼的卷積層,以滑動窗的形式從左到右、從上到下依次預(yù)測當(dāng)前像素點的信息;在幀間信息的預(yù)測過程中,先前幀的圖像信息都會通過隱藏層來傳遞給當(dāng)前幀,并對該隱藏層進(jìn)行深度可分離卷積計算,進(jìn)一步提取先前幀的特征信息。通過這種方式,本申請的基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法充分利用了三維醫(yī)學(xué)圖像當(dāng)中的空間信息,能夠?qū)崿F(xiàn)像素點的準(zhǔn)確預(yù)測,為后續(xù)編碼過程提升壓縮效果提供幫助。
34、在編碼器的設(shè)計上,本申請的基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法采用了基于混合邏輯斯蒂分布的算術(shù)編碼算法,其有兩個優(yōu)點:混合分布能更好地擬合真實場景下的三維醫(yī)學(xué)圖像數(shù)據(jù),提升概率預(yù)測準(zhǔn)確性;邏輯斯蒂分布的累積分布函數(shù)是深度學(xué)習(xí)領(lǐng)域常見的sigmoid函數(shù),便于概率分布的計算。最后,對該算術(shù)編碼模塊進(jìn)行優(yōu)化,實現(xiàn)基于fpga的網(wǎng)絡(luò)預(yù)測加編碼的聯(lián)合部本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點】
1.一種基于FPGA的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,包含:
2.根據(jù)權(quán)利要求1所述的基于FPGA的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,
3.根據(jù)權(quán)利要求1所述的基于FPGA的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,
4.根據(jù)權(quán)利要求3所述的基于FPGA的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,
5.根據(jù)權(quán)利要求3所述的基于FPGA的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,
6.根據(jù)權(quán)利要求3所述的基于FPGA的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,
7.根據(jù)權(quán)利要求3所述的基于FPGA的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,
8.根據(jù)權(quán)利要求3所述的基于FPGA的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,
9.根據(jù)權(quán)利要求8所述的基于FPGA的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,
10.一種基于FPGA的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮系統(tǒng),包含根據(jù)權(quán)利要求1-9任一所述的基于FPGA的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法形成的FPGA平臺,所述基于FPGA的可學(xué)習(xí)三維醫(yī)學(xué)
...【技術(shù)特征摘要】
1.一種基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,包含:
2.根據(jù)權(quán)利要求1所述的基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,
3.根據(jù)權(quán)利要求1所述的基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,
4.根據(jù)權(quán)利要求3所述的基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,
5.根據(jù)權(quán)利要求3所述的基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,
6.根據(jù)權(quán)利要求3所述的基于fpga的可學(xué)習(xí)三維醫(yī)學(xué)圖像壓縮方法,其特征在于,...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:余鋒,陳杰濤,陳乾豪,陳渭杰,
申請(專利權(quán))人:浙江大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。