【技術(shù)實現(xiàn)步驟摘要】
融合知識圖譜和深度學習的糖尿病預測方法及系統(tǒng)
[0001]本專利技術(shù)涉及一種融合知識圖譜和深度學習的糖尿病預測方法及系統(tǒng),屬于醫(yī)療信息化
技術(shù)介紹
[0002]糖尿病是因機體胰島素分泌相對或絕對不足導致血糖過高,而引起蛋白質(zhì)和脂肪代謝紊亂的一種常見內(nèi)分泌代謝性疾病。糖尿病的癥狀常表現(xiàn)為多飲、多食、多尿、體重下降,但主要危害在于患者長期血糖升高會引發(fā)各種嚴重的并發(fā)癥,給腎臟、血管、神經(jīng)、眼睛等器官帶來巨大的危害,甚至危及生命。
[0003]目前,糖尿病仍然無法被完全治愈,但如果在糖尿病早期對患者進行適當?shù)淖o理,改變其生活方式并輔助藥物治療,能夠使糖尿病并發(fā)癥的風險降低30%~60%。因此,糖尿病的早期發(fā)現(xiàn)至關(guān)重要。在醫(yī)學上,糖尿病的診斷主要依靠指尖采血的方式,診斷標準為空腹血糖≥7.0mmol/L或者糖耐量試驗后兩小時血糖≥11.1mmol/L。
[0004]但隨著人工智能技術(shù)和智慧醫(yī)療的飛速發(fā)展,研究人員開始將人工智能方法應用于糖尿病的預測。主要是采用機器學習或深度學習相關(guān)算法自動處理糖尿病數(shù)據(jù),挖掘出數(shù)據(jù)中的隱藏信息,以此來判斷患者是否患有糖尿病。目前已有的糖尿病分類預測模型雖然能有效識別糖尿病高危人群,可為健康管理、疾病預防決策提供依據(jù),但仍然存在一些不足之處。
[0005]例如,目前的糖尿病分類預測模型大多基于數(shù)據(jù)驅(qū)動的方法實現(xiàn),受到數(shù)據(jù)質(zhì)量的限制。而且大多模型僅考慮患者的體檢數(shù)據(jù),并未考慮到患者的生活習慣以及自身癥狀對預測結(jié)果的影響。
[0006]此外,僅基于機器學習 ...
【技術(shù)保護點】
【技術(shù)特征摘要】
1.一種融合知識圖譜和深度學習的糖尿病預測方法,其特征在于:包括以下步驟,S1、構(gòu)建體檢數(shù)據(jù)實體向量庫,基于體檢數(shù)據(jù)實體向量庫將患者體檢數(shù)據(jù)表示成向量形式,得到體檢數(shù)據(jù)向量;S2、獲取糖尿病專業(yè)文獻,進行知識抽取和知識融合,并基于知識表示模型TransR將糖尿病領(lǐng)域知識圖譜中的所有實體和關(guān)系表示成向量的形式,構(gòu)建糖尿病領(lǐng)域知識圖譜;S3、基于步驟S2構(gòu)建的糖尿病領(lǐng)域知識圖譜,抽取患者癥狀描述中的實體和關(guān)系,并表示成向量的形式,得到癥狀描述向量,進而獲得患者自身狀況的矩陣;S4、融合自注意力機制與卷積神經(jīng)網(wǎng)絡,構(gòu)建分類預測模型,由患者自身狀況的矩陣,通過構(gòu)建的分類預測模型獲得預測結(jié)果。2.如權(quán)利要求1所述的融合知識圖譜和深度學習的糖尿病預測方法,其特征在于:步驟S1中,構(gòu)建體檢數(shù)據(jù)實體向量庫,具體為,S11、依據(jù)醫(yī)學上定義的體檢指標正常范圍,將體檢指標的檢測值劃分為更具細粒度的若干參考范圍,并確定對應的關(guān)系;S12、基于劃分的參考范圍,將體檢指標、關(guān)系與檢測值表示成三元組的形式,采用知識表示模型TransH得到體檢數(shù)據(jù)實體向量庫。3.如權(quán)利要求1所述的融合知識圖譜和深度學習的糖尿病預測方法,其特征在于:步驟S2中,獲取糖尿病專業(yè)文獻,進行知識抽取和知識融合,并基于知識表示模型TransR將糖尿病領(lǐng)域知識圖譜中的所有實體和關(guān)系表示成向量的形式,構(gòu)建糖尿病領(lǐng)域知識圖譜,具體為,S21、獲取用于構(gòu)建知識圖譜的糖尿病領(lǐng)域?qū)I(yè)文獻;S22、進行知識抽取,包括實體抽取和關(guān)系抽取,其中,實體抽取為基于雙向長短期記憶網(wǎng)絡BiLSTM和條件隨機場CRF模型抽取出步驟S21得到的糖尿病領(lǐng)域?qū)I(yè)文獻中與糖尿病相關(guān)的實體;關(guān)系抽取為通過對文本進行句法分析抽取出文本中隱含的實體之間的關(guān)系,并表示成三元組(頭實體,關(guān)系,尾實體)的形式;S23、進行知識融合,通過實體對齊和實體鏈接對抽取的知識實體整合、消歧,通過關(guān)系推理進行正確性判斷,進而更新三元組中的實體和關(guān)系;S24、進行知識表示,基于知識表示模型TransR將三元組中的實體和關(guān)系表示成向量形式,得到構(gòu)建的糖尿病領(lǐng)域知識圖譜。4.如權(quán)利要求1
?
3任一項所述的融合知識圖譜和深度學習的糖尿病預測方法,其特征在于:步驟S3中,進而獲得患者自身狀況的矩陣,具體為,S31、判定患者是否進行體檢獲得體檢數(shù)據(jù),如是,進入步驟S32;如否,則進入步驟S33;S32、在患者進行體檢獲得體檢數(shù)據(jù)時,由得到的癥狀描述向量與步驟S1得到的患者體檢數(shù)據(jù)向量拼接成描述患者自身狀況的矩陣;S33、在患者未進行體檢未獲得體檢數(shù)據(jù)時,由得到的癥狀描述向量單獨拼接成描述患者自身狀況的矩陣。5.如權(quán)利要求1
?
3任一項所述的融合知識圖譜和深度學習的糖尿病預測方法,其特征在于:步驟S4中,融合自注意力機制與卷積神經(jīng)網(wǎng)絡,構(gòu)建分類預測模型,分類預測模型包括輸入層、自注意力層、卷積層、全連接層、Softmax層和輸出層,具體為,S41、分類預測模型的輸入層將患者自身狀況的矩陣輸入到自注意力層中,由自注意力
層的自注意力機制挖掘患者體檢數(shù)據(jù)與癥狀描述間的相互影響關(guān)系,獲取全局信息矩陣;S42、將獲取的全局信息矩陣輸入到卷積層中,進行局部特征提取,得到患者體檢數(shù)據(jù)和癥狀描述的最終表示向量;S43、將步驟S42得到的患者體檢數(shù)據(jù)和癥狀描述的最終表示向量,經(jīng)全連接層的變換后得到患者是否患有糖尿病的得分向量s;S44、將得分向量s輸入到Softmax層,得分向量s經(jīng)由Softmax層計算,得到患者是否患有糖尿病的概率分布,根據(jù)概率分布獲得患者是否患有糖尿病的預測結(jié)果,并由輸出層輸出預測結(jié)果。6.如權(quán)利要求5所述的融合知識圖譜和深度學習的糖尿病預測方法,其特征在于:步驟S41中,由自注意力層的自注意力機制挖掘患者體檢數(shù)據(jù)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:徐鶴,鄭群力,王汝傳,李鵬,程海濤,季一木,
申請(專利權(quán))人:南京郵電大學,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。