The present invention provides a method to predict the risk of cardiovascular disease and the system, the method comprises the following steps: step one, the prognosis of cardiovascular disease risk prediction problem definition, step two, health data collection, cardiovascular patients in step three, the data pretreatment, including data integration, data cleaning and missing data processing step four, the feature, structure and feature selection, and identify the risk factors, potential step five, will identify the risk factor and the outcome of rehabilitation. Input and output sample set, input to the random forest algorithm is used to train the model, and the predictive ability of the models to assess the. Health care data of cardiovascular patients need the clinician input method, forecast the rehabilitation outcome of patients with a future period of time through the model, can be a good prognostic risk prediction, in order to achieve accurate personalized rehabilitation.
【技術實現步驟摘要】
心腦血管疾病風險預測方法及系統
本專利技術涉及一種智慧醫療領域,具體地,涉及一種心腦血管疾病風險預測方法及系統。
技術介紹
心腦血管疾病泛指由于高脂血癥、血液黏稠、動脈粥樣硬化、高血壓等所導致的心臟、大腦及全身組織發生的缺血性或出血性疾病,是心臟血管和腦血管疾病的統稱。心腦血管疾病是一種嚴重威脅人類,特別是50歲以上中老年人健康的常見病,具有高患病率、高致殘率和高死亡率的特點,即使應用目前最先進、完善的治療手段,仍有50%以上的心腦血管疾病幸存者生活不能完全自理,全世界每年死于心腦血管疾病的人數高達1500萬人,居各種死因首位。預后預測是指預測疾病的可能病程和結局。它既包括判斷疾病的特定后果,也包括提供時間線索,如預測某段時間內發生某種結局的可能性。早發現、早診斷、早治療是改善預后的前提。心腦血管疾病患者的良好預后是患者生活質量的保障,也是醫患雙方進行康復治療的首要目標。精準醫療的一個目標是能對心腦血管疾病患者的預后有準確的預測,從而能針對性地對康復項目進行調整,達到康復速度快,康復效果好的目標。隨著醫療信息化的發展,醫院積累了大量的健康醫療數據。如何更好的利用這些數據以及醫學知識,通過認知計算技術,提供精準醫療的決策是醫院現階段所需要的。認知計算有助于彌合數據量和數據洞察力之間的差距,幫助臨床醫生發掘數據中隱藏的洞察力。基于這些發掘的洞察力,認知模型可提供基于證據的選項,進而幫助決策并減少人為偏差,有助于醫療專業人員做出更加明智、及時的決策。到目前為止,認知計算技術在中國人群心腦血管疾病預后風險預測方面尚屬空白。而國外認知計算技術雖然已有成功應用案例,但 ...
【技術保護點】
一種心腦血管疾病風險預測方法,其特征在于,其包括以下步驟:步驟一,問題定義,心腦血管疾病患者預后風險預測問題包括分析的目標人群、關心的預后結局、人群數據采集的觀察窗口及預測時間窗口;步驟二,數據采集,針對目標人群,從相關信息系統收集觀察期窗口內的心腦血管疾病患者的醫療健康數據及預后結局數據;步驟三,數據預處理,數據質量的好壞直接影響模型的預測效果,數據預處理針對數據集進行一系列的集成、清洗和缺失數據的處理,從而提高數據質量。采集的數據類型多種多樣,其中包括選擇項、日期時間、數值型、字符型以及是否型數據,不同數據類型使得數據預處理更加有挑戰性,針對不同數據類型需要采取不同處理方法進行針對性數據預處理;步驟四,特征工程,基于經過清洗的病人住院記錄、健康狀況特征形成一系列觀測向量,主要工作包括基于各種數據類型生成原始輸入特征,數據類型的轉換,并基于領域知識及歷史數據生成新的輸入特征;步驟五,模型構建與評估,在眾多的機器學習算法中,隨機森林是一種利用多個分類樹對數據進行判別與分類的方法,隨機森林算法擅長處理高維特征,同時還給出各個變量的重要性評分,評估各個變量在分類中所起的作用且易于實現并行化 ...
【技術特征摘要】
1.一種心腦血管疾病風險預測方法,其特征在于,其包括以下步驟:步驟一,問題定義,心腦血管疾病患者預后風險預測問題包括分析的目標人群、關心的預后結局、人群數據采集的觀察窗口及預測時間窗口;步驟二,數據采集,針對目標人群,從相關信息系統收集觀察期窗口內的心腦血管疾病患者的醫療健康數據及預后結局數據;步驟三,數據預處理,數據質量的好壞直接影響模型的預測效果,數據預處理針對數據集進行一系列的集成、清洗和缺失數據的處理,從而提高數據質量。采集的數據類型多種多樣,其中包括選擇項、日期時間、數值型、字符型以及是否型數據,不同數據類型使得數據預處理更加有挑戰性,針對不同數據類型需要采取不同處理方法進行針對性數據預處理;步驟四,特征工程,基于經過清洗的病人住院記錄、健康狀況特征形成一系列觀測向量,主要工作包括基于各種數據類型生成原始輸入特征,數據類型的轉換,并基于領域知識及歷史數據生成新的輸入特征;步驟五,模型構建與評估,在眾多的機器學習算法中,隨機森林是一種利用多個分類樹對數據進行判別與分類的方法,隨機森林算法擅長處理高維特征,同時還給出各個變量的重要性評分,評估各個變量在分類中所起的作用且易于實現并行化。利用選定的人群和輸入特征及已知的康復結局,構建了隨機森林預測模型。2.根據權利要求1所述的心腦血管疾病風險預測方法,其特征在于,所述步驟二中數據采集所需要采集的數據包括:康復科門診數據、康復科治療室數據、神內/神外門診數據、神內/神外住院數據、康復科住院數據、腦卒中篩查門診數據,這些數據涉及的內容涵蓋有患者基本信息、病歷或電子病歷、檢測檢驗、影像、診斷、處方、治療、評估表數據。3.根據權利要求1所述的心腦血管疾病風險預測方法,其特征在于,所述步驟三具體包括以下步驟:步驟三十一,數據集成,把不同來源、格式、特點性質的數據整合到一起,從而為之后的分析和模型訓練提供全面的數據,只需把不同來源的數據按照一定聯系規則整合到一起,根據病人ID號把不同數據源但有同樣ID號的信息連接在一起,這樣所有來自不同數據源的數據就被整合到了一起;步驟三十二,數據清洗,數據清洗的任務是通過各種措施從準確性、一致性、無冗余性角度清洗原始數據以提高數據質量,方便下一步缺失數據處理的操作;步驟三十三,缺失值處理,是對數...
【專利技術屬性】
技術研發人員:童曉渝,章玉宇,崔修濤,王永明,熊偉,胡天龍,廖光源,
申請(專利權)人:中電科軟件信息服務有限公司,
類型:發明
國別省市:上海,31
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。