The invention belongs to the technical field of data mining, medical information and large data, in particular to a drug analysis method based on a full memory event sequence mining model. The method of the invention, the original data into the categories of drug medication event sequence, all each medication use event type event sequence nodes multidimensional vector into Euclidean space representation; then according to the previous node to predict drug events of a historical record of events weighted sum form feature prediction of event memory representation, as standard input vector classifier to predict the next event, the multi-dimensional vector to predict events expressed as output, training a prediction model, the multi dimension vector maps in Euclidean space to the original space type, the use of all drugs for the training sequence of events; the new drug event sequence, input the trained model, to predict future events. This method can make use of as much data as possible for decision making, thus reducing the error of decision making.
【技術實現步驟摘要】
一種基于全記憶事件序列挖掘模型的用藥分析方法
本專利技術屬于數據挖掘、醫療信息和大數據
,具體涉及一種基于全記憶事件序列挖掘模型的用藥分析方法。
技術介紹
有效的用藥方案對于患者獲取最佳治療是非常重要的。利用已經積累的大規模的患者臨床用藥歷史數據進行分析建模,有助于醫生對患者下一步用藥提供決策支持。數據挖掘方法已經被用于用藥分析,傳統的用藥數據挖掘方法采用頻繁模式挖掘發現頻繁出現的用藥組合,推斷藥物之間的關聯。然而,一方面,不考慮用藥順序的頻繁模式挖掘忽略了疾病演變的特征對用藥的影響;另一方面,雖然已有考慮“序”和時間特征的頻繁序列模式挖掘方法被使用,然而,大量冗余的結果模式和關聯規則限制了方法的實際應用。更重要的是,患者的用藥并不是簡單的考慮先后關系,還需要考慮在治療過程中前序不同時間點的用藥對目標時間點的用藥的影響的差異。本專利技術針對患者用藥歷史數據,提出一種基于全記憶事件序列挖掘模型的用藥分析方法。首先,采用事件序列形式建模表示用藥歷史數據,即形成用藥事件序列;然后,針對患者疾病隨時間的變化,以及用藥受不同階段用藥情況的影響,將需要預測事件的時間節點前的所有事件看作為預測事件的記憶,對預測事件記憶加權構成事件記憶特征表示,并構建訓練數據集;再構建訓練模型,設置損失函數,求解參數;最后,對于待預測用藥事件序列實現事件預測。該方法不僅考慮了時間順序,以及不同階段患者用藥的影響差異,而且對比以往的一階或高階事件序列分析方法,能夠利用盡可能多的數據來用于決策,從而減少決策的失誤。
技術實現思路
本專利技術的主要目的是提供一種基于用藥記錄數據的用藥分析方法 ...
【技術保護點】
基于全記憶事件序列挖掘模型的用藥分析方法,其特征在于,具體步驟為:(1)首先,對患者歷史用藥數據進行預處理,即采集用藥事件序列的原始數據,將原始用藥數據轉換成用藥事件發生序列;然后,對用藥事件序列數據進行處理,將序列中的每個事件都用一個或多個類別型的變量進行表示;(2)對于已經處理好的類別型變量表示的事件序列,設置一個特定的記憶長度閾值,選擇高于該閾值的序列用于構造訓練數據集;(3)采用基于全記憶事件序列方法構建訓練預測模型;(4)對于新的用藥事件序列,輸入預測模型實現對未來時間節點的用藥事件進行預測。
【技術特征摘要】
1.基于全記憶事件序列挖掘模型的用藥分析方法,其特征在于,具體步驟為:(1)首先,對患者歷史用藥數據進行預處理,即采集用藥事件序列的原始數據,將原始用藥數據轉換成用藥事件發生序列;然后,對用藥事件序列數據進行處理,將序列中的每個事件都用一個或多個類別型的變量進行表示;(2)對于已經處理好的類別型變量表示的事件序列,設置一個特定的記憶長度閾值,選擇高于該閾值的序列用于構造訓練數據集;(3)采用基于全記憶事件序列方法構建訓練預測模型;(4)對于新的用藥事件序列,輸入預測模型實現對未來時間節點的用藥事件進行預測。2.如權利要求1所述的基于全記憶時間序列挖掘模型的用藥分析方法,其特征在于,步驟(1)中的患者歷史用藥數據的事件序列的轉化表示方法,該步驟將患者歷史用藥記錄表示為事件,每個事件用一個或多個類別型變量表示。3.如權利要求1所述的基于全記憶時間序列挖掘模型的用藥分析方法,其特征在于,步驟(2)中將患者用藥的歷史事件作為記憶序列,形成記憶特征表示。4.如權利要求1所述的基于全記憶時間序列挖掘模型的用藥分析方法,其特征在于,步驟(4)把要新的用藥事件序列作為訓練好的預測模型的輸入,使用模型輸出預測結果。5.如權利要求1所述的基于全記憶時間序列挖掘模型的用藥分析方法,其特征在于,步驟(2)中所述構造訓練數據集方法的具體步驟為:(1...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。