• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于主成分分析算法的醫保欺詐識別方法技術

    技術編號:15691251 閱讀:108 留言:0更新日期:2017-06-24 04:18
    本發明專利技術提出了一種基于主成分分析算法的醫保欺詐識別方法,包括:獲取醫保基礎數據,生成醫保結構化數據集;對各項數據進行標準化處理,生成標準化矩陣;計算標準化矩陣的協方差矩陣,并求解樣本協方差矩陣的特征方程,確定主成分;將標準化后的指標變量轉換為主成分得分;分別計算每個主成分得分的均值和標準差,根據切比雪夫定律計算每個主成分維度下的異常閾值;以每個主成分為坐標,制作二維空間散點圖,將每個散點代表實際醫保賬戶,判斷大于步驟S5中異常閾值的醫保報銷賬號視為異常帳號。本發明專利技術對醫保數據進行清洗、整理,采取主成分分析方法,對與欺詐行為相關的變量進行特征降維,根據統計學方法計算異常閾值,對醫保欺詐高風險識別。

    A medical fraud identification method based on principal component analysis algorithm

    The invention provides an algorithm based on principal component analysis of the medical insurance fraud identification method, including: obtaining medical insurance data, generating structured data sets of the medical insurance; data standardization, standardization of generating matrix; calculate the covariance matrix matrix standardization, and the characteristic equation of the sample covariance matrix, to determine the main components; the variables of the normalized conversion component scores were calculated respectively; the mean and standard deviation of each principal component scores, calculate the abnormal threshold of each principal component dimension according to the Chebyshev law; each principal component is to coordinate, making two-dimensional scatter plots, each dot represents the actual Medicare accounts, judge is greater than the anomaly threshold step S5 in the Medicare reimbursement account as abnormal account. The invention of Medicare data cleaning, sorting, taking the principal component analysis method is adopted to reduce the dimensionality of fraud related variables, to calculate the abnormal threshold according to statistical methods, high risk identification of insurance fraud.

    【技術實現步驟摘要】
    一種基于主成分分析算法的醫保欺詐識別方法
    本專利技術涉及計算機應用
    ,特別涉及一種基于主成分分析算法的醫保欺詐識別方法。
    技術介紹
    隨著社會經濟的發展,國家為了給老百姓提供更好的醫保環境,醫保政策越來越好。然而,一些人通過各種各樣的手段騙取醫保,導致醫保基金不合理流失。另一方面,由于經辦機構的監管模式主要以人工審核監管為主,多采用基于簡單規則的數據篩選方法,從醫療基金收支監測、簡單指標預警等方面開展基金風險管理工作,不僅速度慢,人力成本高,而且難以保證對欺詐行為的識別準確度。在現有的技術中,專利(申請號:201510760477.4;名稱:一種醫療保險異常數據在線智能檢測方法)提出,對已標注為異常的醫保數據樣本進行特征學習,然后運用機器學習算法進行在線檢查,然而如何確定目標樣本是否異常,該專利并未涉及。此外,專利(申請號:201410598935.4;名稱:一種基于數據挖掘的醫保欺詐行為的檢測方法)采取對醫保參保人的信息記錄進行分位數打分的方法確定異常級別,并將多種異常類別簡單加總確定總異常分值。該方法把連續性變量人為分段,損失了數據信息,而且忽略了各變量間可能存在的相關性,使總異常分值失去準確性。
    技術實現思路
    本專利技術的目的旨在至少解決所述技術缺陷之一。為此,本專利技術的目的在于提出一種基于主成分分析算法的醫保欺詐識別方法。為了實現上述目的,本專利技術的實施例提供一種基于主成分分析算法的醫保欺詐識別方法,包括如下步驟:步驟S1,獲取醫保基礎數據,生成醫保結構化數據集X;步驟S2,對所述醫保結構化數據集X中的各項數據進行標準化處理,生成標準化矩陣Z;步驟S3,計算所述標準化矩陣Z的協方差矩陣R,并求解樣本協方差矩陣R的特征方程,確定主成分;步驟S4,將標準化后的指標變量轉換為主成分得分;步驟S5,分別計算每個主成分得分的均值和標準差,根據切比雪夫定律計算每個主成分維度下的異常閾值;步驟S6,以每個主成分為坐標,制作二維空間散點圖,將每個散點代表實際醫保賬戶,判斷大于步驟S5中異常閾值的醫保報銷賬號視為異常帳號,將異常帳號以可視化形式進行呈現。進一步,在所述步驟S1中,所述醫保基礎數據,包括:醫保基金帳號、每個帳號基金報銷總額、門診天數、基金報銷比例和門診花費總額。進一步,在所述步驟S1中,計算每個醫保基金賬號每天門診花費總額和基金報銷總額,進而計算每年門診報銷總天數、基金報銷額和基金報銷比例,生成醫保結構化數據集X。進一步,在所述步驟S2中,采集樣本向量x=(X1,X2,X3)T),n個樣品xi=(xi1,xi2,xi3)T,i=1,2,…,n,進行如下標準化變換:其中p為特征變量個數得到標準化矩陣Z。進一步,在所述步驟S3中,所述協方差矩陣R為:其中,k為樣本數。進一步,在所述步驟S3中,所述求解樣本協方差矩陣R的特征方程,確定主成分,包括:計算樣本協方差矩陣R的特征方程|R-λIp|=0,得到p個特征根,確定主成分;根據λ為特征值、m為待選主成分數、p為變量數,當取2個主成分PC1和PC2時,對每個λj,計算方程組Rb=λjb,得到單位特征向量其中,j=1,2。進一步,在所述步驟S4中,所述將標準化后的指標變量轉換為主成分得分,包括:其中,Uij為每個樣本主成分得分,各樣本主成分總得分=U1+U2。進一步,在所述步驟S5中,所述根據切比雪夫定律計算每個主成分維度下的異常閾值,包括:max=mean+4*std,其中,max為異常閾值,mean為主成分得分的均值,std為主成分得分的標準差。根據本專利技術實施例的基于主成分分析算法的醫保欺詐識別方法,對醫保數據進行清洗、整理,采取主成分分析方法,對與欺詐行為相關的變量進行特征降維,根據統計學方法計算異常閾值,通過數據可視化方法實現醫保欺詐高風險識別。本專利技術克服了現有方法的不足,基于醫保基金持卡人一年中發生門診報銷行為的天數、報銷總金額以及報銷金額占總費用中的比例,建立門診報銷異常行為識別模型,檢索涉嫌欺詐的高風險卡號。本專利技術附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本專利技術的實踐了解到。附圖說明本專利技術的上述和/或附加的方面和優點從結合下面附圖對實施例的描述中將變得明顯和容易理解,其中:圖1為根據本專利技術實施例的基于主成分分析算法的醫保欺詐識別方法的流程圖;圖2為根據本專利技術實施例的某地區年度醫保數據的示意圖;圖3為根據本專利技術實施例的特征變量的碎石圖;圖4為根據本專利技術實施例的樣本得分的示意圖;圖5為根據本專利技術實施例的醫保欺詐高風險帳號的示意圖。具體實施方式下面詳細描述本專利技術的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,旨在用于解釋本專利技術,而不能理解為對本專利技術的限制。本專利技術公開了一種基于主成分分析算法的醫保欺詐識別方法,該方法可以實現在醫療保險數據的基礎上,快速、準確識別醫保欺詐行為。如圖1所示,本專利技術實施例的基于主成分分析算法的醫保欺詐識別方法,包括如下步驟:步驟S1,獲取醫保基礎數據,生成醫保結構化數據集X。其中,醫保基礎數據,包括:醫保基金帳號、每個帳號基金報銷總額、門診天數、基金報銷比例和門診花費總額。參考圖2,計算每個醫保基金賬號每天門診花費總額和基金報銷總額,進而計算每年門診報銷總天數、基金報銷額和基金報銷比例,生成醫保結構化數據集X。步驟S2,對醫保結構化數據集X中的各項數據進行標準化處理,生成標準化矩陣Z。具體的,采集樣本向量x=(X1,X2,X3)T),n個樣品xi=(xi1,xi2,xi3)T,i=1,2,…,n,進行如下標準化變換:其中p為特征變量個數,得到標準化矩陣Z。步驟S3,計算標準化矩陣Z的協方差矩陣R,并求解樣本協方差矩陣R的特征方程,確定主成分。首先,計算協方差矩陣R為:其中,k為樣本數。然后,求解樣本協方差矩陣R的特征方程,確定主成分,包括:計算樣本協方差矩陣R的特征方程|R-λIp|=0,得到p個特征根,確定主成分;根據λ為特征值、m為待選主成分數、p為變量數,當取2個主成分PC1和PC2時,信息的利用率達85%以上。對每個λj,計算方程組Rb=λjb,得到單位特征向量其中,j=1,2。步驟S4,將標準化后的指標變量轉換為主成分得分。在本步驟中,將標準化后的指標變量轉換為主成分得分,包括:其中,Uij為每個樣本主成分得分,各樣本主成分總得分=U1+U2。步驟S5,分別計算每個主成分得分U1、U2的均值和標準差,根據切比雪夫定律計算每個主成分維度下的異常閾值。在本步驟中,根據切比雪夫定律計算每個主成分維度下的異常閾值,包括:max=mean+4*std,其中,max為異常閾值,mean為主成分得分的均值,std為主成分得分的標準差。以2個主成分PC1和PC2為例,分別計算主成分得分U1、U2的均值(mean1、mean2)和標準差(std1、std2),根據切比雪夫定律計算PC1維度的異常閾值max1=mean1+4*std1、PC2維度的異常閾值max2=mean2+4*std2。步驟S6,以每個主成分為坐標,制作二維空間散點圖,將每個散點代表實際醫保賬戶,判斷大于步驟S5中異常本文檔來自技高網...
    一種基于主成分分析算法的醫保欺詐識別方法

    【技術保護點】
    一種基于主成分分析算法的醫保欺詐識別方法,其特征在于,包括如下步驟:步驟S1,獲取醫保基礎數據,生成醫保結構化數據集X;步驟S2,對所述醫保結構化數據集X中的各項數據進行標準化處理,生成標準化矩陣Z;步驟S3,計算所述標準化矩陣Z的協方差矩陣R,并求解樣本協方差矩陣R的特征方程,確定主成分;步驟S4,將標準化后的指標變量轉換為主成分得分;步驟S5,分別計算每個主成分得分的均值和標準差,根據切比雪夫定律計算每個主成分維度下的異常閾值;步驟S6,以每個主成分為坐標,制作二維空間散點圖,將每個散點代表實際醫保賬戶,判斷大于步驟S5中異常閾值的醫保報銷賬號視為異常帳號,將異常帳號以可視化形式進行呈現。

    【技術特征摘要】
    1.一種基于主成分分析算法的醫保欺詐識別方法,其特征在于,包括如下步驟:步驟S1,獲取醫保基礎數據,生成醫保結構化數據集X;步驟S2,對所述醫保結構化數據集X中的各項數據進行標準化處理,生成標準化矩陣Z;步驟S3,計算所述標準化矩陣Z的協方差矩陣R,并求解樣本協方差矩陣R的特征方程,確定主成分;步驟S4,將標準化后的指標變量轉換為主成分得分;步驟S5,分別計算每個主成分得分的均值和標準差,根據切比雪夫定律計算每個主成分維度下的異常閾值;步驟S6,以每個主成分為坐標,制作二維空間散點圖,將每個散點代表實際醫保賬戶,判斷大于步驟S5中異常閾值的醫保報銷賬號視為異常帳號,將異常帳號以可視化形式進行呈現。2.如權利要求1所述的基于主成分分析算法的醫保欺詐識別方法,其特征在于,在所述步驟S1中,所述醫保基礎數據,包括:醫保基金帳號、每個帳號基金報銷總額、門診天數、基金報銷比例和門診花費總額。3.如權利要求2所述的基于主成分分析算法的醫保欺詐識別方法,其特征在于,在所述步驟S1中,計算每個醫保基金賬號每天門診花費總額和基金報銷總額,進而計算每年門診報銷總天數、基金報銷額和基金報銷比例,生成醫保結構化數據集X。4.如權利要求1所述的基于主成分分析算法的醫保欺詐識別方法,其特征在于,在所述步驟S2中,采集樣本向量x=(X1,X2,X3)T),n個樣品xi=(xi1,xi2,xi3)T,i=1,2,…,n,進行如下標準化變換:

    【專利技術屬性】
    技術研發人員:謝國亮程嵐孫志強張憲錄孫廣陽
    申請(專利權)人:天津艾登科技有限公司
    類型:發明
    國別省市:天津,12

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 一本大道无码日韩精品影视| 午夜成人无码福利免费视频| 熟妇人妻系列av无码一区二区| 精品无码中文视频在线观看| 亚洲啪啪AV无码片| 亚洲AV综合色区无码另类小说| 无码人妻精品一区二区蜜桃| 国产丝袜无码一区二区三区视频| 亚洲最大中文字幕无码网站| 亚洲中文字幕无码专区| 精品久久久无码人妻中文字幕豆芽 | 精品国产a∨无码一区二区三区| 中文字幕无码日韩欧毛| 国产av永久无码天堂影院| 免费无码专区毛片高潮喷水| 精品深夜AV无码一区二区| 夜夜添无码一区二区三区| 无码色AV一二区在线播放| 永久免费AV无码国产网站| 久久精品无码一区二区三区日韩| 亚洲午夜无码久久久久小说| 亚洲精品无码永久在线观看你懂的| 国产精品亚洲а∨无码播放不卡 | 免费A级毛片无码视频| 中文字幕日韩精品无码内射| 成人免费无码精品国产电影| 亚洲av日韩aⅴ无码色老头| 92午夜少妇极品福利无码电影| 亚洲av无码国产精品色午夜字幕| 国内精品无码一区二区三区| 天码av无码一区二区三区四区| 成人无码嫩草影院| 西西4444www大胆无码| 男人av无码天堂| 天码av无码一区二区三区四区| 国产精品亚洲а∨无码播放麻豆 | 日韩精品人妻系列无码专区免费 | 亚洲AV永久无码精品一百度影院 | 国内精品人妻无码久久久影院| 无码日韩精品一区二区人妻| 国产av无码专区亚洲国产精品|