• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于數據挖掘的建模方法及裝置制造方法及圖紙

    技術編號:15691526 閱讀:40 留言:0更新日期:2017-06-24 04:48
    本發明專利技術涉及一種基于數據挖掘的建模方法及裝置,所述基于數據挖掘的建模方法包括:在收到待篩選的備選指標后,將所述備選指標均分成K個指標群;計算各指標群中每一備選指標的群內距離D1和群間距離D2,根據所述群內距離D1和群間距離D2并基于預定的計算規則計算各備選指標對應的篩選評價值A;根據所述篩選評價值A選擇備選指標,基于所述K值并利用所選擇的備選指標建立指標模型。本發明專利技術能夠準確地選出相關性最弱的備選指標,提高建模效率。

    Method and device for modeling based on Data Mining

    The invention relates to a method and device modeling method based on data mining, the modeling method based on data mining in alternative indicators include: received to be screened, the alternative indicators are divided into K index group; calculate each alternative indicators of each index in group D1 and group D2, the distance between the distance and according to the group within the distance D1 and the distance between groups D2 and based on the screening evaluation calculation rules to calculate the predetermined optional index value corresponding to the A; according to the screening evaluation value A alternative indicators, the K value and establish the index model using alternative indicators based on the selected. The invention can accurately select the weakest index of correlation and improve the modeling efficiency.

    【技術實現步驟摘要】
    基于數據挖掘的建模方法及裝置
    本專利技術涉及數據挖掘
    ,尤其涉及一種基于數據挖掘的建模方法及裝置。
    技術介紹
    目前,在與數據挖掘相關的建模中,通常收集到的備選建模指標數量較多,有時多達200個以上,但通常對建模有效的一般只有一部分,例如在200個備選建模指標中可能只有30個是有效的。為了從大量的備選建模指標中篩選出建模所需的有效指標,現有的方法是人工手動選出高相關度的指標進行建模,這種人工選擇的方法由于帶有主觀性,因此不能準確地選出建模的有效指標,且建模的效率低。
    技術實現思路
    本專利技術的目的在于提供一種基于數據挖掘的建模方法及裝置,旨在準確地選出相關性最弱的備選指標,提高建模效率。為實現上述目的,本專利技術提供一種基于數據挖掘的建模方法,所述基于數據挖掘的建模方法包括:S1,在收到待篩選的備選指標后,將所述備選指標均分成K個指標群;S2,計算各指標群中每一備選指標的群內距離D1和群間距離D2,根據所述群內距離D1和群間距離D2并基于預定的計算規則計算各備選指標對應的篩選評價值A;S3,根據所述篩選評價值A選擇備選指標,基于所述K值并利用所選擇的備選指標建立指標模型。優選地,所述步驟S2包括:S21,計算每一指標群下的備選指標的均值,根據所述均值獲取群中心集合,根據所述群中心集合計算每一備選指標與所述群中心集合的距離,以計算得到的距離作為所述群內距離D1;S22,計算每一備選指標所在的指標群與其他各指標群的中心距離,從所述中心距離中獲取距離最小的對應的指標群,根據所獲取的指標群計算所述群間距離D2;S23,計算所述篩選評價值A:A=(1-D1)/(1-D2)。優選地,所述步驟S3包括:S31,在每一指標群中,選出最大篩選評價值對應的至少一個備選指標和最小篩選評價值對應的至少一個備選指標;S32,若所述K值大于等于預設閾值時,則利用各指標群挑選出的備選指標建立預定的一指標模型;S33,若所述K值小于預設閾值時,則增大所述K值,重新計算篩選評價值并執行步驟S31,以利用各指標群選出的備選指標建立預定的另一指標模型。優選地,所述步驟S3之后還包括:S4,利用預定的驗證數據樣本對所建立的指標模型進行驗證,將驗證后準確率最高的指標模型作為基準模型進行應用。優選地,所述步驟S4包括:若準確率最高的指標模型的數量為1,則將該準確率最高的指標模型作為基準模型進行應用;若準確率最高的指標模型的數量大于1,則隨機選擇一準確率最高的指標模型作為基準模型進行應用,或者,增加驗證數據樣本的數量,直至準確率最高的指標模型的數量為1,并將該準確率最高的指標模型作為基準模型進行應用。為實現上述目的,本專利技術還提供一種基于數據挖掘的建模裝置,所述基于數據挖掘的建模裝置包括:均分模塊,用于在收到待篩選的備選指標后,將所述備選指標均分成K個指標群;計算模塊,用于計算各指標群中每一備選指標的群內距離D1和群間距離D2,根據所述群內距離D1和群間距離D2并基于預定的計算規則計算各備選指標對應的篩選評價值A;建立模塊,用于根據所述篩選評價值A選擇備選指標,基于所述K值并利用所選擇的備選指標建立指標模型。優選地,所述計算模塊包括:第一計算單元,用于計算每一指標群下的備選指標的均值,根據所述均值獲取群中心集合,根據所述群中心集合計算每一備選指標與所述群中心集合的距離,以計算得到的距離作為所述群內距離D1;第二計算單元,用于計算每一備選指標所在的指標群與其他各指標群的中心距離,從所述中心距離中獲取距離最小的對應的指標群,根據所獲取的指標群計算所述群間距離D2;第三計算單元,用于計算所述篩選評價值A:A=(1-D1)/(1-D2)。優選地,所述建立模塊包括:選擇單元,用于在每一指標群中,選出最大篩選評價值對應的至少一個備選指標和最小篩選評價值對應的至少一個備選指標;第一建立單元,用于若所述K值大于等于預設閾值時,則利用各指標群挑選出的備選指標建立預定的一指標模型;第二建立單元,用于若所述K值小于預設閾值時,則增大所述K值,重新計算篩選評價值并選出的備選指標,以利用各指標群選出的備選指標建立預定的另一指標模型。優選地,所述基于數據挖掘的建模裝置還包括:驗證模塊,用于利用預定的驗證數據樣本對所建立的指標模型進行驗證,將驗證后準確率最高的指標模型作為基準模型進行應用。優選地,所述驗證模塊具體用于若準確率最高的指標模型的數量為1,則將該準確率最高的指標模型作為基準模型進行應用;若準確率最高的指標模型的數量大于1,則隨機選擇一準確率最高的指標模型作為基準模型進行應用,或者,增加驗證數據樣本的數量,直至準確率最高的指標模型的數量為1,并將該準確率最高的指標模型作為基準模型進行應用。本專利技術的有益效果是:本專利技術在將備選指標均分為若干個指標群后,首先計算各指標群中每一備選指標的群內距離D1和群間距離D2,根據群內距離D1和群間距離D2計算得到篩選評價值A,由于篩選評價值A綜合考慮備選指標的群內距離D1和群間距離D2,因此,根據篩選評價值A可以選出相關性最小的備選指標,即選出的備選指標為最具有代表性或者最有效的指標,不需人工手動選取,選取的準確性高,且建模效率高。附圖說明圖1為本專利技術基于數據挖掘的建模方法第一實施例的流程示意圖;圖2為圖1所示步驟S2的細化流程示意圖;圖3為圖1所示步驟S3的細化流程示意圖;圖4為本專利技術基于數據挖掘的建模方法第二實施例的流程示意圖;圖5為本專利技術基于數據挖掘的建模裝置一實施例的結構示意圖;圖6為圖5所示計算模塊的結構示意圖;圖7為圖5所示建立模塊的結構示意圖。具體實施方式以下結合附圖對本專利技術的原理和特征進行描述,所舉實例只用于解釋本專利技術,并非用于限定本專利技術的范圍。如圖1所示,圖1為本專利技術基于數據挖掘的建模方法一實施例的流程示意圖,該基于數據挖掘的建模方法包括以下步驟:步驟S1,在收到待篩選的備選指標后,將所述備選指標均分成K個指標群;本實施例可應用在一基于數據挖掘的建模裝置中,該裝置在接收到待篩選的備選指標后,將備選指標隨機均分成K個指標群,以對備選指標進行聚類分析。其中,K為大于1的自然數,例如,共有150個備選指標,若K為10,則隨機均分成10個指標群,每個指標群中有15個備選指標。其中,在接收到150個備選指標之前,例如初始備選指標有200個,可以通過逐步回歸向前向后的方法,設置合適的參數來初步選出150個備選指標。其中,以建立客戶是否發生理賠的模型為例,備選指標包括人口統計特征、生命階段特征、客戶價值信息、產品持有情況、投保行為習慣、歷史理賠相關信息等等。步驟S2,計算各指標群中每一備選指標的群內距離D1和群間距離D2,根據所述群內距離D1和群間距離D2并基于預定的計算規則計算各備選指標對應的篩選評價值A;本實施例中,群內距離D1指的是備選指標變量與群中心集合的相關系數,該群內距離D1越大,則說明該備選指標與群中心集合的相關性越大。群中心集合由各指標群中的備選指標的均值決定。群間距離D2指的是備選指標變量與離群最近的群的中心的相關系數,該群間距離D2越小,則說明該備選指標與離群最近的群的中心的相關性越大。根據各備選指標的群內距離D1和群間距離D2計算篩選評價值A時,同時考慮各備選指標的群內距離D1和群間距離D2,所計算得出的篩選評本文檔來自技高網...
    基于數據挖掘的建模方法及裝置

    【技術保護點】
    一種基于數據挖掘的建模方法,其特征在于,所述基于數據挖掘的建模方法包括:S1,在收到待篩選的備選指標后,將所述備選指標均分成K個指標群;S2,計算各指標群中每一備選指標的群內距離D1和群間距離D2,根據所述群內距離D1和群間距離D2并基于預定的計算規則計算各備選指標對應的篩選評價值A;S3,根據所述篩選評價值A選擇備選指標,基于所述K值并利用所選擇的備選指標建立指標模型。

    【技術特征摘要】
    1.一種基于數據挖掘的建模方法,其特征在于,所述基于數據挖掘的建模方法包括:S1,在收到待篩選的備選指標后,將所述備選指標均分成K個指標群;S2,計算各指標群中每一備選指標的群內距離D1和群間距離D2,根據所述群內距離D1和群間距離D2并基于預定的計算規則計算各備選指標對應的篩選評價值A;S3,根據所述篩選評價值A選擇備選指標,基于所述K值并利用所選擇的備選指標建立指標模型。2.根據權利要求1所述的基于數據挖掘的建模方法,其特征在于,所述步驟S2包括:S21,計算每一指標群下的備選指標的均值,根據所述均值獲取群中心集合,根據所述群中心集合計算每一備選指標與所述群中心集合的距離,以計算得到的距離作為所述群內距離D1;S22,計算每一備選指標所在的指標群與其他各指標群的中心距離,從所述中心距離中獲取距離最小的對應的指標群,根據所獲取的指標群計算所述群間距離D2;S23,計算所述篩選評價值A:A=(1-D1)/(1-D2)。3.根據權利要求2所述的基于數據挖掘的建模方法,其特征在于,所述步驟S3包括:S31,在每一指標群中,選出最大篩選評價值對應的至少一個備選指標和最小篩選評價值對應的至少一個備選指標;S32,若所述K值大于等于預設閾值時,則利用各指標群挑選出的備選指標建立預定的一指標模型;S33,若所述K值小于預設閾值時,則增大所述K值,重新計算篩選評價值并執行步驟S31,以利用各指標群選出的備選指標建立預定的另一指標模型。4.根據權利要求1至3任一項所述的基于數據挖掘的建模方法,其特征在于,所述步驟S3之后還包括:S4,利用預定的驗證數據樣本對所建立的指標模型進行驗證,將驗證后準確率最高的指標模型作為基準模型進行應用。5.根據權利要求4所述的基于數據挖掘的建模方法,其特征在于,所述步驟S4包括:若準確率最高的指標模型的數量為1,則將該準確率最高的指標模型作為基準模型進行應用;若準確率最高的指標模型的數量大于1,則隨機選擇一準確率最高的指標模型作為基準模型進行應用,或者,增加驗證數據樣本的數量,直至準確率最高的指標模型的數量為1,并將該準確率最高的指標模型作為基準模型進行應用。6.一種基于數據挖掘的建模裝置,其特征在于,所述基...

    【專利技術屬性】
    技術研發人員:陳依云
    申請(專利權)人:平安科技深圳有限公司
    類型:發明
    國別省市:廣東,44

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产品无码一区二区三区在线蜜桃| 色欲A∨无码蜜臀AV免费播| 亚洲av午夜精品无码专区| 亚洲熟妇av午夜无码不卡| 人妻丰满熟妇A v无码区不卡| 精品无码人妻久久久久久| 无码av高潮喷水无码专区线| 无码人妻精品一区二| 精品日韩亚洲AV无码| 国产日产欧洲无码视频无遮挡 | 久久久久亚洲AV成人无码网站| 制服在线无码专区| 亚洲国产无套无码av电影| 特级无码a级毛片特黄| 蜜桃AV无码免费看永久| 国产色无码精品视频免费| 精品少妇人妻av无码专区| 中文AV人妻AV无码中文视频| 东京热人妻无码一区二区av| 西西4444www大胆无码| 丰满少妇人妻无码专区| 亚洲精品无码久久久久久| 久久精品国产亚洲AV无码偷窥 | 亚洲日韩国产二区无码 | 精品无码一区二区三区爱欲九九| 免费a级毛片无码av| 无码人妻aⅴ一区二区三区有奶水| 亚洲av无码成h人动漫无遮挡 | 人妻精品久久无码区| 亚洲熟妇无码爱v在线观看| 国产产无码乱码精品久久鸭| 中文字幕丰满乱子无码视频| r级无码视频在线观看| 午夜无码一区二区三区在线观看| 99久无码中文字幕一本久道| 成人免费一区二区无码视频| 免费无码AV片在线观看软件| 国产福利无码一区在线| 下载天堂国产AV成人无码精品网站| 性生交片免费无码看人| 无码A级毛片日韩精品|