• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種篩選用戶特征的方法及裝置制造方法及圖紙

    技術編號:15690879 閱讀:82 留言:0更新日期:2017-06-24 03:37
    本申請公開了一種篩選用戶特征的方法及裝置。該方法包括:提取用戶特征集合,所述用戶特征集合至少包含兩個用戶特征;針對所述用戶特征集合中的每一個用戶特征,以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,確定所述用戶特征的關聯因子;將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選。從而解決了,現有技術在盡可能多的提取的用戶特征之后,只能通過人工干預的方式來完成對用戶特征的篩選,導致用戶特征的篩選效率低的問題。

    Method and device for screening user characteristics

    The present invention discloses a method and a device for screening user characteristics. The method includes: extracting user feature sets the user feature set contains at least two user characteristics; for each user characteristics of the set of user characteristics in the dependent variable the user features, the user characteristics set the user characteristics of its user characteristics as independent variables, determine related factors for the user characteristics; the correlation factor of each user user features in the feature set and a preset threshold comparison, select the user characteristics according to the results of. The utility model solves the problem that the prior art can complete the screening of user characteristics only through manual intervention after the user's characteristics are extracted as much as possible, resulting in low screening efficiency of the user characteristics.

    【技術實現步驟摘要】
    一種篩選用戶特征的方法及裝置
    本申請涉及機器學習
    ,尤其涉及一種篩選用戶特征的方法及裝置。
    技術介紹
    隨著互聯網的蓬勃發展,機器學習(MachineLearning,ML)技術作為一種新的技術,越來越受到人們的重視。機器學習技術通常用來分析和預測用戶的行為,在實際應用中可以通過建立各種數學模型來實現。在數學模型的建立過程中,通常需要在網絡中收集大量的用戶數據,然后對這些用戶數據進行分析和處理,從而提取用戶數據中能夠解釋用戶行為的用戶特征,并將這些用戶特征作為解釋變量來建立數學模型。然而,在對網絡中收集大量的用戶數據進行分析和處理,進而提取用戶特征時,由于事先很難知道所要分析的用戶行為會和哪些用戶特征有關,因此實際應用中通常會盡可能多的提取與所要分析的用戶行相關的用戶特征,由于用于獎勵模型的用戶特征增多,從而導致建立數學模型的時間較長,并且所建立的數學模型復雜。例如用于分析用戶信用的數學模型中,通常會采集用戶的收入信息和學歷信息,但是通常收入信息和學歷信息會用較強的依賴關系,如果將它們都作為解釋變量,將會使該數學模型參數的數量增多,模型的建立時間加長,并且還會對模型的性能有所影響。現有技術在盡可能多的提取與所要分析的用戶行相關的用戶特征之后,只能通過人工干預的方式來完成對用戶特征的篩選,從而導致用戶特征的篩選效率較低。
    技術實現思路
    本申請實施例提供一種篩選用戶特征的方法及裝置,用于解決現有技術篩選用戶特征效率低的問題。本專利技術實施例提供一種篩選用戶特征的方法,所述方法包括:提取用戶特征集合,所述用戶特征集合至少包含兩個用戶特征;針對所述用戶特征集合中的每一個用戶特征,以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,確定所述用戶特征的關聯因子;將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選。優選的,所述將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選具體包括:將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,篩選出所述用戶特征集合中關聯因子大于預設閾值的用戶特征子集合。優選的,當篩選出的用戶特征子集合中至少包含兩個用戶特征時,所述方法還包括:通過用戶特征子集合中每一個用戶特征的標準差以及用戶特征子集合中用戶特征兩兩之間的協方差,確定用戶特征子集合中用戶特征兩兩之間的相關系數;將所確定的每一個相關系數取絕對值并分別與預設變量對比,當所述相關系數的絕對值大于所述預設變量時,將所述相關系數以及所述相關系數對應的兩個用戶特征構建為關聯組;通過所構建的各個關聯組,確定構建各個關聯組的用戶特征的特征相關分;根據所述特征相關分,篩選出至少一個用戶特征。優選的,當特征相關分越高表示相關關系越強時,所述根據所述特征相關分,篩選出至少一個用戶特征具體包括:提取最高特征相關分所對應的用戶特征,并將所述用戶特征構建篩選集合;根據特征相關分從高到低的順序,針對構建各個關聯組的每一個用戶特征依次執行如下操作:獲取所述用戶特征和所述篩選集合中的每一個用戶特征之間的相關系數;判斷所獲取的各相關系數的絕對值是否均小于第二閾值,若是,則將所述用戶特征放入所述篩選集合;篩選出篩選集合中的用戶特征。優選的,當所確定的每一個相關系數的絕對值均小于預設變量時,減小所述預設變量并將所確定的每一個相關系數的絕對值分別與減小后的預設變量對比。優選的,當用戶特征集合中每一個用戶特征的方差膨脹因子均小于預設閾值時,所述用戶特征子集合具體為空集。優選的,所述以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,確定所述用戶特征的方差膨脹因子具體包括:以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,通過邏輯回歸確定所述用戶特征的方差膨脹因子。優選的,所述用戶特征用于建立分析用戶行為的數學模型。優選的,所述關聯因子具體包括方差膨脹因子。本專利技術實施例還提供一種篩選用戶特征的裝置,所述裝置包括:提取單元、確定單元和篩選單元,其中:提取單元,用于提取用戶特征集合,所述用戶特征集合至少包含兩個用戶特征;確定單元,用于針對所述用戶特征集合中的每一個用戶特征,以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,確定所述用戶特征的方差膨脹因子;篩選單元,用于將用戶特征集合中每一個用戶特征的方差膨脹因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選。優選的,所述篩選單元包括篩選子單元,用于將用戶特征集合中每一個用戶特征的方差膨脹因子分別和預設閾值對比,篩選出所述用戶特征集合中方差膨脹因子大于預設閾值的用戶特征子集合,所述用戶特征子集合包括空集。本申請實施例采用的上述至少一個技術方案能夠達到以下有益效果:根據所確定的每一個用戶特征的關聯因子,將各關聯因子分別和預設閾值進行對比,從而對用戶特征集合中的用戶特征進行篩選,提高了用戶特征的篩選效率。從而解決了,現有技術在盡可能多的提取的用戶特征之后,只能通過人工干預的方式來完成對用戶特征的篩選,導致用戶特征的篩選效率低的問題。附圖說明此處所說明的附圖用來提供對本申請的進一步理解,構成本申請的一部分,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:圖1為本申請實施例1提供的一種篩選用戶特征的方法的具體實現流程示意圖;圖2為本申請實施例2提供的一種篩選用戶特征的方法的具體實現流程示意圖;圖3為本申請實施例3提供的一種篩選用戶特征的方法的具體實現流程示意圖;圖4為本申請實施例4提供的一種篩選用戶特征的裝置的具體結構示意圖。具體實施方式為使本申請的目的、技術方案和優點更加清楚,下面將結合本申請具體實施例及相應的附圖對本申請技術方案進行清楚、完整地描述。顯然,所描述的實施例僅是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├?,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。以下結合附圖,詳細說明本申請各實施例提供的技術方案。實施例1實施例1提供了一種篩選用戶特征的方法,用于解決現有技術只能通過人工干預的方式來完成對用戶特征的篩選,導致用戶特征的篩選效率低的問題。該方法的具體流程示意圖如圖1所示,包括下述步驟:步驟11:提取用戶特征集合。所述用戶特征集合至少包含兩個用戶特征,用戶特征是用戶各屬性抽象的結果,這些屬性可以包括年齡、性別、收入等。由于用戶特征提取之后用于建立數學模型,所以提取的用戶特征集合包含的用戶特征可以根據所要建立的模型來確定,例如當建立評估用戶信用的模型時,該用戶特征集合包含的用戶特征至少有用戶年齡、用戶收入等一般來說,在提取用戶特征集合前先建立用戶數據庫,然后從用戶數據庫中提取用戶特征集合,不過本申請并不限于這種方式提取用戶特征集合,也可以是問卷調查等形式提取用戶特征集合,甚至也可以任意的方式選取用戶特征集合,提取用戶特征集合的方式并不會影響本申請的技術效果。但是,在實際應用中,如果提取用戶特征集合的目的最終是用于建立數學模型,用以評估用戶行為,用戶特征集合中包含的用戶特征可以從用戶數據庫中本文檔來自技高網...
    一種篩選用戶特征的方法及裝置

    【技術保護點】
    一種篩選用戶特征的方法,其特征在于,包括:提取用戶特征集合,所述用戶特征集合至少包含兩個用戶特征;針對所述用戶特征集合中的每一個用戶特征,以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,確定所述用戶特征的關聯因子;將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選。

    【技術特征摘要】
    1.一種篩選用戶特征的方法,其特征在于,包括:提取用戶特征集合,所述用戶特征集合至少包含兩個用戶特征;針對所述用戶特征集合中的每一個用戶特征,以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,確定所述用戶特征的關聯因子;將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選。2.如權利要求1所述的方法,其特征在于,所述將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選具體包括:將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,篩選出所述用戶特征集合中關聯因子大于預設閾值的用戶特征子集合。3.如權利要求2所述的方法,其特征在于,當篩選出的用戶特征子集合中至少包含兩個用戶特征時,所述方法還包括:通過用戶特征子集合中每一個用戶特征的標準差以及用戶特征子集合中用戶特征兩兩之間的協方差,確定用戶特征子集合中用戶特征兩兩之間的相關系數;將所確定的每一個相關系數取絕對值并分別與預設變量對比,當所述相關系數的絕對值大于所述預設變量時,將所述相關系數以及所述相關系數對應的兩個用戶特征構建為關聯組;通過所構建的各個關聯組,確定構建各個關聯組的用戶特征的特征相關分;根據所述特征相關分,篩選出至少一個用戶特征。4.如權利要求3所述的方法,其特征在于,當特征相關分越高表示相關關系越強時,所述根據所述特征相關分,篩選出至少一個用戶特征具體包括:提取最高特征相關分所對應的用戶特征,并將所述用戶特征構建篩選集合;根據特征相關分從高到低的順序,針對構建各個關聯組的每一個用戶特征依次執行如下操作:獲取所述用戶特征和所述篩選集合中的每一個用戶特征之間的相關系數;判斷所獲取的各相關系數的絕對值是否均小于第二閾值,若是,則...

    【專利技術屬性】
    技術研發人員:杜瑋張柯,李文鵬,李屾,姜曉燕王曉光謝樹坤,俞吳杰,朱訓,
    申請(專利權)人:阿里巴巴集團控股有限公司
    類型:發明
    國別省市:開曼群島,KY

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲av成人无码久久精品| 无码av最新无码av专区| 国模无码视频一区| 人妻无码精品久久亚瑟影视| 日韩精品无码一区二区视频| 精品久久久无码人妻中文字幕 | 亚洲AV无码一区二区三区牲色| 无码丰满熟妇一区二区| 亚洲精品97久久中文字幕无码| 久久ZYZ资源站无码中文动漫| 五月丁香六月综合缴清无码| 亚洲AV无码乱码麻豆精品国产| 狠狠躁狠狠躁东京热无码专区| 无码尹人久久相蕉无码| 无码精品人妻一区二区三区漫画| 亚洲?v无码国产在丝袜线观看| av潮喷大喷水系列无码| 亚洲av中文无码乱人伦在线咪咕| 亚洲AV无码一区二三区| 无码av人妻一区二区三区四区| 亚洲Av无码精品色午夜| 亚洲精品午夜无码电影网| 日韩精品无码永久免费网站| 无码av人妻一区二区三区四区 | 久久精品中文字幕无码| 一本大道无码日韩精品影视| 人妻精品无码一区二区三区| 亚洲AV无码成人精品区狼人影院| 蜜桃成人无码区免费视频网站| 亚洲AV无码精品色午夜在线观看| 中文无码制服丝袜人妻av| 国产精品午夜福利在线无码| 久久亚洲AV成人无码国产最大| 亚洲av中文无码乱人伦在线观看 | 无码一区二区三区免费视频| 亚洲AV日韩AV永久无码色欲| 无码毛片内射白浆视频| 精品久久久久久无码中文野结衣| 国产精品无码一区二区三区免费 | 国产精品多人p群无码| 精品无码三级在线观看视频|