• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種用戶目標人群擴散方法、裝置及存儲介質制造方法及圖紙

    技術編號:36696050 閱讀:22 留言:0更新日期:2023-02-27 20:08
    本發明專利技術公開一種用戶目標人群擴散方法、裝置及存儲介質,用戶目標人群擴散方法包括:獲取用戶的歷史數據,將用戶劃分為種子人群和非種子人群;選取種子人群為正樣本,非種子人群為負樣本,輸入用于人群擴散的深度學習網絡模型進行模型訓練,訓練完成得到人群擴散模型;接收用戶配置的目標種子人群包輸入人群擴散模型中得到目標種子人群包向量,獲取用戶配置的目標擴散人群中各個目標擴散用戶的目標擴散用戶向量;計算目標擴散人群中各目標擴散用戶向量與目標種子人群包向量之間的相似度,進行排序得到目標擴散人群的推薦擴散人群包。本發明專利技術具有多目標自適應擴散,適配復雜場景和控制計算成本,節約計算時間的有益效果。節約計算時間的有益效果。節約計算時間的有益效果。

    【技術實現步驟摘要】
    一種用戶目標人群擴散方法、裝置及存儲介質


    [0001]本專利技術涉及人工智能
    ,具體的涉及一種用戶目標人群擴散方法、裝置及存儲介質。

    技術介紹

    [0002]在較大型的營銷活動中,運營人員需要基于已確定的少量種子人群,進行更大量相似人群的圈選,來達到精準營銷目的。種子人群:代指企業經營中,發生了某些具體動作(如購買商品、參與活動等)的核心用戶人群。例如:進行某商品推廣時,需要選取目標人群發放優惠券,全量發放成本過高,隨機發放轉化率較低。業務人員會利用已有用戶數據,圈選滿足某些條件(如近期購買過類似商品或符合某些特征)的人群。但人工圈選人群量級較小,需要基于此人群包(也稱種子人群),在非種子人群中(除種子人群外的全量用戶)選取與種子人群相似的用戶進行擴散。此時需要用到人群擴散方法,人群擴散是基于種子用戶(人工挑選的人群包),通過一定的算法評估模型,找到更多擁有潛在關聯性的相似人群的技術。
    [0003]現有的人群擴散方法大致分為三類。
    [0004]1.基于標簽的人群擴散方法通過對種子人群進行人工統計分析或模型分析,識別種子人群特征,如:性別男性、年齡20
    ?
    26歲等特征占比較高,然后通過以上人群特征標簽,圈選人群作為拓展人群,進行后續的營銷活動。
    [0005]該方法存在一定缺陷,首先強依賴于人群特征分析,分析過程費時費力且分析結論無法有效評估。其次基于分析結果進行標簽圈選時,需要通過標簽組合控制擴散人群數量,此過程不可控。如限制標簽“性別男”后,人群數量超過預期擴散人群數量,限制標簽組合“性別男,年齡20
    ?
    26歲”后,人群數量可能又小于預期擴散人群數量。只能通過構建其他標簽組合方式,或再次對人群抽樣才能達到預期。整個過程人力成本高且準確率低。
    [0006]2.基于分類模型的人群擴散方法將人群擴散看作分類問題,種子人群為類別A,部分其他非種子人群為類別B,利用分類模型(邏輯回歸、決策樹等)進行訓練。將生成的模型對全量非種子人群進行預測,此時得到的預測結果為每個用戶為類別A的可能性(二分類問題,反之為類別B的可能性亦可)。最后通過將預測結果進行排序,得到可能性最大的N個用戶作為擴散人群。
    [0007]該方法存在一定缺陷,首先訓練分類模型時,部分非種子人群的選取方式可能影響模型效果。由于種子人群往往是全量人群中很少的一部分,如千萬用戶中,可能只識別出幾百或幾千的種子人群。因此如何在控制正負樣本比例的基礎上,選取部分非種子人群十分復雜,模型效果難以得到保證。其次該方法只能在得到種子人群后進行啟動樣本選取、特征篩選、模型訓練的一系列過程,整個過程耗時較長,業務人員使用時體驗感較差,無法通過預訓練的方式減少應用人群擴散功能的時間。
    [0008]3.基于向量相似度的人群擴散方法
    利用深度學習模型(如雙塔模型)對每個用戶進行向量化表示,通過種子人群包的N個用戶向量與每個非種子用戶的向量計算相似度,然后對非種子用戶與種子人群包的相似度進行排序,最后得到指定數量的人群作為擴散用戶。
    [0009]但該方法也存在一定不足。首先在利用模型進行用戶向量化表示時,往往通過選取單一目標(如點擊、瀏覽、下單等)訓練滿足特定場景的模型。如廣告宣傳時業務人員希望通過人群擴散提高廣告點擊率,而商品促銷活動中則希望提高轉化率(商品下單數/商品點擊數)。不同的人群擴散目標需要算法工程師訓練不同的模型、擴散后的人群質量難以控制、人群擴散的邏輯難以解釋導致需要大量的后續分析等等。其次在計算種子人群包與其他用戶的相似度時,涉及如何對種子人群包進行向量化表示問題。種子人群包中的N個用戶向量與非種子用戶計算得到N個相似度,以往的方式選取N個相似度的平均值、最大值或最小值作為用戶與人群包的相似度。但這種方法計算量大且無法準確量化相似度,易受到異常值影響。
    [0010]有鑒于此,特提出本專利技術專利。

    技術實現思路

    [0011]針對上述相關技術的不足,本專利技術提出一種用戶目標人群擴散方法,通過人工指導結合算法模型,找到營銷活動轉化率較高的目標人群,具體地,采用如下技術方案:一種用戶目標人群擴散方法,包括:獲取用戶的歷史數據,將用戶劃分為種子人群和非種子人群;選取種子人群為正樣本,非種子人群為負樣本,輸入用于人群擴散的深度學習網絡模型進行模型訓練,訓練完成得到人群擴散模型;接收用戶配置的目標種子人群包輸入人群擴散模型中得到目標種子人群包向量,獲取用戶配置的目標擴散人群中各個目標擴散用戶的目標擴散用戶向量;計算目標擴散人群中各目標擴散用戶向量與目標種子人群包向量之間的相似度,進行排序得到目標擴散人群的推薦擴散人群包。
    [0012]作為本專利技術的可選實施方式,本專利技術的一種用戶目標人群擴散方法中,所述選取種子人群為正樣本,非種子人群為負樣本,輸入用于人群擴散的深度學習網絡模型進行模型訓練,訓練完成得到人群擴散模型包括:所述深度學習網絡模型包括種子人群包向量單元和目標向量單元,將所述正樣本數據輸入種子人群包向量單元,將部分正樣本數據和負樣本數據輸入目標向量單元進行深度學習訓練,將種子人群包向量單元輸出的種子人群包向量與目標向量單元輸出的目標向量進行相似度計算,根據相似度計算結果反饋深度學習網絡模型進行種子人群包向量單元和目標向量單元的參數優化。
    [0013]作為本專利技術的可選實施方式,本專利技術的一種用戶目標人群擴散方法中,所述將所述正樣本數據輸入種子人群包向量單元進行深度學習訓練包括:所述正樣本的N個多維用戶向量輸入種子人群包向量單元;針對N個多維用戶向量進行聚類分析,得到k個聚類中心向量,所述聚類中心的個數k根據人群包人數N的數量分段式調整;將k個聚類中心向量輸入注意力單元,得到種子人群包的全局向量表示。
    [0014]作為本專利技術的可選實施方式,本專利技術的一種用戶目標人群擴散方法中,所述接收用戶配置的目標種子人群包輸入人群擴散模型中得到目標種子人群包向量,獲取用戶配置的目標擴散人群中各個目標擴散用戶的目標擴散用戶向量包括:接收用戶上傳的目標種子人群包,將目標種子人群包輸入人群擴散模型中得到目標種子人群包向量;接收用戶配置的目標擴散人群的擴散條件,所述的擴散條件包括擴散人數、擴散限定條件及擴散目標,由用戶全量數據庫中提取滿足擴散限定條件的目標用戶構成目標擴散人群,獲取目標擴散人群中各個目標擴散用戶的目標擴散用戶向量。
    [0015]作為本專利技術的可選實施方式,本專利技術的一種用戶目標人群擴散方法中,所述計算目標擴散人群中各目標擴散用戶向量與目標種子人群包向量之間的相似度,進行排序得到目標擴散人群的推薦擴散人群包括:當所述擴散目標為單目標擴散時,計算目標擴散用戶向量與種子人群包向量的單個相似度;當所述擴散目標為多目標擴散時,分別計算每個目標擴散的相似度,將多個相似度進行加權平均計算得到多目標擴散相似度;可選地,所述加權平均計算的加權權重通過用戶配置,默認為等權重。
    [0016]作為本專利技術的可選實施方式,本專利技術的一種用戶目標人群擴散方法,包括:將當前全量用戶中各個用戶的用戶特征分別輸本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種用戶目標人群擴散方法,其特征在于,包括:獲取用戶的歷史數據,將用戶劃分為種子人群和非種子人群;選取種子人群為正樣本,非種子人群為負樣本,輸入用于人群擴散的深度學習網絡模型進行模型訓練,訓練完成得到人群擴散模型;接收用戶配置的目標種子人群包輸入人群擴散模型中得到目標種子人群包向量,獲取用戶配置的目標擴散人群中各個目標擴散用戶的目標擴散用戶向量;計算目標擴散人群中各目標擴散用戶向量與目標種子人群包向量之間的相似度,進行排序得到目標擴散人群的推薦擴散人群包。2.根據權利要求1所述的一種用戶目標人群擴散方法,其特征在于,所述選取種子人群為正樣本,非種子人群為負樣本,輸入用于人群擴散的深度學習網絡模型進行模型訓練,訓練完成得到人群擴散模型包括:所述深度學習網絡模型包括種子人群包向量單元和目標向量單元,將所述正樣本數據輸入種子人群包向量單元,將部分正樣本數據和負樣本數據輸入目標向量單元進行深度學習訓練,將種子人群包向量單元輸出的種子人群包向量與目標向量單元輸出的目標向量進行相似度計算,根據相似度計算結果反饋深度學習網絡模型進行種子人群包向量單元和目標向量單元的參數優化。3.根據權利要求2所述的一種用戶目標人群擴散方法,其特征在于,所述將所述正樣本數據輸入種子人群包向量單元進行深度學習訓練包括:所述正樣本的N個多維用戶向量輸入種子人群包向量單元;針對N個多維用戶向量進行聚類分析,得到k個聚類中心向量,所述聚類中心的個數k根據人群包人數N的數量分段式調整;將k個聚類中心向量輸入注意力單元,得到種子人群包的全局向量表示。4.根據權利要求1所述的一種用戶目標人群擴散方法,其特征在于,所述接收用戶配置的目標種子人群包輸入人群擴散模型中得到目標種子人群包向量,獲取用戶配置的目標擴散人群中各個目標擴散用戶的目標擴散用戶向量包括:接收用戶上傳的目標種子人群包,將目標種子人群包輸入人群擴散模型中得到目標種子人群包向量;接收用戶配置的目標擴散人群的擴散條件,所述的擴散條件包括擴散人數、擴散限定條件及擴散目標,由用戶全量數據庫中提取滿足擴散限定條件的目標用戶構成目標擴散人群,獲取目標擴散人群中各個目標擴散用戶的目標擴散用戶向量。5.根據權利要求4所述的一種用戶目標人群擴散方法,其特征在于,所述計算目標擴散人群中各目標擴散用戶向量與目標種子人群包向量之間的相似度,進行排序得到目標擴散人群的推薦擴散人群包括:當所述擴散目標為單目標擴散時,計算目標...

    【專利技術屬性】
    技術研發人員:王涵
    申請(專利權)人:北京數勢云創科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码熟妇人妻在线视频| 欧日韩国产无码专区| 亚洲午夜国产精品无码| 亚洲桃色AV无码| 中日韩亚洲人成无码网站| mm1313亚洲精品无码又大又粗| 亚洲AV综合色区无码一区爱AV| 亚洲一区二区无码偷拍| 国产日韩精品无码区免费专区国产 | 一本久道中文无码字幕av| 无码国内精品人妻少妇| 人妻系列无码专区久久五月天| 无码GOGO大胆啪啪艺术| 曰韩精品无码一区二区三区| 久久亚洲中文字幕无码| 久久无码人妻一区二区三区午夜| 国产精品成人无码久久久久久| 无码人妻一区二区三区免费手机| 亚洲一区二区三区AV无码| 亚洲?V无码乱码国产精品| 99久久国产热无码精品免费| 亚洲va无码专区国产乱码| 国产网红主播无码精品| 亚洲一级Av无码毛片久久精品| 日韩免费a级毛片无码a∨| 伊人无码精品久久一区二区 | 亚洲av无码久久忘忧草| 亚洲熟妇无码另类久久久| 国产精品毛片无码| 国产精品无码素人福利不卡| 内射无码午夜多人| 亚洲中文字幕无码专区| 国产a v无码专区亚洲av| 国产精品亚洲αv天堂无码| 久久精品无码专区免费| 国精品无码一区二区三区在线| 精品无码人妻久久久久久| 亚洲熟妇无码八AV在线播放| 国产白丝无码免费视频| 亚洲精品色午夜无码专区日韩| 亚洲爆乳精品无码一区二区三区|