• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    畫像數(shù)據(jù)處理方法和畫像模型訓(xùn)練方法技術(shù)

    技術(shù)編號:24251640 閱讀:37 留言:0更新日期:2020-05-22 23:37
    本申請涉及一種畫像數(shù)據(jù)處理方法及畫像模型訓(xùn)練方法,其中畫像數(shù)據(jù)處理方法包括:獲取目標(biāo)用戶對應(yīng)的歷史離散用戶特征集合,獲取目標(biāo)特征域?qū)?yīng)的目標(biāo)畫像模型,將歷史離散用戶特征集合輸入其中,得到目標(biāo)用戶對應(yīng)于目標(biāo)特征域的用戶畫像,目標(biāo)畫像模型是根據(jù)第一訓(xùn)練樣本對預(yù)訓(xùn)練畫像模型進行調(diào)整得到的,第一訓(xùn)練樣本包括第一訓(xùn)練離散用戶特征集合和目標(biāo)特征域的訓(xùn)練標(biāo)簽,第一訓(xùn)練離散用戶特征集合包括目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征,預(yù)訓(xùn)練畫像模型是根據(jù)第二訓(xùn)練樣本對初始畫像模型進行訓(xùn)練得到的,第二訓(xùn)練樣本包括多個訓(xùn)練特征域?qū)?yīng)的第二訓(xùn)練離散用戶特征集合及訓(xùn)練標(biāo)簽集合。采用本申請的方法可以得到更加準(zhǔn)確的用戶畫像。

    Methods of image data processing and image model training

    【技術(shù)實現(xiàn)步驟摘要】
    畫像數(shù)據(jù)處理方法和畫像模型訓(xùn)練方法
    本申請涉及計算機
    ,特別是涉及一種畫像數(shù)據(jù)處理方法和畫像模型訓(xùn)練方法。
    技術(shù)介紹
    隨著計算機技術(shù)的發(fā)展,人們越來越多地依賴互聯(lián)網(wǎng)來獲取各方面的信息,為了達到向用戶及時推薦各種有用信息又盡量避免推薦無用信息的目的,通常根據(jù)用戶的用戶畫像確定接受信息的目標(biāo)人群。用戶畫像的構(gòu)建可以通過訓(xùn)練好的畫像模型進行預(yù)測得到。傳統(tǒng)技術(shù)中,在訓(xùn)練畫像模型時,對于存在多領(lǐng)域用戶數(shù)據(jù)的場景,通常是分別對每個領(lǐng)域單獨提取對應(yīng)的用戶行為數(shù)據(jù),進行模型訓(xùn)練,得到每個領(lǐng)域?qū)?yīng)的用戶畫像模型。這種方式忽略了多領(lǐng)域之間的關(guān)聯(lián),導(dǎo)致訓(xùn)練得到的畫像模型生成的用戶畫像并不準(zhǔn)確。
    技術(shù)實現(xiàn)思路
    基于此,有必要針對
    技術(shù)介紹
    中引出的技術(shù)問題,提供一種畫像數(shù)據(jù)處理方法和畫像模型訓(xùn)練方法。一種畫像數(shù)據(jù)處理方法,包括:獲取目標(biāo)用戶對應(yīng)的歷史離散用戶特征集合;所述歷史離散用戶特征集合中包括至少一個非目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征;獲取目標(biāo)特征域?qū)?yīng)的目標(biāo)畫像模型;所述目標(biāo)畫像模型是根據(jù)第一訓(xùn)練樣本對預(yù)訓(xùn)練畫像模型進行調(diào)整得到的;所述第一訓(xùn)練樣本包括第一訓(xùn)練離散用戶特征集合和所述目標(biāo)特征域的訓(xùn)練標(biāo)簽,所述第一訓(xùn)練離散用戶特征集合包括所述目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征;所述預(yù)訓(xùn)練畫像模型是根據(jù)第二訓(xùn)練樣本對初始畫像模型進行訓(xùn)練得到的;所述第二訓(xùn)練樣本包括多個訓(xùn)練特征域?qū)?yīng)的第二訓(xùn)練離散用戶特征集合及訓(xùn)練標(biāo)簽集合;將所述歷史離散用戶特征集合輸入所述目標(biāo)畫像模型,得到所述目標(biāo)用戶對應(yīng)于所述目標(biāo)特征域的用戶畫像。一種畫像數(shù)據(jù)處理裝置,所述裝置包括:特征獲取模塊,用于獲取目標(biāo)用戶對應(yīng)的歷史離散用戶特征集合;所述歷史離散用戶特征集合中包括至少一個非目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征;模型獲取模塊,用于獲取目標(biāo)特征域?qū)?yīng)的目標(biāo)畫像模型;所述目標(biāo)畫像模型是根據(jù)第一訓(xùn)練樣本對預(yù)訓(xùn)練畫像模型進行調(diào)整得到的;所述第一訓(xùn)練樣本包括第一訓(xùn)練離散用戶特征集合和所述目標(biāo)特征域的訓(xùn)練標(biāo)簽,所述第一訓(xùn)練離散用戶特征集合包括所述目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征;所述預(yù)訓(xùn)練畫像模型是根據(jù)第二訓(xùn)練樣本對初始畫像模型進行訓(xùn)練得到的;所述第二訓(xùn)練樣本包括多個訓(xùn)練特征域?qū)?yīng)的第二訓(xùn)練離散用戶特征集合及訓(xùn)練標(biāo)簽集合;特征輸入模塊,用于將所述歷史離散用戶特征集合輸入所述目標(biāo)畫像模型,得到所述目標(biāo)用戶對應(yīng)于所述目標(biāo)特征域的用戶畫像。一種計算機可讀存儲介質(zhì),存儲有計算機程序,所述計算機程序被處理器執(zhí)行時,使得所述處理器執(zhí)行如上述畫像數(shù)據(jù)處理方法所述的步驟。一種計算機設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述計算機程序被所述處理器執(zhí)行時,使得所述處理器執(zhí)行如上述畫像數(shù)據(jù)處理方法所述的步驟。上述畫像數(shù)據(jù)處理方法、裝置、計算機可讀存儲介質(zhì)和計算機設(shè)備,由于目標(biāo)畫像模型是根據(jù)第一訓(xùn)練樣本對預(yù)訓(xùn)練畫像模型進行調(diào)整得到的,第一訓(xùn)練樣本包括第一訓(xùn)練離散用戶特征集合和目標(biāo)特征域的訓(xùn)練標(biāo)簽,第一訓(xùn)練離散用戶特征集合包括目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征,而預(yù)訓(xùn)練畫像模型則是根據(jù)第二訓(xùn)練樣本對初始畫像模型進行訓(xùn)練得到的,第二訓(xùn)練樣本包括多個訓(xùn)練特征域?qū)?yīng)的第二訓(xùn)練離散用戶特征集合及訓(xùn)練標(biāo)簽集合,因此目標(biāo)畫像模型能夠充分地學(xué)習(xí)到多個特征域之間的特征關(guān)聯(lián)性以及其他特征域的離散用戶特征與目標(biāo)特征域用戶畫像之間的映射關(guān)系,當(dāng)將目標(biāo)用戶對應(yīng)的歷史離散用戶特征集合輸入到目標(biāo)畫像模型時,最終得到的用戶畫像考慮了其他特征域與目標(biāo)特征域之間的特征關(guān)聯(lián)性,因此相較于傳統(tǒng)技術(shù)得到的用戶畫像,本申請得到的用戶畫像更加準(zhǔn)確。一種畫像模型訓(xùn)練方法,包括:獲取預(yù)訓(xùn)練畫像模型;所述預(yù)訓(xùn)練畫像模型是根據(jù)第一訓(xùn)練樣本對初始畫像模型進行訓(xùn)練得到的;所述第一訓(xùn)練樣本包括多個訓(xùn)練特征域?qū)?yīng)的第一訓(xùn)練離散用戶特征集合及訓(xùn)練標(biāo)簽集合;獲取第二訓(xùn)練樣本;所述第二訓(xùn)練樣本包括第二訓(xùn)練離散用戶特征集合和所述目標(biāo)特征域的訓(xùn)練標(biāo)簽,所述第二訓(xùn)練離散用戶特征集合包括所述目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征;根據(jù)所述第二訓(xùn)練樣本對所述預(yù)訓(xùn)練畫像模型進行調(diào)整,得到所述目標(biāo)特征域?qū)?yīng)的目標(biāo)畫像模型。一種畫像模型訓(xùn)練裝置,其特征在于,所述裝置包括:模型獲取模塊,用于獲取預(yù)訓(xùn)練畫像模型;所述預(yù)訓(xùn)練畫像模型是根據(jù)第一訓(xùn)練樣本對初始畫像模型進行訓(xùn)練得到的;所述第一訓(xùn)練樣本包括多個訓(xùn)練特征域?qū)?yīng)的第一訓(xùn)練離散用戶特征集合及訓(xùn)練標(biāo)簽集合;樣本獲取模塊,用于獲取第二訓(xùn)練樣本;所述第二訓(xùn)練樣本包括第二訓(xùn)練離散用戶特征集合和所述目標(biāo)特征域的訓(xùn)練標(biāo)簽,所述第二訓(xùn)練離散用戶特征集合包括所述目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征;模型調(diào)整模塊,用于根據(jù)所述第二訓(xùn)練樣本對所述預(yù)訓(xùn)練畫像模型進行調(diào)整,得到所述目標(biāo)特征域?qū)?yīng)的目標(biāo)畫像模型。一種計算機可讀存儲介質(zhì),存儲有計算機程序,所述計算機程序被處理器執(zhí)行時,使得所述處理器執(zhí)行如上述畫像模型訓(xùn)練方法所述的步驟。一種計算機設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述計算機程序被所述處理器執(zhí)行時,使得所述處理器執(zhí)行如上述畫像模型訓(xùn)練方法所述的步驟。上述畫像模型訓(xùn)練方法、裝置、計算機可讀存儲介質(zhì)和計算機設(shè)備,由于目標(biāo)畫像模型是根據(jù)第一訓(xùn)練樣本對預(yù)訓(xùn)練畫像模型進行調(diào)整得到的,第一訓(xùn)練樣本包括第一訓(xùn)練離散用戶特征集合和目標(biāo)特征域的訓(xùn)練標(biāo)簽,第一訓(xùn)練離散用戶特征集合包括目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征,而預(yù)訓(xùn)練畫像模型則是根據(jù)第二訓(xùn)練樣本對初始畫像模型進行訓(xùn)練得到的,第二訓(xùn)練樣本包括多個訓(xùn)練特征域?qū)?yīng)的第二訓(xùn)練離散用戶特征集合及訓(xùn)練標(biāo)簽集合,因此目標(biāo)畫像模型能夠充分地學(xué)習(xí)到多個特征域之間的特征關(guān)聯(lián)性以及其他特征域的離散用戶特征與目標(biāo)特征域用戶畫像之間的映射關(guān)系,通過該目標(biāo)畫像模型得到用戶畫像時,由于可以考慮到特征域之間的關(guān)聯(lián)性,因此相較于傳統(tǒng)技術(shù),能夠得到更加準(zhǔn)確的用戶畫像。附圖說明圖1為一個實施例中畫像數(shù)據(jù)處理方法的應(yīng)用環(huán)境圖;圖2為一個實施例中畫像數(shù)據(jù)處理方法的流程示意圖;圖3為一個實施例中對離散特征向量進行融合的步驟示意圖;圖4為一個實施例中目標(biāo)畫像模型的結(jié)構(gòu)示意圖;圖5為一個實施例中基于注意力機制對一個特征域下的離散特征向量進行融合的原理圖;圖6為一個實施例中對域間特征向量中的子特征進行特征交叉處理的原理圖;圖6A為一個實施例中對域間特征向量進行線性變換的原理圖;圖7為一個實施例中畫像數(shù)據(jù)處理裝置的結(jié)構(gòu)框圖;圖8為一個實施例中畫像模型訓(xùn)練方法的流程示意圖;圖9為一個實施例中目標(biāo)畫像模型訓(xùn)練過程的示意圖圖10為一個實施例中畫像模型訓(xùn)練裝置的結(jié)構(gòu)框圖;圖11為一個實施例中計算機設(shè)備的結(jié)構(gòu)框圖。具體實施方式為了使本申請的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本申請進行進一步詳細說明。應(yīng)當(dāng)理解,此處所本文檔來自技高網(wǎng)...

    【技術(shù)保護點】
    1.一種畫像數(shù)據(jù)處理方法,包括:/n獲取目標(biāo)用戶對應(yīng)的歷史離散用戶特征集合;所述歷史離散用戶特征集合中包括至少一個非目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征;/n獲取目標(biāo)特征域?qū)?yīng)的目標(biāo)畫像模型;/n所述目標(biāo)畫像模型是根據(jù)第一訓(xùn)練樣本對預(yù)訓(xùn)練畫像模型進行調(diào)整得到的;所述第一訓(xùn)練樣本包括第一訓(xùn)練離散用戶特征集合和所述目標(biāo)特征域的訓(xùn)練標(biāo)簽,所述第一訓(xùn)練離散用戶特征集合包括所述目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征;/n所述預(yù)訓(xùn)練畫像模型是根據(jù)第二訓(xùn)練樣本對初始畫像模型進行訓(xùn)練得到的;所述第二訓(xùn)練樣本包括多個訓(xùn)練特征域?qū)?yīng)的第二訓(xùn)練離散用戶特征集合及訓(xùn)練標(biāo)簽集合;/n將所述歷史離散用戶特征集合輸入所述目標(biāo)畫像模型,得到所述目標(biāo)用戶對應(yīng)于所述目標(biāo)特征域的用戶畫像。/n

    【技術(shù)特征摘要】
    1.一種畫像數(shù)據(jù)處理方法,包括:
    獲取目標(biāo)用戶對應(yīng)的歷史離散用戶特征集合;所述歷史離散用戶特征集合中包括至少一個非目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征;
    獲取目標(biāo)特征域?qū)?yīng)的目標(biāo)畫像模型;
    所述目標(biāo)畫像模型是根據(jù)第一訓(xùn)練樣本對預(yù)訓(xùn)練畫像模型進行調(diào)整得到的;所述第一訓(xùn)練樣本包括第一訓(xùn)練離散用戶特征集合和所述目標(biāo)特征域的訓(xùn)練標(biāo)簽,所述第一訓(xùn)練離散用戶特征集合包括所述目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征;
    所述預(yù)訓(xùn)練畫像模型是根據(jù)第二訓(xùn)練樣本對初始畫像模型進行訓(xùn)練得到的;所述第二訓(xùn)練樣本包括多個訓(xùn)練特征域?qū)?yīng)的第二訓(xùn)練離散用戶特征集合及訓(xùn)練標(biāo)簽集合;
    將所述歷史離散用戶特征集合輸入所述目標(biāo)畫像模型,得到所述目標(biāo)用戶對應(yīng)于所述目標(biāo)特征域的用戶畫像。


    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一訓(xùn)練樣本的確定步驟包括:
    獲取第一時間段對應(yīng)的第一訓(xùn)練離散業(yè)務(wù)數(shù)據(jù)集合及第二時間段對應(yīng)于所述目標(biāo)特征域的第二訓(xùn)練離散業(yè)務(wù)數(shù)據(jù)集合;所述第二時間段為第一時間段之后的時間段;所述第一訓(xùn)練離散業(yè)務(wù)數(shù)據(jù)集合包括所述目標(biāo)特征域?qū)?yīng)的歷史離散業(yè)務(wù)數(shù)據(jù);
    根據(jù)所述第一訓(xùn)練離散業(yè)務(wù)數(shù)據(jù)集合確定所述第一訓(xùn)練離散用戶特征集合;
    根據(jù)所述第二訓(xùn)練離散業(yè)務(wù)數(shù)據(jù)集合確定所述目標(biāo)特征域的訓(xùn)練標(biāo)簽。


    3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)訓(xùn)練畫像模型的調(diào)整步驟包括:
    獲取預(yù)設(shè)的第一保留概率及第二保留概率;
    根據(jù)所述第一訓(xùn)練樣本對所述預(yù)訓(xùn)練畫像模型進行調(diào)整,并且以所述第一保留概率保留第一訓(xùn)練離散用戶特征集合中目標(biāo)特征域?qū)?yīng)的歷史離散用戶特征,以第二保留概率保留第一訓(xùn)練離散用戶特征集合中其他特征域?qū)?yīng)的歷史離散用戶特征。


    4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第二訓(xùn)練樣本的確定步驟包括:
    分別獲取各訓(xùn)練特征域?qū)?yīng)的訓(xùn)練行為數(shù)據(jù)集合;
    獲取各所述訓(xùn)練行為數(shù)據(jù)集合中各訓(xùn)練行為數(shù)據(jù)對應(yīng)的標(biāo)簽,得到各訓(xùn)練特征域?qū)?yīng)的第一標(biāo)簽集合;
    根據(jù)各所述第一標(biāo)簽集合中各標(biāo)簽對應(yīng)的訓(xùn)練行為數(shù)據(jù)所對應(yīng)的行為次數(shù)及時間衰減系數(shù),確定各所述第一標(biāo)簽集合中各標(biāo)簽的權(quán)重;
    根據(jù)各所述第一標(biāo)簽集合中各標(biāo)簽的權(quán)重確定所述第二訓(xùn)練樣本對應(yīng)的候選標(biāo)簽集合;
    從所述候選標(biāo)簽集合中選取預(yù)設(shè)數(shù)量的候選標(biāo)簽作為所述第二訓(xùn)練樣本對應(yīng)的目標(biāo)訓(xùn)練標(biāo)簽,根據(jù)所述目標(biāo)訓(xùn)練標(biāo)簽得到所述第二訓(xùn)練樣本對應(yīng)的訓(xùn)練標(biāo)簽集合;
    將所述候選標(biāo)簽集合中剩下的標(biāo)簽組成所述第二訓(xùn)練樣本對應(yīng)的第二訓(xùn)練離散用戶特征集合。


    5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述目標(biāo)訓(xùn)練標(biāo)簽得到所述第二訓(xùn)練樣本對應(yīng)的訓(xùn)練標(biāo)簽集合包括:
    將所述目標(biāo)訓(xùn)練標(biāo)簽確定為所述第二訓(xùn)練樣本對應(yīng)的正訓(xùn)練標(biāo)簽;
    獲取負訓(xùn)練標(biāo)簽;所述負訓(xùn)練標(biāo)簽為第一訓(xùn)練標(biāo)簽和第二訓(xùn)練標(biāo)簽中的至少一種;所述第一訓(xùn)練標(biāo)簽為其他訓(xùn)練樣本對應(yīng)的正訓(xùn)練標(biāo)簽;所述第二訓(xùn)練標(biāo)簽為預(yù)設(shè)的標(biāo)簽詞典中的標(biāo)簽;
    將所述正訓(xùn)練標(biāo)簽和負訓(xùn)練標(biāo)簽組成所述第二訓(xùn)練樣本對應(yīng)的訓(xùn)練標(biāo)簽集合。


    6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述歷史離散用戶特征集合輸入所述目標(biāo)畫像模型,得到所述目標(biāo)用戶對應(yīng)于所述目標(biāo)特征域的用戶畫像包括:
    將所述歷史離散用戶特征集合輸入所述目標(biāo)畫像模型的輸入層,通過所述輸入層向量化所述歷史離散用戶特征集合,得到各特征域?qū)?yīng)的離散特征向量;
    通過所述目標(biāo)畫像模型的融合層融合各特征域?qū)?yīng)的離散特征向量,得到所述目標(biāo)用戶對應(yīng)的目標(biāo)特征向量;
    通過所述目標(biāo)畫像模型從所述目標(biāo)特征域?qū)?yīng)的候選用戶標(biāo)簽集合中篩選出與所述目標(biāo)特征向量對應(yīng)的用戶標(biāo)簽,得到所述用戶畫像。


    7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述融合層包括域內(nèi)融合層、域間融合層、特征交叉層和全連接層;所述通過所述目標(biāo)畫像模型的融合層融合各特征域?qū)?yīng)的離散特征向量,得到所述目標(biāo)用戶對應(yīng)的目標(biāo)特征向量包括:
    通過所述域內(nèi)融合層融合各所述特征域?qū)?yīng)的離散特征向量得到各特征域?qū)?yīng)的域內(nèi)特征...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:閆肅陳鑫張旭林樂宇
    申請(專利權(quán))人:騰訊科技深圳有限公司
    類型:發(fā)明
    國別省市:廣東;44

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 免费无码又爽又刺激高潮软件| 免费A级毛片无码免费视| 国产亚洲精品无码专区| 亚洲精品无码国产| 亚洲精品无码国产片| 国产AV无码专区亚洲AV手机麻豆| 中文字幕有码无码AV| 无码人妻精品一区二区蜜桃 | 无码成人AAAAA毛片| 国产精品无码素人福利不卡| 亚洲啪AV永久无码精品放毛片| 免费无码又爽又刺激网站| av中文无码乱人伦在线观看| 久久无码国产专区精品| 亚洲自偷自偷偷色无码中文 | 亚洲韩国精品无码一区二区三区 | 好了av第四综合无码久久| 一本加勒比hezyo无码专区| 免费无码一区二区三区蜜桃大| 亚洲色av性色在线观无码| 亚洲国产精品无码专区在线观看 | 国产免费AV片无码永久免费| 亚洲av永久无码精品漫画| 中文字幕在线无码一区二区三区| 亚洲国产精品无码久久| 亚洲精品自偷自拍无码| 无码国内精品久久综合88| 无码精品A∨在线观看中文| 日韩欧国产精品一区综合无码| 国产成人无码免费视频97| 无码免费又爽又高潮喷水的视频 | 91无码人妻精品一区二区三区L| 国产日韩AV免费无码一区二区| mm1313亚洲精品无码又大又粗| 无码人妻aⅴ一区二区三区有奶水| 精品无码日韩一区二区三区不卡 | 亚洲av无码潮喷在线观看| 国产在线无码精品电影网| 国产AV无码专区亚洲A∨毛片| 亚洲一区精品无码| 亚洲成a人片在线观看无码专区|