本申請實施例提供了一種交易數(shù)據(jù)處理方法、裝置、設(shè)備及存儲介質(zhì),涉及數(shù)據(jù)分析技術(shù)領(lǐng)域,該方法包括:獲取當(dāng)前周期內(nèi)待評估對象在至少一個特征維度的交易特征。基于特征維度對應(yīng)的特征評分模型,以及特征維度的交易特征,確定特征維度的特征評分值,特征評分模型是通過數(shù)據(jù)擬合獲得的。通過數(shù)據(jù)擬合獲得每個特征維度對應(yīng)的特征評分模型,減少了前期模型訓(xùn)練的工作量和模型部署時間,降低了模型使用門檻。在橫向基于至少一個特征維度的特征評分值,獲得待評估對象的初步評估分值,再在縱向基于待評估對象的初步評估分值和待評估對象的歷史評估分值,獲得待評估對象在當(dāng)前周期的綜合評估分值,從而提高評分的準確性。從而提高評分的準確性。從而提高評分的準確性。
【技術(shù)實現(xiàn)步驟摘要】
一種交易數(shù)據(jù)處理方法、裝置、設(shè)備及存儲介質(zhì)
[0001]本專利技術(shù)涉及數(shù)據(jù)分析
,尤其涉及一種交易數(shù)據(jù)處理方法、裝置、設(shè)備及存儲介質(zhì)。
技術(shù)介紹
[0002]數(shù)據(jù)分析以及挖掘技術(shù),其核心在于基于海量的數(shù)據(jù)對業(yè)務(wù)場景的需求進行量化處理。在量化過程中,常采用評分模型對待評估對象進行評分。比如,個性化推薦系統(tǒng)通過評分模型對應(yīng)用或商鋪進行評分,并基于應(yīng)用或商鋪的評分,對應(yīng)用或商鋪進行推薦,其中,主流的評分模型包括Xgboost、GBDT等復(fù)雜模型。
[0003]然而,對于復(fù)雜模型來說,使用門檻較高,前期模型訓(xùn)練的工作量較大,部署時間長。
技術(shù)實現(xiàn)思路
[0004]本申請實施例提供了一種交易數(shù)據(jù)處理方法、裝置、設(shè)備及存儲介質(zhì),用于減少前期模型訓(xùn)練的工作量,降低模型使用門檻,縮短模型部署時間。
[0005]一方面,本申請實施例提供了一種交易數(shù)據(jù)處理方法,包括:
[0006]獲取當(dāng)前周期內(nèi)待評估對象在至少一個特征維度的交易特征;
[0007]針對每個特征維度,基于所述特征維度對應(yīng)的特征評分模型,以及所述特征維度的交易特征,確定所述特征維度的特征評分值,所述特征評分模型是通過數(shù)據(jù)擬合獲得的;
[0008]基于所述至少一個特征維度的特征評分值,獲得所述待評估對象的初步評估分值;
[0009]基于所述待評估對象的初步評估分值和所述待評估對象的歷史評估分值,獲得所述待評估對象在所述當(dāng)前周期的綜合評估分值。
[0010]本申請實施例中,通過數(shù)據(jù)擬合獲得每個特征維度對應(yīng)的特征評分模型,相較于復(fù)雜模型來說,減少了前期模型訓(xùn)練的工作量,降低了模型使用門檻,縮短了模型部署時間。其次,采用特征評分模型,基于特征維度的交易特征,確定特征維度的特征評分值,然后在橫向基于至少一個特征維度的特征評分值,獲得待評估對象的初步評估分值,再在縱向基于待評估對象的初步評估分值和待評估對象的歷史評估分值,獲得待評估對象在當(dāng)前周期的綜合評估分值,從而提高評分的準確性。
[0011]可選地,所述特征評分模型是通過數(shù)據(jù)擬合獲得的,包括:
[0012]針對每個特征維度,獲取多個樣本對象在所述特征維度的原始交易數(shù)據(jù);
[0013]對所述原始交易數(shù)據(jù)中的異常交易數(shù)據(jù)進行剔除,獲得候選交易數(shù)據(jù);
[0014]對所述候選交易數(shù)據(jù)進行分箱處理,獲得所述特征維度的樣本特征數(shù)據(jù);
[0015]基于所述特征維度的樣本特征數(shù)據(jù)進行數(shù)據(jù)擬合,獲得所述特征維度對應(yīng)的特征評分模型。
[0016]本申請實施例中,通過對獲取到的原始交易數(shù)據(jù)進行異常值剔除得到候選交易數(shù)
據(jù),使用于模型訓(xùn)練的數(shù)據(jù)更加準確,從而提高模型訓(xùn)練的效果。其次,對候選交易數(shù)據(jù)進行分箱處理可以縮短數(shù)據(jù)處理的周期,從而提升模型訓(xùn)練的效率。
[0017]可選地,所述對所述原始交易數(shù)據(jù)中的異常交易數(shù)據(jù)進行剔除,獲得候選交易數(shù)據(jù),包括:
[0018]對所述原始交易數(shù)據(jù)進行劃分,并基于劃分結(jié)果,從所述原始交易數(shù)據(jù)中獲得第一個分位數(shù)和最后一個分位數(shù);
[0019]基于所述第一個分位數(shù)和所述最后一個分位數(shù),確定所述原始交易數(shù)據(jù)的篩選閾值;
[0020]對所述原始交易數(shù)據(jù)中大于所述篩選閾值的異常交易數(shù)據(jù)進行剔除,獲得候選交易數(shù)據(jù)。
[0021]本申請實施例中,通過借鑒分位思想將原始交易數(shù)據(jù)分成若干份,然后基于劃分結(jié)果計算篩選閾值,通過篩選閾值將異常交易數(shù)據(jù)劃分出來,從而為模型訓(xùn)練提供質(zhì)量較高的數(shù)據(jù)。
[0022]可選地,所述對所述候選交易數(shù)據(jù)進行分箱處理,獲得所述特征維度的樣本特征數(shù)據(jù),包括:
[0023]將所述候選交易數(shù)據(jù)劃分為多個區(qū)間段的子交易數(shù)據(jù);
[0024]針對每個區(qū)間段,將所述區(qū)間段的中心值,作為所述區(qū)間段的子交易數(shù)據(jù)的交易表征值;以及,基于所述區(qū)間段內(nèi)的子交易數(shù)據(jù)和位于所述區(qū)間段之前的歷史區(qū)間段內(nèi)的子交易數(shù)據(jù),統(tǒng)計所述區(qū)間段對應(yīng)的累積樣本數(shù)量;
[0025]對所述多個區(qū)間段各自對應(yīng)的子交易數(shù)據(jù)的交易表征值,以及所述多個區(qū)間段各自對應(yīng)的累積樣本數(shù)量映射至預(yù)設(shè)數(shù)值區(qū)間內(nèi),獲得所述特征維度的樣本特征數(shù)據(jù)。
[0026]本申請實施例中,通過用每個區(qū)間段的中心值來代表該區(qū)間段,減少了計算量。通過將交易表征值和所對應(yīng)的累計樣本數(shù)量映射至預(yù)設(shè)區(qū)間段,即通過累計分布函數(shù)將候選交易數(shù)據(jù)映射到一個框架內(nèi),提高了后續(xù)數(shù)據(jù)擬合的效率。
[0027]可選地,所述基于所述特征維度的樣本特征數(shù)據(jù)進行數(shù)據(jù)擬合,獲得所述特征維度對應(yīng)的特征評分模型,包括:
[0028]對映射后的多個所述交易表征值,以及映射后多個所述累積樣本數(shù)量進行擬合,獲得所述特征維度對應(yīng)的特征評分模型。
[0029]本申請實施例中,通過累計分布函數(shù)將候選交易數(shù)據(jù)映射到一個框架后,對映射后的多個交易表征值,以及映射后多個累積樣本數(shù)量進行擬合,獲得特征維度對應(yīng)的特征評分模型,使得模型泛化能力強,計算簡便,開發(fā)上線時效性高,能夠滿足大部分初級的特征量化工作,提升效率。
[0030]可選地,所述基于所述至少一個特征維度的特征評分值,獲得所述待評估對象的初步評估分值,包括:
[0031]針對一個特征維度,將所述一個特征維度的特征評分值,作為所述待評估對象的初步評估分值;
[0032]針對多個特征維度,對所述多個特征維度的特征評分值進行加權(quán)求和,獲得所述待評估對象的初步評估分值。
[0033]本申請實施例中,不同的特征維度對交易水平的影響不同,通過對多個特征維度
的特征評分值進行橫向加權(quán)求和,得到初步評估分值,可以有效提高評分的準確性。
[0034]可選地,所述基于所述待評估對象的初步評估分值和所述待評估對象的歷史評估分值,獲得所述待評估對象在所述當(dāng)前周期的綜合評估分值,包括:
[0035]獲取所述待評估對象在過去至少一個周期內(nèi)的歷史評估分值;
[0036]對所述待評估對象的初步評估分值,以及所述過去至少一個周期內(nèi)的歷史評估分值進行加權(quán)求和,獲得所述待評估對象在所述當(dāng)前周期的綜合評估分值。
[0037]本申請實施例中,通過對待評估對象的當(dāng)前周期和歷史周期的評估分值進行縱向加權(quán)求和,得到待評估對象的綜合評估分值,避免了因為時間的特殊性而導(dǎo)致綜合評估分值不準確的問題,提高了評分的準確性。
[0038]一方面,本申請實施例提供了一種交易數(shù)據(jù)處理裝置,該裝置包括:
[0039]獲取模塊,用于獲取當(dāng)前周期內(nèi)待評估對象在至少一個特征維度的交易特征;
[0040]確定模塊,用于針對每個特征維度,基于所述特征維度對應(yīng)的特征評分模型,以及所述特征維度的交易特征,確定所述特征維度的特征評分值,所述特征評分模型是通過數(shù)據(jù)擬合獲得的;
[0041]處理模塊,還用于基于所述至少一個特征維度的特征評分值,獲得所述待評估對象的初步評估分值;
[0042]所述處理模塊,還用于基于所述待評估對象的初步評估分值和所述待評估對象的歷史評估分值本文檔來自技高網(wǎng)...
【技術(shù)保護點】
【技術(shù)特征摘要】
1.一種交易數(shù)據(jù)處理方法,其特征在于,包括:獲取當(dāng)前周期內(nèi)待評估對象在至少一個特征維度的交易特征;針對每個特征維度,基于所述特征維度對應(yīng)的特征評分模型,以及所述特征維度的交易特征,確定所述特征維度的特征評分值,所述特征評分模型是通過數(shù)據(jù)擬合獲得的;基于所述至少一個特征維度的特征評分值,獲得所述待評估對象的初步評估分值;基于所述待評估對象的初步評估分值和所述待評估對象的歷史評估分值,獲得所述待評估對象在所述當(dāng)前周期的綜合評估分值。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述特征評分模型是通過數(shù)據(jù)擬合獲得的,包括:針對每個特征維度,獲取多個樣本對象在所述特征維度的原始交易數(shù)據(jù);對所述原始交易數(shù)據(jù)中的異常交易數(shù)據(jù)進行剔除,獲得候選交易數(shù)據(jù);對所述候選交易數(shù)據(jù)進行分箱處理,獲得所述特征維度的樣本特征數(shù)據(jù);基于所述特征維度的樣本特征數(shù)據(jù)進行數(shù)據(jù)擬合,獲得所述特征維度對應(yīng)的特征評分模型。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對所述原始交易數(shù)據(jù)中的異常交易數(shù)據(jù)進行剔除,獲得候選交易數(shù)據(jù),包括:對所述原始交易數(shù)據(jù)進行劃分,并基于劃分結(jié)果,從所述原始交易數(shù)據(jù)中獲得第一個分位數(shù)和最后一個分位數(shù);基于所述第一個分位數(shù)和所述最后一個分位數(shù),確定所述原始交易數(shù)據(jù)的篩選閾值;對所述原始交易數(shù)據(jù)中大于所述篩選閾值的異常交易數(shù)據(jù)進行剔除,獲得候選交易數(shù)據(jù)。4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對所述候選交易數(shù)據(jù)進行分箱處理,獲得所述特征維度的樣本特征數(shù)據(jù),包括:將所述候選交易數(shù)據(jù)劃分為多個區(qū)間段的子交易數(shù)據(jù);針對每個區(qū)間段,將所述區(qū)間段的中心值,作為所述區(qū)間段的子交易數(shù)據(jù)的交易表征值;以及,基于所述區(qū)間段內(nèi)的子交易數(shù)據(jù)和位于所述區(qū)間段之前的歷史區(qū)間段內(nèi)的子交易數(shù)據(jù),統(tǒng)計所述區(qū)間段對應(yīng)的累積樣本數(shù)量;將所述多個區(qū)間段各自對應(yīng)的子交易數(shù)據(jù)的交易表征值,以及所述多個區(qū)間段各自對應(yīng)的累積樣本數(shù)量映射至預(yù)設(shè)數(shù)值區(qū)間內(nèi),獲得所述特征維度的樣本特征數(shù)據(jù)。5.根據(jù)權(quán)利要求4所述的方法,...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:趙杰,李愛林,王瑞明,
申請(專利權(quán))人:中國銀聯(lián)股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。