本公開涉及一種搜索數據的處理方法及裝置,其中的方法包括:上傳在搜索引擎中的第一搜索數據至云數據平臺;篩選出所述第一搜索數據中頻率權重大于等于預設權重的第二搜索數據;獲取所述第二搜索數據,以及所述第二搜索數據的標識信息;根據所述第二搜索數據的標識信息,以及在搜索引擎內出現的第一搜索數據中包括的第二搜索數據的數量,獲得信用權重。本公開的有益效果為:通過云數據平臺對用戶的第一搜索數據進行計算得出該用戶的信用權重,從而完成對該該用戶的金融行為的分析,很好地通過第一搜索數據實現了用戶的金融行為作出評價判斷,并且對用戶的金融畫像方面的刻畫也起到了十分重要的作用。
【技術實現步驟摘要】
本公開實施例涉及數據處理
,尤其涉及一種搜索數據的處理方法及裝置。
技術介紹
在傳統金融貸款業務的過程中,銀行需要對客戶的各種信息(如身份信息、存款貸款、工作信息、每月流水、不動資產等)進行征信協查,這些信息有些可以通過各大銀行實現互聯的網絡數據平臺獲取,有些卻需要銀行相關的業務人員預審以及實地查看客戶的各個數據信息,花費周期漫長,造成了傳統金融貸款的效率低下。而在移動互聯網時代,通過移動終端用戶的行為對用戶信用進行評估,即通過行為金融學的方式評估用戶的信用,從而實現終端用戶的貸款業務,是目前終端中逐漸成熟的一種方式,跟傳統金融貸款比,行為金融貸款不需要太多人工干預,它是根據用戶日常生活中的行為在終端中得到的體現,刻畫用戶的金融畫像,進而評估用戶的信用實現其信用貸款的方式。用戶用戶畫像一詞具有很重要的場景因素,以數據描述和了解客戶,人是異常復雜的動物,信息緯度也非常復雜,僅通過外部的數據來進行人物的刻畫是十分低端的,信用信息和人口屬性為主,強相關信息,忽略弱關聯信息,權重值以上的可以作為其用戶畫像的刻畫數據,用戶刻畫時的幾個緯度如人口屬性、信用緯度、消費特征、興趣愛好、社交信息等,畫像數據的整理和集中,找到同業務場景中相關的數據,對數據進行分類和標簽化,并根據業務需要判斷是否需要引入外部數據,如銀行信征中心、社交軟件等,本公開提供了一種通過對個人的第一搜索數據的處理可得出對應用戶的信用評價的方法。而如何使用戶行為在終端中的體現轉化成確切的數據,從而使這些數據更好地判斷用戶的信用級別,進而服務于金融風險控制,是目前亟需解決的一個問題。公開內容本公開提供一種搜索數據的處理方法及裝置,使得通過用戶終端中的第一搜索數據的處理得出對應的行為及其信用評價,從而更好地實現對用戶的行為的判斷。第一方面,本公開實施例提供了一種搜索數據的處理方法,所述方法包括:上傳若干用戶在搜索引擎中的第一搜索數據至云數據平臺;篩選出所述第一搜索數據中頻率權重大于等于預設權重的第二搜索數據;獲取所述第二搜索數據,以及所述第二搜索數據的標識信息;根據所述第二搜索數據的標識信息,以及在搜索引擎內出現的第一搜索數據中包括的第二搜索數據的數量,獲得信用權重。本公開的實施例提供的技術方案可以包括以下有益效果:通過云數據平臺對第一搜索數據進行篩選得出其中權重較大的第二搜索數據以及各第二搜索數據對應的標識信息,通過該標識信息以及第二搜索數據在搜索引擎內出現的第一搜索數據的比重,計算得出信用權重,從而完成對用戶的金融行為的分析,無須再花費大量人力物力對該用戶的實際金融情形考察,很好地通過第一搜索數據實現了用戶的金融行為作出評價判斷,并且對用戶的金融畫像方面的刻畫也起到了十分重要的作用。結合另一方面,在另一方面的一種可能的實現方式中,所述上傳在搜索引擎中的第一搜索數據至云數據平臺之前,包括:獲取在各搜索引擎中的瀏覽數據集合;獲取所述瀏覽數據集合中每項瀏覽數據的使用頻率;比較該使用頻率與預設使用頻率,選取使用頻率大于等于預設使用頻率的瀏覽數據作為第一搜索數據;所述第一搜索數據為刪除了低于預設使用頻率的瀏覽數據以后的瀏覽數據集合。本公開的實施例提供的技術方案可以包括以下有益效果:在將第一搜索數據上傳到云數據平臺之前,可進一步對搜索引擎中出現的瀏覽數據進行篩選以得到待上傳的第一搜索數據,對于使用頻率低于預設使用頻率的無作用瀏覽數據作出丟棄操作,從而使得在第一搜索數據的源頭上保證了第一搜索數據的質量。結合另一方面,在另一方面的一種可能的實現方式中,獲取所述第二搜索數據,以及所述第二搜索數據的標識信息時,包括:獲取每一所述第二搜索數據的出現次數;將出現次數最多的第二搜索數據作為聚類數據;獲取所述聚類數據在所述云數據平臺中的標識信息。本公開的實施例提供的技術方案可以包括以下有益效果:通過在第二搜索數據中出現次數最多的第二搜索數據作為聚類數據,并且獲取該聚類數據在云數據平臺上被打上的標識信息,該標識信息為對第二搜索數據的聚類結果作出的標簽,該標簽能夠反應該用戶最經常進行的金融行為,進而可反映出該用戶金融行為所對應的信用評價。結合另一方面,在另一方面的一種可能的實現方式中,所述上傳若干用戶在搜索引擎中的第一搜索數據至云數據平臺時,包括:獲取在搜索引擎中的瀏覽數據;按照數據屬性對各所述瀏覽數據進行劃分,以得到類型權重;將類型權重大于預設閾值的瀏覽數據作為第一搜索數據上傳至云數據平臺。本公開的實施例提供的技術方案可以包括以下有益效果:對用戶的搜索引擎中出現的瀏覽數據的另一種篩選方式,通過數據屬性對瀏覽數據進行劃分,從而得到類型權重大于預設閾值的瀏覽數據上傳,使得通過較為準確地獲取該用戶的標識信息,從而更準確地對該用戶的金融行為作出信用評價。結合另一方面,在另一方面的一種可能的實現方式中,根據所述第二搜索數據的標識信息,以及在搜索引擎內出現的第一搜索數據中包括的第二搜索數據的數量,獲得信用權重,包括:根據第一搜索數據判斷得出應用場景;根據各應用場景所對應的數據關聯強度,以及第一搜索數據的類型權重,計算得出各第二搜索數據的關聯比重;根據所述關聯比重以及標識信息得到對應的信用權重。本公開的實施例提供的技術方案可以包括以下有益效果:數據關聯強度可作為對信用評價的一處常量K,通過該常量K使得得出信用權重時各用戶站在同統一的評價標準,從而使得用戶的信用權重更為客觀,更接近于真實的用戶的信用評價。結合另一方面,在另一方面的一種可能的實現方式中,上傳在搜索引擎中的第一搜索數據至云數據平臺時,包括:獲取各所述第一搜索數據的應用場景;對應用場景進行粗粒度分析,以得到在粗粒度分析所體現的分析規則內包括的第一搜索數據。本公開的實施例提供的技術方案可以包括以下有益效果:各所述第一搜索數據的應用場景的粗粒度分析,同樣地作為對第一搜索數據的一種篩選方式,可以通過一定的篩選規則得出第二搜索數據,通過粗粒度分析的方式可使得所述第一搜索數據能夠得到更為準確的分類結果。第二方面,本公開還提供了一種搜索數據的處理裝置,其具體的技術方案包括如下:上傳模塊,被配置用于上傳在搜索引擎中的第一搜索數據至云數據平臺;篩選模塊,被配置用于篩選出所述第一搜索數據中頻率權重大于等于預設權重的第二搜索數據;獲取模塊,被配置用于獲取所述第二搜索數據,以及所述第二搜索數據的標識信息;權重計算模塊,被配置用于根據所述第二搜索數據的標識信息,以及在搜索引擎內出現的第一搜索數據中包括的第二搜索數據的數量,獲得的信用權重。結合另一方面,在另一方面的一種可能的實現方式中,所述裝置還包括:瀏覽獲取模塊,被配置用于獲取所述在各搜索引擎中的瀏覽數據集合;頻率獲取模塊,被配置用于獲取所述瀏覽數據集合中每項瀏覽數據的使用頻率;比較模塊,被配置用于比較該使用頻率與預設使用頻率,選取使用頻率大于等于預設使用頻率的瀏覽數據作為第一搜索數據,丟棄使用頻率小于預設使用頻率的瀏覽數據;其中,所述上傳模塊中的所述第一搜索數據為刪除了低于預設使用頻率的瀏覽數據以后的瀏覽數據集合。結合另一方面,在另一方面的一種可能的實現方式中,所述權重計算模塊還包括:次數獲取模塊,被配置用于獲取每一所述第二搜索數據的出現次數;聚類數據模塊,被配置用于將出現次數最本文檔來自技高網...

【技術保護點】
一種搜索數據的處理方法,其特征在于,所述方法包括:上傳在搜索引擎中的第一搜索數據至云數據平臺;篩選出所述第一搜索數據中頻率權重大于等于預設權重的第二搜索數據;獲取所述第二搜索數據,以及所述第二搜索數據的標識信息;根據所述第二搜索數據的標識信息,以及在所述搜索引擎內出現的第一搜索數據中包括的第二搜索數據的數量,獲得信用權重。
【技術特征摘要】
1.一種搜索數據的處理方法,其特征在于,所述方法包括:上傳在搜索引擎中的第一搜索數據至云數據平臺;篩選出所述第一搜索數據中頻率權重大于等于預設權重的第二搜索數據;獲取所述第二搜索數據,以及所述第二搜索數據的標識信息;根據所述第二搜索數據的標識信息,以及在所述搜索引擎內出現的第一搜索數據中包括的第二搜索數據的數量,獲得信用權重。2.根據權利要求1所述的方法,其特征在于,所述上傳在搜索引擎中的第一搜索數據至云數據平臺之前,包括:獲取在各搜索引擎中的瀏覽數據集合;獲取瀏覽數據集合中每項瀏覽數據的使用頻率;比較該使用頻率與預設使用頻率,選取使用頻率大于等于預設使用頻率的瀏覽數據作為第一搜索數據;所述第一搜索數據為刪除了低于預設使用頻率的瀏覽數據以后的瀏覽數據集合。3.根據權利要求1所述的方法,其特征在于,獲取所述第二搜索數據,以及所述第二搜索數據的標識信息時,包括:獲取每一所述第二搜索數據的出現次數;將出現次數最多的第二搜索數據作為聚類數據;獲取所述聚類數據在所述云數據平臺中的標識信息。4.根據權利要求1所述的方法,其特征在于,所述上傳在搜索引擎中的第一搜索數據至云數據平臺時,包括:獲取在搜索引擎中的瀏覽數據;按照數據屬性對各所述瀏覽數據進行劃分,以得到類型權重;將類型權重大于預設閾值的瀏覽數據作為第一搜索數據上傳至云數據平臺。5.根據權利要求4所述的方法,其特征在于,根據所述第二搜索數據的標識信息,以及在搜索引擎內出現的第一搜索數據中包括的第二搜索數據的數量,獲得信用權重,包括:根據第一搜索數據判斷得出應用場景;根據各應用場景所對應的數據關聯強度,以及第一搜索數據的類型權重,計算得出各第二搜索數據的關聯比重;根據所述關聯比重以及標識信息得到對應的信用權重。6.根據權利要求1所述的方法,其特征在于,所述上傳在搜索引擎中的第一搜索數據至云數據平臺時,包括:獲取各所述第一搜索數據的應用場景;對應用場景進行粗粒度分析,以得到在粗粒度分析所體現的分析規則內包括的第一搜索數據。7.一種搜索數據的處理裝置,其特征在于,所述裝置包括:上傳模塊,被配置用于上傳在搜索引擎中的第一搜索數據至云數據平臺;篩選模塊,被配置用于篩選出所述第一搜索數據中頻率權重大于等于預設權重的第二搜索數據;獲取模塊,被配置用于獲取所述第二搜索數據,以及所述第二搜索數據的標識信息;權重計算模塊,被配置用于根據所述第二搜索數據的標識...
【專利技術屬性】
技術研發人員:劉鐵俊,張鵬飛,林形省,
申請(專利權)人:北京小米移動軟件有限公司,
類型:發明
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。