本申請實施例提供一種處理線索數據的方法、裝置、介質及電子設備,所述方法包括:將第一類線索對應的過程數據存儲在臨時分區中,其中,所述第一類線索屬于未完結線索,所述未完結線索為需要進行業務跟蹤的線索;監控所述臨時分區中存儲的各個線索,并將第二類線索對應的過程數據從所述臨時分區中刪除并存儲至固定分區中,其中,所述第二類線索為完結線索,所述完結線索為不需要繼續業務跟蹤的線索。通過本申請的實施例可以通過監控位于臨時分區中的線索進而有效減少了數據處理處理量,達到了節省海量數據通過join關聯操作浪費計算時間和計算資源的效果。和計算資源的效果。和計算資源的效果。
【技術實現步驟摘要】
一種處理線索數據的方法、裝置、介質及電子設備
[0001]本申請涉及大數據處理領域,具體而言本申請實施例涉及一種處理線索數據的方法、裝置、介質及電子設備。
技術介紹
[0002]數據載體就是線索,即用戶信息。這些信息分多個事實,這些事實包括:入庫、下發、撥打、回收、轉人工、成交均是靠一個線索信息串起來的,但是目前無運營管理平臺,因此在統計跨事實的數據時無法關聯上下游數據,例如,現在實時記錄都是單標單個的,定期觀測沒有結束生命周期的線索并跟蹤。
[0003]現有的數據量小的時候與各線索相關的所有數據采用一張表進行記錄跟蹤,也就是說,數據量不大時直接對表格中的線索狀態進行更新即可,但是大數據的上下游數據很多(例如,現有線索狀態更新算法輸入數據量非常大)現有技術均采用全部掃描的方式對各線索進行跟蹤因此造成耗時嚴重,影響處理速度。
技術實現思路
[0004]本申請實施例的目的在于提供一種處理線索數據的方法、裝置、介質及電子設備,通過本申請的實施例可以通過監控位于臨時分區中的線索進而有效減少了數據處理處理量,達到了節省海量數據通過join關聯操作浪費計算時間和計算資源的效果。
[0005]第一方面,本申請實施例提供一種處理線索數據的方法,所述方法包括:將第一類線索對應的過程數據存儲在臨時分區中,其中,所述第一類線索屬于未完結線索,所述未完結線索為需要進行業務跟蹤的線索;監控所述臨時分區中存儲的各個線索,并將第二類線索對應的過程數據從所述臨時分區中刪除并存儲至固定分區中,其中,所述第二類線索為完結線索,所述完結線索為不需要繼續業務跟蹤的線索。
[0006]本申請的一些實施例把沒有完結的線索放到臨時分區中,僅監控未完結的線索,能有效改善現有技術采用全部掃描所有線索的方式造成的耗時嚴重且處理速度慢的問題。
[0007]在一些實施例中,所述將與第一類線索對應的過程數據存儲在臨時分區中,包括:采用累積快照的方式將與所述第一類線索對應的過程數據存儲在所述臨時分區中。
[0008]本申請的一些實施例通過周期性更新臨時分區中的數據來提升對線索的跟蹤效果。
[0009]在一些實施例中,在所述將第一類線索對應的過程數據存儲在臨時分區中之前,所述方法還包括:獲取與第一線索對應的第一過程數據;通過所述第一過程數據確認所述第一線索屬于所述第一類線索;在所述臨時分區中查找與所述第一線索的線索標識對應的目標存儲區域;所述將與未完結線索對應的過程數據存儲在臨時分區中,包括:根據所述與第一線索對應的第一過程數據修改所述目標存儲區域中的目標字段。
[0010]本申請的一些實施例通過判定最新的過程數據是否導致對應的線索結束,進而確定將這些過程數據存儲在臨時分區還是存儲在固定區域,以提升臨時分區中僅存儲未完結
的線索對應的數據。
[0011]在一些實施例中,所述方法還包括:讀取規則表;其中,所述確認所述第一線索屬于所述第一類線索,包括:根據所述規則表確認所述第一線索屬于所述第一類線索。
[0012]本申請的一些實施例通過規則表中設置的判定規則來確定各類線索是否屬于未完結線索,提升線索屬性判定的準確性和靈活性。
[0013]在一些實施例中,通過所述規則表可配置至少一個線索的生命周期的長度。
[0014]本申請的一些實施例通過對規則表進行更新或者重配置的方式可以實時更改最新的線索狀態判定規則,以提升技術方案的通用性。
[0015]在一些實施例中,所述方法還包括:采用動態分區算法將存儲區域劃分為所述臨時分區和所述固定分區。
[0016]本申請的一些實施例中采用動態分區算法來劃分存儲區域。
[0017]在一些實施例中,所述臨時分區中的數據是按照周期進行更新的。
[0018]本申請的一些實施例通過周期性更新臨時分區中的數據可以實現以累積快照的方式將與所述第一類線索對應的過程數據存儲在所述臨時分區中。
[0019]在一些實施例中,所述第一類線索包括:線索成交、線索回收或者線索邏輯刪除。
[0020]本申請的一些實施例提供多種完結線索的示例。
[0021]第二方面,本申請的一些實施例提供一種處理線索數據的裝置,所述裝置包括:第一處理模塊,被配置為將第一類線索對應的過程數據存儲在臨時分區中,其中,所述第一類線索屬于未完結線索,所述未完結線索為需要進行業務跟蹤的線索;第二處理模塊,被配置為監控所述臨時分區中存儲的各個線索,并將第二類線索對應的過程數據從所述臨時分區中刪除并存儲至固定分區中,其中,所述第二類線索為完結線索,所述完結線索為不需要繼續業務跟蹤的線索。
[0022]第三方面,本申請的一些實施例中提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述程序被處理器執行時可實現如第一方面任意實施例所述的方法。
[0023]第四方面,本申請的一些實施例提供一種電子設備,包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其中,所述處理器執行所述程序時可實現如第一方面任意實施例所述的方法。
附圖說明
[0024]為了更清楚地說明本申請實施例的技術方案,下面將對本申請實施例中所需要使用的附圖作簡單地介紹,應當理解,以下附圖僅示出了本申請的某些實施例,因此不應被看作是對范圍的限定,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他相關的附圖。
[0025]圖1為本申請實施例提供的處理線索數據的系統的架構圖;
[0026]圖2為本申請實施例提供的處理線索數據的方法的流程圖之一;
[0027]圖3為本申請實施例提供的處理線索數據的方法的流程圖之二;
[0028]圖4為本申請實施例提供的處理線索數據的裝置的組成框圖;
[0029]圖5為本申請實施例提供的電子設備組成示意圖。
具體實施方式
[0030]下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行描述。
[0031]應注意到:相似的標號和字母在下面的附圖中表示類似項,因此,一旦某一項在一個附圖中被定義,則在隨后的附圖中不需要對其進行進一步定義和解釋。同時,在本申請的描述中,術語“第一”、“第二”等僅用于區分描述,而不能理解為指示或暗示相對重要性。
[0032]本申請的一些實施例針對海量案件作業數據追蹤問題,利用動態分區技術(例如,hive sql動態分區技術),首先將判斷線索或案件是否是終態,其次將不是終態的線索與最新的埋點日志數據進行關聯,最后根據關聯后的數據判斷線索是否是完結,將不完結的線索的數據放在臨時分區和將完結的線索的數據放在作業日期分區中,達到了節省海量數據通過join關聯操作浪費計算時間和計算資源的效果。
[0033]可以理解的是,本申請的一些實施例采用累計快照的方式把沒有完結的線索放到臨時分區中,僅監控未完結的線索,不需要采用相關技術的每天進行所有線索對應的所有數據的全表掃描以及全表更新狀態,節省了io開支增加了大數本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種處理線索數據的方法,其特征在于,所述方法包括:將第一類線索對應的過程數據存儲在臨時分區中,其中,所述第一類線索屬于未完結線索,所述未完結線索為需要進行業務跟蹤的線索;監控所述臨時分區中存儲的各個線索,并將第二類線索對應的過程數據從所述臨時分區中刪除并存儲至固定分區中,其中,所述第二類線索為完結線索,所述完結線索為不需要繼續業務跟蹤的線索。2.如權利要求1所述的方法,其特征在于,所述將與第一類線索對應的過程數據存儲在臨時分區中,包括:采用累積快照的方式將與所述第一類線索對應的過程數據存儲在所述臨時分區中。3.如權利要求1所述的方法,其特征在于,在所述將第一類線索對應的過程數據存儲在臨時分區中之前,所述方法還包括:獲取與第一線索對應的第一過程數據;通過所述第一過程數據確認所述第一線索屬于所述第一類線索;在所述臨時分區中查找與所述第一線索的線索標識對應的目標存儲區域;所述將與未完結線索對應的過程數據存儲在臨時分區中,包括:根據所述與第一線索對應的第一過程數據修改所述目標存儲區域中的目標字段。4.如權利要求3所述的方法,其特征在于,所述方法還包括:讀取規則表;其中,所述確認所述第一線索屬于所述第一類線索,包括:根據所述規則表確認所述第一線索屬于所述第一類線索。5.如權利要求4所述的方法,其特征在于,通過所述規則表可配置至...
【專利技術屬性】
技術研發人員:李由,梁鵬斌,馮夢盈,
申請(專利權)人:零犀北京科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。