• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種海量數據處理方法、裝置及系統制造方法及圖紙

    技術編號:8271471 閱讀:219 留言:0更新日期:2013-01-31 03:42
    本申請公開了一種海量數據處理方法、裝置及系統,應用于數據副本集群中存儲有海量數據的數據節點,所述數據節點在預設時間間隔點獲取本數據節點中不同于與其相連的另一數據節點的數據,并將獲取的數據寫入至另一數據節點中,觸發另一數據節點更新其數據版本;所述方法包括:當前數據節點接收待更新數據,并將待更新數據寫入至本數據節點,待更新數據在數據副本集群接收到的更新請求信息中提取;并更新當前數據節點的數據版本;若當前系統時間到達預設時間間隔點,當前數據節點獲取本數據節點中不同于另一數據節點的數據,并將獲取的數據寫入至另一數據節點中,觸發另一數據節點更新其數據版本。通過本申請實施例,提高對海量數據的處理效率。

    【技術實現步驟摘要】
    本申請涉及軟件
    ,特別涉及一種海量數據處理方法、裝置及系統
    技術介紹
    海量數據一般是指數據量為PB級以上的數據。海量數據的處理,一般采用分布式處理方案,即將海量數據進行分片,分發至不同的節點進行處理,為保證數據的安全,通常采用數據冗余方案,即一份數據存在于多個節點上,此時,冗余的數據稱為數據副本。目前,在對海量數據進行一次寫入處理時,需要系統對存儲有海量數據的每個數據副本執行寫入操作,即將待更新數據發送至每個數據副本,每個數據副本將待更新數據寫入到本數據副本中,從而保證海量數據的一致性。例如,當前數據有N個數據副本,在對當前數據進行寫入操作時,需要系統對該數據的N個數據副本均執行寫入操作,即執行N次 寫入操作,使得系統對海量數據的處理效率較低。同時,若數據副本中有一個數據副本寫入失敗,那么其他數據副本即使寫入成功,也均會回滾至被寫入之前的狀態,此時,需要系統重新對所有的數據副本再次執行寫入操作,從而明顯使得系統對海量數據的處理性能降低,嚴重影響海量數據的處理效率。
    技術實現思路
    有鑒于此,本申請通過提供一種海量數據處理方法、裝置及系統,用以解決現有技術中對多個同時存儲有海量數據的數據副本進行一次寫入處理時,需系統執行多次寫入操作,從而使得海量數據的處理效率降低的技術問題,以及用以解決現有海量數據處理方案中,一次寫入失敗,所有數據副本回滾,從而明顯使得系統對海量數據的處理性能降低,嚴重影響海量數據的處理效率的技術問題。本申請提供了一種海量數據處理方法,應用于預設的分布式數據副本集群中存儲有海量數據的數據節點;其中,所述數據副本集群包括至少一個所述數據節點,所述每一數據節點至少與一個不同于本數據節點的另一數據節點相連,且所述數據節點在其預設時間間隔點獲取本數據節點中不同于所述另一數據節點的數據,并將所述獲取的數據寫入至所述另一數據節點中,觸發所述另一數據節點更新其數據版本;所述方法包括依據預設規則在所述數據副本集群中被選取的當前數據節點接收待更新數據,并將所述待更新數據寫入至本數據節點;其中,所述待更新數據在所述數據副本集群接收到的更新請求信息中提取;并更新所述當前數據節點的數據版本;若當前系統時間到達所述預設時間間隔點,所述當前數據節點獲取本數據節點中不同于所述另一數據節點的數據,并將所述獲取的數據寫入至所述另一數據節點中,觸發所述另一數據節點更新其數據版本。上述方法,優選地,所述數據節點的數據版本包括被寫入數據的標識信息;所述更新所述當前數據節點的數據版本包括將所述待更新數據的標識信息添加至所述當前數據節點的數據版本中。上述方法,優選地,所述依據預設規則在所述數據副本集群中選取當前數據節點包括任意選取所述數據副本集群中的一個數據節點作為當前數據節點;或選取所述數據副本集群中數據版本最大的數據節點作為當前數據節點。上述方法,優選地,所述當前數據節點獲取本數據節點中不同于所述另一數據節點的數據,并將所述獲取的數據寫入至所述另一數據節點中,觸發所述另一數據節點更新 其數據版本包括所述當前數據節點依據其數據版本生成同步請求信息,并將所述同步請求信息發送至所述另一數據節點;其中,所述同步請求信息包括所述當前數據節點的數據版本;所述另一數據節點依據其數據版本及所述當前數據節點的數據版本生成同步回復信息,并將所述同步回復信息發送至所述當前數據節點;其中,所述同步回復信息包括所述當前數據節點中不同于所述另一數據節點的數據的標識信息;所述當前數據節點提取與所述同步回復信息中的標識信息相對應的數據,并將所述提取的數據寫入至所述另一數據節點,觸發所述另一數據節點更新其數據版本。本申請還提供了一種海量數據處理裝置,應用于預設的分布式數據副本集群中存儲有海量數據的數據節點;其中,所述數據副本集群至少包括一個所述數據節點,所述每一數據節點至少與一個不同于本數據節點的另一數據節點相連;所述裝置包括計時單元、第一寫入單元、第二寫入單元和版本更新單元,其中所述計時單元,用于實時判斷當前系統時間是否到達本數據節點的預設時間間隔點,如果是,觸發本數據節點的所述第一寫入單元;所述第一寫入單元,用于在所述當前系統時間到達所述時間間隔點時獲取本數據節點中不同于與其相連的另一數據節點的數據,將所述獲取的數據寫入至所述另一數據節點,并觸發所述另一數據節點的版本更新單元;所述第二寫入單元,在所述數據副本集群接收到更新請求信息,本數據節點被選取為當前數據節點時被觸發,用于接收待更新數據,并將所述待更新數據寫入至本數據節點,觸發所述版本更新單元;其中,所述待更新數據在所述數據副本集群接收到的更新請求信息中提取;所述版本更新單元,用于更新本數據節點的數據版本。上述裝置,優選地,所述數據節點的數據版本包括被寫入數據的標識信息;所述版本更新單元,具體用于將所述本數據節點中被寫入數據的標識信息添加至本數據節點的數據版本中。上述裝置,優選地,所述第一寫入單元包括請求信息生成子單元、回復信息接收子單元和數據寫入子單元所述請求信息生成子單元,用于依據本數據節點的數據版本生成同步請求信息,并將所述同步請求信息發送至與其相連接的另一數據節點;其中,所述同步請求信息包括所述本數據節點的數據版本;所述回復信息接收子單元,用于接收所述另一數據節點發送的同步回復信息;其中,所述同步回復信息由所述另一數據節點依據其數據版本及所述同步請求信息中的數據版本生成,包括本數據節點中不同于所述另一數據節點的數據的標識信息;所述數據寫入子單元,用于提取與所述同步回復信息中的標識信息相對應的數據,并將所述提取的數據寫入至所述另一數據節點,觸發所述另一數據節點的版本更新單J Li ο 上述裝置,優選地,所述第一寫入單元還包括回復信息生成子單元;所述回復信息生成子單元,用于依據其數據版本及本數據節點接收到的同步請求信息中的數據版本生成同步回復信息,并將所述同步回復信息發送至所述同步請求信息所屬的數據節點。本申請還提供了一種海量數據處理系統,包括至少一個如上述任意一項所述的海量數據處理裝置。上述系統,優選地,所述系統還包括集群控制器;所述集群控制器,用于接收更新請求信息,任意選取所述數據副本集群中的一個數據節點作為當前數據節點,或選取所述數據副本集群中數據版本最大的數據節點作為當前數據節點,并將所述更新請求信息中的待更新數據進行提取發送至所述當前數據節點,同時觸發所述當前數據節點中海量數據處理裝置的第二寫入單元。由上述方案可知,本申請提供的一種海量數據處理方法、裝置及系統,應用于數據副本集群中每個存儲有海量數據的數據節點中,通過將待更新數據寫入到被選取的當前數據節點中,再由當前數據節點在每個預設時間間隔點將其不同于與其相連的另一數據節點的數據寫入到該另一數據節點中,由此,由數據副本集群中數據節點定時與其相連的數據節點之間交互及更新數據,無須對每個數據節點執行數據寫入的操作,由每個數據節點自行與其相連的數據節點進行數據交換及更新,從而實現整個數據副本集群中的所有數據節點的數據同步,即在所述數據副本集群中,每個數據節點在每個預設時間間隔點時將其不同于與其相連的數據節點的數據寫入至該數據節點,在需要進行數據更新時,只需執行一次對數據副本集群中的數據節點寫入待更新數據的操作,相連的數據節點之間進行本文檔來自技高網...

    【技術保護點】
    一種海量數據處理方法,其特征在于,應用于預設的分布式數據副本集群中存儲有海量數據的數據節點;其中,所述數據副本集群包括至少一個所述數據節點,所述每一數據節點至少與一個不同于本數據節點的另一數據節點相連,且所述數據節點在其預設時間間隔點獲取本數據節點中不同于所述另一數據節點的數據,并將所述獲取的數據寫入至所述另一數據節點中,觸發所述另一數據節點更新其數據版本;所述方法包括:依據預設規則在所述數據副本集群中被選取的當前數據節點接收待更新數據,并將所述待更新數據寫入至本數據節點;其中,所述待更新數據在所述數據副本集群接收到的更新請求信息中提取;并更新所述當前數據節點的數據版本;若當前系統時間到達所述預設時間間隔點,所述當前數據節點獲取本數據節點中不同于所述另一數據節點的數據,并將所述獲取的數據寫入至所述另一數據節點中,觸發所述另一數據節點更新其數據版本。

    【技術特征摘要】
    1.一種海量數據處理方法,其特征在于,應用于預設的分布式數據副本集群中存儲有海量數據的數據節點; 其中,所述數據副本集群包括至少一個所述數據節點,所述每一數據節點至少與一個不同于本數據節點的另一數據節點相連,且所述數據節點在其預設時間間隔點獲取本數據節點中不同于所述另一數據節點的數據,并將所述獲取的數據寫入至所述另一數據節點中,觸發所述另一數據節點更新其數據版本; 所述方法包括 依據預設規則在所述數據副本集群中被選取的當前數據節點接收待更新數據,并將所述待更新數據寫入至本數據節點; 其中,所述待更新數據在所述數據副本集群接收到的更新請求信息中提取; 并更新所述當前數據節點的數據版本; 若當前系統時間到達所述預設時間間隔點,所述當前數據節點獲取本數據節點中不同于所述另一數據節點的數據,并將所述獲取的數據寫入至所述另一數據節點中,觸發所述另一數據節點更新其數據版本。2.根據權利要求I所述的方法,其特征在于,所述數據節點的數據版本包括被寫入數據的標識信息; 所述更新所述當前數據節點的數據版本包括 將所述待更新數據的標識信息添加至所述當前數據節點的數據版本中。3.根據權利要求I所述的方法,其特征在于,所述依據預設規則在所述數據副本集群中選取當前數據節點包括 任意選取所述數據副本集群中的一個數據節點作為當前數據節點; 或選取所述數據副本集群中數據版本最大的數據節點作為當前數據節點。4.根據權利要求2所述的方法,其特征在于,所述當前數據節點獲取本數據節點中不同于所述另一數據節點的數據,并將所述獲取的數據寫入至所述另一數據節點中,觸發所述另一數據節點更新其數據版本包括 所述當前數據節點依據其數據版本生成同步請求信息,并將所述同步請求信息發送至所述另一數據節點; 其中,所述同步請求信息包括所述當前數據節點的數據版本; 所述另一數據節點依據其數據版本及所述當前數據節點的數據版本生成同步回復信息,并將所述同步回復信息發送至所述當前數據節點; 其中,所述同步回復信息包括所述當前數據節點中不同于所述另一數據節點的數據的標識信息; 所述當前數據節點提取與所述同步回復信息中的標識信息相對應的數據,并將所述提取的數據寫入至所述另一數據節點,觸發所述另一數據節點更新其數據版本。5.一種海量數據處理裝置,其特征在于,應用于預設的分布式數據副本集群中存儲有海量數據的數據節點; 其中,所述數據副本集群至少包括一個所述數據節點,所述每一數據節點至少與一個不同于本數據節點的另一數據節點相連; 所述裝置包括計時單元、第一寫入單元、第二寫入單元和版本更新單元,...

    【專利技術屬性】
    技術研發人員:李晨馬向暉
    申請(專利權)人:杭州勒卡斯廣告策劃有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 免费无码肉片在线观看| 无码一区二区三区| 久久精品成人无码观看56| 亚洲成a人无码av波多野按摩 | 人妻aⅴ中文字幕无码| 亚洲爆乳少妇无码激情| 久久亚洲国产成人精品无码区| 国产成人无码精品一区二区三区| 精品亚洲成A人无码成A在线观看| 在线看片无码永久免费aⅴ| 无码人妻一区二区三区在线| av中文无码乱人伦在线观看| 午夜福利av无码一区二区| 国产av无码久久精品| 精品无码人妻一区二区三区| 日韩av片无码一区二区不卡电影 | 老司机无码精品A| 亚洲国产成人片在线观看无码| 亚洲精品无码久久久久APP| 岛国无码av不卡一区二区| 亚洲精品无码久久久久A片苍井空| 亚洲av无码国产精品夜色午夜| 亚洲AV综合色区无码二区偷拍| 无翼乌工口肉肉无遮挡无码18| 亚洲性无码av在线| 国产办公室秘书无码精品99| 永久免费无码网站在线观看| 中文无码亚洲精品字幕| 无码精品国产VA在线观看| 狠狠躁夜夜躁无码中文字幕| 无码视频一区二区三区| 精品久久久久久无码专区| 久久青草亚洲AV无码麻豆| 亚洲va无码va在线va天堂| 亚洲啪啪AV无码片| 丰满熟妇人妻Av无码区| 亚洲国产精品无码专区影院| 潮喷失禁大喷水aⅴ无码| 久久无码AV中文出轨人妻| 亚洲伊人成无码综合网| 无码人妻精品一区二区三区99不卡 |