【技術實現步驟摘要】
本專利技術涉及計算機存儲領域,具體涉及集群存儲中,海量文件備份加速的技術,具體地說是。
技術介紹
隨著信息時代的到來網絡應用的高速發展,網絡信息數據量越來越大,海量存儲系統中所保存的數據量也越來越大,越來越多的存儲系統中保存的數據量都已經達到了 PB級。數據規模的快速增長無疑給文件同步、數據備份帶來了新的問題。在海量數據的新環境下,傳統的文件同步方法的性能已經無法滿足業務需求。由于現有的文件同步方法大都沒有針對海量數據的環境進行專門的設計和優化,因此同步海量文件的性能較低。
技術實現思路
本專利設計了。其特征在于通過利用文件對比算法以及多線程技術,減少了需要在網絡中傳輸的數據量,并且充分利用了網絡的帶寬,進而提高了文件同步的速度,減少了文件同步所需要的時間。該方法涉及如下幾個主要步驟: 1)、比較源端和目的端對應文件的大小和修改時間;如果源端文件和目的端文件的大小和修改時間中有一項不同,則啟動一個線程,在新線程中開始執行步驟2。之后重復步驟1,比較下一個文件的大小和修改時間; 2)、目的端文件分塊,計算校驗和;該步驟首先對目的端的文件進行分塊,之后對每個塊分別計算校驗和; 3)、將目的端文件的校驗和列表傳輸到同步源;校驗和列表中包括數據塊的編號和校驗和; 4)、在源端進行文件的數據塊比對。在同步的源端,計算文件中的第一個數據塊的校驗和,并在從目的端得到的校驗和列表中,查找該校驗和是否存在;如果存在,則將該校驗和對應的目的端文件數據塊編號記錄到結果數組中的對應位置,并將數據塊窗口向后移動一個數據塊的長度;如果不存在,則將該數據塊的第一個 ...
【技術保護點】
一種提高存儲系統間海量文件同步速度的方法,其特征在于該方法涉及如下幾個主要步驟:1)、比較源端和目的端對應文件的大小和修改時間;如果源端文件和目的端文件的大小和修改時間中有一項不同,則啟動一個線程,在新線程中開始執行步驟2;之后重復步驟1,比較下一個文件的大小和修改時間;2)、目的端文件分塊,計算校驗和;該步驟首先對目的端的文件進行分塊,之后對每個塊分別計算校驗和;3)、將目的端文件的校驗和列表傳輸到同步源;校驗和列表中包括數據塊的編號和校驗和;4)、在源端進行文件的數據塊比對;在同步的源端,計算文件中的第一個數據塊的校驗和,并在從目的端得到的校驗和列表中,查找該校驗和是否存在;如果存在,則將該校驗和對應的目的端文件數據塊編號記錄到結果數組中的對應位置,并將數據塊窗口向后移動一個數據塊的長度;如果不存在,則將該數據塊的第一個字節保存到結果數組的對應位置,并將數據塊窗口向后移動一個字節;重復以上過程,直至整個文件比對完畢;5)、將步驟4中得到的結果數組傳輸到目的端;6)、目的端根據從源端接收到的結果數組,重新生成文件。
【技術特征摘要】
1.一種提高存儲系統間海量文件同步速度的方法,其特征在于該方法涉及如下幾個主要步驟: 1)、比較源端和目的端對應文件的大小和修改時間;如果源端文件和目的端文件的大小和修改時間中有一項不同,則啟動一個線程,在新線程中開始執行步驟2;之后重復步驟1,比較下一個文件的大小和修改時間; 2)、目的端文件分塊,計算校驗和;該步驟首先對目的端的文件進行分塊,之后對每個塊分別計算校驗和; 3)、將目的端文件的校驗和列表傳輸到同步源;校驗和列表中包括數據塊的編號和校驗和; 4)、在源...
【專利技術屬性】
技術研發人員:孟令斌,
申請(專利權)人:浪潮電子信息產業股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。