【技術實現步驟摘要】
本專利技術涉及一種云環境下的空間數據劃分方法,屬于計算機網絡
技術介紹
云計算是一種分布式系統能將計算任務分給多臺機器來處理,能對各種應用系統提供計算力、存儲空間和信息服務。現在職呢辦公司和開源云計算平臺等都使用map-reduce并行計算模型。該模型為海量數據的處理提供了一個通用、高效的技術框架,從而在地理空間數據查詢處理、數據挖掘等領域得到了越來越廣泛的應用。當今,提高地理空間數據索引效率是個熱點問題,如何找到一種有效的方法在云平臺上建立索引機制具有重要的意義。W樹是個高度平衡樹,用空間對象的#份?(最小外接矩形)來近似表示空間數據對象,根據對象的#份 建立樹,并可以直接對空間中占據一定 范圍的空間數據對象進行索引。如何找到一種算法劃分空間數據對象使得樹滿足空間數據對象劃分的準則(數據量平衡準則、空間關系平衡準則),有效地提高空間數據的索引效率。已有的并行空間數據庫中的分配方法不適合云計算平臺,且大都是按空間區域平均劃分,這樣很難滿足空間數據對象劃分的準則。Ariel 等人提出了用Z曲線編碼空間數據對象,然后根據《部節點的數目,按空間數據量平均劃分,把得到的每個部分交給 ^處理得到R樹,這種方法不滿足空間關系平衡原則,即劃分不能保證空間相鄰的對象在樹的同一分支上,以致索引效率降低。Shubin zhang等人提出了基于空間填充曲線的劃分和輪轉法結合的劃分方法,但這種方法既不滿足空間關系平衡原則,也不滿足數據平衡準則,這種方法劃分的結果在map-reduce上建立的R樹的索引效率非常低 賈婷等人提出一種A均值聚類算法的空間數據劃分方法,把空間數據劃 ...
【技術保護點】
一種云環境下的空間數據劃分方法,其特征在于,包括以下步驟:步驟1、將空間數據庫中的各空間數據對象用其最小外接矩形的中心點坐標表示;步驟2、利用Hilbert曲線編碼方法將空間數據庫中的空間數據對象映射為一維有序數組,并依序將一維有序數組中的元素平均劃分為k個類,k為所述云環境中存儲節點的數量;步驟3、計算一維有序數組中每個元素與k個類中心的歐氏距離,對于任意一個元素,如其與當前所屬類的中心的距離非最小,且當前所屬類中的元素個數大于一預設的閾值,則將該元素劃入距離最近的類中心所在類中;所述閾值小于或等于???????????????????????????????????????????????,n為所述一維有序數組中的元素個數;步驟4、更新k個類中心;步驟5、重復執行步驟4、步驟5,直到滿足預設的迭代停止條件;步驟6、按照最終的劃分結果對空間數據對象進行劃分。2012103421709100001dest_path_image002.jpg
【技術特征摘要】
1.一種云環境下的空間數據劃分方法,其特征在于,包括以下步驟 步驟I、將空間數據庫中的各空間數據對象用其最小外接矩形的中心點坐標表示;步驟2、利用Hilbert曲線編碼方法將空間數據庫中的空間數據對象映射為一維有序數組,并依序將一維有序數組中的元素平均劃分為々個類,左為所述云環境中存儲節點的數量; 步驟3、計算一維有序數組中每個元素與A個類中心的歐氏距離,對于任意一個元素,如其與當前所屬類的中心的距離非最小,且當前所屬...
【專利技術屬性】
技術研發人員:劉林峰,孫靖,吳家皋,鄒志強,
申請(專利權)人:南京郵電大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。