一種基于非易失性存儲器的頻繁模式挖掘方法技術

技術編號：15690989 閱讀：380 留言：0更新日期：2017-06-24 03:49

本發明專利技術提供了一種基于非易失性存儲器的頻繁模式挖掘方法，它包括以下步驟：步驟1、利用多核系統對頻繁模式樹進行并行構建：先將數據庫中的多條數據項大致均勻地分配到每個核中，利用CN106250549A記載的方法，在每一個核上構建一棵本地頻繁模式樹；步驟2、對步驟1所構建的頻繁模式樹進行合并：將本地頻繁模式樹的信息搜集起來，合并成一棵大的全局頻繁模式樹。由于本發明專利技術采用并行構建頻繁模式樹，大幅度縮短了構建的時間，提高了構建頻繁模式樹的效率，解決了挖掘大數據集時構建樹的速度慢的問題。

A frequent pattern mining method based on nonvolatile memory

The invention provides a non volatile memory to frequent pattern mining method based on it, which comprises the following steps: 1, the use of multi-core system on parallel frequent pattern tree construction: the first of the plurality of data items are roughly evenly distributed to each core database, using the method of CN106250549A records, a the local frequent pattern tree construction in each nucleus; step 2, step 1 of frequent pattern tree constructed by merging: local frequent pattern tree information together, merge into a large global frequent pattern tree. Because the invention adopts the parallel construction of frequent pattern trees, the construction time is greatly shortened, the efficiency of constructing frequent pattern trees is improved, and the problem of slow construction of large data sets is solved.

全部詳細技術資料下載

【技術實現步驟摘要】
一種基于非易失性存儲器的頻繁模式挖掘方法
本專利技術屬于存儲器
，具體涉及一種用于NVM的頻繁模式挖掘方法。
技術介紹
中國專利文獻CN106250549A于2016年12月21日公開了一種基于內存的頻繁模式挖掘方法，它包括以下步驟：步驟1，構建頻繁模式初始樹，創建頻繁模式樹的根結點T，以“null”標記；再次掃描數據庫，將讀取的每條事務中的頻繁項選出并按L中的次序排序；排序后以null為根結點構建一條頻繁模式樹的路徑，只對路徑上位于最末的結點的計數加1，路徑上的其他結點的計數保持不變；依次掃描完整個數據庫中所有事務后獲得頻繁模式初始樹；步驟2，用深度優先搜索算法對頻繁模式初始樹依次進行遍歷，遍歷結點的計數器值為該結點本身的值加上其所有孩子結點的值。該專利能減少對NVM的寫操作，能快速的構建頻繁模式樹；且能減少對靠近根結點的結點計數域大量密集的寫操作，延長了NVM壽命。但是，當待挖掘的數據集非常大，用該專利的方法構建樹的效率很低，有必要探索一種快速構建頻繁模式樹的方法。
技術實現思路
針對現有技術中存在的技術問題，本專利技術所要解決的技術問題就是提供一種基于非易失性存儲器的頻繁模式挖掘方法，它在挖掘大數據集時，能夠快速構建頻繁模式樹。本專利技術所要解決的技術問題是通過這樣的技術方案實現的，它包括以下步驟：步驟1、利用多核系統對頻繁模式樹進行并行構建先將數據庫中的多條交易記錄大致均勻地分配到每個核中，利用CN106250549A記載的方法，在每一個核上構建一棵本地頻繁模式樹；步驟2、對步驟1所構建的頻繁模式樹進行合并將本地頻繁模式樹的信息搜集起來，合并成一...
一種基于非易失性存儲器的頻繁模式挖掘方法

【技術保護點】
一種基于非易失性存儲器的頻繁模式挖掘方法，其特征是，包括以下步驟：步驟1、利用多核系統對頻繁模式樹進行并行構建先將數據庫中的多條交易記錄大致均勻地分配到每個核中，利用CN106250549A記載的方法，在每一個核上構建一棵本地頻繁模式樹；步驟2、對步驟1所構建的頻繁模式樹進行合并將本地頻繁模式樹的信息搜集起來，合并成一棵大的全局頻繁模式樹。

【技術特征摘要】
1.一種基于非易失性存儲器的頻繁模式挖掘方法，其特征是，包括以下步驟：步驟1、利用多核系統對頻繁模式樹進行并行構建先將數據庫中的多條交易記錄大致均勻地分配到每個核中，利用CN106250549A記載的方法，在每一個核上構建一棵本地頻繁模式樹；步驟2、對步驟1所構建的頻繁模式樹進行合并將本地頻繁模式樹的信息搜集起來，合并成一棵大的全局頻繁模式樹。2.根據權利要求1所述的基于非易失性存儲器的頻繁模式挖掘方法，其特征是：在所述步驟1中，構建本地頻繁模式樹時，采用左孩子右兄弟鏈表結構；在所述步驟2中，包括以下步驟：步驟（1）、從根結點出發，將樹1的根結點的最末孩子結點的...

【專利技術屬性】
技術研發人員：劉鐸，林怡，黃鉑鈞，朱瀟，李陽，
申請(專利權)人：重慶大學，
類型：發明
國別省市：重慶,50

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術