本發明專利技術提供一種基于動態關聯規則的設備故障信息挖掘方法,能夠反應動態關聯規則隨著時間產生的變化,所述方法包括:獲取設備故障維修信息數據集D;按照預約維修日期將獲取的設備故障維修信息數據集D劃分為n個子數據集D
A method of mining equipment fault information based on dynamic association rules
The present invention provides a method for mining equipment fault information based on association rules, can reflect the dynamic association rule changes over time, the method comprises: obtaining the equipment maintenance information data set D; according to the appointment date of service will get the equipment maintenance information data set D is divided into n sub data sets D
【技術實現步驟摘要】
一種基于動態關聯規則的設備故障信息挖掘方法
本專利技術涉及數據挖掘
,特別是指一種基于動態關聯規則的設備故障信息挖掘方法。
技術介紹
在數據挖掘技術發展繁榮的大背景下,關聯規則技術得到了蓬勃發展,關聯規則挖掘的目的是為了從大量數據中發現項/變量之間的關聯和相關關系。傳統關聯規則挖掘方法挖掘的關聯規則能反映變量間的相互依賴關系,但是不能反映規則本身的變化規律。以挖掘故障信息數據庫為例,傳統的關聯規則挖掘方法挖掘的關聯規則能夠發現數據庫中不同設備、故障原因以及維修信息之間的聯系,從而有利于找出設備、故障原因以及維修信息之間的聯系,并根據設備確定最常見的故障原因等,但是,傳統的關聯規則挖掘方法沒有考慮關聯規則隨著時間產生的變化的情況,認為挖掘的關聯規則在數據庫中是永恒有效的,沒有考慮關聯規則的變化。
技術實現思路
本專利技術要解決的技術問題是提供一種基于動態關聯規則的設備故障信息挖掘方法,以解決現有技術所存在的沒有考慮關聯規則隨著時間產生變化的問題。為解決上述技術問題,本專利技術實施例提供一種基于動態關聯規則的設備故障信息挖掘方法,包括:獲取設備故障維修信息數據集D;按照預約維修日期將獲取的設備故障維修信息數據集D劃分為n個子數據集D1,D2,...,Dn,其中,D={D1,D2,...,Dn};定義動態關聯規則算法,其中,動態關聯規則表示為:其中,A、B分別表示項集,SV表示支持度向量,CV表示置信度向量,s表示項集的支持度,c表示關聯規則的置信度,表示動態關聯規則的推理符號;按照定義的動態關聯規則算法,對n個子數據集D1,D2,...,Dn進行動態關聯規則挖掘,得到設備故障原因與維修措施之間的關聯關系。進一步地,所述獲取設備故障維修信息數據集D包括:獲取設備故障維修信息原始數據集;從獲取的設備故障維修信息原始數據集中,獲取目標屬性數據;對獲取的目標屬性數據進行預處理,所述預處理包括:處理目標屬性中的屬性缺失值,屬性格式不一致值和/或去掉冗余值。進一步地,在對獲取的目標屬性數據進行預處理之后,所述方法還包括:對預處理后的對目標屬性數據進行字符離散化,得到設備故障維修信息數據集D。進一步地,所述動態關聯規則的支持度向量SV表示為:SV=[s(A∪B)1,s(A∪B)2,...,s(A∪B)n]其中,表示項集A∪B在子數據集Di中的支持度度量,st.表示約束條件,表示項集A∪B在子數據集Di中出現的頻數,|Di|為子數據集Di中的記錄數。進一步地,所述動態關聯規則的置信度向量CV表示為:其中,反映了項集A∪B在子數據集Di中的置信度度量,st.表示約束條件,為項集A∪B的SV中的第i個元素,為項集A的SV中的第i個元素。進一步地,所述動態關聯規則的支持度s表示為:其中,M是數據集D中的記錄數,表示項集A∪B在子數據集Di中出現的頻數。進一步地,所述動態關聯規則的置信度c表示為:其中,s(A∪B)為項集A∪B的支持度,sX為項集A的支持度。進一步地,所述按照定義的動態關聯規則算法,對n個子數據集D1,D2,...,Dn進行動態關聯規則挖掘,得到設備故障原因與維修措施之間的關聯關系包括:對每個時間段上的子數據集利用頻繁項集產生算法產生動態關聯規則左項和右項;確定所述動態關聯規則左項的支持度,所述動態關聯規則左項的支持度表示為:其中,表示動態關聯規則左項的支持度,表示動態關聯規則左項在時間段ti上的支持度向量,Mi表示與時間段ti上的子數據集Di中的記錄數Mi,M表示數據集D中總的記錄數;若所述動態關聯規則左項的支持度大于預設的支持度閾值,則確定所述動態關聯規則左右全項的支持度,所述動態關聯規則左右全項的支持度表示為:其中,sR表示動態關聯規則左右全項的支持度,sRi表示動態關聯規則左右全項在時間段ti上的支持度向量;通過公式確定動態關聯規則的置信度,其中,c表示動態關聯規則的置信度;判斷所述動態關聯規則的置信度是否大于預設的置信度閾值,若大于預設的置信度閾值,則根據挖掘得到的動態關聯規則,分析設備故障原因與維修措施之間的關聯關系。進一步地,所述方法還包括:建立時間序列回歸模型,預測動態關聯規則的發展趨勢。進一步地,所述方法還包括:在交互式可視化界面上,根據用戶點擊的預約維修日期,鏈接到相應的項集和關聯規則的挖掘結果界面;和/或,在交互式可視化界面上,根據用戶輸入的查詢條件進行匹配查詢,以列表的形式顯示相應的查詢結果,所述查詢條件包括:項集或關聯規則;和/或,在交互式可視化界面上,根據用戶選擇的關聯規則,以柱狀圖的形式顯示所述關聯規則的置信度。本專利技術的上述技術方案的有益效果如下:上述方案中,獲取設備故障維修信息數據集D;按照預約維修日期將獲取的設備故障維修信息數據集D劃分為n個子數據集D1,D2,...,Dn,其中,D={D1,D2,...,Dn};定義動態關聯規則算法,其中,動態關聯規則表示為:其中,A、B分別表示項集,SV表示支持度向量,CV表示置信度向量,s表示項集支持度,c表示動態關聯規則的置信度;按照定義的動態關聯規則算法,對n個子數據集D1,D2,...,Dn進行動態關聯規則挖掘,得到設備故障原因與維修措施之間的關聯關系,這樣,挖掘得到的動態關聯規則與獲取到的設備故障維修信息數據集D中的預約維修日期動態相關,從而能夠反映出挖掘得到的動態關聯規則與預約維修日期之間的關系。附圖說明圖1為本專利技術實施例提供的基于動態關聯規則的設備故障信息挖掘方法的流程示意圖;圖2為本專利技術實施例提供的設備所屬品牌分布示意圖;圖3為本專利技術實施例提供的設備所屬大類分布圖;圖4為本專利技術實施例提供的按照預約日期劃分后,預約維修日期分布示意圖;圖5為本專利技術實施例提供的故障原因分布圖;圖6為本專利技術實施例提供的組成關聯規則的置信度向量柱狀示意圖;圖7為本專利技術實施例提供的組成關聯規則的全項頻繁項集的支持度向量柱狀示意圖;圖8為本專利技術實施例提供的關聯規則全項頻繁項集支持度柱狀示意圖;圖9為本專利技術實施例提供的支持度回歸預測曲線;圖10為本專利技術實施例提供的Django架構的工作原理圖;圖11為本專利技術實施例提供的詳細結果頁面;圖12為本專利技術實施例提供的查詢頁面;圖13為本專利技術實施例提供的某規則置信度趨勢柱狀圖。具體實施方式為使本專利技術要解決的技術問題、技術方案和優點更加清楚,下面將結合附圖及具體實施例進行詳細描述。本專利技術針對現有的沒有考慮關聯規則隨著時間產生變化的問題,提供一種基于動態關聯規則的設備故障信息挖掘方法參看圖1所示,本專利技術實施例提供的基于動態關聯規則的設備故障信息挖掘方法,包括:S101,獲取設備故障維修信息數據集D;S102,按照預約維修日期將獲取的設備故障維修信息數據集D劃分為n個子數據集D1,D2,...,Dn,其中,D={D1,D2,...,Dn};S103,定義動態關聯規則算法,其中,動態關聯規則表示為:其中,A、B分別表示項集,SV表示支持度向量,CV表示置信度向量,s表示項集的支持度,c表示關聯規則的置信度,表示動態關聯規則的推理符號;S104,按照定義的動態關聯規則算法,對n個子數據集D1,D2,...,Dn進行動態關聯規則挖掘,得到設備故障原因與維修措施之間的關聯關系。本專利技術實施例所述的基于動態關聯規則的設備故障信息挖掘本文檔來自技高網...

【技術保護點】
一種基于動態關聯規則的設備故障信息挖掘方法,其特征在于,包括:獲取設備故障維修信息數據集D;按照預約維修日期將獲取的設備故障維修信息數據集D劃分為n個子數據集D
【技術特征摘要】
1.一種基于動態關聯規則的設備故障信息挖掘方法,其特征在于,包括:獲取設備故障維修信息數據集D;按照預約維修日期將獲取的設備故障維修信息數據集D劃分為n個子數據集D1,D2,...,Dn,其中,D={D1,D2,...,Dn};定義動態關聯規則算法,其中,動態關聯規則表示為:其中,A、B分別表示項集,SV表示支持度向量,CV表示置信度向量,s表示項集的支持度,c表示關聯規則的置信度,表示動態關聯規則的推理符號;按照定義的動態關聯規則算法,對n個子數據集D1,D2,...,Dn進行動態關聯規則挖掘,得到設備故障原因與維修措施之間的關聯關系。2.根據權利要求1所述的基于動態關聯規則的設備故障信息挖掘方法,其特征在于,所述獲取設備故障維修信息數據集D包括:獲取設備故障維修信息原始數據集;從獲取的設備故障維修信息原始數據集中,獲取目標屬性數據;對獲取的目標屬性數據進行預處理,所述預處理包括:處理目標屬性中的屬性缺失值,屬性格式不一致值和/或去掉冗余值。3.根據權利要求2所述的基于動態關聯規則的設備故障信息挖掘方法,其特征在于,在對獲取的目標屬性數據進行預處理之后,所述方法還包括:對預處理后的對目標屬性數據進行字符離散化,得到設備故障維修信息數據集D。4.根據權利要求1所述的基于動態關聯規則的設備故障信息挖掘方法,其特征在于,所述動態關聯規則的支持度向量SV表示為:其中,表示項集A∪B在子數據集Di中的支持度度量,st.表示約束條件,表示項集A∪B在子數據集Di中出現的頻數,|Di|為子數據集Di中的記錄數。5.根據權利要求1所述的基于動態關聯規則的設備故障信息挖掘方法,其特征在于,所述動態關聯規則的置信度向量CV表示為:其中,反映了項集A∪B在子數據集Di中的置信度度量,st.表示約束條件,為項集A∪B的SV中的第i個元素,為項集A的SV中的第i個元素。6.根據權利要求1所述的基于動態關聯規則的設...
【專利技術屬性】
技術研發人員:王玲,彭開香,
申請(專利權)人:北京科技大學,
類型:發明
國別省市:北京,11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。