【技術實現步驟摘要】
一種基于梯度提升樹的接觸網缺陷內因分析方法及裝置
[0001]本專利技術涉及軌道交通接觸網缺陷分析
,具體涉及一種基于梯度提升樹的接觸網缺陷內因分析方法及裝置。
技術介紹
[0002]接觸網是電氣化鐵路的基本組成部分,由于其結構復雜,零部件眾多和較為頻繁的弓網接觸,使得接觸網成為頻繁發生缺陷的電氣設備。接觸網運營工作中,缺陷致因因素分析(簡稱“內因分析”)是缺陷管理及有效減少缺陷的重要組成工作。現有的缺陷內因分析工作,主要是依據缺陷記錄和接觸網運維人員的從業經驗,通過簡單粗放的數據分析來實現。運維人員結合缺陷記錄數據,通過一定的猜想和試驗驗證來確定特定缺陷的致因因素。但是該方法有幾點缺陷,第一,過度依賴運維人員的從業經驗。第二,數據來源過于單一,導致缺陷分析維度不夠全面,分析不準確。第三,需要通過試驗反復驗證,成本過高且效率低。
技術實現思路
[0003]本專利技術目的在于提供一種基于梯度提升樹的接觸網缺陷內因分析方法及裝置,本專利技術方案以統計學中的多元回歸分析為總體思路,以梯度提升決策樹和梯度提升回歸樹為工具,通過對設計因素,制造因素,施工因素,運維因素,環境累積因素和其他因素等多維度因素分析實現對接觸網缺陷的內因分析。本專利技術使得接觸網缺陷內因分析更加準確、合理且全面,同時也提高了分析效率。
[0004]本專利技術通過下述技術方案實現:
[0005]第一方面,本專利技術提供了一種基于梯度提升樹的接觸網缺陷內因分析方法,該方法包括:
[0006]獲取歷史的接觸網缺陷 ...
【技術保護點】
【技術特征摘要】
1.一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,該方法包括:獲取歷史的接觸網缺陷詳細記錄數據和接觸網缺陷內因因素詳細數據;對所述接觸網缺陷詳細記錄數據和接觸網缺陷內因因素詳細數據進行數據預處理,得到預處理后的建模數據;根據所述建模數據,構建梯度提升樹模型,并進行模型訓練得到訓練后的綜合決策預測模型;利用內因因素在所述綜合決策預測模型各個節點的基尼不純度計算與缺陷相關聯的內因因素;獲取實時接觸網測量數據,并將所述實時接觸網測量數據輸入所述綜合決策預測模型中,計算缺陷發生概率,并輸出。2.根據權利要求1所述的一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,所述接觸網缺陷詳細記錄數據包括各類型電氣缺陷或者機械缺陷的相關數據,所述相關數據包括缺陷名稱、發生時間、發生地點和處理時間,所述發生地點包括支柱號和錨段號;所述接觸網缺陷內因因素詳細數據包括6個維度因素數據,所述6個維度因素包括設計因素,制造因素,施工因素,運維因素、環境累積因素和其他因素;各維度因素數據表至少包含支柱號和\或錨段號,以及該維度對應的各因素相關值。3.根據權利要求1所述的一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,所述數據預處理包括缺失值處理、“缺陷
?
內因”兩表聯合查詢處理和數據平衡處理。4.根據權利要求3所述的一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,所述“缺陷
?
內因”兩表聯合查詢處理是指以支柱號和\或錨段號為關聯字段,獲取缺陷發生位置的內因因素數據;查詢結果表至少包含支柱號和\或錨段號、缺陷名稱、發現時間和各因素相關值;所述數據平衡處理的處理過程為:統計接觸網中發生缺陷的位置數量和未發生缺陷的位置數量,計算所述發生缺陷的位置數量與未發生缺陷的位置數量的比值;當所述比值大于等于預設比值時,則發生缺陷的位置與未發生缺陷的位置的數據組合作為建模數據;當所述比值小于預設比值時,則根據未發生缺陷的位置對應數據進行混洗和隨機抽樣,隨機抽樣數量等于未發生缺陷的位置數量乘以預設比值,并將發生缺陷的位置與隨機抽樣提取的數據組合作為建模數據。5.根據權利要求1所述的一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,所述建模數據的表結構為支柱號、錨段號、缺陷名稱、發生時間、導高設計值、拉出值設計值、隧道類型和標簽。6.根據權利要求1所述的一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,所述綜合決策預測模型的表達式f(x)為:式中,x為接觸網各位置的內因因素數據,f
i
(x)為第i次提升學習的預測模型輸出的缺陷發生預測標簽,α
i
為該預測模型的權重,k為預測模型的個數。
7.根據權利要求6所述的一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,所述梯度提升樹模型是一種結合決策樹模型和提升算法而得到的模型;所述決策樹模型的模型訓練過程如下:步驟A,把所述建模數據記作內因因...
【專利技術屬性】
技術研發人員:李俊兵,張金鑫,熊昊睿,黃瀚韜,涂安洪,黃飛,唐子錢,
申請(專利權)人:成都智谷耘行信息技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。