• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于梯度提升樹的接觸網缺陷內因分析方法及裝置制造方法及圖紙

    技術編號:36692405 閱讀:29 留言:0更新日期:2023-02-27 20:01
    本發明專利技術公開了一種基于梯度提升樹的接觸網缺陷內因分析方法及裝置,包括:獲取歷史的接觸網缺陷詳細記錄數據和接觸網缺陷內因因素詳細數據;對接觸網缺陷詳細記錄數據和接觸網缺陷內因因素詳細數據進行數據預處理,得到預處理后的建模數據;根據建模數據,構建梯度提升樹模型,并進行模型訓練得到訓練后的綜合決策預測模型;獲取實時接觸網測量數據,并將實時接觸網測量數據輸入綜合決策預測模型中,利用內因因素在綜合決策預測模型各個節點的基尼不純度計算缺陷內因分析結果并輸出;其中,缺陷內因分析結果包括缺陷發生概率及與缺陷相關聯的內因因素。本發明專利技術使得接觸網缺陷內因分析更加準確、合理且全面,同時也提高了分析效率。析效率。析效率。

    【技術實現步驟摘要】
    一種基于梯度提升樹的接觸網缺陷內因分析方法及裝置


    [0001]本專利技術涉及軌道交通接觸網缺陷分析
    ,具體涉及一種基于梯度提升樹的接觸網缺陷內因分析方法及裝置。

    技術介紹

    [0002]接觸網是電氣化鐵路的基本組成部分,由于其結構復雜,零部件眾多和較為頻繁的弓網接觸,使得接觸網成為頻繁發生缺陷的電氣設備。接觸網運營工作中,缺陷致因因素分析(簡稱“內因分析”)是缺陷管理及有效減少缺陷的重要組成工作。現有的缺陷內因分析工作,主要是依據缺陷記錄和接觸網運維人員的從業經驗,通過簡單粗放的數據分析來實現。運維人員結合缺陷記錄數據,通過一定的猜想和試驗驗證來確定特定缺陷的致因因素。但是該方法有幾點缺陷,第一,過度依賴運維人員的從業經驗。第二,數據來源過于單一,導致缺陷分析維度不夠全面,分析不準確。第三,需要通過試驗反復驗證,成本過高且效率低。

    技術實現思路

    [0003]本專利技術目的在于提供一種基于梯度提升樹的接觸網缺陷內因分析方法及裝置,本專利技術方案以統計學中的多元回歸分析為總體思路,以梯度提升決策樹和梯度提升回歸樹為工具,通過對設計因素,制造因素,施工因素,運維因素,環境累積因素和其他因素等多維度因素分析實現對接觸網缺陷的內因分析。本專利技術使得接觸網缺陷內因分析更加準確、合理且全面,同時也提高了分析效率。
    [0004]本專利技術通過下述技術方案實現:
    [0005]第一方面,本專利技術提供了一種基于梯度提升樹的接觸網缺陷內因分析方法,該方法包括:
    [0006]獲取歷史的接觸網缺陷詳細記錄數據和接觸網缺陷內因因素詳細數據;
    [0007]對所述接觸網缺陷詳細記錄數據和接觸網缺陷內因因素詳細數據進行數據預處理,得到預處理后的建模數據;
    [0008]根據所述建模數據,構建梯度提升樹模型,并進行模型訓練得到訓練后的綜合決策預測模型;
    [0009]利用內因因素在所述綜合決策預測模型各個節點的基尼不純度計算與缺陷相關聯的內因因素;獲取實時接觸網測量數據,并將所述實時接觸網測量數據輸入所述綜合決策預測模型中,計算缺陷發生概率,并輸出。
    [0010]進一步地,所述接觸網缺陷詳細記錄數據包括各類型電氣缺陷或者機械缺陷的相關數據,所述相關數據包括缺陷名稱、發生時間、發生地點和處理時間,所述發生地點包括支柱號和錨段號;
    [0011]所述接觸網缺陷內因因素詳細數據包括6個維度因素數據,所述6個維度因素包括設計因素,制造因素,施工因素,運維因素、環境累積因素和其他因素;
    [0012]各維度因素數據表至少包含支柱號和\或錨段號,以及該維度對應的各因素相關
    值。
    [0013]進一步地,所述數據預處理包括缺失值處理、“缺陷
    ?
    內因”兩表聯合查詢處理和數據平衡處理。
    [0014]進一步地,所述缺失值處理是針對每個因素的數據字段進行處理。如果某因素的數據缺失量占字段數據總量的比例大于等于預設的缺失值處理閾值a,則刪除該字段;如果該比例小于預設的缺失值處理閾值a,則該字段的缺失值用該字段的均值來代替;
    [0015]所述“缺陷
    ?
    內因”兩表聯合查詢處理是指以支柱號和\或錨段號為關聯字段,獲取缺陷發生位置的內因因素數據;查詢結果表至少包含支柱號和\或錨段號、缺陷名稱、發現時間和各因素相關值等;
    [0016]所述數據平衡處理的處理過程為:統計接觸網中發生缺陷的位置數量和未發生缺陷的位置數量,計算所述發生缺陷的位置數量與未發生缺陷的位置數量的比值;當所述比值大于等于預設比值時,則發生缺陷的位置與未發生缺陷的位置的數據組合作為建模數據;當所述比值小于預設比值時,則根據未發生缺陷的位置對應數據進行混洗和隨機抽樣,隨機抽樣數量等于未發生缺陷的位置數量乘以預設比值,并將發生缺陷的位置與隨機抽樣提取的數據組合作為建模數據。
    [0017]進一步地,所述建模數據的表結構為支柱號、錨段號、缺陷名稱、發生時間、導高設計值、拉出值設計值、隧道類型和標簽;其中如果接觸網某位置發生缺陷,則該位置的標簽值為1;如果接觸網某位置未發生缺陷,則該位置的標簽值為0。
    [0018]進一步地,所述綜合決策預測模型的表達式f(x)為:
    [0019][0020]式中,x為接觸網各位置的內因因素數據,f
    i
    (x)為第i次提升學習的預測模型輸出的缺陷發生預測標簽,α
    i
    為該預測模型的權重,k為預測模型的個數。
    [0021]進一步地,所述梯度提升樹模型是一種結合決策樹模型和提升算法而得到的模型;所述決策樹模型是指針對研究對象的類別進行預測的樹狀模型。模型訓練過程如下:
    [0022]步驟A,把所述建模數據記作內因因數數據、缺陷發生標簽和閾值作為輸入,輸入到決策樹模型中;
    [0023]步驟B,根據所述內因因數數據中每個特征字段,計算決策樹分叉前后的基尼不純度系數;
    [0024]步驟C,根據所述基尼不純度系數,選擇使所述基尼不純度系數最小的內因因素字段作為該節點的切分字段;根據所述切分字段的取值或者分界值生成節點分支;
    [0025]步驟D,在生成的節點分支上遞歸地重復步驟B和步驟C,直到所有分支的基尼不純度系數或信息增益均方差小于閾值,結束。
    [0026]進一步地,所述提升算法的執行過程如下:
    [0027]輸入樣本數據集,初始化訓練數據的初始權重;根據所述初始權重進行數據權重化,并進行第一次建模訓練得到第一個預測模型;計算所述第一個預測模型的誤差率和所述第一個預測模型的模型權重;
    [0028]根據所述第一個預測模型的誤差率和所述第一個預測模型的模型權重去更新訓
    練數據的權重,根據更新后訓練數據的權重再次進行數據權重化,并進行第二次建模訓練得到第二個預測模型;計算所述第二個預測模型的誤差率和所述第二個預測模型的模型權重;
    [0029]重復上述循環過程,直至計算得到第k個預測模型和第k個預測模型的模型權重;
    [0030]根據以上k個預測模型及每個預測模型相應的權重,得到綜合決策預測模型。
    [0031]進一步地,所述缺陷發生概率指的是各內因因素對缺陷發生情況的影響程度;所述缺陷發生概率f(x)的計算公式為:
    [0032][0033]式中,x為接觸網各位置的內因因素數據,f
    i
    (x)為第i次提升學習的預測模型輸出的缺陷發生預測標簽,α
    i
    為該預測模型的權重,k為預測模型的個數;
    [0034]所述與缺陷相關聯的內因因素指的是將所有內因因素的重要性進行降序排列后得到的與相應缺陷相關性最高的內因因素;內因因素X在所有模型所有節點的重要性的算術平均值即為因素X與該缺陷的發生情況的關聯程度,如下公式:
    [0035][0036]式中,M為梯度提升樹模型中的節點個數,Importance_X
    m
    內因因素X在第m個節點重要性。
    [0037]第二方面,本專利技術又提供了一種基于梯度提升樹的接觸網缺陷內因本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,該方法包括:獲取歷史的接觸網缺陷詳細記錄數據和接觸網缺陷內因因素詳細數據;對所述接觸網缺陷詳細記錄數據和接觸網缺陷內因因素詳細數據進行數據預處理,得到預處理后的建模數據;根據所述建模數據,構建梯度提升樹模型,并進行模型訓練得到訓練后的綜合決策預測模型;利用內因因素在所述綜合決策預測模型各個節點的基尼不純度計算與缺陷相關聯的內因因素;獲取實時接觸網測量數據,并將所述實時接觸網測量數據輸入所述綜合決策預測模型中,計算缺陷發生概率,并輸出。2.根據權利要求1所述的一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,所述接觸網缺陷詳細記錄數據包括各類型電氣缺陷或者機械缺陷的相關數據,所述相關數據包括缺陷名稱、發生時間、發生地點和處理時間,所述發生地點包括支柱號和錨段號;所述接觸網缺陷內因因素詳細數據包括6個維度因素數據,所述6個維度因素包括設計因素,制造因素,施工因素,運維因素、環境累積因素和其他因素;各維度因素數據表至少包含支柱號和\或錨段號,以及該維度對應的各因素相關值。3.根據權利要求1所述的一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,所述數據預處理包括缺失值處理、“缺陷
    ?
    內因”兩表聯合查詢處理和數據平衡處理。4.根據權利要求3所述的一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,所述“缺陷
    ?
    內因”兩表聯合查詢處理是指以支柱號和\或錨段號為關聯字段,獲取缺陷發生位置的內因因素數據;查詢結果表至少包含支柱號和\或錨段號、缺陷名稱、發現時間和各因素相關值;所述數據平衡處理的處理過程為:統計接觸網中發生缺陷的位置數量和未發生缺陷的位置數量,計算所述發生缺陷的位置數量與未發生缺陷的位置數量的比值;當所述比值大于等于預設比值時,則發生缺陷的位置與未發生缺陷的位置的數據組合作為建模數據;當所述比值小于預設比值時,則根據未發生缺陷的位置對應數據進行混洗和隨機抽樣,隨機抽樣數量等于未發生缺陷的位置數量乘以預設比值,并將發生缺陷的位置與隨機抽樣提取的數據組合作為建模數據。5.根據權利要求1所述的一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,所述建模數據的表結構為支柱號、錨段號、缺陷名稱、發生時間、導高設計值、拉出值設計值、隧道類型和標簽。6.根據權利要求1所述的一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,所述綜合決策預測模型的表達式f(x)為:式中,x為接觸網各位置的內因因素數據,f
    i
    (x)為第i次提升學習的預測模型輸出的缺陷發生預測標簽,α
    i
    為該預測模型的權重,k為預測模型的個數。
    7.根據權利要求6所述的一種基于梯度提升樹的接觸網缺陷內因分析方法,其特征在于,所述梯度提升樹模型是一種結合決策樹模型和提升算法而得到的模型;所述決策樹模型的模型訓練過程如下:步驟A,把所述建模數據記作內因因...

    【專利技術屬性】
    技術研發人員:李俊兵張金鑫熊昊睿黃瀚韜涂安洪黃飛唐子錢
    申請(專利權)人:成都智谷耘行信息技術有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: av无码免费一区二区三区| 亚洲熟妇无码AV在线播放| 无码国内精品久久人妻麻豆按摩 | 无码av中文一区二区三区桃花岛| 亚洲6080yy久久无码产自国产| 日韩少妇无码喷潮系列一二三 | 免费A级毛片无码视频| 欧美性生交xxxxx无码影院∵| 国产亚洲精品无码专区| 亚洲av片不卡无码久久| 亚洲中久无码永久在线观看同| 亚洲av无码一区二区三区四区 | 亚洲第一极品精品无码久久| 人妻中文字幕AV无码专区| 无码免费一区二区三区免费播放| 国产av无码久久精品| 久久无码人妻一区二区三区| 少妇性饥渴无码A区免费 | 无码高潮爽到爆的喷水视频app| av无码人妻一区二区三区牛牛 | 中文字幕无码中文字幕有码| 日韩av无码免费播放 | 亚洲人av高清无码| 国产网红无码精品视频| 国产午夜无码片免费| 办公室丝袜激情无码播放| 日韩精品无码Av一区二区| 日韩人妻无码精品无码中文字幕| 亚州AV综合色区无码一区| 精品久久久久久久无码久中文字幕 | 国产在线观看无码免费视频| 国产乱人伦中文无无码视频试看| 亚洲av午夜精品无码专区| 蜜桃无码AV一区二区| 精品无码人妻夜人多侵犯18 | 无码人妻一区二区三区免费n鬼沢 无码人妻一区二区三区免费看 | 亚洲动漫精品无码av天堂| 国产精品亚洲а∨无码播放不卡 | 无码人妻AV免费一区二区三区| 中文字字幕在线中文无码| 国产av永久无码天堂影院|