【技術實現步驟摘要】
本專利技術屬于電力信息化系統運維,涉及一種故障原因分析方法,尤其是一種電力信息化系統故障原因分析方法。
技術介紹
1、i6000是國網信息通信運維的核心支撐系統。該平臺是集“調度、運行、檢修、客服、三線”于一體的信息通信一體化調度運行支撐平臺,可以大幅提升國網電力信息通信運行保障能力、信息通信業務共享融合能力、信息通信優質服務能力。該系統具有以下特點:1.全生命周期管理:國網i6000系統可以對信息設備進行全生命周期管理,包括設備采購、入庫、維修、報廢等環節,實現設備信息的全面管理;2.自動化運維:國網i6000系統可以實現自動化巡檢、自動部署等功能,減少人工干預,提高運維效率;3.實時監控:國網i6000系統可以實時監控信息系統的運行狀態,及時發現問題并進行處理,保障信息系統的穩定運行;4.數據分析:國網i6000系統可以對信息設備和系統運行數據進行分析,提供數據支持,為決策提供依據。
2、隨著電力信息化系統的復雜性不斷增加,對這些系統進行高效和有效管理的需求也在增長。這時,aiops(人工智能運維)就顯得尤為重要——它將人工智能(ai)和機器學習(ml)應用于it運維領域。aiops能夠自動化許多it流程,為系統性能、安全性等指標提供更快速、更準確的洞察。在aiops中,根本原因分析是一個關鍵環節,它對于找出it問題的根源至關重要。
3、根本原因分析是一種用于識別it運維中問題根源的方法。這個過程通常包括一系列步驟,目的是追溯問題至其源頭。盡管這種方法是it運維的重要組成部分,但傳統的根本原因分析方法
4、傳統方法的一個主要問題是需要大量的人工操作。分析師需要收集數據、分析數據并找出問題的根本原因,這可能需要數小時甚至數天的時間。這種手動過程不僅耗時,而且容易出錯,因為分析師可能會遺漏關鍵數據或做出錯誤的推斷。
5、此外,傳統的根本原因分析方法在識別復雜問題的根源時可能存在困難。在多個問題相互關聯的情況下,沒有對系統全面的理解,很難準確找出問題的根源。
6、因此,未解決上述問題,本專利技術提出一種電力信息化系統故障原因分析方法。
7、經檢索,未發現與本專利技術相同或相似的現有技術的公開文獻。
技術實現思路
1、本專利技術的目的在于克服現有技術的不足,提出一種電力信息化系統故障原因分析方法,能夠提高系統故障排查和定位的效率。
2、本專利技術解決其現實問題是采取以下技術方案實現的:
3、一種電力信息化系統故障原因分析方法,包括以下步驟:
4、步驟1、離線階段,根據電力業務系統文檔和運維人員的知識經驗構建故障分析決策樹,并注冊診斷過程中需要使用的各類api工具;
5、步驟2、在線階段,根據系統中發生的故障生成故障描述,然后根據故障描述中的關鍵詞匹配步驟1中的故障分析決策樹,之后由控制程序遍歷故障分析決策樹,將故障描述、樹中結點的執行決策、可調用api工具、歷史故障信息組合成提示詞模板發送給大模型,令大模型分析系統故障的根本原因。
6、而且,所述步驟1的具體步驟包括:
7、(1)離線階段,首先需要收集電力業務系統文檔,文檔中包括各領域的故障案例以及對應的解決方案;
8、(2)根據文檔構建故障分析決策樹,并在注冊診斷過程中能夠調用系統接口的api工具。
9、而且,所述步驟1第(2)步中構建故障分析決策樹的具體步驟包括:
10、①預設一個故障分類集合:{cpu故障處理流程,i/o故障處理流程}
11、②遍歷集合,使用關鍵詞匹配算法檢索文檔中的相關故障及解決方案;
12、③總結故障解決方案,生成故障分析決策樹。
13、而且,所述步驟1第(2)步中在注冊診斷過程中能夠調用系統接口的api工具的具體方法為:
14、動態注冊api工具,使大模型能通過api接口獲取電力業務系統參數;此外還應建立api工具與決策樹節點間的關聯關系;
15、所述建立決策樹節點與api工具關聯關系的步驟包括:
16、①為每個api工具添加功能標簽;
17、②在需要調用參數的決策樹節點中標注所需的功能標簽;
18、③訪問需要調用參數的決策樹節點時,系統根據標簽匹配,向大模型提供需要調用的api工具接口。
19、而且,所述步驟2的具體步驟包括:
20、(1)在線分析階段中,首先生成提示詞模板,以引導大模型分析故障;
21、(2)生成提示詞模板后,會根據故障涉及領域數量,選擇執行基于樹搜索的根因分析算法或多模型協同分析算法,最終得到根因描述。
22、而且,所述步驟2第(1)步中所生成提示詞模板包括:故障描述、故障分析決策、可利用的工具集合和歷史故障信息;其中,故障描述由系統監控工具生成,故障分析決策由控制程序遍歷故障分析決策樹獲得,可利用的工具集合由節點中的標簽訪問,歷史故障信息由故障描述中的關鍵詞檢索獲得。
23、而且,所述步驟2的第(2)步的具體步驟包括:
24、①單領域異常時,采用基于樹搜索的根因分析方法得到根因描述;
25、其具體步驟包括:
26、1)調用大模型分析故障:
27、提示詞模板輸入至大模型后,大模型會根據決策樹中的內容及自身知識分析故障;如節點內容包括獲取指定參數和該參數的正常閾值,該步驟則會先令大模型調用相應的系統api獲取所需參數,然后再結合參數結果,決策樹中的內容及自身知識分析故障。
28、2)結果判定與路徑選擇:
29、基于節點執行結果選擇下一步決策;若滿足決策節點中故障判斷條件下一個節點不是葉子節點,則需遍歷下一個節點;若下一個節點是葉子節點,則說明找到根因,讀取葉子節點信息輸出根因分析報告;若不滿足判斷條件,說明不是當前路徑的故障,執行另一條決策路徑。
30、3)其他情況處理:
31、當預設的故障診斷決策樹中的節點訪問完畢且還未找到故障根因時,大模型會使用提示詞總結已完成的診斷路徑和已排除的可能性,隨后將基于其預訓練知識庫,結合已收集的系統狀態數據執行自主推理分析,最終生成故障根因。
32、②多領域異常時,采用多模型協同分析算法得到根因描述;
33、其具體步驟包括:
34、1)故障分析決策樹分配:根據故障描述匹配故障領域,然后為每個領域分配一個大模型。當故障描述中涉及cpu使用率故障與i/o等待時間過高的耦合的問題,則會調用兩個大模型,并在第一個模型的提示詞模板中使用cpu領域故障處理流程決策樹以及相關api工具,在第二個模型的提示詞模板中使用i/o領域故障處理流程決策樹以及相關api工具;
35、2)執行診斷:分別執行基于決策樹引導的根因分析算法;
36、3)結果合并:合并多個模型的分析結果,最終生成一份根因分析報告。
37、本文檔來自技高網...
【技術保護點】
1.一種電力信息化系統故障原因分析方法,其特征在于:包括以下步驟:
2.根據權利要求1所述的一種電力信息化系統故障原因分析方法,其特征在于:所述步驟1的具體步驟包括:
3.根據權利要求2所述的一種電力信息化系統故障原因分析方法,其特征在于:所述步驟1第(2)步中構建故障分析決策樹的具體步驟包括:
4.根據權利要求2所述的一種電力信息化系統故障原因分析方法,其特征在于:所述步驟1第(2)步中在注冊診斷過程中能夠調用系統接口的API工具的具體方法為:
5.根據權利要求1所述的一種電力信息化系統故障原因分析方法,其特征在于:所述步驟2的具體步驟包括:
6.根據權利要求5所述的一種電力信息化系統故障原因分析方法,其特征在于:所述步驟2第(1)步中所生成提示詞模板包括:故障描述、故障分析決策、可利用的工具集合和歷史故障信息;其中,故障描述由系統監控工具生成,故障分析決策由控制程序遍歷故障分析決策樹獲得,可利用的工具集合由節點中的標簽訪問,歷史故障信息由故障描述中的關鍵詞檢索獲得。
7.根據權利要求5所述的一種電力信息化
...【技術特征摘要】
1.一種電力信息化系統故障原因分析方法,其特征在于:包括以下步驟:
2.根據權利要求1所述的一種電力信息化系統故障原因分析方法,其特征在于:所述步驟1的具體步驟包括:
3.根據權利要求2所述的一種電力信息化系統故障原因分析方法,其特征在于:所述步驟1第(2)步中構建故障分析決策樹的具體步驟包括:
4.根據權利要求2所述的一種電力信息化系統故障原因分析方法,其特征在于:所述步驟1第(2)步中在注冊診斷過程中能夠調用系統接口的api工具的具體方法為:
5.根據權利要求1所述的一種電力信...
【專利技術屬性】
技術研發人員:李妍,劉瑩,柏峻峰,羅大勇,張倩宜,王旭東,江黛茹,郭曉艷,張旭,何金,孫軼凡,王梓蒴,趙迪,董陽,常曉潤,謝浩,孫先范,馬永,趙煜陽,馮曉文,覃勇杰,王文娟,童磊,胡游君,康睿,張南京,韓少聰,唐海榮,周振煜,柏永飛,嚴晴,阮冬玲,倪洋,周晨曦,薛紫薇,張鶴譯,
申請(專利權)人:國網天津市電力公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。