本發明專利技術屬于分布式光伏集群處理技術領域,具體提供一種分布式光伏集群劃分方法、裝置、設備及存儲介質,所述方法包括如下步驟:收集光伏電站數據,包括光伏電站的容量、位置、光伏電池板的傾角和朝向;從收集的光伏電站數據中選擇作為集群劃分依據的特征參數,并基于選擇的特征參數,計算區域內各場站的樣本向量;對樣本向量進行歸一化處理;采用最大期望聚類算法獲得集群聚類結果;基于獲得的集群聚類結果對目標集群進行集群劃分。將光伏電站采集數據后的預處理,以及后續的集群快速可靠的以最大期望算法模式計算出來進行劃分。在數據預處理時保證了數據的可靠性以及準確性。時保證了數據的可靠性以及準確性。時保證了數據的可靠性以及準確性。
【技術實現步驟摘要】
分布式光伏場景下的集群劃分方法、裝置、設備及介質
[0001]本專利技術涉及分布式光伏集群處理
,具體涉及分布式光伏場景下的集群劃分方法、裝置、設備及介質。
技術介紹
[0002]隨著全球能源需求的增長和環境問題的日益嚴峻,分布式光伏發電逐漸成為可持續能源的重要組成部分。分布式光伏發電是指將光伏電站建在分散的地方,而不是在一個集中的地方,這種發電方式具有靈活性高、地域覆蓋范圍廣等優勢。然而,隨著分布式光伏發電規模的不斷擴大,如何高效地管理和優化分布式光伏發電集群成為了一個重要的問題。
[0003]以集群為單位對配電網進行規劃主要包含集群劃分與集群規劃兩方面研究內容。在集群劃分方面,目前的分布式光伏集群劃分方法主要是基于統計數據和地理位置進行劃分,這種方法不能充分考慮光伏電站之間的相互影響和影響因素的復雜性。因此,該方法可能導致集群內光伏電站之間存在巨大的差異性,不能實現最優的資源利用。目前的分布式光伏集群劃分方法主要著眼于集群內部的劃分,缺少對集群之間協作的考慮。因此,在多個集群之間無法實現有效的資源共享和協同運營,也無法實現能源負荷平衡的最優化配置。分布式光伏集群由于其分布性和規模性,管理和維護難度較大,需要大量的人力和物力投入,而且在集群內光伏電站數量增加時,管理和維護的難度也會逐漸加大。
技術實現思路
[0004]針對現有集群劃分導致集群內光伏電站之間存在巨大的差異性,不能實現最優的資源利用的問題,本專利技術提供分布式光伏場景下的集群劃分方法、裝置、設備及介質。
[0005]第一方面,本專利技術技術方案提供一種分布式光伏場景下的集群劃分方法,包括如下步驟:
[0006]收集光伏電站數據,包括光伏電站的容量、位置、光伏電池板的傾角和朝向;
[0007]從收集的光伏電站數據中選擇作為集群劃分依據的特征參數,并基于選擇的特征參數,計算區域內各場站的樣本向量;
[0008]對樣本向量進行歸一化處理;
[0009]采用最大期望聚類算法獲得集群聚類結果;
[0010]基于獲得的集群聚類結果對目標集群進行集群劃分。
[0011]作為本專利技術技術方案的進一步限定,從收集的光伏電站數據中選擇作為集群劃分依據的特征參數的步驟之前包括:
[0012]對收集的光伏電站數據進行數據預處理。
[0013]作為本專利技術技術方案的進一步限定,對收集的光伏電站數據進行數據預處理的步驟包括:
[0014]對收集的光伏電站數據進行數據清洗;
[0015]將清洗后的數據進行數據集成生成數據集。
[0016]作為本專利技術技術方案的進一步限定,對收集的光伏電站數據進行數據清洗的步驟包括:
[0017]去除唯一屬性進行數據清洗;
[0018]對清洗后的數據進行缺失值處理;
[0019]將缺失值處理后的數據進行特征二元化將數值型的屬性轉換為布爾值的屬性。
[0020]作為本專利技術技術方案的進一步限定,將清洗后的數據進行數據集成生成數據集的步驟之后還包括:
[0021]采用十折交叉驗證的方式將數據集劃分為訓練集和驗證集。
[0022]作為本專利技術技術方案的進一步限定,采用十折交叉驗證的方式將數據集劃分為訓練集和驗證集的步驟包括:
[0023]把數據集分割成K個不重合的子數據集;
[0024]做K次模型訓練和驗證;每一次,使用一個子數據集驗證模型,并使用其它K
?
1個子數據集來訓練模型;
[0025]對K次訓練誤差和驗證誤差分別求平均得到訓練集和驗證集。
[0026]作為本專利技術技術方案的進一步限定,采用最大期望聚類算法獲得集群聚類結果的步驟包括:
[0027]輸入樣本向量的特征,包括光伏集群電站數據、集群數量N、聚類特征;
[0028]隨機選擇N個樣本作為各簇質心;即原質心;
[0029]計算樣本i到各簇質心之間的距離dist(Xi,Yi);
[0030]找到距離i最近的質心;
[0031]根據簇中的所有樣本點計算新質心;
[0032]當計算出的新質心與原質心的距離小于設定閾值時,獲得集群聚類結果。
[0033]第二方面,本專利技術技術方案還提供一種分布式光伏場景下的集群劃分裝置,包括數據收集模塊、樣本向量計算模塊、歸一化處理模塊、聚類計算模塊和執行劃分模塊;
[0034]數據收集模塊,用于收集光伏電站數據,包括光伏電站的容量、位置、光伏電池板的傾角和朝向;
[0035]樣本向量計算模塊,用于從收集的光伏電站數據中選擇作為集群劃分依據的特征參數,并基于選擇的特征參數,計算區域內各場站的樣本向量;
[0036]歸一化處理模塊,用于對樣本向量進行歸一化處理;
[0037]聚類計算模塊,用于采用最大期望聚類算法獲得集群聚類結果;
[0038]執行劃分模塊,用于基于獲得的集群聚類結果對目標集群進行集群劃分。
[0039]作為本專利技術技術方案的進一步限定,該裝置還包括預處理模塊,用于對收集的光伏電站數據進行數據預處理。
[0040]預處理模塊包括數據清洗單元和數據集成單元;
[0041]數據清洗單元,用于對收集的光伏電站數據進行數據清洗;
[0042]數據集成單元,用于將清洗后的數據進行數據集成生成數據集。
[0043]作為本專利技術技術方案的進一步限定,數據清洗單元,具體用于去除唯一屬性進行數據清洗;對清洗后的數據進行缺失值處理;將缺失值處理后的數據進行特征二元化將數
值型的屬性轉換為布爾值的屬性。
[0044]作為本專利技術技術方案的進一步限定,數據預處理模塊還包括數據集劃分單元,用于采用十折交叉驗證的方式將數據集劃分為訓練集和驗證集。
[0045]作為本專利技術技術方案的進一步限定,數據集劃分單元,具體用于把數據集分割成K個不重合的子數據集;做K次模型訓練和驗證;每一次,使用一個子數據集驗證模型,并使用其它K
?
1個子數據集來訓練模型;對K次訓練誤差和驗證誤差分別求平均得到訓練集和驗證集。
[0046]作為本專利技術技術方案的進一步限定,聚類計算模塊,具體用于接收輸入的樣本向量的特征,包括光伏集群電站數據、集群數量N、聚類特征;隨機選擇N個樣本作為各簇質心;即原質心;計算樣本i到各簇質心之間的距離dist(Xi,Yi);找到距離i最近的質心;根據簇中的所有樣本點計算新質心;當計算出的新質心與原質心的距離小于設定閾值時,獲得集群聚類結果。
[0047]第三方面,本專利技術技術方案還提供一種電子設備,所述電子設備包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;存儲器存儲有可被至少一個處理器執行的計算機程序指令,所述計算機程序指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行如第一方面所述的分布式光伏場景下的集群劃分方法。
[0048]第四方面,本專利技術技術方案還提供一種非暫態計算機可讀存儲介質,所述非暫態計本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種分布式光伏場景下的集群劃分方法,其特征在于,包括如下步驟:收集光伏電站數據,包括光伏電站的容量、位置、光伏電池板的傾角和朝向;從收集的光伏電站數據中選擇作為集群劃分依據的特征參數,并基于選擇的特征參數,計算區域內各場站的樣本向量;對樣本向量進行歸一化處理;采用最大期望聚類算法獲得集群聚類結果;基于獲得的集群聚類結果對目標集群進行集群劃分。2.根據權利要求1所述的分布式光伏場景下的集群劃分方法,其特征在于,從收集的光伏電站數據中選擇作為集群劃分依據的特征參數的步驟之前包括:對收集的光伏電站數據進行數據預處理。3.根據權利要求2所述的分布式光伏場景下的集群劃分方法,其特征在于,對收集的光伏電站數據進行數據預處理的步驟包括:對收集的光伏電站數據進行數據清洗;將清洗后的數據進行數據集成生成數據集。4.根據權利要求3所述的分布式光伏場景下的集群劃分方法,其特征在于,對收集的光伏電站數據進行數據清洗的步驟包括:去除唯一屬性進行數據清洗;對清洗后的數據進行缺失值處理;將缺失值處理后的數據進行特征二元化將數值型的屬性轉換為布爾值的屬性。5.根據權利要求4所述的分布式光伏場景下的集群劃分方法,其特征在于,將清洗后的數據進行數據集成生成數據集的步驟之后還包括:采用十折交叉驗證的方式將數據集劃分為訓練集和驗證集。6.根據權利要求5所述的分布式光伏場景下的集群劃分方法,其特征在于,采用十折交叉驗證的方式將數據集劃分為訓練集和驗證集的步驟包括:把數據集分割成K個不重合的子數據集;做K次模型訓練和驗證;每一次,使用一個子數據集驗證模型,并使用其它K
?
1個子數據集來訓練模型;對K次訓練誤差和驗證誤差分別求平均得...
【專利技術屬性】
技術研發人員:肖鈞浩,劉玉民,張楠,高麗媛,馬紅月,明萌,陳雪瑞,崔明濤,李春陽,張沛堯,郭文靜,李加浩,秦偉明,林靜雯,李天陽,楊旭昕,
申請(專利權)人:國網信息通信產業集團有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。