本發明專利技術公開了一種基于回歸樹模型的碳排放量測算方法,步驟如下:S1、分析碳排放的來源和變化影響因子;碳排放來源和變化影響因子包括但不限于以下內容:化石燃料二氧化碳排放數據(ODIAC)、夜光數據、道路交通數據、地形因子,將各數據進行預處理并統一到相同的分辨率,進行數據匹配;S2、將處理后的變量數據組成建模數據集,利用回歸樹模型對匹配數據集進行建模;S3、統計每日的所有數據,利用搭建好的碳排放預測模型進行預測,得到區域全覆蓋的日尺度碳排放數據集。本發明專利技術采用上述的一種基于回歸樹模型的碳排放量測算方法,獲得高時空分辨率的、高覆蓋度的區域碳排放數據集。高覆蓋度的區域碳排放數據集。高覆蓋度的區域碳排放數據集。
【技術實現步驟摘要】
一種基于回歸樹模型的碳排放量測算方法
[0001]本專利技術涉及碳排放預測
,尤其是涉及一種基于回歸樹模型的碳排放量測算方法。
技術介紹
[0002]隨著工業化快速發展,人類活動導致的氣候變化問題已成為人類面臨的全球性問題。以二氧化碳為主的溫室氣體的過度排放成為影響全球氣候變化的主要因素,導致全球變暖,加劇氣候氣候系統的不穩定性,使臺風、干旱、高溫寒潮等極端天氣頻發,制約了經濟的發展,影響社會穩定和環境保護。
[0003]現有的碳排放測算方法按照設計思路大致可分為兩類,第一類是直接測算方法,即“自下而上”的從排放的源頭出發估算碳排放量;第二類是間接測算方法,即“自上而下”的基于各類觀測數據,從碳排放的來源和去向的影響因素出發,間接的估算碳排放量。
[0004]目前,被廣泛使用的“自下而上”的碳排放的測算方法有3種。第一種是排放因子法,這是由政府間氣候變化專門委員會(IPCC)提出的,其基本的思路是基于標準化協議,化石能源生產和消耗等各類經濟活動數據與不同部門來源的預先計算的排放因子相結合直接計算出對應的碳排放測算值,是使用范圍最廣的一種方法。其中,各類活動數據主要來自于政府統計的各類相關數據;排放因子也就是各組織提供的能源消耗與碳排放之間的排放系數。優點是簡單明了,方法成熟;缺點是容易忽略排放源內部的情況,當排放系統發生變化,導致排放因子相應變化時,可能不能恰當的處理。
[0005]第二種方法是質量平衡法,此方法依據質量平衡的原理,即為了滿足生產等需求,新生產的各類設備和物質應與消耗的相應物質等同,從而進行碳排放估算。該方法的優點是明確區分各類人工設施排放源和自然排放源之間的差異,從而反映碳排放發生地的實際排放量,在排放系統發生變化時可以較好的處理;但相應的缺點是需要考慮的因素過多,處理過程復雜,可能產生較多誤差,且數據獲取困難,是一種有待發展的方法。
[0006]最后一種是實測法,也就是直接根據需要實地測量數據,匯總得到總的碳排放量。此方法結果準確,但是成本高、投入大,因此,多數情況下是實地采樣,然后分析推算結果,這種情況下,獲取的樣本數據的代表性和精度可能存在問題。
[0007]而間接測算方法依賴于直接估算獲取的排放數據,但結合了地面觀測數據或者天基觀測數據,從而獲取時空分辨率更高更廣的碳排放估算數據。
[0008]總的來說,直接測算方法估計的碳排放量數據通常以行政區來劃分統計單元,這是因為收集的各類排放源的活動統計數據一般以省級或國家級為基本單元的。因此,難以對這些統計單元內部的碳排放的空間分布及數量變化進行研究分析,其時效性低,空間分辨率低。而間接測算方法雖然可以獲取空間分辨率更高的碳排放數據,但也存在數據缺失多,時間分辨率低等諸多問題,同時測算的精度也有待考慮。
技術實現思路
[0009]本專利技術的目的是提供一種基于回歸樹模型的碳排放量測算方法,獲得高時空分辨率的、高覆蓋度的區域碳排放數據集。
[0010]為實現上述目的,本專利技術提供了一種基于回歸樹模型的碳排放量測算方法,步驟如下:
[0011]S1、將數據導入CPU中,分析碳排放的來源和變化影響因子;
[0012]碳排放來源和變化影響因子包括但不限于以下內容:化石燃料CO2排放數據(ODIAC)、夜光數據、交通數據、地形因子,將各數據進行預處理并統一到相同的分辨率,進行數據匹配;
[0013]S2、將處理后的變量數據組成建模數據集,利用回歸樹模型對匹配數據集進行建模;
[0014]S3、統計每日的所有數據,利用搭建好的碳排放預測模型進行預測,得到區域全覆蓋的日尺度碳排放數據集。
[0015]優選的,步驟S1中,數據進行預處理并統一到相同分辨率的方法為:
[0016]利用化石燃料CO2排放數據ODIAC,其空間分辨率為1km
×
1km,時間分辨率為1月和1年,月度碳排放數據是由年度的碳排放數據根據碳排放季節變化分解得到的;其覆蓋范圍包含城市區域,同時其排放數據包含了區域整體的面源排放和發電廠的點源排放,因此進行分解獲取面源排放數據;
[0017]利用NPP衛星系統上搭載的可見光紅外成像輻射儀(VIIRS)提供的VNP46A2數據,其空間分辨率為15弧秒
×
15弧秒,時間分辨率為1天,該數據未去除異常燈光和背景噪聲的影響,通過高斯低通濾波去除噪聲;
[0018]利用CEC北美環境地圖集的10米比例的路網數據,計算區域內道路影響的權重;
[0019]將ODIAC數據、VIIRS/NPP數據、路網數據、地形和時間參數的數據在時間上統計到月平均,空間上統一到0.01
×
0.01網格內,獲取建模數據集。
[0020]優選的,步驟S2中,建模方法為:
[0021]通過匹配的數據集,利用回歸樹模型進行建模,并調整回歸樹中主要參數,并采用三種精度驗證方式對模型精度進行評估,分別是直接擬合結果對比、基于時間序列的十折交叉驗證結果對比、基于空間位置的十折交叉驗證結果對比。
[0022]優選的,回歸樹模型構建的流程如下:
[0023](1)選擇最佳待切分特征,首先,遍歷數據集對應特征的所有特征值,計算按該特征值進行數據集二分時的誤差;然后,選擇使得切分后的兩個子集的誤差最小的特征及其相應值作為最佳切分特征值;子集誤差用基尼指數表示,基尼指數表示一個隨機選中的樣本被分錯的概率,計算公式如下:
[0024][0025]p
k
表示選中的樣本屬于k類別的概率;
[0026]假設數據集為D,對每個特征A,按照其特征值可能取值a將數據集劃分為子集D1、D2,那么在特征A取值a時集合D的基尼指數Gini(D,A)為:
[0027][0028]其中|D|和|D1|表示集合中元素的數量;
[0029](2)對數據集進行切分,按照最佳切分特征將數據集切分為左右子樹,特征的值大于最佳切分特征的值則屬于左子樹,反之屬于右子樹,獲取左右子節點,若不能繼續切分,則作為葉子節點;
[0030](3)遞歸處理,最上述左右子節點遞歸調用步驟(1)(2),直至將訓練集空間切分完全,生成回歸樹;
[0031](4)基于回歸樹的預測,將待預測數據輸入回歸樹,獲取其特征值;首先,判斷當前回歸樹節點是否為葉子節點,如果是則做出預測,不是則將數據相應特征上的特征值與當前回歸樹節點的對應特征值作比較,判斷其應劃分為左子樹或右子樹,然后判斷對應的回歸樹的子樹是否為葉子節點,若不是葉子節點,則重復上述過程,直至找到葉子節點,如果是葉子節點,則進行預測;相應地,在右子樹也做這樣的判斷。
[0032]優選的,模型精度評估的指標包括但不限于決定系數R2、均方根誤差RMSE、平均絕對誤差MAE,其中R2、RMSE、MAE的公式如下所示:
[0033][0034]其中,y
′
i
表示模型預測的碳排放值,y
i
表示對應ODI本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種基于回歸樹模型的碳排放量測算方法,其特征在于,步驟如下:S1、將數據導入CPU中,分析碳排放的來源和變化影響因子;碳排放來源和變化影響因子包括但不限于以下內容:化石燃料二氧化碳排放數據ODIAC、夜光數據、道路交通數據、地形因子,將各數據進行預處理并統一到相同的分辨率,進行數據匹配;S2、將處理后的變量數據組成建模數據集,利用回歸樹模型對匹配數據集進行建模;S3、統計每日的所有數據,利用搭建好的碳排放預測模型進行預測,得到區域全覆蓋的日尺度碳排放數據集。2.根據權利要求1所述的一種基于回歸樹模型的碳排放量測算方法,其特征在于,步驟S1中,數據進行預處理并統一到相同分辨率的方法為:利用化石燃料CO2排放數據ODIAC,其空間分辨率為1km
×
1km,時間分辨率為1月和1年,月度碳排放數據是由年度的碳排放數據根據碳排放季節變化分解得到的;其覆蓋范圍包含城市區域,同時其排放數據包含了區域整體的面源排放和發電廠的點源排放,因此進行分解獲取面源排放數據;利用NPP衛星系統上搭載的可見光紅外成像輻射儀VIIRS提供的VNP46A2數據,其空間分辨率為15弧秒
×
15弧秒,時間分辨率為1天,通過高斯低通濾波去除噪聲;利用CEC北美環境地圖集的10米比例的路網數據,計算區域內道路影響的權重;將ODIAC數據、VIIRS/NPP數據、道路交通數據、地形和時間參數的數據在時間上統計到月平均,空間上統一到0.01
×
0.01網格內,獲取建模數據集。3.根據權利要求1所述的一種基于回歸樹模型的碳排放量測算方法,其特征在于,步驟S2中,建模方法為:通過匹配的數據集,利用回歸樹模型進行建模,并調整回歸樹中主要參數,并采用三種精度驗證方式對模型精度進行評估,分別是直接擬合結果對比、基于時間序列的十折交叉驗證結果對比、基于空間位置的十折交叉驗證結果對比。4.根據權利要求3所述的一種基于回歸樹模型的碳排放量測算方法,其特征在于,回歸樹模型構建的流程如下:(1)選擇最佳待切分特征,首先,遍歷數據集對應特征的所有特征值,計算按該特征值進行數據集二分時的誤差;然后,選擇使得切分后的兩個子集的誤差最小的特征及其相應值作為最佳切分特征值;子集誤差用基尼指數表示,基尼指數表示一個隨機選中的樣本被分錯的概率,計算公式如下:p
...
【專利技術屬性】
技術研發人員:王威,金志立,何俊辰,張儀瀟,
申請(專利權)人:中南大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。