【技術實現步驟摘要】
本專利技術涉及商圈客流量預測,尤其是涉及一種基于圖神經網絡的商圈客流量預測方法、系統及裝置。
技術介紹
1、目前,對商圈客流量的預測方法,已經由傳統模型向機器學習模型發展。最常用的傳統模型如:重力模型、泊松回歸等,具有較好的解釋度,但由于公式簡單,參數來自經驗值,無法很好地捕捉非線性和不規則的模式,難以對復雜的人類流動模式進行精確建模,也無法對城市不同區域的客流量進行預測。
2、現有的機器學習模型,雖然能夠在一定程度上模擬客流的復雜模式,但是往往忽略了人群在城市之內流動形成的空間交互網絡的結構特征以及地點之間的空間鄰近效應,也沒有考慮客源地的經濟屬性對商圈客流量的影響,所以不能在精細尺度下對交通小區到商圈的客流量進行準確預測。
技術實現思路
1、本專利技術的目的在于提供一種基于圖神經網絡的商圈客流量預測方法、系統及裝置,以解決現有技術中存在的至少一種上述技術問題。
2、第一方面,為解決上述技術問題,本專利技術提供了一種基于圖神經網絡的商圈客流量預測方法,包括如下步驟:
3、步驟1、基于交通小區集合及商圈集合,構建商圈客流量預測的特征空間,包括od流特征、商圈特征及交通小區特征。
4、在一種可行的實施方式中,所述od流特征包括od流量和od距離;所述od流量是第個交通小區到第個商圈(即od對)的每小時平均客流人數;所述od距離是與之間的歐氏距離。
5、優選地,每小時平均客流人數是基于(預設年份的)手機信令數據,通過計算每天每
6、在一種可行的實施方式中,所述商圈特征包括商圈日均客流量、商圈用地面積、商圈業態多樣性指數及停車場數量;
7、所述商圈日均客流量是基于大數據平臺(例如智慧足跡極智daas平臺)提供的用戶每日駐留脫敏信息表,通過(sql語言)查詢獲取;所述用戶每日駐留脫敏信息表包括駐留時間、駐留地點等;
8、所述商圈用地面積是采集自導航平臺(例如高德地圖)提供的建筑輪廓數據;
9、所述商圈業態多樣性指數是基于導航平臺提供的poi(興趣點)數量,通過hillnumbers指數公式進行計算,具體公式為:
10、;
11、其中,表示商圈業態多樣性指數;表示商圈中業態類型總數;表示商圈內第種業態類型的poi數量占商圈poi總數的比例;表示參數,具體為辛普森指數的倒數,這樣可以兼顧poi的豐富度以及不同業態類型的均勻度;
12、所述停車場數量是指在商圈的預設緩沖區范圍內的停車場數量,可從導航平臺中采集。
13、在一種可行的實施方式中,所述交通小區特征包括小區平均房價、小區平均消費金額、小區至城區中心距離、小區居住人口及小區就業人口;
14、所述小區平均房價可以采集自住宅交易平臺(例如鏈家公司)的二手房價數據,并通過反距離權重插值法進行處理;
15、所述小區平均消費金額可以采集自金融機構(例如銀聯公司)提供的消費統計數據(例如城市1km網格各品類消費統計數據,該數據在空間上進行了聚合,不涉及個人消費隱私),并通過反距離權重插值法進行處理;
16、所述小區至城區中心距離可以為各交通小區多邊形中心點至最近城區中心的歐氏距離;
17、所述小區居住人口及所述小區就業人口,可以基于大數據平臺提供的用戶每日駐留脫敏信息表,通過(sql語言)查詢獲取;所述用戶每日駐留脫敏信息表的駐留類型包括居住、工作及到訪。
18、步驟2、將交通小區特征嵌入至圖神經網絡中,得到交通小區嵌入向量;將商圈特征嵌入至第一多層感知機中,得到商圈嵌入向量;將嵌入向量與相應的od流特征進行連接,作為od流綜合表示向量。
19、在一種可行的實施方式中,將交通小區嵌入至圖神經網絡的具體方法包括:
20、將交通小區特征分別通過并行設置的第一圖卷積神經網絡(gcn)模塊及第二圖卷積神經網絡模塊進行嵌入處理,分別得到第一嵌入向量及第二嵌入向量;
21、第一圖卷積神經網絡包括鄰域圖,第二圖卷積神經網絡包括消費水平相似圖,其中,表示圖的節點,即交通小區;表示節點個數;表示交通小區的個數,等于;表示節點與節點之間所連接的邊;表示鄰域圖中加權邊的鄰接矩陣;表示消費水平相似圖中加權邊的鄰接矩陣;
22、第一嵌入向量的具體表達式為:
23、;
24、其中,表示向量的維數;表示階矩陣;
25、第二嵌入向量的具體表達式為:
26、;
27、再將與進行融合,得到第三嵌入向量,具體公式可以為:
28、;
29、其中,和均為可訓練權重參數,且屬于。
30、在一種可行的實施方式中,中邊的定義公式為:
31、;
32、其中,表示鄰域圖的可訓練距離衰減參數;表示第個交通小區與第個交通小區之間的歐氏距離;這樣,就可以通過兩個交通小區(不規則地理單元)的鄰近性來構建圖,并使信息通過邊進行傳遞。
33、在一種可行的實施方式中,中邊的定義公式為:
34、;
35、其中,表示消費水平相似圖的可訓練距離衰減參數;表示的消費水平;表示的消費水平;表示與之間的消費水平相似度;之所以這樣設計公式,是因為具有相似消費水平的兩個區域可能具有相似的購物選擇,即使它們在空間上相距很遠,而且一個交通小區中的房價及消費金額能夠在一定程度上反映不同人群在消費水平上的差異,因此,本申請采用房價和消費金額作為交通小區消費水平的評價指標,并采用余弦相似性來計算兩個交通小區的消費水平相似度。
36、在一種可行的實施方式中,每個圖卷積神經網絡模塊均為多層常規結構設置,即依次相連的輸入層、圖卷積層及輸出層,以便在保證嵌入效果的同時,減少運算量。
37、在一種可行的實施方式中,所述第一多層感知機為兩層結構,以便在保證嵌入效果的同時,減少運算量。
38、步驟3、基于od流綜合表示向量,構建訓練集及驗證集;基于訓練集,對第二多層感知機進行訓練,預測得到各交通小區與各商圈之間的客流量;基于驗證集,對第二多層感知機進行迭代驗證,直至驗證集的性能不再提升,從而避免過擬合;將在驗證集上表現最佳的od流綜合表示向量作為輸入,傳入至全連接神經網絡(fcn)中;基于外部預測需求,構建測試集,通過所述全連接神經網絡,預測商圈客流量;
39、在一種可行的實施方式中,所述第二多層感知機具有批量標準化的多層結構(例如四層),以便通過反向傳播學習嵌入。
40、在一種可行的實施方式中,所述第二多層感知機的損失函數為均方誤差函數,具體公式為:
41、;
42、其中,表示交通小區與商圈之間的配對數量;表示第個交通小區到第個商圈的每小時平均客流人數的實際計算值;表示第個交通小區到第個商圈的每小時平均客流人數的預測值。
43、第二方面,基于本文檔來自技高網...
【技術保護點】
1.一種基于圖神經網絡的商圈客流量預測方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述OD流特征包括OD流量和OD距離;所述OD流量是第個交通小區到第個商圈的每小時平均客流人數;所述OD距離是與之間的歐氏距離。
3.根據權利要求1所述的方法,其特征在于,所述商圈特征包括商圈日均客流量、商圈用地面積、商圈業態多樣性指數及停車場數量;
4.根據權利要求1所述的方法,其特征在于,所述交通小區特征包括小區平均房價、小區平均消費金額、小區至城區中心距離、小區居住人口及小區就業人口;
5.根據權利要求1所述的方法,其特征在于,將交通小區嵌入至圖神經網絡的具體方法包括:
6.根據權利要求5所述的方法,其特征在于,中邊的定義公式為:
7.根據權利要求1所述的方法,其特征在于,所述第二多層感知機為具有批量標準化的四層結構,包括依次相連的輸入層、第一隱藏層、第二隱藏層及輸出層。
8.根據權利要求1所述的方法,其特征在于,所述第二多層感知機的損失函數為均方誤差函數,具體公式為:
9.
10.一種基于圖神經網絡的商圈客流量預測裝置,其特征在于,包括處理器、存儲器及總線,所述存儲器存儲由處理器讀取的指令及數據,所述處理器用于調用所述存儲器中的指令及數據,以執行如權利要求1-8中任一所述的方法,所述總線連接各功能部件之間用于傳送信息。
...【技術特征摘要】
1.一種基于圖神經網絡的商圈客流量預測方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述od流特征包括od流量和od距離;所述od流量是第個交通小區到第個商圈的每小時平均客流人數;所述od距離是與之間的歐氏距離。
3.根據權利要求1所述的方法,其特征在于,所述商圈特征包括商圈日均客流量、商圈用地面積、商圈業態多樣性指數及停車場數量;
4.根據權利要求1所述的方法,其特征在于,所述交通小區特征包括小區平均房價、小區平均消費金額、小區至城區中心距離、小區居住人口及小區就業人口;
5.根據權利要求1所述的方法,其特征在于,將交通小區嵌入至圖神經網絡的具體方法包括:
6.根據權利要求5所述的方法,...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。