基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法技術(shù)

技術(shù)編號：43892288 閱讀：8 留言：0更新日期：2025-01-03 13:07

本發(fā)明專利技術(shù)公開基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，將采集多種數(shù)據(jù)庫指標數(shù)據(jù)作為數(shù)據(jù)集并劃分為訓練集、驗證集與測試集，靜態(tài)指標嵌入向量。通過連續(xù)的下采樣獲得不同長度的尺度層。時間擴張雙重注意力層提取不同感受野的時間維度信息；靜態(tài)特征融合動態(tài)GCN層捕捉空間維度的信息，結(jié)合片段間注意力層獲取數(shù)據(jù)的全局依賴。將各時間片段信息聚合計算出預測值。計算損失率并用Adam優(yōu)化算法反向傳播，不斷更新模型參數(shù)，重復訓練直至訓練損失率收斂，將權(quán)重保存為最優(yōu)模型。將測試集數(shù)據(jù)投入已保存的最優(yōu)模型，輸出預測值、預測精度。本發(fā)明專利技術(shù)克服了共享鄰接矩陣的弊端，提升了模型的預測準確性。

全部詳細技術(shù)資料下載

【技術(shù)實現(xiàn)步驟摘要】

本專利技術(shù)涉及數(shù)據(jù)庫管理，尤其涉及基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法。

技術(shù)介紹

1、數(shù)據(jù)庫管理系統(tǒng)是各行各業(yè)用于存儲、分析數(shù)據(jù)，求得穩(wěn)定發(fā)展的主要工具，所以若能提前感知數(shù)據(jù)庫在運營過程中指標數(shù)據(jù)的不正常變動，便能減少資源損失。數(shù)據(jù)庫指標數(shù)據(jù)亦指一維時間序列數(shù)據(jù)，對于時序數(shù)據(jù)的預測一般通過采集大量長期變動的歷史信息，學習其中蘊含的數(shù)學邏輯，得到預測數(shù)據(jù)，及時預示維護人員。傳統(tǒng)的時序預測算法對于數(shù)據(jù)集要求較高，且需要專家經(jīng)驗，過于費時費力，如var在樣本數(shù)較少時，估計參數(shù)精度較低且難以給出變量之間的動態(tài)依賴。而深度學習領(lǐng)域的時序預測算法對大規(guī)模復雜的非平穩(wěn)數(shù)據(jù)處理能力更強。lstm、gru模型側(cè)重于信息的動態(tài)更新，但難以獲取時序的多尺度、周期性特征，無法捕捉數(shù)據(jù)之間的動態(tài)變化性；transformer模型應用注意力機制提取變量間的關(guān)系，提升了訓練速度，但模型的時空復雜度較高。此外，目前在數(shù)據(jù)庫中，尚未有模型考慮到服務器的靜態(tài)特征是否對數(shù)據(jù)庫運維是否有影響。基于gnn的預測算法通過時空兩個維度獲取數(shù)據(jù)特征，運用圖結(jié)構(gòu)描述時序數(shù)據(jù)間的作用，在分布不均勻、不規(guī)則的數(shù)據(jù)研究上有很強的包容度。

技術(shù)實現(xiàn)思路

1、本專利技術(shù)的目的在于解決目前數(shù)據(jù)庫指標數(shù)據(jù)預測技術(shù)不足的問題，綜合考慮全局與局部上下文信息，提取多尺度時空特征，提出基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，與靜態(tài)信息融合的動態(tài)圖構(gòu)造層，能夠?qū)W習靜態(tài)與動態(tài)特征之間的關(guān)聯(lián)，更全面分析數(shù)據(jù)，而不同時間片段

2、本專利技術(shù)采用的技術(shù)方案是：

3、基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其包括以下步驟：

4、步驟1，選定目標時間段內(nèi)的不同種類的一維指標數(shù)據(jù)序列形成多變量時間序列數(shù)據(jù)集，并對指標數(shù)據(jù)進行數(shù)據(jù)預處理清理后按設(shè)定比例劃分為訓練集、測試集與驗證集，不同預測任務的設(shè)定比例不同；同時收集數(shù)據(jù)庫運營相應服務器的靜態(tài)配置信息，經(jīng)過詞嵌入技術(shù)word2vec生成嵌入向量；

5、具體地，采集數(shù)據(jù)庫指標數(shù)據(jù)序列x＝[st[i]]∈rn×t,t∈[1,2,…,t]，i∈[1,2,…,n]，x表示t個時間戳的歷史觀測值，n表示變量特征數(shù)，st[i]∈rn×1表示第i個變量在時間戳t處的值；

6、選定目標時間段內(nèi)的25個指標數(shù)據(jù)作為多變量時間序列數(shù)據(jù)集，數(shù)據(jù)采集速度為每分鐘采集一次；同時，收集數(shù)據(jù)庫運營相應服務器的7個靜態(tài)配置信息；進行數(shù)據(jù)預處理對缺失值線性插值、異常值剔除(將閾值之外的值，取其前5個數(shù)的均值替換)；靜態(tài)配置信息經(jīng)過詞嵌入技術(shù)word2vec生成嵌入向量；將處理過的25個指標數(shù)據(jù)按比例劃分為訓練集、測試集與驗證集，不同預測任務比例不同；

7、步驟2，構(gòu)建數(shù)據(jù)庫指標數(shù)據(jù)預測模型，分為依次連接的如下模塊：下采樣多尺度模塊、時間擴張雙重注意力模塊、靜態(tài)特征融合動態(tài)gcn模塊、片段間注意力與預測模塊；下采樣多尺度模塊包含多層的卷積、池化單元，用于生成不同長度的時序，長序列反映數(shù)據(jù)的整體波動狀況，短序列體現(xiàn)數(shù)據(jù)的局部特征；下采樣多尺度模塊的結(jié)果數(shù)據(jù)輸入到時間擴張雙重注意力模塊，時間擴張雙重注意力模塊包含兩路的并行時間卷積層，時間注意力與深度通道注意力門，用于捕獲特征的時間相關(guān)性；靜態(tài)特征融合動態(tài)gcn層綜合考慮數(shù)據(jù)庫靜態(tài)配置信息的影響，將靜態(tài)數(shù)據(jù)圖結(jié)構(gòu)與動態(tài)的數(shù)據(jù)圖結(jié)構(gòu)融合，捕獲特征的空間相關(guān)性；通過片段間注意力提取整體序列的全局相關(guān)性；最后將各尺度信息聚合輸出預測結(jié)果；

8、數(shù)據(jù)庫指標數(shù)據(jù)預測模型執(zhí)行如下步驟：

9、步驟2-1，使用預設(shè)的下采樣劃分多尺度層，捕獲時序在不同尺度下的時間相關(guān)性，也能靈活應對長序列數(shù)據(jù)；

10、步驟2-2，使用時間擴張雙重注意力模塊捕獲時間依賴，提取高級時間特征；時間擴張雙重注意力模塊由并行時間卷積層以及雙重注意力門組成；

11、步驟2-3，時序數(shù)據(jù)是實時變化的，不能依靠單一共享的鄰接矩陣。時間擴張雙重注意力模塊的結(jié)果輸入到靜態(tài)特征融合動態(tài)gcn模塊中捕捉空間特征，使用以gru為主的圖動態(tài)構(gòu)造層捕捉動態(tài)變化特征生成一系列鄰接矩陣，送入圖卷積網(wǎng)絡(gcn)當中獲取向量關(guān)聯(lián)；同時，采用服務器靜態(tài)信息的靜態(tài)特征圖學習層生成鄰接矩陣，同樣送入圖卷積網(wǎng)絡中；將兩種結(jié)果融合相加，再與下采樣多尺度模塊的輸出進行殘差操作，防止過擬合，獲取時空特征信息；

12、步驟2-4：使用片段間注意力層，交互時間片段表示全局相關(guān)性；

13、步驟2-5：跨尺度的時空信息聚合，即將每層信息順位相加；

14、步驟2-6：輸入由兩層的激活函數(shù)與一維卷積構(gòu)成的預測模塊，動態(tài)調(diào)整所需輸出數(shù)據(jù)的維度以便進行兩種預測任務：單步預測輸出的單時間步q處預測值yt+q；多步預測輸出的一段時間預測序列為[yt+1、yt+2,...,yt+q]；

15、步驟3：針對兩種預測任務分別采取對應的評估指標進行評估，再利用優(yōu)化算法執(zhí)行時序預測的反向傳播，更新模型參數(shù)，降低模型訓練損失值；其中單步預測中使用損失函數(shù)衡量預測值與真實值的誤差，損失函數(shù)包括相對平方誤差(rse)、相關(guān)系數(shù)(corr)；多步預測中使用平均絕對誤差(mae)、均方根誤差(rmse)、corr；

16、步驟4：使用早停策略加快模型訓練速度，當訓練損失連續(xù)不降低的迭代輪次達到設(shè)定次數(shù)時，停止當前輪訓練，并保存此前損失值最低時所對應的權(quán)重為最優(yōu)模型；

17、步驟5：利用測試集數(shù)據(jù)測試模型性能輸出模型測試損失值，并獲取預測模塊的預測輸出的預測時間序列值共同作為預測結(jié)果；

18、步驟6：將預測結(jié)果用于待預測的數(shù)據(jù)庫一維指標數(shù)據(jù)預測，實時監(jiān)測數(shù)據(jù)庫系統(tǒng)運營狀況。

19、進一步地，步驟1中提及的訓練集、驗證集與測試集劃分的具體描述如下：

20、步驟1-1：單步預測中按照比例6：2：2劃分訓練集、驗證集與測試集。而在多步預測中，為了加強模型捕捉各個節(jié)點間的交互性，定義了輸入序列、輸出序列的時間步偏移量，添加時間特征(如每個時間步在一天中的位置、每個時間步在一周中的位置)，采用滑動窗口的方式增加樣本量，按照7：1：2的比例生成訓練、驗證和測試所需的輸入和輸出數(shù)據(jù)。

21、進一步地，步驟2-1中的下采樣劃分多尺度層具體執(zhí)行如下步驟：

22、步驟2-1-1，獲取與尺度層數(shù)對應的預設(shè)的卷積核大小數(shù)組；預設(shè)的卷積核大小數(shù)組中的卷積核大小數(shù)值隨著尺度層增大依次減小；

23、步驟2-1-2，輸入數(shù)據(jù)經(jīng)過1×1卷積和第一層尺度層對應的卷積核大小的卷積獲取第一個尺度層1；

24、步驟2-1-3，在第一尺度層的基礎(chǔ)上，以當前得到的尺度層作為輸入分為兩路進行下采樣，下采樣過程為：第一路通過殘差的1×1卷積；第二路通過下個尺度層對應的卷積核大小的卷積和池化核大小為1×3的池化，本文檔來自技高網(wǎng)...

【技術(shù)保護點】

1.基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：其包括以下步驟：

2.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：步驟1中數(shù)據(jù)庫一維指標數(shù)據(jù)序列X＝[st[i]]∈RN×T，t∈[1，2，...，T]，i∈[1，2，...，N]，X表示T個時間戳的歷史觀測值，N表示變量特征數(shù)，st[i]∈RN×1表示第i個變量在時間戳t處的值；步驟1中選定目標時間段內(nèi)的25個指標數(shù)據(jù)作為多變量時間序列數(shù)據(jù)集，數(shù)據(jù)采集速度為每分鐘采集一次；收集數(shù)據(jù)庫運營相應服務器的7個靜態(tài)配置信息；數(shù)據(jù)預處理包括對缺失值線性插值、異常值剔除。

3.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：步驟1中提及的訓練集、驗證集與測試集劃分的具體描述如下：單步預測中按照比例6：2：2劃分訓練集、驗證集與測試集；在多步預測中采用滑動窗口的方式增加樣本量，按照7：1：2的比例生成訓練、驗證和測試所需的輸入數(shù)據(jù)。

4.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)

5.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：步驟2-2中的時間擴張雙重注意力模塊具體執(zhí)行如下步驟：

6.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：步驟2-3中的靜態(tài)特征融合動態(tài)GCN模塊具體為：

7.根據(jù)權(quán)利要求6所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：步驟2-3-2中生成的第一個動態(tài)鄰接矩陣的具體表達式如下：

8.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：步驟2-4中的片段間注意力層具體為：將靜態(tài)特征融合動態(tài)GCN模塊的輸出結(jié)果作為輸入序列Xin按預設(shè)大小分割成n塊，結(jié)合特征嵌入維度dm與片段長度的維度S得d＝S·dm；再將輸入序列Xin進行線性映射得到Qin、Kin、Vin，并用自注意力機制得到全局相關(guān)性：最后將各片段結(jié)果拼接。

9.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：步驟3中提及的評估指標具體為：時間輸入窗口長度為168，單步預測中的預測輸出長度為1；多步預測中的預測輸出長度為12；所用指標分別為：

10.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：步驟4中使用早停策略加快模型訓練速度，當訓練損失連續(xù)15個Epoch不降低時，停止當前輪訓練，并保存此前損失值最低時所對應的權(quán)重為最優(yōu)模型。

...

【技術(shù)特征摘要】

1.基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：其包括以下步驟：

2.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：步驟1中數(shù)據(jù)庫一維指標數(shù)據(jù)序列x＝[st[i]]∈rn×t，t∈[1，2，...，t]，i∈[1，2，...，n]，x表示t個時間戳的歷史觀測值，n表示變量特征數(shù)，st[i]∈rn×1表示第i個變量在時間戳t處的值；步驟1中選定目標時間段內(nèi)的25個指標數(shù)據(jù)作為多變量時間序列數(shù)據(jù)集，數(shù)據(jù)采集速度為每分鐘采集一次；收集數(shù)據(jù)庫運營相應服務器的7個靜態(tài)配置信息；數(shù)據(jù)預處理包括對缺失值線性插值、異常值剔除。

3.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：步驟1中提及的訓練集、驗證集與測試集劃分的具體描述如下：單步預測中按照比例6：2：2劃分訓練集、驗證集與測試集；在多步預測中采用滑動窗口的方式增加樣本量，按照7：1：2的比例生成訓練、驗證和測試所需的輸入數(shù)據(jù)。

4.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：步驟2-1中的下采樣劃分多尺度層具體執(zhí)行如下步驟：

5.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法，其特征在于：步驟2-2中的時間擴張雙重注意力模塊具...

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：鄭華，洪明霞，馮碩，陳子濱，張超超，朱小欽，
申請(專利權(quán))人：福建師范大學，
類型：發(fā)明
國別省市：

全部詳細技術(shù)資料下載我是這個專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條評論

還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

發(fā)布您的意見

相關(guān)領(lǐng)域技術(shù)