【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及數(shù)據(jù)庫管理,尤其涉及基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法。
技術(shù)介紹
1、數(shù)據(jù)庫管理系統(tǒng)是各行各業(yè)用于存儲、分析數(shù)據(jù),求得穩(wěn)定發(fā)展的主要工具,所以若能提前感知數(shù)據(jù)庫在運營過程中指標數(shù)據(jù)的不正常變動,便能減少資源損失。數(shù)據(jù)庫指標數(shù)據(jù)亦指一維時間序列數(shù)據(jù),對于時序數(shù)據(jù)的預測一般通過采集大量長期變動的歷史信息,學習其中蘊含的數(shù)學邏輯,得到預測數(shù)據(jù),及時預示維護人員。傳統(tǒng)的時序預測算法對于數(shù)據(jù)集要求較高,且需要專家經(jīng)驗,過于費時費力,如var在樣本數(shù)較少時,估計參數(shù)精度較低且難以給出變量之間的動態(tài)依賴。而深度學習領(lǐng)域的時序預測算法對大規(guī)模復雜的非平穩(wěn)數(shù)據(jù)處理能力更強。lstm、gru模型側(cè)重于信息的動態(tài)更新,但難以獲取時序的多尺度、周期性特征,無法捕捉數(shù)據(jù)之間的動態(tài)變化性;transformer模型應用注意力機制提取變量間的關(guān)系,提升了訓練速度,但模型的時空復雜度較高。此外,目前在數(shù)據(jù)庫中,尚未有模型考慮到服務器的靜態(tài)特征是否對數(shù)據(jù)庫運維是否有影響。基于gnn的預測算法通過時空兩個維度獲取數(shù)據(jù)特征,運用圖結(jié)構(gòu)描述時序數(shù)據(jù)間的作用,在分布不均勻、不規(guī)則的數(shù)據(jù)研究上有很強的包容度。
技術(shù)實現(xiàn)思路
1、本專利技術(shù)的目的在于解決目前數(shù)據(jù)庫指標數(shù)據(jù)預測技術(shù)不足的問題,綜合考慮全局與局部上下文信息,提取多尺度時空特征,提出基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,與靜態(tài)信息融合的動態(tài)圖構(gòu)造層,能夠?qū)W習靜態(tài)與動態(tài)特征之間的關(guān)聯(lián),更全面分析數(shù)據(jù),而不同時間片段
2、本專利技術(shù)采用的技術(shù)方案是:
3、基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其包括以下步驟:
4、步驟1,選定目標時間段內(nèi)的不同種類的一維指標數(shù)據(jù)序列形成多變量時間序列數(shù)據(jù)集,并對指標數(shù)據(jù)進行數(shù)據(jù)預處理清理后按設(shè)定比例劃分為訓練集、測試集與驗證集,不同預測任務的設(shè)定比例不同;同時收集數(shù)據(jù)庫運營相應服務器的靜態(tài)配置信息,經(jīng)過詞嵌入技術(shù)word2vec生成嵌入向量;
5、具體地,采集數(shù)據(jù)庫指標數(shù)據(jù)序列x=[st[i]]∈rn×t,t∈[1,2,…,t],i∈[1,2,…,n],x表示t個時間戳的歷史觀測值,n表示變量特征數(shù),st[i]∈rn×1表示第i個變量在時間戳t處的值;
6、選定目標時間段內(nèi)的25個指標數(shù)據(jù)作為多變量時間序列數(shù)據(jù)集,數(shù)據(jù)采集速度為每分鐘采集一次;同時,收集數(shù)據(jù)庫運營相應服務器的7個靜態(tài)配置信息;進行數(shù)據(jù)預處理對缺失值線性插值、異常值剔除(將閾值之外的值,取其前5個數(shù)的均值替換);靜態(tài)配置信息經(jīng)過詞嵌入技術(shù)word2vec生成嵌入向量;將處理過的25個指標數(shù)據(jù)按比例劃分為訓練集、測試集與驗證集,不同預測任務比例不同;
7、步驟2,構(gòu)建數(shù)據(jù)庫指標數(shù)據(jù)預測模型,分為依次連接的如下模塊:下采樣多尺度模塊、時間擴張雙重注意力模塊、靜態(tài)特征融合動態(tài)gcn模塊、片段間注意力與預測模塊;下采樣多尺度模塊包含多層的卷積、池化單元,用于生成不同長度的時序,長序列反映數(shù)據(jù)的整體波動狀況,短序列體現(xiàn)數(shù)據(jù)的局部特征;下采樣多尺度模塊的結(jié)果數(shù)據(jù)輸入到時間擴張雙重注意力模塊,時間擴張雙重注意力模塊包含兩路的并行時間卷積層,時間注意力與深度通道注意力門,用于捕獲特征的時間相關(guān)性;靜態(tài)特征融合動態(tài)gcn層綜合考慮數(shù)據(jù)庫靜態(tài)配置信息的影響,將靜態(tài)數(shù)據(jù)圖結(jié)構(gòu)與動態(tài)的數(shù)據(jù)圖結(jié)構(gòu)融合,捕獲特征的空間相關(guān)性;通過片段間注意力提取整體序列的全局相關(guān)性;最后將各尺度信息聚合輸出預測結(jié)果;
8、數(shù)據(jù)庫指標數(shù)據(jù)預測模型執(zhí)行如下步驟:
9、步驟2-1,使用預設(shè)的下采樣劃分多尺度層,捕獲時序在不同尺度下的時間相關(guān)性,也能靈活應對長序列數(shù)據(jù);
10、步驟2-2,使用時間擴張雙重注意力模塊捕獲時間依賴,提取高級時間特征;時間擴張雙重注意力模塊由并行時間卷積層以及雙重注意力門組成;
11、步驟2-3,時序數(shù)據(jù)是實時變化的,不能依靠單一共享的鄰接矩陣。時間擴張雙重注意力模塊的結(jié)果輸入到靜態(tài)特征融合動態(tài)gcn模塊中捕捉空間特征,使用以gru為主的圖動態(tài)構(gòu)造層捕捉動態(tài)變化特征生成一系列鄰接矩陣,送入圖卷積網(wǎng)絡(gcn)當中獲取向量關(guān)聯(lián);同時,采用服務器靜態(tài)信息的靜態(tài)特征圖學習層生成鄰接矩陣,同樣送入圖卷積網(wǎng)絡中;將兩種結(jié)果融合相加,再與下采樣多尺度模塊的輸出進行殘差操作,防止過擬合,獲取時空特征信息;
12、步驟2-4:使用片段間注意力層,交互時間片段表示全局相關(guān)性;
13、步驟2-5:跨尺度的時空信息聚合,即將每層信息順位相加;
14、步驟2-6:輸入由兩層的激活函數(shù)與一維卷積構(gòu)成的預測模塊,動態(tài)調(diào)整所需輸出數(shù)據(jù)的維度以便進行兩種預測任務:單步預測輸出的單時間步q處預測值yt+q;多步預測輸出的一段時間預測序列為[yt+1、yt+2,...,yt+q];
15、步驟3:針對兩種預測任務分別采取對應的評估指標進行評估,再利用優(yōu)化算法執(zhí)行時序預測的反向傳播,更新模型參數(shù),降低模型訓練損失值;其中單步預測中使用損失函數(shù)衡量預測值與真實值的誤差,損失函數(shù)包括相對平方誤差(rse)、相關(guān)系數(shù)(corr);多步預測中使用平均絕對誤差(mae)、均方根誤差(rmse)、corr;
16、步驟4:使用早停策略加快模型訓練速度,當訓練損失連續(xù)不降低的迭代輪次達到設(shè)定次數(shù)時,停止當前輪訓練,并保存此前損失值最低時所對應的權(quán)重為最優(yōu)模型;
17、步驟5:利用測試集數(shù)據(jù)測試模型性能輸出模型測試損失值,并獲取預測模塊的預測輸出的預測時間序列值共同作為預測結(jié)果;
18、步驟6:將預測結(jié)果用于待預測的數(shù)據(jù)庫一維指標數(shù)據(jù)預測,實時監(jiān)測數(shù)據(jù)庫系統(tǒng)運營狀況。
19、進一步地,步驟1中提及的訓練集、驗證集與測試集劃分的具體描述如下:
20、步驟1-1:單步預測中按照比例6:2:2劃分訓練集、驗證集與測試集。而在多步預測中,為了加強模型捕捉各個節(jié)點間的交互性,定義了輸入序列、輸出序列的時間步偏移量,添加時間特征(如每個時間步在一天中的位置、每個時間步在一周中的位置),采用滑動窗口的方式增加樣本量,按照7:1:2的比例生成訓練、驗證和測試所需的輸入和輸出數(shù)據(jù)。
21、進一步地,步驟2-1中的下采樣劃分多尺度層具體執(zhí)行如下步驟:
22、步驟2-1-1,獲取與尺度層數(shù)對應的預設(shè)的卷積核大小數(shù)組;預設(shè)的卷積核大小數(shù)組中的卷積核大小數(shù)值隨著尺度層增大依次減小;
23、步驟2-1-2,輸入數(shù)據(jù)經(jīng)過1×1卷積和第一層尺度層對應的卷積核大小的卷積獲取第一個尺度層1;
24、步驟2-1-3,在第一尺度層的基礎(chǔ)上,以當前得到的尺度層作為輸入分為兩路進行下采樣,下采樣過程為:第一路通過殘差的1×1卷積;第二路通過下個尺度層對應的卷積核大小的卷積和池化核大小為1×3的池化,本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:其包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟1中數(shù)據(jù)庫一維指標數(shù)據(jù)序列X=[st[i]]∈RN×T,t∈[1,2,...,T],i∈[1,2,...,N],X表示T個時間戳的歷史觀測值,N表示變量特征數(shù),st[i]∈RN×1表示第i個變量在時間戳t處的值;步驟1中選定目標時間段內(nèi)的25個指標數(shù)據(jù)作為多變量時間序列數(shù)據(jù)集,數(shù)據(jù)采集速度為每分鐘采集一次;收集數(shù)據(jù)庫運營相應服務器的7個靜態(tài)配置信息;數(shù)據(jù)預處理包括對缺失值線性插值、異常值剔除。
3.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟1中提及的訓練集、驗證集與測試集劃分的具體描述如下:單步預測中按照比例6:2:2劃分訓練集、驗證集與測試集;在多步預測中采用滑動窗口的方式增加樣本量,按照7:1:2的比例生成訓練、驗證和測試所需的輸入數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)
5.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-2中的時間擴張雙重注意力模塊具體執(zhí)行如下步驟:
6.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-3中的靜態(tài)特征融合動態(tài)GCN模塊具體為:
7.根據(jù)權(quán)利要求6所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-3-2中生成的第一個動態(tài)鄰接矩陣的具體表達式如下:
8.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-4中的片段間注意力層具體為:將靜態(tài)特征融合動態(tài)GCN模塊的輸出結(jié)果作為輸入序列Xin按預設(shè)大小分割成n塊,結(jié)合特征嵌入維度dm與片段長度的維度S得d=S·dm;再將輸入序列Xin進行線性映射得到Qin、Kin、Vin,并用自注意力機制得到全局相關(guān)性:最后將各片段結(jié)果拼接。
9.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟3中提及的評估指標具體為:時間輸入窗口長度為168,單步預測中的預測輸出長度為1;多步預測中的預測輸出長度為12;所用指標分別為:
10.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟4中使用早停策略加快模型訓練速度,當訓練損失連續(xù)15個Epoch不降低時,停止當前輪訓練,并保存此前損失值最低時所對應的權(quán)重為最優(yōu)模型。
...【技術(shù)特征摘要】
1.基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:其包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟1中數(shù)據(jù)庫一維指標數(shù)據(jù)序列x=[st[i]]∈rn×t,t∈[1,2,...,t],i∈[1,2,...,n],x表示t個時間戳的歷史觀測值,n表示變量特征數(shù),st[i]∈rn×1表示第i個變量在時間戳t處的值;步驟1中選定目標時間段內(nèi)的25個指標數(shù)據(jù)作為多變量時間序列數(shù)據(jù)集,數(shù)據(jù)采集速度為每分鐘采集一次;收集數(shù)據(jù)庫運營相應服務器的7個靜態(tài)配置信息;數(shù)據(jù)預處理包括對缺失值線性插值、異常值剔除。
3.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟1中提及的訓練集、驗證集與測試集劃分的具體描述如下:單步預測中按照比例6:2:2劃分訓練集、驗證集與測試集;在多步預測中采用滑動窗口的方式增加樣本量,按照7:1:2的比例生成訓練、驗證和測試所需的輸入數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-1中的下采樣劃分多尺度層具體執(zhí)行如下步驟:
5.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-2中的時間擴張雙重注意力模塊具...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:鄭華,洪明霞,馮碩,陳子濱,張超超,朱小欽,
申請(專利權(quán))人:福建師范大學,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。