• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法技術(shù)

    技術(shù)編號:43892288 閱讀:8 留言:0更新日期:2025-01-03 13:07
    本發(fā)明專利技術(shù)公開基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,將采集多種數(shù)據(jù)庫指標數(shù)據(jù)作為數(shù)據(jù)集并劃分為訓練集、驗證集與測試集,靜態(tài)指標嵌入向量。通過連續(xù)的下采樣獲得不同長度的尺度層。時間擴張雙重注意力層提取不同感受野的時間維度信息;靜態(tài)特征融合動態(tài)GCN層捕捉空間維度的信息,結(jié)合片段間注意力層獲取數(shù)據(jù)的全局依賴。將各時間片段信息聚合計算出預測值。計算損失率并用Adam優(yōu)化算法反向傳播,不斷更新模型參數(shù),重復訓練直至訓練損失率收斂,將權(quán)重保存為最優(yōu)模型。將測試集數(shù)據(jù)投入已保存的最優(yōu)模型,輸出預測值、預測精度。本發(fā)明專利技術(shù)克服了共享鄰接矩陣的弊端,提升了模型的預測準確性。

    【技術(shù)實現(xiàn)步驟摘要】

    本專利技術(shù)涉及數(shù)據(jù)庫管理,尤其涉及基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法。


    技術(shù)介紹

    1、數(shù)據(jù)庫管理系統(tǒng)是各行各業(yè)用于存儲、分析數(shù)據(jù),求得穩(wěn)定發(fā)展的主要工具,所以若能提前感知數(shù)據(jù)庫在運營過程中指標數(shù)據(jù)的不正常變動,便能減少資源損失。數(shù)據(jù)庫指標數(shù)據(jù)亦指一維時間序列數(shù)據(jù),對于時序數(shù)據(jù)的預測一般通過采集大量長期變動的歷史信息,學習其中蘊含的數(shù)學邏輯,得到預測數(shù)據(jù),及時預示維護人員。傳統(tǒng)的時序預測算法對于數(shù)據(jù)集要求較高,且需要專家經(jīng)驗,過于費時費力,如var在樣本數(shù)較少時,估計參數(shù)精度較低且難以給出變量之間的動態(tài)依賴。而深度學習領(lǐng)域的時序預測算法對大規(guī)模復雜的非平穩(wěn)數(shù)據(jù)處理能力更強。lstm、gru模型側(cè)重于信息的動態(tài)更新,但難以獲取時序的多尺度、周期性特征,無法捕捉數(shù)據(jù)之間的動態(tài)變化性;transformer模型應用注意力機制提取變量間的關(guān)系,提升了訓練速度,但模型的時空復雜度較高。此外,目前在數(shù)據(jù)庫中,尚未有模型考慮到服務器的靜態(tài)特征是否對數(shù)據(jù)庫運維是否有影響。基于gnn的預測算法通過時空兩個維度獲取數(shù)據(jù)特征,運用圖結(jié)構(gòu)描述時序數(shù)據(jù)間的作用,在分布不均勻、不規(guī)則的數(shù)據(jù)研究上有很強的包容度。


    技術(shù)實現(xiàn)思路

    1、本專利技術(shù)的目的在于解決目前數(shù)據(jù)庫指標數(shù)據(jù)預測技術(shù)不足的問題,綜合考慮全局與局部上下文信息,提取多尺度時空特征,提出基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,與靜態(tài)信息融合的動態(tài)圖構(gòu)造層,能夠?qū)W習靜態(tài)與動態(tài)特征之間的關(guān)聯(lián),更全面分析數(shù)據(jù),而不同時間片段生成的鄰接矩陣也能反映連續(xù)變化的時序特征,克服了共享鄰接矩陣的弊端,提升了模型的預測準確性。

    2、本專利技術(shù)采用的技術(shù)方案是:

    3、基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其包括以下步驟:

    4、步驟1,選定目標時間段內(nèi)的不同種類的一維指標數(shù)據(jù)序列形成多變量時間序列數(shù)據(jù)集,并對指標數(shù)據(jù)進行數(shù)據(jù)預處理清理后按設(shè)定比例劃分為訓練集、測試集與驗證集,不同預測任務的設(shè)定比例不同;同時收集數(shù)據(jù)庫運營相應服務器的靜態(tài)配置信息,經(jīng)過詞嵌入技術(shù)word2vec生成嵌入向量;

    5、具體地,采集數(shù)據(jù)庫指標數(shù)據(jù)序列x=[st[i]]∈rn×t,t∈[1,2,…,t],i∈[1,2,…,n],x表示t個時間戳的歷史觀測值,n表示變量特征數(shù),st[i]∈rn×1表示第i個變量在時間戳t處的值;

    6、選定目標時間段內(nèi)的25個指標數(shù)據(jù)作為多變量時間序列數(shù)據(jù)集,數(shù)據(jù)采集速度為每分鐘采集一次;同時,收集數(shù)據(jù)庫運營相應服務器的7個靜態(tài)配置信息;進行數(shù)據(jù)預處理對缺失值線性插值、異常值剔除(將閾值之外的值,取其前5個數(shù)的均值替換);靜態(tài)配置信息經(jīng)過詞嵌入技術(shù)word2vec生成嵌入向量;將處理過的25個指標數(shù)據(jù)按比例劃分為訓練集、測試集與驗證集,不同預測任務比例不同;

    7、步驟2,構(gòu)建數(shù)據(jù)庫指標數(shù)據(jù)預測模型,分為依次連接的如下模塊:下采樣多尺度模塊、時間擴張雙重注意力模塊、靜態(tài)特征融合動態(tài)gcn模塊、片段間注意力與預測模塊;下采樣多尺度模塊包含多層的卷積、池化單元,用于生成不同長度的時序,長序列反映數(shù)據(jù)的整體波動狀況,短序列體現(xiàn)數(shù)據(jù)的局部特征;下采樣多尺度模塊的結(jié)果數(shù)據(jù)輸入到時間擴張雙重注意力模塊,時間擴張雙重注意力模塊包含兩路的并行時間卷積層,時間注意力與深度通道注意力門,用于捕獲特征的時間相關(guān)性;靜態(tài)特征融合動態(tài)gcn層綜合考慮數(shù)據(jù)庫靜態(tài)配置信息的影響,將靜態(tài)數(shù)據(jù)圖結(jié)構(gòu)與動態(tài)的數(shù)據(jù)圖結(jié)構(gòu)融合,捕獲特征的空間相關(guān)性;通過片段間注意力提取整體序列的全局相關(guān)性;最后將各尺度信息聚合輸出預測結(jié)果;

    8、數(shù)據(jù)庫指標數(shù)據(jù)預測模型執(zhí)行如下步驟:

    9、步驟2-1,使用預設(shè)的下采樣劃分多尺度層,捕獲時序在不同尺度下的時間相關(guān)性,也能靈活應對長序列數(shù)據(jù);

    10、步驟2-2,使用時間擴張雙重注意力模塊捕獲時間依賴,提取高級時間特征;時間擴張雙重注意力模塊由并行時間卷積層以及雙重注意力門組成;

    11、步驟2-3,時序數(shù)據(jù)是實時變化的,不能依靠單一共享的鄰接矩陣。時間擴張雙重注意力模塊的結(jié)果輸入到靜態(tài)特征融合動態(tài)gcn模塊中捕捉空間特征,使用以gru為主的圖動態(tài)構(gòu)造層捕捉動態(tài)變化特征生成一系列鄰接矩陣,送入圖卷積網(wǎng)絡(gcn)當中獲取向量關(guān)聯(lián);同時,采用服務器靜態(tài)信息的靜態(tài)特征圖學習層生成鄰接矩陣,同樣送入圖卷積網(wǎng)絡中;將兩種結(jié)果融合相加,再與下采樣多尺度模塊的輸出進行殘差操作,防止過擬合,獲取時空特征信息;

    12、步驟2-4:使用片段間注意力層,交互時間片段表示全局相關(guān)性;

    13、步驟2-5:跨尺度的時空信息聚合,即將每層信息順位相加;

    14、步驟2-6:輸入由兩層的激活函數(shù)與一維卷積構(gòu)成的預測模塊,動態(tài)調(diào)整所需輸出數(shù)據(jù)的維度以便進行兩種預測任務:單步預測輸出的單時間步q處預測值yt+q;多步預測輸出的一段時間預測序列為[yt+1、yt+2,...,yt+q];

    15、步驟3:針對兩種預測任務分別采取對應的評估指標進行評估,再利用優(yōu)化算法執(zhí)行時序預測的反向傳播,更新模型參數(shù),降低模型訓練損失值;其中單步預測中使用損失函數(shù)衡量預測值與真實值的誤差,損失函數(shù)包括相對平方誤差(rse)、相關(guān)系數(shù)(corr);多步預測中使用平均絕對誤差(mae)、均方根誤差(rmse)、corr;

    16、步驟4:使用早停策略加快模型訓練速度,當訓練損失連續(xù)不降低的迭代輪次達到設(shè)定次數(shù)時,停止當前輪訓練,并保存此前損失值最低時所對應的權(quán)重為最優(yōu)模型;

    17、步驟5:利用測試集數(shù)據(jù)測試模型性能輸出模型測試損失值,并獲取預測模塊的預測輸出的預測時間序列值共同作為預測結(jié)果;

    18、步驟6:將預測結(jié)果用于待預測的數(shù)據(jù)庫一維指標數(shù)據(jù)預測,實時監(jiān)測數(shù)據(jù)庫系統(tǒng)運營狀況。

    19、進一步地,步驟1中提及的訓練集、驗證集與測試集劃分的具體描述如下:

    20、步驟1-1:單步預測中按照比例6:2:2劃分訓練集、驗證集與測試集。而在多步預測中,為了加強模型捕捉各個節(jié)點間的交互性,定義了輸入序列、輸出序列的時間步偏移量,添加時間特征(如每個時間步在一天中的位置、每個時間步在一周中的位置),采用滑動窗口的方式增加樣本量,按照7:1:2的比例生成訓練、驗證和測試所需的輸入和輸出數(shù)據(jù)。

    21、進一步地,步驟2-1中的下采樣劃分多尺度層具體執(zhí)行如下步驟:

    22、步驟2-1-1,獲取與尺度層數(shù)對應的預設(shè)的卷積核大小數(shù)組;預設(shè)的卷積核大小數(shù)組中的卷積核大小數(shù)值隨著尺度層增大依次減小;

    23、步驟2-1-2,輸入數(shù)據(jù)經(jīng)過1×1卷積和第一層尺度層對應的卷積核大小的卷積獲取第一個尺度層1;

    24、步驟2-1-3,在第一尺度層的基礎(chǔ)上,以當前得到的尺度層作為輸入分為兩路進行下采樣,下采樣過程為:第一路通過殘差的1×1卷積;第二路通過下個尺度層對應的卷積核大小的卷積和池化核大小為1×3的池化,本文檔來自技高網(wǎng)...

    【技術(shù)保護點】

    1.基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:其包括以下步驟:

    2.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟1中數(shù)據(jù)庫一維指標數(shù)據(jù)序列X=[st[i]]∈RN×T,t∈[1,2,...,T],i∈[1,2,...,N],X表示T個時間戳的歷史觀測值,N表示變量特征數(shù),st[i]∈RN×1表示第i個變量在時間戳t處的值;步驟1中選定目標時間段內(nèi)的25個指標數(shù)據(jù)作為多變量時間序列數(shù)據(jù)集,數(shù)據(jù)采集速度為每分鐘采集一次;收集數(shù)據(jù)庫運營相應服務器的7個靜態(tài)配置信息;數(shù)據(jù)預處理包括對缺失值線性插值、異常值剔除。

    3.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟1中提及的訓練集、驗證集與測試集劃分的具體描述如下:單步預測中按照比例6:2:2劃分訓練集、驗證集與測試集;在多步預測中采用滑動窗口的方式增加樣本量,按照7:1:2的比例生成訓練、驗證和測試所需的輸入數(shù)據(jù)。

    4.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-1中的下采樣劃分多尺度層具體執(zhí)行如下步驟:

    5.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-2中的時間擴張雙重注意力模塊具體執(zhí)行如下步驟:

    6.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-3中的靜態(tài)特征融合動態(tài)GCN模塊具體為:

    7.根據(jù)權(quán)利要求6所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-3-2中生成的第一個動態(tài)鄰接矩陣的具體表達式如下:

    8.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-4中的片段間注意力層具體為:將靜態(tài)特征融合動態(tài)GCN模塊的輸出結(jié)果作為輸入序列Xin按預設(shè)大小分割成n塊,結(jié)合特征嵌入維度dm與片段長度的維度S得d=S·dm;再將輸入序列Xin進行線性映射得到Qin、Kin、Vin,并用自注意力機制得到全局相關(guān)性:最后將各片段結(jié)果拼接。

    9.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟3中提及的評估指標具體為:時間輸入窗口長度為168,單步預測中的預測輸出長度為1;多步預測中的預測輸出長度為12;所用指標分別為:

    10.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合GCN的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟4中使用早停策略加快模型訓練速度,當訓練損失連續(xù)15個Epoch不降低時,停止當前輪訓練,并保存此前損失值最低時所對應的權(quán)重為最優(yōu)模型。

    ...

    【技術(shù)特征摘要】

    1.基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:其包括以下步驟:

    2.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟1中數(shù)據(jù)庫一維指標數(shù)據(jù)序列x=[st[i]]∈rn×t,t∈[1,2,...,t],i∈[1,2,...,n],x表示t個時間戳的歷史觀測值,n表示變量特征數(shù),st[i]∈rn×1表示第i個變量在時間戳t處的值;步驟1中選定目標時間段內(nèi)的25個指標數(shù)據(jù)作為多變量時間序列數(shù)據(jù)集,數(shù)據(jù)采集速度為每分鐘采集一次;收集數(shù)據(jù)庫運營相應服務器的7個靜態(tài)配置信息;數(shù)據(jù)預處理包括對缺失值線性插值、異常值剔除。

    3.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟1中提及的訓練集、驗證集與測試集劃分的具體描述如下:單步預測中按照比例6:2:2劃分訓練集、驗證集與測試集;在多步預測中采用滑動窗口的方式增加樣本量,按照7:1:2的比例生成訓練、驗證和測試所需的輸入數(shù)據(jù)。

    4.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-1中的下采樣劃分多尺度層具體執(zhí)行如下步驟:

    5.根據(jù)權(quán)利要求1所述的基于雙重注意力與靜態(tài)融合gcn的數(shù)據(jù)庫指標數(shù)據(jù)預測方法,其特征在于:步驟2-2中的時間擴張雙重注意力模塊具...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:鄭華洪明霞馮碩陳子濱張超超朱小欽
    申請(專利權(quán))人:福建師范大學
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码中文字幕av免费放dvd| 日韩精品无码免费视频| 免费无码H肉动漫在线观看麻豆 | 国产成人无码AV在线播放无广告 | 无码中文2020字幕二区| 成人无码嫩草影院| 亚洲中文字幕无码爆乳AV| 无码人妻精品一区二区在线视频| 亚洲精品无码专区在线播放| 西西4444www大胆无码| 国产成人无码精品一区二区三区| 久久亚洲精品无码VA大香大香| 亚洲国产精品无码中文lv| 久久久久亚洲?V成人无码| 亚洲av永久中文无码精品 | 少妇中文无码高清| 中文无码字慕在线观看| 色情无码WWW视频无码区小黄鸭 | 亚洲无码日韩精品第一页| 亚洲精品无码少妇30P| 无码国产精品一区二区免费虚拟VR| 亚洲av中文无码| 日韩视频无码日韩视频又2021 | 国产精品无码成人午夜电影| 免费无码国产V片在线观看| 麻豆人妻少妇精品无码专区| 无码少妇一区二区三区芒果| 亚洲精品无码专区| 亚洲av永久中文无码精品综合| 亚洲人av高清无码| 亚洲不卡无码av中文字幕| 亚洲 另类 无码 在线| 久久av高潮av无码av喷吹| 伊人久久无码中文字幕| 色综合久久无码中文字幕| 亚洲AV无码精品国产成人| 综合无码一区二区三区| 久久亚洲AV无码精品色午夜| 日韩少妇无码一区二区三区 | 日韩美无码五月天| 国产免费无码一区二区|