【技術(shù)實(shí)現(xiàn)步驟摘要】
本專(zhuān)利技術(shù)涉及時(shí)間序列分析,具體為一種基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法及系統(tǒng)。
技術(shù)介紹
1、軌跡聚類(lèi)是將具有相似運(yùn)動(dòng)模式或行為的軌跡數(shù)據(jù)歸為一類(lèi),從而幫助理解和發(fā)現(xiàn)軌跡數(shù)據(jù)中的模式和規(guī)律,提高對(duì)移動(dòng)對(duì)象的運(yùn)動(dòng)行為的理解,可用于任務(wù)分類(lèi)、異常行為檢測(cè)和軌跡預(yù)測(cè)等。軌跡聚類(lèi)的研究主要分為兩步,相似度度量和軌跡聚類(lèi)。相似度度量方面,現(xiàn)有常用的軌跡距離算法(dtw距離,豪斯多夫距離等)普遍存在異常值敏感和忽略軌跡變化趨勢(shì)的問(wèn)題。軌跡聚類(lèi)方面,大部分研究者用基于密度的方法對(duì)軌跡進(jìn)行聚類(lèi),然而這類(lèi)算法只適用于密差異較大的凸形數(shù)據(jù)集,限制了其在處理復(fù)雜數(shù)據(jù)集上的應(yīng)用。此外,目前大多聚類(lèi)都忽略了軌跡的時(shí)間關(guān)聯(lián)性且易受噪聲軌跡的干擾,影響其結(jié)果的準(zhǔn)確性和穩(wěn)定性。
2、本專(zhuān)利技術(shù)提出一種基于時(shí)間與多維空間的譜三向模糊軌跡聚類(lèi)模型克服了傳統(tǒng)模型的限制,以提供更準(zhǔn)確和有意義的軌跡聚類(lèi)結(jié)果。通過(guò)結(jié)合譜聚類(lèi)、多維數(shù)據(jù)處理技術(shù)和噪聲處理,本專(zhuān)利技術(shù)的模型能夠很好地分組渦旋軌跡數(shù)據(jù),揭示海洋渦旋不同時(shí)間的移動(dòng)模式,對(duì)海上風(fēng)能資源評(píng)估和風(fēng)電場(chǎng)設(shè)計(jì)有著重要意義。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述存在的問(wèn)題,提出了本專(zhuān)利技術(shù)。
2、因此,本專(zhuān)利技術(shù)解決的技術(shù)問(wèn)題是:現(xiàn)有的模糊軌跡聚類(lèi)方法存在異常值敏感和忽略軌跡變化趨勢(shì),以及如何關(guān)注軌跡的時(shí)間關(guān)聯(lián)性的優(yōu)化問(wèn)題。
3、為解決上述技術(shù)問(wèn)題,本專(zhuān)利技術(shù)提供如下技術(shù)方案:一種基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法,包括:根據(jù)軌跡的時(shí)間關(guān)聯(lián)性,使
4、作為本專(zhuān)利技術(shù)所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法的一種優(yōu)選方案,其中:所述使用基于dpc的密集時(shí)間段劃分算法得到軌跡的密集時(shí)間段包括根據(jù)軌跡的時(shí)間屬性確定時(shí)間軸的長(zhǎng)度和單位,并將軌跡數(shù)據(jù)映射至?xí)r間軸上,計(jì)算軸上的單位時(shí)間軌跡密度,確定軌跡數(shù)量,根據(jù)時(shí)間軸長(zhǎng)度確定時(shí)間窗口大小,計(jì)算單位時(shí)間窗口內(nèi)的局部密度和相對(duì)距離,表示為:
5、
6、
7、其中,t為時(shí)間軸長(zhǎng),ρj為時(shí)間點(diǎn)j的密度,ldi表示局部密度,dij表示時(shí)間點(diǎn)i與最小ld時(shí)間點(diǎn)的距離,rdi為相對(duì)距離,根據(jù)局部密度和相對(duì)距離構(gòu)建決策圖,并確定密集時(shí)間段劃分點(diǎn)的數(shù)量和值,確定密集時(shí)間段,依據(jù)密集時(shí)間段對(duì)軌跡數(shù)據(jù)集進(jìn)行劃分,并計(jì)算軌跡于密集時(shí)間段的時(shí)間隸屬度,表示為:
8、
9、其中,表示軌跡tri在密集時(shí)間段dtij上的時(shí)間隸屬度,和表示tri和dtij的開(kāi)始時(shí)間,和表示tri和dtij的結(jié)束時(shí)間。
10、作為本專(zhuān)利技術(shù)所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法的一種優(yōu)選方案,其中:所述計(jì)算多維軌跡間距離包括將多維軌跡根據(jù)特征變化進(jìn)行分割,得到由首尾采樣點(diǎn)組成的軌跡段,使用動(dòng)態(tài)規(guī)劃算法來(lái)找到兩軌跡段間最佳的對(duì)齊路徑,使匹配距離最小,兩軌跡間距離等于軌跡上所有匹配段距離之和,表示為:
11、
12、
13、
14、其中,si與sj分別為從屬于tra和trb軌跡的軌跡段,為si與sj的相對(duì)權(quán)重,等于匹配段于兩條軌跡長(zhǎng)度的占比,||si-sj||為si中點(diǎn)與sj中點(diǎn)的距離,為si與sj的變化率之差,τ為距離權(quán)重。
15、作為本專(zhuān)利技術(shù)所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法的一種優(yōu)選方案,其中:所述基于譜三向模糊聚類(lèi)方法得到軌跡的簇隸屬度,判斷軌跡從屬簇包括基于圖論把軌跡數(shù)據(jù)為連接圖,根據(jù)軌跡距離矩陣計(jì)算高斯核權(quán)重矩陣和度矩陣,高斯核權(quán)重計(jì)算表示為:
16、
17、其中mij表示tri與trj的距離,wij表示tri與trj相連邊上的權(quán)重,σ調(diào)節(jié)高斯分布的參數(shù),根據(jù)節(jié)點(diǎn)相連的邊的權(quán)重之和構(gòu)建對(duì)角線度矩陣d,對(duì)角線度矩陣減去高斯核權(quán)重矩陣得到拉普拉斯矩陣,并進(jìn)行標(biāo)準(zhǔn)化,將拉普拉斯矩陣特征分解獲取最少k個(gè)特征值的特征向量,其中k為聚類(lèi)數(shù),特征向量作為輸入,通過(guò)三向模糊聚類(lèi)得到軌跡的三向簇隸屬度,收斂后得到軌跡的簇隸屬度,判斷軌跡的所屬簇。
18、作為本專(zhuān)利技術(shù)所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法的一種優(yōu)選方案,其中:所述三向模糊聚類(lèi)包括隨機(jī)初始化隸屬度矩陣u,值域?yàn)閇0,1],根據(jù)隸屬度計(jì)算簇cp的中心表示為:
19、
20、其中,m為模糊指數(shù),n為軌跡數(shù)量,uip表示tri于簇cp的隸屬度,表示tri特征向量的第i個(gè)行向量;根據(jù)軌跡i至簇中心的距離計(jì)算軌跡的簇隸屬度(uip),表示為:
21、
22、其中dip表示和的歐式距離,k為聚類(lèi)數(shù),軌跡的簇隸屬度的三向化表示為:
23、
24、其中ε為三向界定閾值,x表示大于三向界定閾值和軌跡的時(shí)間隸屬度乘積的最小數(shù)量集合,對(duì)三向隸屬度進(jìn)行標(biāo)準(zhǔn)化表示為:
25、
26、迭代更新簇中心和隸屬度矩陣,直到u收斂或簇中心不再變化,則停止迭代。
27、作為本專(zhuān)利技術(shù)所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法的一種優(yōu)選方案,其中:所述結(jié)合calinski-harabasz指標(biāo)和pearson相關(guān)系數(shù)評(píng)估軌跡在多維空間上的聚類(lèi)結(jié)果包括評(píng)估軌跡多特征聚類(lèi)結(jié)果表示為:
28、
29、其中,bcsst表示簇間軌跡的特征t與時(shí)間的pearson系數(shù)的平均值的方差,wcsst表示各簇內(nèi)軌跡的特征t與時(shí)間的相關(guān)系數(shù)的方差的平均值。
30、作為本專(zhuān)利技術(shù)所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法的一種優(yōu)選方案,其中:所述判斷最佳聚類(lèi)數(shù)包括根據(jù)不同聚類(lèi)數(shù)k下的值判斷最佳聚類(lèi)數(shù),chf指數(shù)的數(shù)值越高,聚類(lèi)結(jié)果效果越好。
31、本專(zhuān)利技術(shù)的另外一個(gè)目的是提供一種基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)系統(tǒng),其能計(jì)算多維軌跡之間的相異性,通過(guò)段與段間匹配量化軌跡整體變化差異,解決了噪聲對(duì)計(jì)算的影響的問(wèn)題。
32、作為本專(zhuān)利技術(shù)所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)系統(tǒng)的一種優(yōu)選方案,其中:包括數(shù)據(jù)預(yù)處理模塊,軌跡特征提取模塊,軌跡聚類(lèi)模塊,評(píng)估模塊;所述數(shù)據(jù)預(yù)處理模塊用于根據(jù)軌跡的時(shí)間屬性確定時(shí)間軸的長(zhǎng)度和單位,將軌跡數(shù)據(jù)映射至?xí)r間軸上,計(jì)算軸上的單位時(shí)間軌跡密度;所述軌跡特征提取模塊使用基于dpc的密集時(shí)間段劃分算法得到軌跡的密集時(shí)間段,計(jì)算軌跡的時(shí)間隸屬度,基于dtw計(jì)算多維軌跡間距離;所述軌跡聚類(lèi)模塊基于譜三向模糊聚類(lèi)方法得到軌跡的簇隸屬度并判斷軌跡的所屬簇;所述評(píng)估模塊結(jié)合calinski-harabasz指標(biāo)和pearson相關(guān)系數(shù)評(píng)估軌跡在多維空間上的聚類(lèi)結(jié)果并分析最優(yōu)結(jié)果。
33、一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,其特征在于本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法,其特征在于,包括:
2.如權(quán)利要求1所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法,其特征在于:所述使用基于DPC的密集時(shí)間段劃分算法得到軌跡的密集時(shí)間段包括根據(jù)軌跡的時(shí)間屬性確定時(shí)間軸的長(zhǎng)度和單位,并將軌跡數(shù)據(jù)映射至?xí)r間軸上,計(jì)算軸上的單位時(shí)間軌跡密度,確定軌跡數(shù)量,根據(jù)時(shí)間軸長(zhǎng)度確定時(shí)間窗口大小,計(jì)算單位時(shí)間窗口內(nèi)的局部密度和相對(duì)距離,表示為:
3.如權(quán)利要求2所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法,其特征在于:所述計(jì)算多維軌跡間距離包括將多維軌跡根據(jù)特征變化進(jìn)行分割,得到由首尾采樣點(diǎn)組成的軌跡段,使用動(dòng)態(tài)規(guī)劃算法來(lái)找到兩軌跡段間最佳的對(duì)齊路徑,使匹配距離最小,兩軌跡間距離等于軌跡上所有匹配段距離之和,表示為:
4.如權(quán)利要求3所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法,其特征在于:所述基于譜三向模糊聚類(lèi)方法得到軌跡的簇隸屬度,判斷軌跡從屬簇包括基于圖論把軌跡數(shù)據(jù)為連接圖,根據(jù)軌跡距離矩陣計(jì)算高斯核權(quán)重矩陣和度矩陣,高斯核權(quán)重計(jì)算表示為:
5.如權(quán)利要求4所述的基于多維時(shí)空的譜三向模
6.如權(quán)利要求5所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法,其特征在于:所述結(jié)合Calinski-Harabasz指標(biāo)和Pearson相關(guān)系數(shù)評(píng)估軌跡在多維空間上的聚類(lèi)結(jié)果包括評(píng)估軌跡多特征聚類(lèi)結(jié)果表示為:
7.如權(quán)利要求6所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法,其特征在于:所述判斷最佳聚類(lèi)數(shù)包括根據(jù)不同聚類(lèi)數(shù)k下的值判斷最佳聚類(lèi)數(shù),CHf指數(shù)的數(shù)值越高,聚類(lèi)結(jié)果效果越好。
8.一種采用如權(quán)利要求1~7任一所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法的系統(tǒng),其特征在于:包括數(shù)據(jù)預(yù)處理模塊,軌跡特征提取模塊,軌跡聚類(lèi)模塊,評(píng)估模塊;
9.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法的步驟。
...【技術(shù)特征摘要】
1.一種基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法,其特征在于,包括:
2.如權(quán)利要求1所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法,其特征在于:所述使用基于dpc的密集時(shí)間段劃分算法得到軌跡的密集時(shí)間段包括根據(jù)軌跡的時(shí)間屬性確定時(shí)間軸的長(zhǎng)度和單位,并將軌跡數(shù)據(jù)映射至?xí)r間軸上,計(jì)算軸上的單位時(shí)間軌跡密度,確定軌跡數(shù)量,根據(jù)時(shí)間軸長(zhǎng)度確定時(shí)間窗口大小,計(jì)算單位時(shí)間窗口內(nèi)的局部密度和相對(duì)距離,表示為:
3.如權(quán)利要求2所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法,其特征在于:所述計(jì)算多維軌跡間距離包括將多維軌跡根據(jù)特征變化進(jìn)行分割,得到由首尾采樣點(diǎn)組成的軌跡段,使用動(dòng)態(tài)規(guī)劃算法來(lái)找到兩軌跡段間最佳的對(duì)齊路徑,使匹配距離最小,兩軌跡間距離等于軌跡上所有匹配段距離之和,表示為:
4.如權(quán)利要求3所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法,其特征在于:所述基于譜三向模糊聚類(lèi)方法得到軌跡的簇隸屬度,判斷軌跡從屬簇包括基于圖論把軌跡數(shù)據(jù)為連接圖,根據(jù)軌跡距離矩陣計(jì)算高斯核權(quán)重矩陣和度矩陣,高斯核權(quán)重計(jì)算表示為:
5.如權(quán)利要求4所述的基于多維時(shí)空的譜三向模糊軌跡聚類(lèi)方法,其特征在于:所述三向模糊聚類(lèi)...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:殷磊,杜偉安,楊曉東,趙致遠(yuǎn),呂金睿,時(shí)帥,杜艷玲,陳柯棋,黃曉琛,馮濤,鄧明星,祁少俊,王張煜,王雁冰,
申請(qǐng)(專(zhuān)利權(quán))人:華能浙江能源開(kāi)發(fā)有限公司清潔能源分公司,
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。