【技術(shù)實(shí)現(xiàn)步驟摘要】
一種面向教育領(lǐng)域資源云存儲的語義預(yù)取系統(tǒng)及方法
本專利技術(shù)屬于教育領(lǐng)域資源云存儲的語義預(yù)技術(shù),具體涉及面向教育領(lǐng)域資源云存儲的語義預(yù)取系統(tǒng)及方法。
技術(shù)介紹
近年來,云計(jì)算得到了快速的發(fā)展,而作為云計(jì)算的重要組成部分,云存儲也成為當(dāng)前的熱門研究課題之一。目前對于云存儲的研究主要集中在數(shù)據(jù)存儲,以及提升存儲性能方面,而較少關(guān)注在存儲對象限于領(lǐng)域情況下的存儲增效研究。按照一般規(guī)律,存儲增效研究主要需要解決對資源請求的網(wǎng)絡(luò)延遲和網(wǎng)絡(luò)服務(wù)質(zhì)量問題,目前方案有緩存和預(yù)取。對以教育領(lǐng)域資源而言,我們發(fā)現(xiàn)存在有訪問對象主題性和行為聚集性等特征,它們將成為我們研究教育領(lǐng)域資源云存儲增效技術(shù)的基礎(chǔ)。訪問的聚集性原理體現(xiàn)為時(shí)間與空間的聚集性,其中時(shí)間聚集性是指距離上次訪問時(shí)間越近的對象或者資源,越有可能再次被訪問;而空間聚集性是指存儲對象相對集中服務(wù)于一定空間地理位置的訪問行為。聚集性原理在計(jì)算機(jī)結(jié)構(gòu)、緩存、基于WEB的企業(yè)系統(tǒng)、環(huán)境感知的軟件等各個(gè)領(lǐng)域都有廣泛的應(yīng)用。目前一些現(xiàn)有的預(yù)取技術(shù)通常采用的方法為:1.一種基于云存儲的高效資源動態(tài)調(diào)度方法·申請日:2012.11.07·申請?zhí)?201210440341.1·申請人地址:250014山東省濟(jì)南市高新區(qū)舜雅路1036號·專利技術(shù)人:黃臣李瑞東2.一種網(wǎng)絡(luò)資源預(yù)取并緩存加速的方法及其裝置·申請日:2011.12.05·申請?zhí)?201110399507.5·申請人地址:100190北京市海淀區(qū)中關(guān)村東路66號長城大廈3層·專利技術(shù)人:李繼明楊東曉3.一種教育資源語義標(biāo)注方法·申請日:2014.10.23·申請?zhí)?201410 ...
【技術(shù)保護(hù)點(diǎn)】
1.一種面向教育領(lǐng)域資源云存儲的語義預(yù)取系統(tǒng),其特征在于,包括用戶接口模塊、請求控制模塊、云存儲模塊、緩存管理模塊、副本管理模塊以及預(yù)取模塊;所述用戶接口模塊用于接收用戶的請求,將請求交付到后臺處理,并根據(jù)后臺系統(tǒng)的返回?cái)?shù)據(jù)響應(yīng)用戶的請求;所述請求控制模塊對用戶的請求進(jìn)行處理;所述云存儲模塊對存儲資源的元數(shù)據(jù)進(jìn)行管理;所述緩存管理模塊由緩存數(shù)據(jù)與緩存管理組成,緩存數(shù)據(jù)是訪問熱度比較高的教育資源元數(shù)據(jù),緩存管理則是對緩存數(shù)據(jù)進(jìn)行實(shí)時(shí)更新,以最大限度降低云存儲模塊中名稱節(jié)點(diǎn)的壓力與提高元數(shù)據(jù)查詢效率;所述副本管理模塊基于教育資源用戶訪問的聚集性特征,根據(jù)系統(tǒng)的負(fù)載情況與資源的訪問熱度對資源的副本進(jìn)行優(yōu)化調(diào)度;所述預(yù)取模塊基于教育資源用戶訪問的主題性特征,接收請求控制模塊傳遞過來的請求,計(jì)算該請求和其相關(guān)請求的訪問熱度以及系統(tǒng)相對承載力,綜合請求文件的訪問熱度和系統(tǒng)相對承載力判斷是否執(zhí)行預(yù)取操作。
【技術(shù)特征摘要】
1.一種面向教育領(lǐng)域資源云存儲的語義預(yù)取系統(tǒng),其特征在于,包括用戶接口模塊、請求控制模塊、云存儲模塊、緩存管理模塊、副本管理模塊以及預(yù)取模塊;所述用戶接口模塊用于接收用戶的請求,將請求交付到后臺處理,并根據(jù)后臺系統(tǒng)的返回?cái)?shù)據(jù)響應(yīng)用戶的請求;所述請求控制模塊對用戶的請求進(jìn)行處理;所述云存儲模塊對存儲資源的元數(shù)據(jù)進(jìn)行管理;所述緩存管理模塊由緩存數(shù)據(jù)與緩存管理組成,緩存數(shù)據(jù)是訪問熱度比較高的教育資源元數(shù)據(jù),緩存管理則是對緩存數(shù)據(jù)進(jìn)行實(shí)時(shí)更新,以最大限度降低云存儲模塊中名稱節(jié)點(diǎn)的壓力與提高元數(shù)據(jù)查詢效率;所述副本管理模塊基于教育資源用戶訪問的聚集性特征,根據(jù)系統(tǒng)的負(fù)載情況與資源的訪問熱度對資源的副本進(jìn)行優(yōu)化調(diào)度;所述預(yù)取模塊基于教育資源用戶訪問的主題性特征,接收請求控制模塊傳遞過來的請求,計(jì)算該請求和其相關(guān)請求的訪問熱度以及系統(tǒng)相對承載力,綜合請求文件的訪問熱度和系統(tǒng)相對承載力判斷是否執(zhí)行預(yù)取操作。2.根據(jù)權(quán)利要求1所述的面向教育領(lǐng)域資源云存儲的語義預(yù)取系統(tǒng),其特征在于,所述請求控制模塊還觸發(fā)優(yōu)化增效模塊。3.根據(jù)權(quán)利要求1所述的面向教育領(lǐng)域資源云存儲的語義預(yù)取系統(tǒng),其特征在于,所述云存儲模塊包括一個(gè)名稱節(jié)點(diǎn)與多個(gè)數(shù)據(jù)節(jié)點(diǎn)組成,所述名稱節(jié)點(diǎn)主要滿足系統(tǒng)的查詢,所述數(shù)據(jù)節(jié)點(diǎn)主要提供了資源的云存儲空間與節(jié)點(diǎn)之間的數(shù)據(jù)通信。4.根據(jù)權(quán)利要求1所述的面向教育領(lǐng)域資源云存儲的語義預(yù)取系統(tǒng),其特征在于,所述副本管理模塊包括副本放置策略、副本生成策略與副本替換策略。5.根據(jù)權(quán)利要求1所述的面向教育領(lǐng)域資源云存儲的語義預(yù)取系統(tǒng),其特征在于,所述執(zhí)行預(yù)取操作的方法為:如果達(dá)到預(yù)取條件則觸發(fā)預(yù)取推理,通過在日志文件、本體和語義標(biāo)注的資源的基礎(chǔ)上推理得到預(yù)取對象,并將預(yù)取對象序列傳遞到副本管理模塊,否則返回不預(yù)取信號。6.一種面向教育領(lǐng)域資源云存儲的語義預(yù)取方法,包括如下步驟:步驟一,用戶請求概念獲取:系統(tǒng)首先會對用戶請求數(shù)據(jù)資源中的標(biāo)注進(jìn)行關(guān)鍵字抽取,利用相應(yīng)的匹配算法將關(guān)鍵詞與本體庫中的概念進(jìn)行逐一匹配,實(shí)現(xiàn)關(guān)鍵詞到本體概念的映射,得到相應(yīng)的概念集合;步驟二,判斷概念集合主題相關(guān)性:具體方法為,隨機(jī)從中抽取m'個(gè)概念(m'≤m)進(jìn)行抽樣分析,并記抽取概念的集合為符號Sim(a,b)表示概念a與概念b在HowNet中的相似度計(jì)算公式,由此可以得出抽樣集合中每個(gè)概念相互之間的相似度,并形成相似度矩陣,其如式(1)所示:根據(jù)HowNet相似的計(jì)算公式定義可知Sim(ci,ci)=1.000,Sim(ci,cj)=Sim(cj,ci),其中ci,cj∈Csa,則可以求出集合Csa的平均概念相似度,其定義如式(2)所示:設(shè)定平均概念相似度閾值ε1,該值可以根據(jù)歷史記錄簡單分析得到,若則集合中的概念具有一定的主題相關(guān)性;步驟三,候選中心概念的選取:具體包括如下的步驟:A:當(dāng)考察會話si與其他會話在時(shí)間段Δt內(nèi)的主題相關(guān)性時(shí),si中的每個(gè)概念ci,1,ci,2,ci,3將逐一比較其他每個(gè)會話中的概念,并且找出其中相似度最大的加入到以si中的概念為中心的序列中,得到Si,1,Si,2,Si,3,當(dāng)ci,j=null時(shí),Si,j=null,j=1,2,3,以Si,1,Si,2,Si,3中概念相似度總和最大作為其對應(yīng)的概念為會話si的代表概念cire,Si,j的相似度總和的計(jì)算方式如式(3)所示:則的相似度總和如式(4)所示:經(jīng)過式(3),(4)的計(jì)算,可以得到會話si中相應(yīng)的代表概念cire,還有與cire相對應(yīng)的主題相關(guān)性概念序列可相應(yīng)求出其他會話的代表概念以及相應(yīng)的主題相關(guān)概念序列;得到代表概念集合后,系統(tǒng)將進(jìn)一步分析從中產(chǎn)生候選中心概念,具體流程如下:A:以cire為概念語義中心,刪除中與之概念相似度小于閾值ε2的概念若刪除后序列中只剩下cire本身,則說明該序列的主題相關(guān)性不明顯,直接刪除該代表概念cire與B:在序列的剩余概念中找出相似度為1的概念進(jìn)行合并,假設(shè)則保留刪除并wi,x=wi,x+wi,y;C:經(jīng)過刪除與合并后,假設(shè)序列剩余概念個(gè)數(shù)為r,根據(jù)式(6)計(jì)算出cire的序列概念相似度總和:并計(jì)算該序列概念的平均相似度,其定義如式(7)所示:再計(jì)算該序列的標(biāo)準(zhǔn)差,其定義如式(8)所示:D:設(shè)定閥值ε3與ε4,ε3應(yīng)根據(jù)該時(shí)間段內(nèi)用戶請求會話的個(gè)數(shù)m成正比,ε4根據(jù)系統(tǒng)主題關(guān)系強(qiáng)弱穩(wěn)定性要求設(shè)定來設(shè)定,保留且的代表概念cire作為候選中心概念,否則進(jìn)入下一個(gè)代表概念的判定,遍歷完代表概念集合及相應(yīng)主題相關(guān)序列,得到候選中心概念集合步驟四,中心概念的確定:其具體的方法如下:A:在候選中心概念集合中,如果判斷出幾個(gè)概念元素的相似度很高,僅需合并為一個(gè)概念予以表征即可,該過程稱之為候選中心概念的歸并,假設(shè)cica為候選中心概念,在候選中心概念集合中與cica相似度大于ε5的概念加入帶合并集合并記為Cica,然后對集合cica∪Cica進(jìn)行概念合并,首先確定帶合并候選概念集合cica∪Cica的合并中心,即中心概念其可以用概念中心度來得到。假設(shè)h=Size(cica∪Cica),ci在Cica中概念中心度定義如式(9)所示(ci∈cica∪Cica):則可以由式(10)得到:合并候選概念集合Cica中概念對應(yīng)主題相關(guān)序列,得到中心概念后,把Cica中候選概念對應(yīng)的主題相關(guān)序列合并到對應(yīng)主題相關(guān)序列,得到中心概念最終對應(yīng)的主題相關(guān)序列,在合并的過程中,集合中其他候選中心概念對應(yīng)主題相關(guān)序列中的概念應(yīng)該重新計(jì)算其與中心概念的相似度,計(jì)算方式如下式(11)所示:至此,中心概念集合Cc的確定與對應(yīng)主題相關(guān)概念序列的獲取到此完成;步驟五,預(yù)取對象的確定:根據(jù)中心概念集合CC系統(tǒng)進(jìn)一步確定預(yù)取對象,確定預(yù)取對象之前分析需要預(yù)取的數(shù)據(jù)節(jié)點(diǎn),與預(yù)取數(shù)據(jù)的數(shù)量,系統(tǒng)結(jié)合CC從空間的維度分析時(shí)間段ΔT內(nèi)的用戶請求,首先根據(jù)系統(tǒng)服務(wù)區(qū)域劃分規(guī)則將請求客戶端劃分為g個(gè)區(qū)域A={ai'|1≤i'≤g},假設(shè)根據(jù)本發(fā)明提出的技術(shù)方案得到某個(gè)時(shí)間段區(qū)域ai'中心概念為則在該時(shí)間段ΔT內(nèi)區(qū)域ai'關(guān)于概念的主題相關(guān)性程度為:計(jì)算方式如下式(12)所示:其中n與T距離根據(jù)系統(tǒng)性能要求確定;mt為時(shí)間段Δt區(qū)域ai'內(nèi)用戶訪問請求總次數(shù);cj是該時(shí)間段Δt區(qū)域ai'內(nèi)的一個(gè)中心概念,其與當(dāng)前時(shí)間段ΔT考察的中心概念有若t=T,即當(dāng)前時(shí)間段,則有βt為時(shí)間衰減系數(shù),0≤βt≤1,越接近當(dāng)前時(shí)刻的時(shí)間段衰減系數(shù)值越大,說明時(shí)間距離當(dāng)前時(shí)刻越遠(yuǎn)參考性越低,系統(tǒng)根據(jù)概念關(guān)系模式進(jìn)行概念語義推理,推理規(guī)則包括一下兩條:規(guī)則1:SubClassOf(cx,cy),SubClassOf(cy,cz)→hasGrandFather(cx,cz)規(guī)則2:SubClassOf(cx,cz),SubClassOf(cy,cz)→...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:黃昌勤,黃微宇,黃瓊浩,王希哲,李源,
申請(專利權(quán))人:華南師范大學(xué),
類型:發(fā)明
國別省市:廣東,44
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。