一種基于XML文檔的元數據模式匹配方法組成比例

技術編號：8453109 閱讀：225 留言：0更新日期：2013-03-21 17:39

本發明專利技術公開了一種基于XML文檔的元數據模式匹配方法，通過計算兩個元數據的語義相似度、屬性相似度、實例相似度、結構相似度和關系相似度，根據具體的XML文檔來設置權重，最后計算綜合相似度，因此在元數據之間的模式匹配時，可使計算結果更精確。

全部詳細技術資料下載

【技術實現步驟摘要】
—種基于XML文檔的元數據模式匹配方法
本專利技術關于元數據模式匹配方面，特別涉及XML文檔的元數據的語義、屬性、實例、結構和關系相似度計算方法，屬于數據庫

技術介紹
擴展標記語言(extensible Markup Language,XML)是一套定義語義標記的規則，用戶通過它可以創建文檔類型定義(Document Type Def inition,簡稱DTD)的規則集,XML 作為統一的轉換語法和交換格式，為開發者和用戶提供一種交換元數據信息的標準途徑，從而能夠方便、簡潔地在基于OMG UML的建模工具和基于OMG MOF的元數據倉儲(Metadata Repository)之間交換元數據。而元數據則是關于數據的數據，用于描述要素、數據集或數據集系列的內容、覆蓋范圍、質量、管理方式、數據的所有者、數據的提供方式等有關的信息。近年來越來越多的科研院所都開始致力于元數據相關問題的研究，特別是隨著語義Web 的發展，元數據理論及其相關技術已逐漸成為計算機領域中重要的研究熱點，為了解決網絡信息爆炸時代出現的諸多問題，元數據作為一種重要的應對方法和措施，已廣泛應用于信息檢索、信息集成、信息共享及軟件工程等各個應用領域中。語義內容異構是元數據模式集成中必須要面對而且需要重點解決的問題。要在網絡環境下消除由這些獨立的元數據方案引起的“信息孤島”，就必須有某種程度的元數據間互操作，用于解決不同元數據所引起的概念和結構的異構問題，這就需要在元數據之上再建立一些機制，來靈活地實現元數據間的互操作。作為解決信息異構、信息集成的主要方法，模式匹配技術設計的是否合...

【技術保護點】
一種基于XML文檔的元數據模式匹配方法，其特征在于，包括以下步驟：1）計算兩個元數據的語義相似度：元數據a和元數據b之間的相似度通過字符串的同義詞匹配來完成，計算模型如下所示：lex_sim(m1,m2)=Σi=1sΣj=1tsim(m1i,m2j)m*n式(1)其中其中m1i是元數據m1的第i個關鍵詞，m2j是元數據m2的第j個關鍵詞，s表示元數據m1的關鍵詞個數，t表示元數據m2的關鍵詞個數，sim(m1i,m2j)表示關鍵詞m1i和m2j的相似度，如果m1i和m2j相同或為同義詞，則sim(m1i,m2j)=1，否則為0；lex_sim(m1,m2)的取值范圍為[0,1]，當元數據m1中的所有關鍵詞與元數據m2所有關鍵詞相同或為同義詞時，lex_sim(m1,m2)=1，而全部不相同或都不為同義詞時lex_sim(m1,m2)=0；2）計算兩個元數據的屬性相似度：使用公式(2)計算出兩個元數據的屬性相似度，計算模型如下所示：attr_sim(m1,m2)=|m2∩m2||m1,m2|+D(m1,m2)|m1∩⫬m2|+(1-D(m1...

【技術特征摘要】

【專利技術屬性】
技術研發人員：朱曉燕，何金陵，潘留興，趙鑫，
申請(專利權)人：江蘇省電力公司信息通信分公司，江蘇電力信息技術有限公司，江蘇省電力公司，國家電網公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術

文檔的最佳匹配對象技術

模式匹配技術