• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種異構數據庫環境下語義集成過程的并行計算方法技術

    技術編號:8682748 閱讀:170 留言:0更新日期:2013-05-09 02:42
    一種異構數據庫環境下語義集成過程的并行計算方法:區分相同屬性是異構數據庫環境下語義集成中的一個重要環節,主要的方法是用特征描述屬性來評估屬性之間的相似性。雖然這種方法具有較高自動化和易于實現的特點,但它將花費更多的時間來比較所有的屬性且不能在語義集成中實現并行計算。本文提出了一種基于數據類型的方法來實現異構數據環境下相同屬性的確定,這種方法具有在描述比較時間的同時實現語義集成的并行計算的特點。

    【技術實現步驟摘要】

    本專利技術涉及。是一種能提高系統性能并且不降低查準率和查全率計算方法。
    技術介紹
    在異構數據庫環境下能夠區分出相同和不相同的屬性是實現數據庫互操作的一個重要前提條件。許多參考文獻討論了如何區分異構數據庫中相同屬性的問題。但這些方法不能區分出現實世界中存在的不相同(似)的數據類型描述的同一屬性(后面給出數據類型之間相同(似)性的定義)O例如,關系模式:Student (Sno, Shame, Sage.Sdept)假如描述屬性Sno的數據類型是整型,則用于區分屬性的特征向量類似為:(data type, length, key or not, value constraints, aver-age, rain, max)特征向量的具體取值為:(int,4,key,notnull,95030,95001。95059)1假如描述屬性Sno的數據類型是字符型,則用于區分屬性的特征向量類似為:(data type, length, key or not, value constraints, theratio of the number ofnumerical characters to the totalnumber of characters,the ratio of white—spacecharac-ters tO total characters, statistics on length)。特征向量的具體取值為:(char,5, key, not null, 1,0,5)2顯然,由于用不相同(似)數據類型描述同一屬性時特征向量的巨大差異性,目前通過比較描述屬性的特征向量信息不能夠區分出不相同(似)的數據類型描述的同一屬性(如⑴和⑵).既然用描述屬性的特征向量信息不能區分出不相同(似)的數據類型描述的同一屬性,我們認為在不相同(似)的數據類型描述的屬性中進行相似屬性的確定是無實際意義的.所以,本文提出一種基于數據類型的方法來實現異構數據環境下相同屬性的確定。該方法要求首先對各個數據庫中的數據根據數據類型分類,然后在數據庫之間具有相同數據類型描述的屬性內部進行屬性是否相同的確定。由于屬性根據數據類型進行了分類,從而可以實現不同數據類型內確定相同屬性過程的并行計算(在第3部分理論上分析了該方法并行計算的可行性),同時,該方法也明顯地減少了語義集成過程中屬性的比較次數。實驗結果顯示我們提出的方法能明顯提高系統的運行效率,并且不降低語義集成中數據的查準率和查全率。
    技術實現思路
    基于上述情況,特此專利技術;該方法根據屬性的元數據信息排除了大部分不相等的屬性對,從而解決了文[10,11]中確定屬性關系時比較費時的問題。但是,該方法僅使用屬性的元數據信息,并未使用數據內容信息,使用文[9]中的規則。則具有相同元數據信息描述的不同屬性不能被區分開。同時,該方法不能實現相同屬性確定過程的并行計算。我們認為為了提高數據的查準率和查全率,描述屬性的特征向量中應增加描述數據內容方面的信息,通過計算模式信息和數據內容與統計信息的概率值來確定相同屬性。1.在數值型屬性間進行相同屬性的確定;首先,進行數值型屬性間相同屬性的確定。我們把描述數值型屬性特征的信息分為三類:模式信息、數據限制和數據內容。(I)模式信息:包括數據類型、長度、是否為鍵屬性;(2)數據限制:包括外鍵信息、屬性取值范圍限制、是否允許為空;(3)數據內容:包括最大值、最小值、平均值、標準差;2.在字符型屬性間進行相同屬性的確定;其中模式信息、數據限制如數值型屬性,數據內容部分包括:字符型屬性的具體取值中數字字符占整個字符的比率,空白字符占整個字符的比率,字符所占空間的統計長度。其中,:字符所占空間的統計長度是指實際用來存儲字符的長度,而不是事先分配的存儲空問的長度。本文檔來自技高網
    ...

    【技術保護點】
    一種異構數據庫環境下語義集成過程的并行計算方法:該方法是是易于實現語義集成過程的并行計算。

    【技術特征摘要】
    1.一種異構數據庫環境下語義集成過程的并行計算方法:該方法是是易于實現語義集成過程的并行計算。2.根據權利要求1的基于一種異構數據庫環境下語義集...

    【專利技術屬性】
    技術研發人員:楊際榮,
    申請(專利權)人:鎮江華揚信息科技有限公司,
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码一区二区三区视频| 无码午夜成人1000部免费视频 | 精品无码一区二区三区爱欲九九| 国产AV无码专区亚洲精品| 午夜无码国产理论在线| 激情射精爆插热吻无码视频| 久久精品无码一区二区三区日韩 | 在线a亚洲v天堂网2019无码| 久久AV高清无码| 国产免费无码AV片在线观看不卡| 国产怡春院无码一区二区| 亚洲国产精品无码久久一区二区| 国产AV天堂无码一区二区三区| 久久国产精品无码HDAV| 亚洲成AV人片在线播放无码| 无码精品人妻一区| 国产精品无码无卡在线观看久| 无码人妻AⅤ一区二区三区| 一本加勒比HEZYO无码资源网| 日韩精品无码免费视频| 色欲aⅴ亚洲情无码AV蜜桃| 中文无码精品A∨在线观看不卡| 久久久久亚洲AV无码专区体验| 一夲道无码人妻精品一区二区| 国产亚洲精品无码专区| 无码av大香线蕉伊人久久| 亚洲成在人线在线播放无码| 亚洲AV无码一区二区乱孑伦AS| 最新国产精品无码| 中国少妇无码专区| 无码色AV一二区在线播放| 狠狠精品干练久久久无码中文字幕| 亚洲日韩一区二区一无码| 亚洲午夜无码久久久久软件| 亚洲国产成人无码av在线播放| 无码国产乱人伦偷精品视频| 青青草无码免费一二三区| 精品无码一区二区三区在线| 亚洲中文字幕无码一去台湾| 蜜臀AV无码一区二区三区| 亚洲成av人片在线观看天堂无码|