本公開的實施例涉及在隱私保護前提下用于數據共享的方法、節點、分布式系統和存儲介質,涉及計算機領域。根據該方法,從包括隱私數據和第一非隱私數據的本地數據,獲取隱私數據,第一非隱私數據與隱私數據相關聯;生成隱私數據的哈希值;生成用于本地數據的本地標識符與哈希值之間的第一關聯;生成用于在分布式系統中索引哈希值的全局標識符,分布式系統與當前節點相關聯;生成全局標識符與哈希值之間的第二關聯;以及向分布式系統中的其他節點發送第二關聯,以在分布式系統中存儲第二關聯,以用于第一非隱私數據的連接共享。由此,能夠在保護本地隱私數據的前提下,安全地進行非隱私數據的共享。私數據的共享。私數據的共享。
【技術實現步驟摘要】
一種基于隱私保護的數據共享方法及裝置
[0001]本公開的實施例總體涉及計算機領域,具體涉及在隱私保護前提下用于數據共享的方法、數據提供節點、數據使用節點、分布式系統和計算機存儲介質。
技術介紹
[0002]在人工智能時代,數據成為一種重要的戰略資源。國家和企業基于戰略及安全需要,對數據隱私的保護也變得越來越嚴格。另外一方面,數據分析及人工智能模型訓練又往往需要大量的數據。如何能在保護數據隱私的前提下進行數據分析及人工智能模型訓練成為當前計算機領域的一個非常重要的研究方向。
技術實現思路
[0003]提供了一種用于數據共享的方法、數據提供節點、數據使用節點、分布式系統以及計算機存儲介質,能夠在保護本地隱私數據的前提下,安全地進行非隱私數據的共享。
[0004]根據本公開的第一方面,提供了一種用于數據共享的方法。該方法包括:從包括隱私數據和第一非隱私數據的本地數據,獲取隱私數據,第一非隱私數據與隱私數據相關聯;生成隱私數據的哈希值;生成用于本地數據的本地標識符與哈希值之間的第一關聯;生成用于在分布式系統中索引哈希值的全局標識符,分布式系統與當前節點相關聯;生成全局標識符與哈希值之間的第二關聯;以及向分布式系統中的其他節點發送第二關聯,以在分布式系統中存儲第二關聯,以用于第一非隱私數據的連接共享。
[0005]根據本公開的第二方面,提供了一種用于數據共享的方法。該方法包括:基于分布式系統中存儲的聯合元數據,生成數據條件信息,聯合元數據至少包括全局標識符和多項非隱私數據的多項屬性信息之間的關聯,全局標識符與隱私數據的哈希值相關聯,隱私數據與多項非隱私數據相關聯,多項非隱私數據位于分布式系統中的多個數據提供節點;向多個數據提供節點發送數據請求,數據請求包括數據條件信息;以及從多個數據提供節點中的至少一個數據提供節點接收與數據條件信息相匹配的至少一項非隱私數據。
[0006]根據本公開的第三方面,提供了一種數據提供節點。該數據提供節點包括:至少一個處理器,以及與至少一個處理器通信連接的存儲器,其中,存儲器存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行根據第一方面所述的方法。
[0007]根據本公開的第四方面,提供了一種數據使用節點。該數據使用節點包括:至少一個處理器,以及與至少一個處理器通信連接的存儲器,其中,存儲器存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行根據第二方面所述的方法。
[0008]根據本公開的第五方面,提供了一種分布式系統。該分布式系統包括:多個根據本公開的第三方面所述的數據提供節點數據提供節點;以及根據本公開的第四方面所述的數據使用節點。
[0009]在本公開的第六方面中,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現根據本公開的第一方面或第二方面所述的方法。
[0010]應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
[0011]結合附圖并參考以下詳細說明,本公開各實施例的上述和其他特征、優點及方面將變得更加明顯。在附圖中,相同或相似的附圖標注表示相同或相似的元素。
[0012]圖1是根據本公開的實施例的分布式系統100的示意圖。
[0013]圖2是根據本公開的實施例的用于數據共享的方法200的示意圖。
[0014]圖3是根據本公開的實施例的用于數據共享的方法300的示意圖。
[0015]圖4是根據本公開的實施例的用于數據共享的方法400的示意圖。
[0016]圖5是根據本公開的實施例的用于數據共享的方法500的示意圖。
[0017]圖6是根據本公開的實施例的用于數據共享的方法600的示意圖。
[0018]圖7是根據本公開的實施例的用于數據共享的方法700的示意圖。
[0019]圖8是用來實現本公開實施例的用于數據共享的方法的電子設備的框圖。
具體實施方式
[0020]以下結合附圖對本公開的示范性實施例做出說明,其中包括本公開實施例的各種細節以助于理解,應當將它們認為僅僅是示范性的。因此,本領域普通技術人員應當認識到,可以對這里描述的實施例做出各種改變和修改,而不會背離本公開的范圍和精神。同樣,為了清楚和簡明,以下的描述中省略了對公知功能和結構的描述。
[0021]在本文中使用的術語“包括”及其變形表示開放性包括,即“包括但不限于”。除非特別申明,術語“或”表示“和/或”。術語“基于”表示“至少部分地基于”。術語“一個示例實施例”和“一個實施例”表示“至少一個示例實施例”。術語“另一實施例”表示“至少一個另外的實施例”。術語“第一”、“第二”等等可以指代不同的或相同的對象。下文還可能包括其他明確的和隱含的定義。
[0022]如上所述,在實際的數據分析及人工智能模型訓練任務中,往往需要使用到不同節點或區域(包括個人、公司或國家)的數據。根據數據安全法,各個節點或區域的與個人身份相關的隱私數據是不能離開本節點或區域的。一般信息系統設計中,節點或區域中的本地數據可以通過本地標識碼(LID,Local ID)進行查詢和提取。每個LID往往用于唯一標識數據中不同的個體,包括但不局限于病人編號及客戶編號等等。由于不同節點或區域的系統設計中LID的生成方法往往不一致,對于相同個體在不同的節點或區域的本地數據的LID往往是不同的。
[0023]此外,各個節點或區域之間由于數據隱私保護需求,無法直接共享所有的源數據。在數據分析和人工智能模型的訓練中,往往希望將不同節點或區域的數據進行關聯,從而提高數據分析和模型訓練的數據覆蓋度和結果準確度。如何能夠在保護隱私數據的前提下,關聯及共享不同區域的非隱私數據內容,來進行相關的數據分析及人工智能模型訓練,是一個非常重要的問題。
[0024]為了至少部分地解決上述問題以及其他潛在問題中的一個或者多個,本公開的示例實施例提出了一種用于數據共享的方案。在該方案中,數據提供節點從包括隱私數據和第一非隱私數據的本地數據獲取隱私數據,第一非隱私數據與隱私數據相關聯。數據提供節點生成隱私數據的哈希值,以及生成用于本地數據的本地標識符與哈希值之間的第一關聯。數據提供節點生成用于在分布式系統中索引哈希值的全局標識符,分布式系統與當前節點相關聯,以及生成全局標識符與哈希值之間的第二關聯。隨后,數據提供節點向分布式系統中的其他節點發送第二關聯,以在分布式系統中存儲第二關聯,以用于第一非隱私數據的連接共享。以此方式,能夠通過本地存儲的、本地數據的本地標識符與隱私數據的哈希值之間的第一關聯以及在分布式系統中存儲的、全局標識符與隱私數據的哈希值之間的第二關聯,能夠在保護本地隱私數據的前提下,安全地進行非隱私數據的共享。此外,在分布式系統中存儲的全局標識符與隱私數據的哈希值之間的第二關聯,也便于將分布式系統中的不同節點處的不本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種用于數據共享的方法,包括:從包括隱私數據和第一非隱私數據的本地數據獲取所述隱私數據,所述第一非隱私數據與所述隱私數據相關聯;生成所述隱私數據的哈希值;生成用于所述本地數據的本地標識符與所述哈希值之間的第一關聯;生成用于在分布式系統中索引所述哈希值的全局標識符,所述分布式系統與當前節點相關聯;生成所述全局標識符與所述哈希值之間的第二關聯;以及向所述分布式系統中的其他節點發送所述第二關聯,以在所述分布式系統中存儲所述第二關聯,以用于所述第一非隱私數據的連接共享。2.根據權利要求1所述的方法,還包括:從當前節點獲取所述第一非隱私數據的第一屬性信息;從所述分布式系統中的一個或多個另外數據提供節點獲取一項或多項第二非隱私數據的一項或多項第二屬性信息,所述一項或多項第二非隱私數據與所述隱私數據相關聯;基于所述第二關聯,生成聯合元數據,所述聯合元數據至少包括所述全局標識符、所述第一屬性信息和所述一項或多項第二屬性信息之間的關聯;以及向所述分布式系統中的所述其他節點發送所述聯合元數據,以在所述分布式系統中存儲所述聯合元數據,以用于所述第一非隱私數據和所述一項或多項第二非隱私數據的連接共享。3.根據權利要求2所述的方法,還包括:接收來自所述分布式系統中的數據使用節點的數據請求,所述數據請求包括數據條件信息,所述數據條件信息基于所述聯合元數據而被生成;獲取與所述數據條件信息相匹配的第一非隱私數據;以及向所述數據使用節點發送所獲取的第一非隱私數據。4.根據權利要求3所述的方法,還包括:從所述一個或多個另外數據提供節點中的至少一個另外數據提供節點獲取所述一項或多項第二非隱私數據中的至少一項第二非隱私數據的至少一項第二屬性信息,所述至少一項第二非隱私數據與所述數據條件信息相匹配;基于所述第二關聯,生成所述全局標識符、所述第一屬性信息和所述至少一項第二屬性信息之間的第三關聯;以及向所述分布式系統中的其他節點發送所述第三關聯,以在所述分布式系統中存儲所述第三關聯,以便于所述數據使用節點基于所述第三關聯,將從當前節點獲取的第一非隱私數據以及從所述至少一個另外數據提供節點獲取的所述至少一項第二非隱私數據進行關聯。5.根據權利要求3或4所述的方法,其中所述數據請求還包括所述數據使用節點的節點地址,以及獲取與所述數據條件信息相匹配的第一非隱私數據包括:確定所述節點地址與預設節點地址是否匹配;以及如果確定所述節點地址與所述預設節點地址匹配,則獲取與所述數據條件信息相匹配的第一非隱私數據。
6.根據權利要求3或4所述的方法,其中所述分布式系統包括區塊鏈系統,以及接收來自數據使用節點的數據請求包括接收來自所述數據使用節點的第一智能合約,所述第一智能合約包括所述數據條件信息。7.根據權利要求6所述的方法,其中所述第一智能合約還包括用于數據共享的激勵機制信息,以及獲取與所述數據條件信息相匹配的第一非隱私數據包括:確定所述本地數據中是否存在與所述數據條件信息相匹配的第一非隱私數據;如果確定所述本地數據中存在與所述數據條件信息相匹配的第一非隱私數據,則確定所述激勵機制信息是否通過評估;如果確定所述激勵機制信息通過評估,則生成并在所述區塊鏈系統中部署第二智能合約,所述第二智能合約包括所述數據條件信息、所述激勵機制信息、所述數據使用節點的節點地址和數字錢包地址以及當前節點的節點地址和數字錢包地址;以及如果確定所述第二智能合約被部署在所述區塊鏈系統中,則獲取與所述數據條件信息相匹配的第一...
【專利技術屬性】
技術研發人員:龐嚴,
申請(專利權)人:重慶新國大研究院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。