链上存证、链下传输的可信数据共享平台
點擊上方藍字關注我們
鏈上存證、鏈下傳輸的可信數據共享平臺
張召1,?田繼鑫2,?金澈清1
1?華東師范大學數據科學與工程學院,上海 200062
2?MCT Technology,上海 200023
?
摘要:區塊鏈系統可以為分享數據的互不信任的多方之間提供可信的基礎設施。但是,將原始分享數據直接上鏈的方式并不適合大規模的數據分享場景。因此,提出了一種數據共享請求和應答記錄上鏈存證、原始數據鏈下安全傳輸的數據共享平臺架構,該架構在一定程度上可以緩解系統負載過重以及隱私保護方面的問題。最后總結了隨著參與節點的增多,以及每秒需要處理的數據共享請求和應答的增多,已有的區塊鏈技術被應用到數據分享和確權領域時,在分布式存儲、共識協議、智能合約執行以及輕客戶端查詢方面面臨的挑戰以及改進的方向,以期為已有區塊鏈系統應用于數據共享領域指明需要進一步突破的技術瓶頸。
關鍵詞:?數據共享?;?數據確權?;?數據追溯?;?區塊鏈
論文引用格式:
張召,田繼鑫,金澈清. 鏈上存證、鏈下傳輸的可信數據共享平臺[J]. 大數據, 2020, 6(5): 106-117.
ZHANG Z, TIAN J X, JIN C Q. On-chain witness and off-chain transmission trustworthy data sharing platform[J]. Big Data Research, 2020, 6(5): 106-117.
1 引言
隨著互聯網技術的發展,以及數據和關鍵信息的采集、傳輸、存儲和處理的自動化,越來越多的數據信息以電子資源的形式記錄和存儲,這些基礎數據是企事業單位的核心數字資產,可以為各行各業的決策支持和精準營銷奠定數據基礎。然而,由于不同企業或者不同政府部門之間缺乏互信,鑒于數據泄露以及不正當使用的風險,以及企業之間或者政府部門之間行政利益的不同,很多數據擁有者不愿意共享數據,從而形成一個個數據孤島,數據的價值無法得到應有的利用,對數據資源造成了極大的浪費。
1.1 數據共享模式
數據流通過程涉及的主體包括數據生產者、數據收集者、數據使用者、數據處理者和數據監管者等。為了打通業務流程,更大程度地發揮數據隱藏的價值,通過數據共享讓數據流通起來是一個非常有效的方法。根據數據共享應用的業務場景,數據的共享模式可以分為如下3類。
(1)數據不離開私有域,通過授權實現遠程訪問共享
該模式下,基于某種業務邏輯,需要訪問多個數據提供者的共享數據,其基本特點是按需共享。這一般屬于協同業務,對于共享的數據,參與方一般預先簽訂授權或者法律法規授權,根據業務的需要,隨時訪問共享數據。如對新型冠狀病毒肺炎確診患者居家隔離的監控及活動軌跡的流控,授權機構可以通過隨時訪問授權用戶的相關數據(如手機用戶的移動軌跡、支付平臺的消費地點、監控數據等)來實現。
(2)數據離開私有域,通過數據移動匯聚實現在匯聚點上的集中數據共享
該模式下,由多個數據提供方提供的數據經規范化處理、匯總、分析后,形成新的共享數據。比較典型的應用是征信平臺,其從各類銀行類金融機構、公共事業、保險公司、支付平臺獲取企業或個人的信貸信息、支付信息、交易信息,經過匯總、處理后形成企業或個人的信用信息,信用信息可供各類授權企業或個人訪問,并作為業務的參考依據。
(3)數據離開私有域,并且所有權也隨之發生轉移,在此過程中需要對數據進行確權
共享數據交易是該模式的典型應用,其基礎是數據確權,在確權的基礎上,共享數據的某些權利發生轉移,同時數據提供方獲得經濟利益。交易的進行需要雙方或多方的認可,并且共享數據的獲得方必須在合約規定的權限內使用共享數據。如果數據獲得方需要將共享數據交易給其他第三方,必須得到原權利人的許可。
從以上3個典型的數據共享模式可以看到,在數據共享流通的過程中,為了避免數據隱私泄露和數據濫用等問題,在共享過程的多個參與方之間建立互信的協作關系是非常必要的。作為一種由互不可信的多方共同維護的分布式賬本,區塊鏈具有防篡改、可追溯、去中心化的特點。區塊鏈技術支撐的數據共享流通可以保證數據從收集到使用、共享乃至銷毀的過程都公開透明、有據可查,并可以通過追溯問責的方式來避免數據共享過程中某一參與方的消極怠工問題。而數據存儲、處理和共享流通等過程公開透明可查使得企業或者部門賴以決策的數據來源更可信,從而使得決策結果更精確。
1.2?區塊鏈系統的相關知識
起源于比特幣的區塊鏈技術是一種按照區塊產生的時間順序將區塊以密碼學哈希順序相連的鏈式數據結構,其中密碼學哈希鏈接方式可以保證數據的難以篡改和難以偽造,拜占庭容錯的共識協議保證在存在惡意節點的網絡環境下,數據仍能在多節點間達成一致。區塊鏈系統中包含交易(transaction)、區塊(block)和鏈(chain)3個基本概念。其中,交易是指對賬本的操作導致的賬本狀態的改變,可以是一次轉賬或者一次智能合約調用;區塊中記錄了一段時間內發生的所有交易和狀態結果,是交易執行的基本單元,是多節點間對當前賬本狀態一致性的一次共識;鏈是由區塊按照生成順序以密碼學哈希鏈串聯而成的,可以被理解為整個賬本狀態變化的日志記錄。
圖1是一個節點包含的簡單的區塊日志數據和狀態數據的示意圖。系統以追加的方式記錄了6條交易日志,假定每個區塊只包含1條交易(如圖1(a)所示,假設A、B和C的賬戶初始余額來自外部系統),需要注意的是,以未花費的交易輸出(unspent transaction output,UTXO)模型為代表的比特幣系統如果要查詢數據的當前狀態,必須重做所有6條交易日志,才能得到A、B、C 3個賬戶的當前余額(如圖1(b)所示),即數據的當前狀態。而以賬戶模型為代表的以太坊以及以無賬戶模型為代表的超級賬本Fabric則同時存儲和維護區塊日志數據和狀態數據。
1.3 基于區塊鏈的數據共享模式
作為一種難以篡改、歷史數據可追溯的分布式賬本,區塊鏈系統雖然可以為不可信的多個參與方提供方便的數據共享服務,但如果直接將需要共享的數據上鏈,通過區塊鏈系統在多方之間分享,則會帶來如下幾個問題。
● 在全復制數據分布下,共享數據的存儲開銷太大。在區塊鏈系統中,為了避免惡意節點對數據的篡改,每個節點都存儲一份完整的數據副本,如果將所有共享數據上鏈,則很快會突破單個節點的存儲容量上限。
● 在對等(peer to peer,P2P)網絡模式下,網絡傳輸代價太大,影響了系統吞吐量。在區塊鏈系統中,所有節點都采用對等模式組網。在由n個節點組成的區塊鏈網絡中,任何一方待共享的原始數據均要通過P2P網絡將數據傳輸至其他n-1個節點,節點之間傳輸太大的數據會導致網絡帶寬資源的急劇減少,并大大降低系統的吞吐量。
● 共享數據采用明文記錄方式,導致數據的隱私得不到保護。在當前大多數區塊鏈系統(如以太坊和超級賬本Fabric)中,僅采用密碼學簽名來防止交易被篡改,交易內容仍以明文存儲,所有參與者都可以看到,但這種依賴區塊鏈的數據共享方式會帶來隱私泄露的風險。
圖1???日志數據和狀態數據示意
因此,考慮到數據共享流通系統的計算、存儲、網絡開銷,以及數據隱私保護方面的問題,基于現有的區塊鏈系統,將全部待共享數據直接上鏈的方式并不能滿足大規模的數據共享需求。本文針對數據共享的應用場景特征,提出了一種鏈上共享存證、鏈下數據傳輸的基于區塊鏈的新的數據共享架構。
2?區塊鏈系統及關鍵技術
2.1?區塊鏈系統
不同于只支持有限腳本的比特幣系統,隨著以支持智能合約為代表的區塊鏈2.0平臺的出現,區塊鏈技術不僅可以為數字貨幣領域提供服務,也可以為包括數據共享場景在內的很多傳統業務提供服務。其中,任何業務邏輯都可以被編程為智能合約,并以去中心化應用(decentralization application,DApp)的方式公開透明地部署到不同的節點上,所有的數據和智能合約代碼通過全復制的方式在不同節點間實現共享,通過共識達成一致。而通常所說的區塊中的一筆交易就是對智能合約相關功能的一次調用。
圖2所示是一個典型的區塊鏈系統,包含 A、B和C 3個全節點(保存完整區塊鏈數據),以及A’、B’和 C’ 3個輕客戶端(只保存區塊頭),其中全節點A和B各自有一個隸屬于自己的輕客戶端 A’和B’,而輕客戶端C’不隸屬于任何全節點。因為各自立場的不同,A、B和C 3個全節點之間并不完全互相信任。全節點既可以發起交易,也可以接收交易(無中心化),交易被操作者簽名后在P2P網絡中傳播,最終交易被共識協議所確定的主節點成批打包成區塊,繼續通過P2P網絡傳播給其他驗證節點,驗證節點確認無誤后,在本地以區塊為單位記賬,其中區塊與區塊之間通過密碼學哈希指針連接。這樣,每個節點都能保存一份完整的區塊鏈數據(全復制分布)。這種交易帶簽名、成批打包進區塊,區塊以哈希鏈方式追加存儲,且最終采用全復制方式分布的數據存儲模式保證了交易數據的難以篡改和可追溯。
2.2 從數據管理的角度看區塊鏈系統涉及的關鍵技術
從第2.1節的敘述可知,區塊鏈系統是一種全新的分布式基礎架構與計算范式。在單節點上,區塊鏈系統使用密碼學哈希鏈串聯的鏈式數據結構來驗證與存儲數據;在節點間,每個節點獨立保存完整的區塊數據,利用分布式共識協議使對數據的修改達成一致;利用密碼學方法保證數據傳輸和訪問的安全;利用可編程的智能合約來靈活操作數據。而從數據管理的角度來看,區塊鏈的本質是一個網絡上節點獨立對等,數據以日志方式記錄,并通過全復制分布實現數據記錄共享,采用哈希鏈數據結構保證數據難以篡改,采用共識算法實現不同節點間數據副本一致性的分布式數據管理系統。
從數據管理的角度看,與傳統的數據庫管理系統相比,區塊鏈系統主要涉及的關鍵技術包括以下4個。
● 開放透明,數據全復制分布。節點間采用全復制的數據分布,即每個節點保存一份完整的數據副本。在區塊鏈系統中,單個節點存儲的數據包括兩類,一類是區塊數據,另一類是狀態數據。其中區塊數據就是通常所說的記錄一批交易的鏈式區塊數據,一般被存儲在原始文件或者keyvalue數據庫中。狀態數據則保存以區塊為單位的一批交易執行后的最新世界狀態(world state),也是執行智能合約時要訪問的數據。因此,高效的數據存儲和組織是區塊鏈系統的關鍵技術之一。
圖2???典型的區塊鏈系統
● 存在惡意節點,節點間數據的一致性需要拜占庭容錯共識協議來保證。由于區塊鏈系統中的節點間數據是全復制分布的,因此在分布式環境下必須要有共識算法保證位于不同節點的數據之間的一致性。因為在區塊鏈系統中,節點可能會主動作惡(拜占庭節點,多方互不可信),包括發送假消息、給不同的節點發送不同的消息等主觀惡意行為,所以拜占庭容錯的共識協議是區塊鏈系統中的關鍵技術之一。
● 可編程智能合約,支持去中心化應用。智能合約為區塊鏈系統提供了靈活的編程語義,支持用戶在區塊鏈系統上搭載自定義的應用程序,使得區塊鏈技術可以被應用在數字貨幣以外的很多其他領域。以智能合約編寫的DApp的運行邏輯、狀態都會經過共識機制的協商確認,保證了執行過程的完整性。智能合約的安全高效運行也是區塊鏈系統的關鍵技術之一。
● 數據防篡改,輕客戶端數據查詢可驗證。與比特幣系統中的簡單支付驗證節點一樣,絕大部分區塊鏈系統中存在一種只保存區塊頭部信息的輕客戶端,輕客戶端的查詢請求往往會被轉發到具有全部區塊數據的全節點上執行。對來自輕客戶端的查詢進行響應,以及對查詢結果的完整性進行驗證也是區塊鏈的關鍵技術之一。
3?區塊鏈技術在數據共享流通中的應用
打破數據孤島、實現數據共享可以發揮數據更大的價值,然而在實際的業務場景中,由于在需要對數據進行共享的不同參與方之間缺乏互信,導致數據確權困難,使得數據共享過程產生很多不必要的壁壘。數據確權就是對數據所有權和使用權的確認。其中,所有權的歸屬可以是個人(如隱私數據所有者),也可以是機構(數據提供者),所有權和使用權都可以交易,或者通過法律法規轉讓和授予。具有去信任化、去中心化以及防篡改、可追溯等特點的區塊鏈系統可以便捷地為參與數據共享的多方之間建立互信,并通過其上的智能合約來實現靈活多樣的數據共享規則,為公開透明、可信、無爭議的數據確權提供技術平臺。
通過區塊鏈來共享數據,最直接的方法是將共享數據直接上鏈,具體如圖3所示。如果D節點的數據需要共享給A、B和C,則通過區塊鏈網絡直接上鏈,并完成同步。同樣,如果其他節點的數據要應答數據共享的請求,也只能借助區塊鏈網絡對數據進行移動,從而使得數據分享流程公開透明,數據確權無爭議。由于現有的區塊鏈系統采用全復制數據分布的方式,這種共享數據直接上鏈的方法會使得A、B、C、D 4個節點保存通過區塊鏈網絡分享的所有數據,造成系統中存儲、計算和網絡資源的極大消耗和浪費,并嚴重影響數據共享的交易吞吐量。更重要的是,數據直接上鏈也會引起隱私泄露的問題,這是由于區塊鏈僅使用簽名的方式防止數據被惡意篡改,而共享數據仍以明文的形式保存。但是如果以加密的方式進行數據上鏈傳輸,又會影響鏈上智能合約的數據正常讀取。
圖3???共享數據直接上鏈
因此,這種數據直接上鏈的方式雖然能保證共享公開透明,但數據隱私得不到應有的保護。考慮到系統吞吐量以及數據隱私保護的問題,本文提出了一種鏈上存證、鏈下數據傳輸的數據共享方式。在這種模式下,只有對共享數據的請求和應答會被記錄在區塊鏈上,而真正的共享數據通過鏈下傳輸,具體鏈下共享數據的傳輸可以通過可信的云服務器中轉,也可以直接通過點對點傳輸。由于所有對共享數據的請求和應答響應都被記錄在區塊鏈上,而區塊鏈又能保證其難以篡改、公開透明、可追溯,因此任何參與方如果對數據確權有異議,都可以通過查詢區塊鏈記錄來對數據的使用權和所有權的遷移過程進行追溯,并且追溯過程不受任何一方人為干擾。另外,共享數據的傳輸通過鏈下進行,一方面保護了數據隱私,另一方面也減輕了鏈上負載,從而提高系統的吞吐量。如果對共享數據的隱私保護有很高的要求,可以采用加密和點對點共享密鑰的方式來實現鏈下共享數據傳輸的安全和隱私保護。
圖4展示了一個鏈上存證、鏈下數據傳輸的應用場景,在該場景中共有A、B、C、D 4個參與方,各參與方擁有屬于自己的數據,其中原始數據以密文的形式存儲在云服務器上,原始數據的元數據(即數據目錄信息,包括數據的基本描述、類別、擁有者等)及其哈希摘要則存儲在區塊鏈上。假設某些業務需要D節點獲取數據集R,D節點的客戶端通過查詢鏈上的目錄信息發現B節點擁有數據集R。此時,D節點的客戶端向B節點發起數據獲取請求,B節點根據預先定制的智能合約,檢查數據請求的合法性,并按照預先制定的規則將數據集R在云存儲服務器上的鏈接、數據集R的哈希摘要以及對數據集R解密的密鑰等,以加密的方式發送給D節點的客戶端,最終D節點的客戶端根據接收到的信息到云服務器下載數據,并驗證其哈希摘要,驗證通過后,合法使用數據集R。需要注意的是,為了保障數據擁有者和數據使用者各自的權利,來自D節點的客戶端的數據請求和B節點的應答均被記錄在區塊鏈上,其中A、B、C、D 4個節點都是本次數據請求和應答的見證者。值得一提的是,從功能的角度看,該平臺可以部署在任何成熟的聯盟鏈系統中,如超級賬本Fabric或者Quorum等。但從性能的角度看,已有的聯盟鏈系統很難滿足本文要解決的數據請求和應答的高吞吐需求,需要對已有的開源系統進行進一步改造,第4節將就這一點進行討論。
圖4???鏈上存證、鏈下數據傳輸的應用場景
基于鏈上對數據共享的請求和應答進行存證、鏈下對待分享數據進行安全傳輸的基本思想,筆者設計了一個如圖5所示的基于區塊鏈的可信的數據共享平臺。該平臺自底向上一共4層,包括存儲層、共識層、智能合約層和應用層。
圖5???基于區塊鏈的可信的數據共享平臺
存儲層包括鏈上的區塊數據和狀態數據,以及為鏈下數據傳輸做準備的鏈外數據云平臺。鏈上的區塊數據主要為數據共享請求和應答做存證,而狀態數據是為各種數據共享和確權規則編寫的智能合約準備的。對于大數據共享來說,往往數據量巨大,需要較大的帶寬、存儲空間、處理能力等資源,本平臺采用云存儲的方式將待共享的原始數據存儲在云端。
共識層可以根據不同的應用場景,選擇不同的共識協議,比如應用于公有鏈的工作量證明(proof of work,PoW)、權益證明(proof of stake,PoS),應用于聯盟鏈和私有鏈的實用拜占庭容錯(practical byzantine fault tolerance,PBFT)協議。如果是企事業內部或者企事業之間的數據共享,為了避免算力的浪費,一般采用基于投票機制的PBFT協議;如果是在更廣的范圍內的缺乏行政約束力的主體之間的數據共享,為了能抵御各種網絡攻擊,也可采用PoW或者PoS。
智能合約層主要用來定義各種與數據共享和確權有關的業務流程和規則。這一層與應用場景密切相關,是最重要的一層,其中包括共享目錄服務合約、共享確權服務合約、共享交易服務合約以及共享服務訪問合約。其中共享目錄服務合約是關于元數據管理的,主要讓各參與方之間互通有無,知道從哪里可以獲取需要的數據,每個參與方有哪些數據可以共享。共享確權服務合約則主要負責在數據流通過程中根據合同以及相應的法律法規對數據進行確權,以及對權利轉移過程產生的費用進行計算和支付。共享交易服務合約主要用來定義數據買賣和交易的規則。共享服務訪問合約主要用于訪問控制驗證和權限驗證。
最上層是應用層,包括輕客戶端訪問、共享數據溯源、共享數據確權和共享數據授權。應用層主要為應用程序提供服務和訪問接口,以及查詢和跟蹤數據共享的進展和結果。其中輕客戶端訪問要保證查詢結果的完整性,因為數據來自不可信的全節點,需要保證查詢結果的保真和完備,即返回的數據沒有被惡意篡改,并且返回的數據既不能多也不能少。共享數據溯源主要負責對有爭議的數據確權進行過程溯源,要求給出數據權限遷移時間線及相關的證據。共享數據確權用來查詢當前某個已共享數據項的擁有權或者使用權歸屬。共享數據授權用來為共享數據設置訪問控制和權限管理規則。
使用筆者設計的基于區塊鏈的可信的數據共享平臺在不可信的多方之間共享數據,需要注意以下幾點。首先,區塊鏈的難以篡改性使得智能合約一旦執行即不可挽回,在數據共享流通的過程中,這一特性要求共享規則和與之相匹配的智能合約的設計需要特別精細,例如,確保轉讓后的使用權在未經授權的情況下不能再擅自轉讓給第三方。其次,因為數據共享的過程采用鏈下傳輸、鏈上存證的方式,所以鏈下數據傳輸的安全性也需要鏈上驗證,在鏈下傳輸的共享數據需多方加密,并將數據摘要通過交易上鏈,訪問時通過智能合約獲取公鑰和數據摘要,確保共享數據是數據提供者共享的原始數據。再次,由于監管的需要,或者受存儲和計算資源所限,有些參與方只保存了區塊的頭部信息,為了使這類輕客戶端用戶對共享交易過程及確權結果進行跟蹤和追溯,系統需要提供可驗證的查詢處理,以保證查詢結果的可信和完整。最后,數據擁有者需要對共享數據進行控制,只有獲得共享數據相關權限的用戶才能使用相關的共享數據,并行使相應的權利。
綜上所述,與傳統的數據共享平臺,以及原始數據直接上鏈的基于區塊鏈的數據共享平臺相比,筆者提出的鏈上存證、鏈下數據傳輸的可信的數據共享平臺具有如下優點:一是鏈上負載輕,原始數據隱私方便保護;二是共享流程和權利轉移公開透明,不可抵賴;三是共享規則和權利轉移智能合約化,避免人為干預,自動完成不可逆轉。
4?區塊鏈系統應用于數據共享方面面臨的挑戰
筆者提出的鏈上存證、鏈下數據傳輸的方法能在一定程度上避免共享數據直接上鏈造成的存儲資源、計算資源以及網絡資源方面的大量消耗和開銷,從而緩解系統負載壓力,這對于區塊鏈系統中資源受限的單個節點的擴展性尤為重要。
但是,隨著平臺參與節點和數據分享請求越來越多,系統負載越來越大,用戶需求對系統吞吐的要求也會越來越高,已有的區塊鏈技術仍然很難保證系統的正常運行。下面從存儲、共識、智能合約執行以及輕客戶端可驗證查詢4個方面闡述該平臺面臨的挑戰和需要進一步改進的方向。
首先,已有的數據全復制分布方式成為數據存儲的瓶頸。全復制的數據分布方式使得每個節點都需要保存一份完整的數據副本,系統的存儲容量受到單個節點存儲能力的限制。TPS(transaction per second)只有20筆/s左右的以太坊在運行了不到三年半的時間以后,存儲容量已經超過了1 TB。那么,在交易吞吐率為幾百甚至上千筆每秒的聯盟鏈中,系統所需的存儲容量會以更快的速度增長,極有可能在短時間內就突破單節點存儲能力的上限。因此,全復制的數據分布方式制約了系統存儲的可擴展性,也制約了系統的擴展性。
其次,已有的共識算法很難滿足系統對交易處理時延和吞吐率的要求。PoW系列共識算法由于需要消耗大量算力,且吞吐率提高以后會引起更多區塊鏈分叉進而導致私自挖礦等安全方面的問題,并不適合上述企業級聯盟鏈的應用場景。而以PBFT協議為代表的面向聯盟鏈的共識協議,TPS也只有400筆/s左右,所能支持的共識節點數目也不能超過20個,因此,已有的共識算法很難滿足數據共享請求的高吞吐率的要求。
再次,已有的智能合約以串行執行方式運行,這會成為系統吞吐性能的瓶頸。在面向數據分享和確權應用的區塊鏈系統中,智能合約的業務邏輯往往比簡單的轉賬操作更復雜。尤其是在系統共識算法效率提高、出塊速度加快以后,智能合約的執行更有可能拖慢系統的整體吞吐性能。在采用IBFT(istanbul byzantine fault tolerant)共識算法的以太坊平臺上做的一組實驗表明,當一個區塊中包含10 0筆調用智能合約的交易時,合約執行時間是共識時間的6倍,而當智能合約的交易數目達到200筆時,合約的執行時間是共識時間的20倍。而在相同的系統上采用PoW這種吞吐率很低的共識算法時發現,與共識時間相比,智能合約的執行時間幾乎可以忽略。這進一步驗證了共識效率提高以后,智能合約的執行效率會成為系統新的瓶頸。而現有的智能合約的串行執行方式嚴重制約了其執行的效率。
最后,對于輕客戶端發起的查詢,現有的區塊鏈系統無法保證其查詢結果的正確性。但是已有的區塊鏈系統僅能驗證輕客戶端發起的交易或者賬號是否存在,無法對復雜查詢返回的結果集的正確性和完整性予以驗證。對于面向數據分享和確權應用的區塊鏈數據管理系統,無信任輕客戶端的存在不可避免,對其查詢結果正確性的驗證也是必須要面對的問題。
因此,需要在上述4個關鍵技術點進行突破,構建高吞吐的區塊鏈系統,以應對大規模節點參與下系統對吞吐率和時延方面日益增長的需求。
5?區塊鏈技術應用于數據共享方面的相關工作
鑒于區塊鏈的可追溯、難以篡改等特性,區塊鏈系統可以解決在供應鏈數據管理、醫療數據分享等領域進行數據分享時面臨的可信問題。但是現有的基于區塊鏈的數據分享系統大多面向某一特定的具體應用,通用的基于區塊鏈的數據分享平臺還比較少見。
Tian F等人提出了一種不僅能夠實時提供供應鏈管理系統中食品的追蹤信息,同時還能保證信息的可靠公開的系統。Hua J等人提出了一種基于區塊鏈的農產品追蹤系統,能夠記錄生產、存儲、運輸、加工、分配以及相關供應鏈的各種信息,同時向第三方(如政府、保險公司、顧客等)公開。Yue X等人提出了一個基于區塊鏈的智能應用HDG,病人不需要通過第三方就能控制和分享自己的病歷。Azaria A等人開發了一個去中心化的大規模病歷數據管理系統MedRec。在這個系統中,通過區塊鏈記錄的綜合日志能夠實現醫療記錄的保密、認證和追溯。Xia Q等人開發了一個可靠的基于區塊鏈的系統MeDShare,專門用來處理在云端存儲大量冗余的醫療信息時遇到的數據追溯問題。Rifi N等人討論了區塊鏈技術應用于醫療數據共享領域的優缺點。
6 結束語
綜上所述,在數據共享和流通過程中由于缺乏信任而形成的數據孤島,使得數據的價值難以最大化。區塊鏈系統雖然能夠為在數據共享中涉及的多方構建信任的基礎設施,但是共享數據直接上鏈的方式仍然會面臨系統負載重、隱私得不到保護的問題。本文提出了一種數據共享請求和應答記錄鏈上存證、共享數據鏈下傳輸的數據共享平臺架構。該架構在一定程度上可以緩解系統負載過重的問題,但是隨著參與節點的增多,以及每秒需要處理的數據共享請求的應答增多,將已有的區塊鏈技術應用到數據分享和確權領域時,仍然需要從以下4個方面努力:首先,設計高效的可驗證、可恢復的數據可擴展存儲方法;其次,在確保所有節點都能公平對等地參與共識過程的前提條件下,提高確定性共識協議的效率,并保證協議的安全性和活性;再次,有效利用區塊鏈智能合約的特點,提高智能合約的并發執行效率;最后,以減少網絡開銷和計算代價為目標,設計精巧的驗證結構、高效的驗證查詢算法來響應輕客戶端查詢。
作者簡介
張召(1977-),女,博士,華東師范大學數據科學與工程學院副教授,主要研究方向為區塊鏈系統研發、分布式數據管理,多項研究成果發表在VLDB、ICDE和DASFAA等數據管理領域的重要國際會議上。先后主持多項國家自然科學基金項目,作為骨干技術人員,參與開發的“面向大型銀行應用的高通量可伸縮分布式數據庫系統”項目獲得2017年教育部高等學校科學研究優秀成果獎(科學技術)科技進步獎一等獎,“支持互聯網級關鍵核心業務的分布式數據庫系統”項目獲評2019年度國家科學技術進步獎二等獎 。
田繼鑫(1977-),男,MCTTechnology研發部門負責人,主要研究方向為分布式系統開發、互聯網系統后臺開發及設計,以及比特幣、超級賬本Fabric以及以太坊等主流區塊鏈系統的架構、源碼及應用開發 。
金澈清(1977-),男,博士,華東師范大學數據科學與工程學院教授、博士生導師、副院長,中國計算機學會高級會員,數據庫專業委員會委員,已發表學術論文100余篇,研究成果曾獲得省部級一等獎和二等獎、霍英東教育基金會青年教師獎,擔任《計算機研究與發展》編委,主要研究方向為區塊鏈、計算教育學、基于位置的服務等 。
聯系我們:
Tel:010-81055448
? ? ? ?010-81055490
? ? ? ?010-81055534
E-mail:bdr@bjxintong.com.cn?
http://www.infocomm-journal.com/bdr
http://www.j-bigdataresearch.com.cn/
轉載、合作:010-81055537
大數據期刊
《大數據(Big Data Research,BDR)》雙月刊是由中華人民共和國工業和信息化部主管,人民郵電出版社主辦,中國計算機學會大數據專家委員會學術指導,北京信通傳媒有限責任公司出版的期刊,已成功入選中文科技核心期刊、中國計算機學會會刊、中國計算機學會推薦中文科技期刊,并被評為2018年國家哲學社會科學文獻中心學術期刊數據庫“綜合性人文社會科學”學科最受歡迎期刊。
關注《大數據》期刊微信公眾號,獲取更多內容
總結
以上是生活随笔為你收集整理的链上存证、链下传输的可信数据共享平台的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据可视化组队学习:《Task02 -
- 下一篇: 数据可视化组队学习:《Task03 -