【重磅】世界区块链组织首席科学家白硕:区块链技术与数据隐私讲座
【重磅】世界區塊鏈組織首席科學家白碩:區塊鏈技術與數據隱私講座
本講座選自世界區塊鏈組織首席科學家白碩于2018年3月29日在清華大數據“應用·創新”系列講座上所做的題為《區塊鏈技術與數據隱私》的演講。
演講全文:
白碩:非常榮幸回到母校,跟大家分享區塊鏈這樣一個非常熱的話題。區塊鏈在前面,隱私在后面,但是大家都知道中國人總是喜歡把修飾語放在前面,把中心語放在后面。隱私應該是信息發達到一定程度,中國人才把隱私的概念提到日程上。
但是中國高速發展的這些年以后,很快就進入了要講隱私的時候。恰好我們遇到了互聯網,互聯網很快形成了一個數據寡頭壟斷數據的格局。沒幾年,這些大的互聯網公司就非常有名,他們掌握的數據資源非常的雄厚。
美國對這件事有一個很有意思的評論:互聯網的pain,區塊鏈的luck。翻譯成中國互聯網之痛,區塊鏈之幸。
1、區域鏈能做什么?
區塊鏈和密碼學的結合,能給我們提供解決隱私問題,解決數據寡頭問題的希望。
2、什么是區塊鏈?
區塊鏈是一塊一塊的數據,一個一個的數據塊。具體的數據是打包在一個區塊里。
哈希函數的兩個特點:
第一,單向性。單向性指知道這些數會算起來很容易,但是如果不知道這些數會非常難。
第二,抗插分攻擊。自備量取值哪怕差一個比特,結果都面目全非,防止你用一種猜測學習的方式把它猜出來。
正是因為有這樣的特性,區塊和區塊之間邏輯上就連成了鏈。數據之間通過這樣一種方式,邏輯上連成了鏈,這樣的鏈叫做區塊鏈。
3、區塊鏈的本質
區塊鏈的本質,有人說是去中間化,有人說是躲開了央行,自己選擇發行貨幣。這些都不對,從技術上理解根本辦不了。
對于數據的訴求,實際上是技術方面的訴求。我們希望記下來的東西是不可篡改(撤銷),不可仿冒,不可抵賴,不可亂序。這四個是跟價值沒有關系的,而且基礎的非對稱加密都似曾相似,如RSA、ECC。但加入了不可透支和不可雙花,就進入了價值轉移、價值傳輸的領域。而價值是不同于信息的,價值有守恒性,信息可以不守恒,
在價值傳遞、價值轉移的領域里面,訴求可以歸結為兩點:
第一,不可透支,指沒那么多錢,不能買值那么多錢的東西,也就是余額和要支付的額度之間需要有一個不等式的約束,不夠就不能做。
第二,不可雙花,指一分錢不能花兩次。
智能合約,可以理解為“讓價值飛一會兒”,本質上是價值轉移,轉移到非你非我的程序手里。
另外,還有業務訴求,一個是隱私保護,一個是可運營性。
一部分人認為不當得利應該不算,但是我們這里有不可撤銷,不可篡改的東西都已經存在,他們解決這個問題只有一個辦法就是分杈,即找到一個大家有共識的歷史帳本,然后剔除篡改這筆,繼續往前走。
另外一些人有一個口號叫做代碼即法,寫出來的法,你知我知,你認我認,你信我信。如果這樣的話,代碼寫錯了也得將錯就錯,甚至說我不承認寫錯了,黑客得就是應該他得。理念的不同導致整個帳本分裂了還不錯,社區也跟著分裂了。
4、數據共享的痛點
普通老百姓的隱私被侵犯的情況很多,一些機構也有很多的數據在進行合作的時候,顧慮最大的就是數據。
特別強調:在數據主權邊界的附近會出現競合兩種關系,所謂的合就是大家有共享的需求,所謂的競就是大家還都要防范對方去偷自己的,不當或者濫用自己的數據。這是一個很大的痛點,這個痛點如果不好好的解決,信息化社會它的弊就會大于利。
5、數據主權
第一,抗衡數據寡頭的聯盟制。加盟的機構,甚至個人,他們彼此之間一樣有防范。區塊鏈本身的深化應用也在呼喚隱私和數據主權保護的落地。
第二,既要見證又不看穿。只要我們技術再執著一點,即刻思維再執著一點,就會發現這個訴求不是不可能達到。
第三,點對點、背靠背的數據合作。更多的是用在征信、評級等領域。我的數據是什么東西,我不告訴你;你想要什么,你不告訴你,但是要的那個東西我看不懂;我給你的東西我也看不懂,但是那兩個可以自動的匹配,如果匹配了,我沒看見你的數據,你也沒看見我的真實需求,這種叫點對點背靠背的數據合作。
第四,跟人工智能的結合。這一波之所以火,主要歸功于深度學習。深度學習做的事情是要數據喂它,它才能產生智能。喂它的數據可能來自四面八方,可能來自不同的機構,匯聚到一處,經過學習訓練產生智能。
6、加密數字貨幣場景
現在有加密數字貨幣,如素數幣,比特幣,萊特幣。數字貨幣想讓它既能夠記帳,又不透露帳本的真實內容。首先民間有這個需求,有些賬戶到底轉給誰了,留下來的記錄就是查不出來。比如央行想推出法定的數字貨幣,張三給李四轉賬了,轉賬了多少錢,不能讓旁邊的王五看見,也不能做成像比特幣那個樣子,它的帳目不能是公開的,要保證隱私。歐盟體系,包括英國也有同樣的看法。有這個看法的話,一定要引入隱私保護機制。
7、從錯誤印象談起
有兩種觀點:第一,區塊鏈是公開透明的,但只是對賬目而言。第二,區塊鏈是匿名的,但只是對地址而言。所以,不能把隱私問題的希望寄托在現在的區塊鏈技術體系上,需要有新東西。
8、賬戶問題
第一,一個地址的身份同一性無法掩蓋。
第二,不同地址之間的關聯交易無法掩蓋。
第三,不同地址之間的趨同交易無法掩蓋。
9、賬目問題
第一,法律法規。比如證券交易規定交易信息不得泄露。
第二,個人權利。合法的主張個人權利,別人只能讓你的權利得到滿足。
第三,無關人回避。張三跟李四交易,王五要看,但是不看憑什么記帳,這是兩邊的糾結。
10、有效支付見證
第一,UTXO模型。在比特幣里面叫UTXO模型,它所謂的幣就是一張一張的面額,比如誰給誰,可以去驗證,是不是真實的人。比特幣的數據結構里面沒有總的余額的概念,只有一張一張的支票,然后要現場算。只要可花之和大于它,就可以花。
第二,余額模型。在以太坊里面叫賬戶余額模式,余額已經算好。
11、交易后業務處理場景(假設)
按照目前的法律,中國結算是最終的數據,是有法律效力的。交易所、證券公司也在記這些數據,但是如果遇到不一致的話,以中國結算的為準。如果這三方能夠把賬記在區塊鏈上,在區塊鏈上直接達成共識,到晚上就是一筆賬,非常清楚。但是,存在兩點問題。
第一,生產關系。中國結算的法律定位跟其他兩方不一樣,如果體現這個法律,大家平等記帳,就體現不了法律記帳。
第二,技術問題。中國結算和交易所拿到的是全本的賬,證券公司只拿到自己客戶交易的單邊賬。對賬就會出現很多問題。
12、供應鏈溯源場景
很多都涉及到溯源的問題,比如農產品,食品,藥品。最初的源頭沿著供應鏈經過簽字一步步走下來,但是公開透明的話,有可能出現一種訴求,即上下游合作方不希望透露。
13、穿透式采購供應鏈融資場景
穿透式的采購供應鏈融資場景,是一個龍頭企業,有大量的采購。比如一個汽車公司,它可能有零配件,一級供應商、二級供應商。如果割斷這些連接,光看這樣一個小公司,它的財力不足。因此,貸款就欠缺依據。但是如果通過穿透來看,它是來自龍頭企業有穩定的現金流,就可以給它增信,使得它的信譽一下子得到它的背書。
在有區塊鏈之前,通常增信只能做到一級,而不能多級穿透。有了區塊鏈就可以多級穿透。在你資金不到位的時候,你可以拿著白條給你生產,但是白條最終會兌換出來資金。有龍頭企業的增信,銀行可以接受去做這個事情。
同樣有個訴求,白條分拆明細不希望被透露。
14、倒金字塔迷局
倒金字塔之謎,即少數公司能夠得到散戶的投資,而多數公司連專業公司都不會投資。區別于沒加入龍頭企業的小公司,償還能力比較穩定,但是有了龍頭企業就可以把它們拎起來,利用金融領域里邊熟知的一些方式來做。
15、數據交易
大數據交易:數據是不守恒的,價值是守恒的。
裸數據交易(偽命題):數據可復制,授權難掌控,賣數據只能是批量賣,很難去按需賣。
“裸”數據交易的痛點:
第一,擴散。賣出去的數據就像潑出去的水,收不回來。
第二,泄密。不是什么數據都可以賣,數據是有些區別。
第三,權屬。有些數據是誰的說不清。
第四,孤島。數據窩在手里增值有限。
16、換個思路賣服務
目前大數據交易普遍存在的思路,就是我們不賣數據,而賣依托數據產生的服務。即把數據X、Y分裝在私欲里面,我們賣的是函數,就是所謂的使用數據的服務。
17、數據API使用權交易
數據使用權是可以交易的,使用了一筆就賣一筆。但存在自身問題,比如服務被使用了多少次,無法算清。
加上區塊鏈就可以變得更好。首先保持不賣數據賣服務的思路,然后服務被使用了多少次,明算帳,忠實記錄,在線支付。
加上大數據交易,我們不交易數據本身,交易數據使用權。
18、數據融合
數據在封閉空間里面是原始數據,在開放空間里是經過了變形,經過函數處理過的數據。那么,在增值空間里,這兩個函數就產生了所謂的數據融合的威力。
19、背靠背求交集場景
競爭的基礎條件:不能給對方看到全集
雙贏的基礎前提:要能同對方共享交集
20、做法
一,不靠譜的做法:引入第三方。
二,沒面子的做法:砸硬盤。
步驟一,各帶著硬盤,到一個中立的場合,使用一臺做的比較干凈的空機器,然后雙方緊盯著源程序;
步驟二,到現場,現場執行;
步驟三,求出交集,砸掉硬盤。
三,高明的辦法:互相加擾。你的數據你加擾,然后我加。只要我們找到這樣的加擾算子,就成功了。加擾跟先后順序無關,可交換。有了智能合約,可以有一個中立的幫你數。
21、控制場景
入向邊界控制場景:保險公司需要醫院的數據,利用聚合特性,邊界內外分段計算。在邊界內的部分是可核查、可監督的。
出向邊界控制場景:滴滴這些平臺公司都有一個相同的特點,是把所有的數據匯集起來在大平臺上做一些全局性的匹配、調度、結算。利用無人運維的區塊鏈有可能來做這件事情,但是會有一些風險。數據寡頭的克星就是這個聯盟,但這個聯盟需要滿足數據背靠背,平臺是無人運營這兩點。但是確實需要一些技術。這和跨境的運營商之間的合作很像。
人們并不介意把數據給一個程序,只要人拿不走就行。
22、匿名評價場景:不刷單
很多大家都在網上購過物,甚至自己都打過好評差評,但是我們知道很多好評差評是刷出來的。評論機制也可以用在信用評分,信用評級,針對單位360度的考核上,但是徹底地不記名。
23、CCP(中央對手方)方案
一,轉出方檢查余額,維護余額;二,無關第三方支背書交易,不背書余額;三,轉入方維護余額;四,監管方交易/余額看穿式管理。
24、隱私保護方案
基于CCP的隱私保護方案
缺點是把決策權交給了中央對手方或者是公正人。隱私性是強的,但是中心化也強了。犧牲了去中心化的屬性,去保障了隱私化的屬性。
基于tear-off的隱私保護方案
tear—off是留痕的,不同于密碼學上的盲簽名是簽過以后不留根的。稍微有點區別。
基于state channel的隱私保護方案
state channel,是狀態通報。它啟動和結算的賬是明的,但是中間的明細是加密的。
25、密碼學等相關知識
零知識交互與證明。在交互的過程當中,不透露任何實體的信息,但是讓你相信這些實體的某種關系成立,而且確實成立,有理性的依據成立。
在同態映射下,先運算后加密和先加密后運算結果相同。在無法知曉實體內容的情況下,對實體間關系進行背書。
神經網絡是機器學習的基礎,深度學習無非就是多層的神經網絡,甚至加上一些回路的。神經網絡經過同態映射之后,是可以在加密的狀態下進行學習。同態之后拿出來,就可以把大家的數據,在密文的情況下進行學習,學習完了再映射回去,這叫同態神經網絡。人工智能黑白雙殺,黑盒子看不見的神經網絡,能看見的是知識圖譜。
美中不足的是,它們的工程實現效率還不理想。state channel照顧了中心化的訴求,但是隱私性很差。CCP照顧了隱私性的訴求,但是去中心化差。所以這叫尺有所長,寸有所短。
26、這個領域其實有三種人
一種人在做算法,數據上純粹【求索】;一種人在做協議,邏輯上清晰【掌控】;一種人在做系統,工程上可行【落地】。
27、開放討論:被遺忘權
被遺忘權指的是我們現在有很多關于我們的信息出現在網絡,想讓它們不出現,做不到。區塊鏈只能證明有,不能證明無。證明無,應該舉證權倒置。
28、總結
第一,隱私和數據主權的保護確實意義重大;
第二,區塊鏈+多方安全計算登場;
第三,落地場景多樣化。
我今天的分享就到這里,謝謝大家!
?
文:杜佳豪
總結
以上是生活随笔為你收集整理的【重磅】世界区块链组织首席科学家白硕:区块链技术与数据隐私讲座的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 红灯检测动画
- 下一篇: NewBing-Sorry, looks