隱私計算:Web3.0風口上的風口? - 冷萃財經

隱私計算:Web3.0風口上的風口?

隱私計算:Web3.0風口上的風口?
文章摘要:上個月,全球知名的信息技術研究和顧問公司Gartner發布了2021年需要重點關注的戰略性科技趨勢。其中隱私計算這項技術被單獨拿出來作為一個大主題,要知道去年Gartner的報告里,隱私計算只能作為一小項出現。這些足以表明「隱私計算」的身價在當下兩年內必定會水漲船高。

上個月,全球知名的信息技術研究和顧問公司Gartner發布了2021年需要重點關注的戰略性科技趨勢。其中隱私計算這項技術被單獨拿出來作為一個大主題,要知道去年Gartner的報告里,隱私計算只能作為一小項出現。這些足以表明「隱私計算」的身價在當下兩年內必定會水漲船高。

隱私計算:Web3.0風口上的風口?

隱私計算的最終目標不在於隱私

為什麼這幾年開始隱私計算被提到的次數和權重越來越高?回想一下,以前一提到隱私講的更多是數據安全問題,針對的對象都是黑客入侵,因為現在「敵人」變了,對立者是用戶和企業之間。

企業從消費者數據中獲取收益的爭議越來越多,更多消費者逐步意識到個人數據中蘊藏的價值,人們越來越希望控制自己的數據資產。也使得政府對個人數據的監管力度有所提升,最終令各類組織承擔起越來越高的個人數據保護與管理壓力。

而在用戶自身也很矛盾,有一句話可以形容這種尷尬:「中國的用戶願意犧牲隱私來獲取更高的便利性」。我們都知道3G/4G網路,以及互聯網、大數據的發展帶來了很多用戶體驗上的優化,例如我們可以精準獲取想看的內容、想買的商品信息以及打到離自己最近且最順路的車。但這些也確實傷害了隱私。一方面用戶希望繼續享有這種便利,另一方面又不希望企業過多掌控隱私,表面上這形成了一個無解的局面。

以上這些現象,隱私數據的保護是一個最直接的出發點。但這不能完全代表整個隱私計算的概念。首先企業和機構在隱私方面的動機和需求是不一樣的,消費者可能僅僅希望保護他們的身份、信用卡信息或其他敏感數據,以防止欺詐或身份盜竊。但企業還要依賴於這些隱私數據給業務帶來更多的增長機會,同時也要承擔在隱私數據使用的整個過程中,這些用戶信息或者企業敏感信息保護的壓力。

因此我們在看隱私計算時,一是隱私,然後是計算,最終的目標是在維護用戶數據主權的同時讓數據在計算之後產生價值,因此隱私計算不單單是數據的靜態保護,而是一個過程的保護。

Web2.0向Web3.0遷移的絕對前提

數據就是資產,這已經成為Web2.0向Web3.0轉變的關鍵特徵。用戶在確立了對自身數據的主權後就會產生另外一個問題,數據很好地牢牢地握在用戶手裡,這時候數據是不具備任何價值的,只有它流通了並且經過演算法、算力的處理後才會產生一定的價值。

但問題就在於,我把數據交出去之後,會不會損害到我的數據主權?企業會不會拿著我的數據去做一些用戶授權範圍以外的事情?沒有一個穩妥解決方案,企業很難讓用戶相信自己。那麼最終的局面就是,用戶手裡拿著自身並不具備價值的數據,企業也無法獲得大量優質的數據源來使其產生商業價值。

這就是隱私計算所要解決的問題。為什麼說隱私計算是Web2.0向Web3.0遷移的絕對前提?我們又如何精準地切入到這條風口賽道機會點?我們需要更加全面地了解隱私計算技術。

隱私計算的標準定義是:「一組互不信任的參與方之間,在保護隱私信息以及沒有可信第三方的前提下的協同計算問題」。我們通過著名的「百萬富翁」假設就可以很好地理解,兩個富翁希望比一下誰更有錢,這是我們要解決的問題,最直接的辦法就是看誰擁有的財富數值大,但是這個時候雙方都不想透露自己具體有多少錢,這個資產數相當於我們手裡的個人數據。那麼我們可以設計一個演算法或者裝置,兩個富翁在各自看不見的地方往那個演算法或者裝置里輸入具體的財富數額,那個封閉的演算法或者裝置就會輸出誰更有錢的結果,整個過程中誰也不知道他們到底有多少錢。那麼這個過程或者說演算法和裝置就是隱私計算。

隱私計算涵蓋了信息搜集者、發布者和使用者在信息產生、感知、發布、傳播、存儲、處理、使用、銷毀等全生命周期過程的所有計算操作,也就是說從數據產生開始,除了數據的所有者之外,誰都不知道數據具體是什麼,其他人可以在所有者的授權下使用這些數據,但是又看不到具體的信息。

這就很好地解決了前面的矛盾,因為企業可能也並不需要知道你具體的信息,他們真正需要的是數據經過處理計算後產生的價值。不僅如此,在現實市場裡面,每一家掌握的數據多少、維度都不一樣,例如騰訊掌控了國人的社交習慣數據,淘寶擁有大量的用戶購物行為數據,任何片面的數據都不能全面精準地勾畫出目標對象的全部特徵。數據流動是數字經濟時代企業的剛性需求,越來越多的企業或組織需要與產業鏈上下游業務夥伴在數據流通和交易領域進行深度合作。因為只有通過各方數據協同計算,才能更好地釋放數據更大的價值,提升生產效率,推進產業創新。數據共享和流通將成為剛性業務需求。但出於數據權屬、數據泄露及自身商業利益等諸多因素考慮,手握大量數據的企業或組織對於開放自己的內部數據尤其是核心數據保持極其謹慎的態度,這就是企業與企業之間的「百萬富翁問題」。

舉個例子,某家電商想用用戶數據做一個推薦演算法,又沒辦法拿到淘寶或者京東的用戶數據。直接買,又擔心有人刷單薅羊毛。但是如果接入了區塊鏈。那我可以只賣出我的淘寶購物數據和京東購物數據,而不提供出我的快遞地址,姓名,支付寶號等。因為都記在區塊鏈上,我既沒法辦法把相同數據賣給這家電商兩次,又沒法賣給電商假數據。作為回報,店家給我支付酬勞,並且獲得了真正的數據來幫助他自己完善演算法,一舉兩得。

隱私計算在可以在確保保密性或隱私的同時,又保護正在使用的數據

而且前面也提到,Web3.0的核心特徵之一是數據確權,那麼只有在數據始終在所有者手中,並且一直得到保護才能說對其擁有完整的主權。因此從Web2.0時代平台控制下流量經濟到Web3.0個體主導下的數據經濟,隱私計算是轉變的絕對關鍵。

隱私計算的賽道體系

最近一兩年我們可能一直零星地聽到零知識證明、TEE、同態加密等這些概念,但是很難對隱私計算的整體概念有一個很清晰的認知。一般來說,隱私計算主要分為可信硬體和密碼學兩大方向。

隱私計算:Web3.0風口上的風口?

可信硬體方向:TEE

其中可信硬體指的是,在一個硬體中建立一個我們可以相信的安全區域,然後把所有的數據處理計算都放在這個封閉的安全區域內進行,但是安全性都需要完全依賴於硬體以及硬體安全環境的建設者。一般是Intel或者其他晶元的製造商。(Intel的SGX、ARM的TrustZone、AMD的SEV等產品)。

其中最具有代表性的就是TEE,其他例如「中立國」、「安全沙箱」等技術都是基於這個思路。可信硬體的優勢在於通用性高,它可以處理幾乎所有類型的隱私計算任務,並且開發難度低,性能也更高。但其最大的問題在於,把安全性押在一個廠商身上,等於把後門完全留給了可信硬體的提供方和設計者。在外界看來這其中隱含了巨大的風險。因此可信硬體方案更多地會被用在那些並不追求極致的安全性,更加要求速度和體驗的場景中。

密碼學方向:多方安全計算

多方安全計算也就是常見到的MPC,是指在沒有可信第三方託管的情況下,多方共同通過一個特定的函數,安全地完成一次協同計算,每個人都是秘密輸入自己的數據,然後大家只能得到這個函數最後計算出來的結果。

隱私計算:Web3.0風口上的風口?

多方安全計算是歷史最為悠久,並且技術底蘊最為深厚的方向,其他所有涉及隱私計算的技術或者解決方案多多少少都會採用多方安全計算的一些技術。並且多方安全計算也是幾年來和區塊鏈結合的最為緊密的技術方向,區塊鏈可以通過採用MPC技術來提升自身的數據保密的能力,以適應更多的應用場景。MPC可以藉助區塊鏈技術實現冗餘計算,從而獲得可驗證的特性。Blockchain+MPC在近期的發展極快,也非常具有想像空間。

多方安全計算算是一種協議或者說技術集合,像我們常聽到的零知識證明、同態加密、不經意傳輸、混淆電路都屬於多方安全計算的工具。多方安全計算由於其通用性相對較低、性能處於中等水平,因此往往會用於一些特定的場景,例如大型機構和企業之間做一些聯合數據分析,另外還可以用於銀行之間黑名單去重等等。但近年來性能提升迅速,安全多方計算的應用範圍和價值都在急劇提升。

混淆電路和不經意傳輸是主流的多方安全計算框架的核心技術:計算過程中,邏輯或者函數會轉換為電路,數據會沿著這套電路被加密以及計算,這個加密電路和相關的信息會發送給其他參與者。然後接收方藉助不經意傳輸來選取標籤,然後對這個加密電路進行解密來獲取計算結果。

這其中的混淆電路指的是,所有計算邏輯和問題都可以轉換成不同的電路,比如我想求和,那就是加法電路,然後混淆電路通過加密和擾亂這些電路的值來掩蓋關鍵信息。這樣整個過程中既沒有任何一個人能看到實際的有效信息,同時也完成了電路所要求的任務。不經意傳輸的意思是A發送了一個信息給接收者B,發送者A是不知道B是否收到了信息的。

再就是最近幾年的明星技術零知識證明。零知識證明的原理是,A和B被一道門隔開,B需要向A證明我是有開門的鑰匙的,那怎麼讓門對面的A相信B有鑰匙這個事實呢?只要讓A看到B是打開門從中間扇鎖著的門走過來的就可以了。這樣A便可以相信B持有門的鑰匙這一事實。

零知識證明指的是一方向另一方陳述一件事是正確的,而不透露出該陳述之外的任何信息。證明者不直接告訴你答案,而是採用另一種表達方式來讓向你證明,直到你認為對方確實知道答案為止。零知識證明技術往下細分也有很多的種類,比如 Zcash 使用的 zk-SNARKs 和 Vitalik Buterin 經常提到的 zk-STARKs。

隱私計算:Web3.0風口上的風口?

零知識證明(Zero knowledge proofs)目前被公認是「最完美」的解決方案,儘管技術實現難度最高,但在保護在以太坊網路的隱私性和安全性上,其效果最佳。

最後就是秘密共享和同態加密這兩個基礎型的應用技術。秘密共享通過把秘密進行分割,並把秘密在n個參與者中分享,使得只有多於特定t個參與者合作才可以計算出或是恢復秘密,而少於t個參與者則不可以得到有關秘密。同態加密原理則是加信息加密後發送給對方,區別於一般加密的點在於,同態加密可以在解密時就完成既定的計算任務。分散式計算環境下的密文數據計算方面具有比較廣泛的應用領域,比如安全雲計算與委託計算、多方保密計算、匿名投票、文件存儲與密文檢索等。而在區塊鏈上,使用同態加密技術,智能合約也可以處理密文,而無法獲知真實數據,能極大的提高隱私安全性。

而像聯邦計算、差分隱私是近兩年來比較新興的解決方案,在這裡我們就不一一贅述了。

總的來說隱私計算的熱度近幾年才剛剛興起,但是其背後,人類對於加密和隱私保護的追求從來沒有停止過,隱私計算是靜態的數據安全基礎上迎合當下市場新需求的結果。而隨著大數據產業的持續發展和數據安全共享需求的日益嚴重,隱私計算技術的落地場景會越來越多。

當前隱私計算的主要應用領域還是在金融行業,多家金融機構在不泄露客戶信息的情況下綜合各種數據去完成對客戶或者某些投資的風險測繪,從而達成風險控制的目的。而像醫療衛生這類敏感性的商業場景也是重要方向之一,例如此前頗受爭議的健康碼管控可能涉及隱私泄露的爭議。類似這樣的矛盾會在Web3.0到來時被全面激化,這時候隱私計算就是關鍵中的關鍵。

冷萃財經原創,作者:Awing,轉載請註明出處:https://www.lccjd.top/2020/11/15/%e9%9a%90%e7%a7%81%e8%ae%a1%e7%ae%97%ef%bc%9aweb3-0%e9%a3%8e%e5%8f%a3%e4%b8%8a%e7%9a%84%e9%a3%8e%e5%8f%a3%ef%bc%9f/?variant=zh-tw

0

掃一掃,分享到微信

猜你喜歡

文章評論

電子郵件地址不會被公開。 必填項已用*標註

後發表評論

    上一篇

    江卓爾:下輪甚至本輪周期,BTC市值很可能先被ETH超過,然後再被BCH超過

    下一篇

    火幣比特幣「湧入」幣安,雙方創全年流出流入記錄

    微信公眾號

    微信公眾號