前言:隱私計算賽道作為當下的風口賽道,無數企業紛紛涌入,搶跑占道。作為一家專注于區塊鏈隱私計算賽道科普入門的垂直媒體,同時也是針對隱私計算興趣者開放的“純天然”、低門檻入口,我們匯總并分類了隱私計算行業內晦澀難懂的名詞,編寫了「隱私計算詞典」板塊,幫助大家理解、學習。?
此篇,我們來了解隱私計算技術架構的第三部分——聯邦學習。
近年來,從無人駕駛汽車,到AlphaGo擊敗頂尖的真人圍棋手等等,AI人工智能在科技領域的發展著實吸引了足夠多人的眼球。
然而,發展至今的AI人工智能仍面臨兩大現實問題:
行業數據分散且收集困難,數據以孤島的形式存在;
北京城市副中心去年共新增落地元宇宙企業63家:金色財經報道,2023北京城市副中心產業高質量發展大會舉行。記者從會上獲悉,2022年副中心元宇宙產業創新資源不斷涌入,去年共新增落地元宇宙企業63家,大企業帶動效應初步顯現。空間布局初步形成,2000平方米元宇宙應用創新中心完成建設。(新京報)[2023/3/20 13:14:21]
隱私得不到保障,安全共享數據成為了一道壁壘。
針對此,人們提出了一種名為「聯邦學習」的隱私計算技術。
聯邦學習,又名聯邦機器學習、聯合學習。它是AI人工智能的一門分支技術,旨在保障大數據交換時的信息安全、數據保護,在合法合規的前提下,有效幫助多行業的數據進行機器學習建模。
Axelar正在推出Axelar虛擬機(VM):金色財經報道,幫助開發人員構建跨鏈加密應用程序的區塊鏈網絡Axelar正在推出Axelar虛擬機(VM),Axelar將其新虛擬機描述為Kubernetes for Web3。Axelar在一份聲明中表示,“Axelar虛擬機將允許開發者在EVM、Cairo VM、Cosmos或其他生態系統上構建他們的dApps(去中心化應用),并在所有鏈上運行它們。”
Axelar將自己描述為“Web3的Stripe”,正如Stripe為Web2開發人員提供一站式服務,幾乎可以將任何銀行機構融入他們的應用程序一樣,Axelar旨在幫助Web3開發人員無縫集成不同的鏈。[2023/2/28 12:32:51]
隱私保護是聯邦學習最主要的關注點,在實際的應用中,聯邦學習通過將數據的不同特征在加密的狀態下加以聚合,以增強機器學習模型能力,再通過共享數據模型,避開原始數據共享,進而保證了數據的安全性。?
XRP市值跌破200億美元:金色財經報道,據Coingecko數據顯示,XRP市值已跌破200億美元關口,當前為19,704,635,008美元。XRP市值于11月8日被Binance USD超越,后者已成為市值第六大加密貨幣,當前市值為24,888,982,501美元。[2022/11/9 12:36:50]
利用聯邦學習的特點,即使是不導出企業數據的情況下,也能為三方或多方建立機器學習模型,既充分保護了數據隱私和數據安全,又為客戶提供個性化、有針對性的服務,實現了互惠互利。?
同時,我們可以利用不同類別的聯邦學習技術來解決數據異質性問題,突破傳統AI技術的局限性。依照參與建模的數據源分布,聯邦學習可分為橫向聯邦學習、縱向聯邦學習和聯邦遷移學習三類。?
美SEC執法主管:不會放慢針對加密貨幣的法律行動:9月9日消息,美國證券交易委員會執法部門主管 Gurbir Grewal 在由法律教育非營利組織執業法律研究所主辦的論壇上表示,無論使用什么技術,都將繼續采取行動,不會放慢針對加密貨幣的法律行動。他還稱:不執行我們監管結構中最基本的規則——這將是對信任的背叛。[2022/9/9 13:20:17]
橫向聯邦學習
?假設收集兩個數據集,這兩個數據集用戶特征重疊多,而用戶重疊少。我們把數據集按照用戶維度切分,取出雙方用戶特征相同,而用戶不完全相同的部分數據作為機器的訓練數據,這種模型稱為橫向聯邦學習。?
例如,兩個不同行政區的銀行,用戶群體分別來自所在行政區,重疊部分少。但是同作為銀行,業務類似,因此數據集收集的用戶特征則大體相同。因此,橫向聯邦學習模型收集的是兩個數據集不完全相同的用戶部分。?
如下圖所示:?
縱向聯邦學習
與橫向聯邦學習相反,在兩個數據集用戶重疊多、用戶特征重疊少的情況下,縱向聯邦學習把數據集按照數據特征維度切分,取出雙方用戶相同,而用戶特征不完全相同的部分作為機器訓練數據。?
例如,同一個行政區的銀行和商超,其收集的數據用戶群體大致類似,但銀行和商超收集到的用戶特征基本不同。因此,縱向聯邦學習模型收集的是兩個數據集不完全相同的用戶特征部分。?
如下圖所示:
聯邦遷移學習
在用于機器學習的數據集樣本用戶與用戶特征重疊都較少的情況下,通常不對數據進行切分,而是引入聯邦遷移學習,來解決數據不足的問題,從而提升模型的效果。
具體地,可以擴展已有的機器學習方法,使之具有橫向聯邦學習或者縱向聯邦學習的能力。?例如,收集一家位于北京的銀行和一家位于上海的商超的數據,由于受到地域限制,用戶群體交集很小;同時,由于銀行和商超類型的不同,二者收集的數據特征也基本無重合。?
引入聯邦遷移學習,首先可以先讓兩個數據集訓練各自的模型,之后通過加密模型數據,避免在傳輸中泄露隱私。之后,對這些模型進行聯合訓練,最后得出最優的模型,再返回給各個企業。?
如下圖所示:?
多種類別的聯邦學習方式使得機器學習模型更加具有通用性,可以在不同數據結構、不同行業間發揮作用,沒有領域和算法限制,同時具有模型質量無損、保護隱私、確保數據安全的優勢。?
在實際的應用中,類似銷售、金融等行業,由于知識產權、隱私保護和數據安全等因素限制,數據壁壘很難打通。
聯邦學習成為了解決這些問題的關鍵,在不影響數據隱私和安全的情況下,對來自多方的數據進行統一的建模,進行機器學習模型的訓練,這些企業之間就能更好地進行數據協作。?
可以說,聯邦學習為構建跨行業、跨地域的大數據和人工智能生態圈提供了良好的技術支持。?考慮到在整個訓練過程中,進行模型更新的通信仍然可以向第三方或中央服務器顯示敏感信息,因此聯邦學習技術廣泛地與安全多方計算、TEE或者區塊鏈等技術結合應用,來增強聯邦學習的隱私性和去信任。
但目前已有的方法通常以降低模型性能或系統效率為代價提供隱私,因此,如何在理論和經驗上理解和平衡這些權衡,將是實現聯邦學習技術廣泛應用落地的一個相當大的挑戰。
來源:金色財經
翻譯:郝方舟 北京時間12月8日23時,美國眾議院金融服務委員會在國會山舉行了“數字資產和金融的未來:了解美國金融創新的挑戰和利益”為題的聽證會.
1900/1/1 0:00:00在前面的文章中,我和大家分享過推特大V-------PlanB在今年6月份對比特幣價格做出的預判.
1900/1/1 0:00:00北京時間12月8日晚11?點,題為“數字資產和金融的未來:了解美國金融服務的挑戰和好處”聽證會舉行,此次聽證會出席證人包含:JeremyAllaire.
1900/1/1 0:00:00001??CryptoVC,LP怎么投?Crypto作為一種新的資產類別,雖然大體上投資原則和傳統市場沒差別,但實際操作的時候,GP還需要重新評估,有時候也得根據crypto的特征調整投資方法.
1900/1/1 0:00:00原文標題:《紅杉資本的加密投資歷程:曾投中火幣、比特大陸,近半年投資至少9個項目》 作者:谷昱 今日,紅杉資本將其官方推特簡介更改為“我們幫助有膽識的人打造傳奇DAO,從創意到代幣空投.
1900/1/1 0:00:0012月6日,國家語言資源監測與研究中心發布“2021年度十大網絡用語”,元宇宙一詞赫然于列。大廠入場元宇宙不足為奇,但元宇宙赫然成為網絡十大熱詞之一,可以想象該詞及背后的信息在網絡中被傳播所達到.
1900/1/1 0:00:00