前言
上一篇我們講述了人工智能,機器學習與聯邦學習的關系。
這篇我們將繼續探索聯邦學習方法的分類。聯邦學習方法被分為橫向聯邦學習、縱向聯邦學習和遷移聯邦學習三類,適用于解決不同的實際問題。
橫向聯邦學習
在兩個數據集的用戶特征重疊較多而用戶重疊較少的情況下,把數據集按照用戶維度切分,并取出雙方用戶特征相同而用戶不完全相同的那部分數據進行訓練。這種方法叫做橫向聯邦學習。
▲?應用場景
橫向聯邦學習的本質是樣本的聯合,適用于參與者間業態相同但觸達客戶不同,即特征重疊多,用戶重疊少時的場景,比如不同地區的銀行間,他們的業務相似,但用戶不同。
民盟中央建議加速元宇宙科普和立法:3月4日消息,民盟中央已起草了《關于“元宇宙”技術發展的提案》,并將提交全國政協十三屆五次會議。在提案中,民盟中央建議,在科普層面需加速知識傳播,法律層面則需加快立法步伐。民盟中央擬提交的提案指出,目前,在新興網絡層面,相關政策法規相對缺失。“元宇宙”在未來將會帶動形成全新的網絡形態,當遇到突發輿情,全虛擬的環境、場景將更難進行源頭追蹤、問題疏導。因此建議應盡早加快立法研究,盡快形成與技術、市場發展相適應的治理模式和法律基礎,全面提升我國社會治理的水平。建議組織相關部門,針對“元宇宙”相關需求、風險進行立法研究,并盡快發布。此前消息,民進中央擬向全國政協十三屆五次會議提交《關于積極穩妥推進元宇宙技術和產業發展的提案》。建議推進元宇宙技術產業發展,建立相關監管治理體系。(華夏時報)[2022/3/4 13:37:12]
比如,有兩家不同地區銀行?—?上海與杭州兩地的兩家銀行,它們的用戶群體分別來自上海與杭州的居住人口,用戶的交集相對較小。由于銀行間的業務相似,記錄的用戶特征大概率是相同的。因此,橫向聯邦學習可以被考慮用來構建聯合模型。
歐科云鏈集團正式啟動區塊鏈科普行動“星途計劃”:歐科云鏈集團于4月26日,正式宣布啟動了區塊鏈科普行動——“星途計劃”,行動包括將在全國范圍展開系列沙龍,加大力度推進區塊鏈科普進機關、進國企、進校園等,聯合政府部門、行業協會等共同構建起更加完善和有效的區塊鏈科普教育生態,與此同時,直擊區塊鏈科普現存痛點,推出簡單易懂的“秒懂區塊鏈”公益短視頻課。
該計劃旨在全維度推動社會建立對產業更清晰的認知,與“鯤鵬計劃”一道助力數字經濟及區塊鏈產業本身健康發展夯實“人才”和“產業認知”兩大基礎。[2021/4/26 20:59:37]
于2017年,Google提出了一個針對安卓手機模型更新的數據聯合建模方案:在單個用戶使用安卓手機時,不斷在本地更新模型參數并將參數上傳到安卓云上,從而使特征維度相同的各數據擁有方建立聯合模型的一種聯邦學習方案。
▲?學習過程
動態 | 報告:區塊鏈等熱點詞促使童書科普百科類成交額同比增速最高:近日,京東圖書與艾瑞咨詢聯合發布了《2019中國圖書市場報告》。報告指出,AI、5G、區塊鏈、機器人、VR、智能家居、AR這些熱點詞,不斷點燃科技熱潮,科技在改變大眾生活的同時,也吸引了越來越多家長的關注,從小培養孩子對科技的興趣和熱愛。因此童書中科普百科類成交額同比增速最高,占比將近40%。[2020/1/8]
Step1.參與方各自從協調方上下載最新模型;
Step2.每個參與方利用本地數據訓練模型,加密梯度上傳給協調方,協調方聚合各用戶的梯度以更新模型參數;
Step3.協調方返回更新后的模型給各參與方;
動態 | 幣安科普MimbleWimble算法:幣安官方推特今日發布隱私算法Mimblewimble的科普貼,在下方留言區大量網友留言猜測是否是基于 Mimblewimble算法的隱私幣Grin或者Beam即將登陸幣安交易所,其中猜測Grin的呼聲更高。[2019/9/2]
Step4.各參與方更新各自模型。
縱向聯邦學習
在兩個數據集的用戶重疊較多而用戶特征重疊較少的情況下,把數據集按照特征維度切分,并取出雙方用戶相同而用戶特征不完全相同的那部分數據進行訓練。這種方法叫做縱向聯邦學習。
▲?適用場景
縱向聯邦學習的本質是特征的聯合,適用于用戶重疊多,特征重疊少的場景,比如同一地區的商超和銀行,他們觸達的用戶都為該地區的居民,但業務不同。
比如,有兩個不同機構,一家是某地的銀行,另一家是同一個地方的電商。它們的用戶群體很有可能包含該地的大部分居民,用戶的交集可能較大。由于銀行記錄的都是用戶的收支行為與信用評級,而電商則保有用戶的瀏覽與購買歷史,因此它們的用戶特征交集較小。縱向聯邦學習就是將這些不同特征在加密的狀態下加以聚合,以增強模型能力的聯邦學習。
▲?學習過程
介紹一種簡單通用的縱向聯邦學習的建模學習過程,加密方式也以半同態加密的PallierEncryption為主。
訓練前:
先采用加密文本對齊的技術手段,在系統內篩選出不同企業之間的共同用戶。
訓練時:
Step1.協調方C向企業A與B發送公鑰,用來加密所需傳輸的數據;
Step2.A和B分別計算和自己相關特征的中間結果,并加密完后進行交互,用來求解各自的梯度結果和損失結果;
Step3.A和B分別計算各自加密后的梯度并添加掩碼后發送給C,同時B計算加密后的損失先發送給C;
Step4.C解密梯度和損失后回傳給A和B,A、B去除掩碼并更新模型。
遷移聯邦學習
在兩個數據集的用戶與用戶特征重疊都較少的情況下,不對數據進行切分,而可以利用遷移學習來克服數據或標簽不足的情況。這種方法叫做聯邦遷移學習。
▲?適用場景
當參與者間特征和樣本重疊都很少時可以考慮使用聯邦遷移學習,如不同地區的銀行和商超間的聯合。主要適用于以深度神經網絡為基模型的場景。
遷移學習的核心是,找到源領域和目標領域之間的相似性。舉一個楊強教授經常舉的例子來說明:我們都知道在中國大陸開車時,駕駛員坐在左邊,靠馬路右側行駛。這是基本的規則。然而,如果在英國、香港等地區開車,駕駛員是坐在右邊,需要靠馬路左側行駛。那么,如果我們從中國大陸到了香港,應該如何快速地適應他們的開車方式呢?訣竅就是找到這里的不變量:不論在哪個地區,駕駛員都是緊靠馬路中間。這就是我們這個開車問題中的不變量。找到相似性?(不變量),是進行遷移學習的核心。
比如有兩個不同機構,一家是位于中國的銀行,另一家是位于美國的電商。由于受到地域限制,這兩家機構的用戶群體交集很小。同時,由于機構類型的不同,二者的數據特征也只有小部分重合。在這種情況下,要想進行有效的聯邦學習,就必須引入遷移學習,來解決單邊數據規模小和標簽樣本少的問題,從而提升模型的效果。
▲?學習過程
聯邦遷移學習的步驟與縱向聯邦學習相似,只是中間傳遞結果不同。
以上是常見的幾種聯邦學習類型,聯邦學習這件“小事”能用在什么場景中,帶來怎樣的價值,會在下一篇文章中詳細介紹。也歡迎各位與我們一起對以上三種類型的聯邦學習進行更深一步的討論,添加小助手加入技術交流群。
作者簡介
嚴楊
來自數據網格實驗室BitXMesh團隊?PirvAIの修道者
Tags:區塊鏈STEPTEPSTE區塊鏈的未來發展前景分析stepg幣怎么樣Step AppSteam Exchange
來源:財聯社 作者:卞純 繼上周推遲對ETF提供商VanEck提議的比特幣產品作出決定后,美國證券交易委員會周三再次就批準另一項比特幣ETF申請作出決定.
1900/1/1 0:00:00說作者|談叔 本期編輯|ColinWu今天,薩爾瓦多總統NayibBukele通過Bitcoin2021邁阿密大會發布了一條視頻,聲稱要提交法案,使比特幣成為該國的法定貨幣,隨后.
1900/1/1 0:00:00據Cointelegraph6月23日報道,NFT平臺Rarible周三宣布籌集了1420萬美元A輪融資.
1900/1/1 0:00:00隨著代碼本周部署到最終測試網,人們期待已久的以太坊網絡倫敦升級即將到來。以太坊的倫敦硬分叉將迎來EIP-1559升級,繼周四在Rinkeby測試網上線后,目前已定于8月4日發布.
1900/1/1 0:00:00巴比特訊,7月1日,中國知名潮流藝術家袁澤銘已確認出席2021世界區塊鏈大會·杭州。袁澤銘畢業于清華大學美術學院,創立設計師品牌THEGUY,曾擔任北京奧運會徽章類特許商品主設計師、倫敦奧運會徽.
1900/1/1 0:00:00據Bitcoinist消息,南非主要金融機構FNB否認與最近倒閉的加密投資公司Africrypt有銀行業務關系的指控。據悉,近兩個月前,Africrypt突然停止運營,這促使銀行機構予以否認.
1900/1/1 0:00:00