初识联邦学习(Federated learning)
??聯邦學習(Federated learning)最早在2016由谷歌提出,并在之后受到大量的關注。本文旨在簡要介紹聯邦學習,了解聯邦學習的背景,而不關注聯邦學習具體的實現方案。希望能解釋通如下幾個問題。
??1.為什么要有聯邦學習
??2.什么是聯邦學習
??3.聯邦學習的簡易模型
??4.聯邦學習的優勢
1.為什么要有聯邦學習?
??在閱讀聯邦學習相關文獻時,總會遇到一個詞——去中心化。聯邦學習實際上是機器學習的一種,只不過它改變了機器學習的訓練模式,變得更加安全。常規的機器學習訓練方式是將全部數據送到一個中心區域,由中心區域的算力完成計算。相對于數據的提供者,中心算是第三方,數據提供者不希望將數據提供給第三方,因為存在潛在的數據泄露危險(這就是數據孤島問題)。于是關于不提供數據,但仍能完成模型運算的愿景就被提出。這就是聯邦學習!
??聯邦學習的目標就是在保證數據隱私安全及合法合規的基礎上,實現共同建模,提升AI模型的效果/在保障大數據交換時的信息安全,保護終端數據和個人隱私數據,保證在合法合規的前提下在多方參與或多計算節點之間開展高效率的機器學習。
2.什么是聯邦學習?
??聯邦學習的架構思想有兩種,一種是中心化聯邦(客戶端/服務器)架構,一種是去中心化聯邦(對等計算)架構。我們常用聯邦學習代指去中心化這種。不同于之前數據集中式的訓練,聯邦學習支持模型的本地訓練(利用本地數據),并將本地訓練的模型上傳至一個server,由server將多個小模型聚合,形成一個大模型。關于什么是聯邦學習,有更為專業的描述:聯邦學習是一種帶有隱私保護,安全加密技術的分布式機器學習框架,旨在讓分散的各參與方在滿足不向其他參與者披露隱私數據的前提下,協作進行機器學習的模型訓練(參考:詳解聯邦學習Federated Learning。
??聯邦學習的分類有三種:
????1)Horizontal FL(橫向聯邦)
????2)Vertical FL(縱向聯邦)
????3)Federated Transfer L(聯邦遷移)
??關于聯邦學習的分類是基于特征重疊和樣本重疊比重確定的,如下圖:
??具體的分類細節以及圖源都來自于這篇文章:詳解聯邦學習Federated Learning
3.聯邦學習的簡易模型
??聯邦學習有三大構成要素:數據源、聯邦學習系統、用戶。具體模型關系如下圖:
??簡單來說就是數據源本地利用已有數據訓練子模型,傳遞至coordinator處由Federated model進行聚合形成完成model,再將完整model提供給用戶使用。
4.聯邦學習的優勢
??聯邦學習四個優勢(參考過來滴~):
??1)數據隔離,數據不會泄露到外部,滿足用戶隱私保護和數據安全的需求
??2)能夠保證模型質量無損,不會出現負遷移,保證聯邦模型比割裂的獨立模型效果好
??3)參與者地位對等,能夠實現公平合作
??4)能夠保證參與各方在保持獨立性的情況下,進行信息與模型參數的加密交換,并同時獲得成長。
最后留一些關于聯邦學習的參考文獻:
[1]Yang Q, Liu Y, Chen T, et al. Federated machine learning: Concept and applications[J]. ACM Transactions on Intelligent Systems and Technology (TIST), 2019, 10(2): 1-19.
[2]Li T, Sahu A K, Talwalkar A, et al. Federated learning: Challenges, methods, and future directions[J]. arXiv preprint arXiv:1908.07873, 2019.
因作者水平有限,如有錯誤之處,請在下方評論區指正,謝謝!
新人創作打卡挑戰賽發博客就能抽獎!定制產品紅包拿不停!總結
以上是生活随笔為你收集整理的初识联邦学习(Federated learning)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C/C++进程文件锁 之 fcntl函数
- 下一篇: python-nmap使用及案例