上海品茶

您的当前位置: 上海品茶 > 上海品茶 > 行业知识 > 联邦学习啥意思?算法原理是怎样的?

联邦学习啥意思?算法原理是怎样的?

1、联邦学习

传统的机器学习算法需要用户将源数据上传到高算力的云服务器上集中训练,这种方式导致了数据流向的不可控和敏感数据泄露问题。Mcmahan等在2016年提出联邦学习技术,允许用户在机器学习过程中既可以保护用户隐私,又能够无须源数据聚合形成训练数据共享。联邦学习本质上是一种分布式的机器学习技术,其流程如图1所示。

联邦学习

客户端(如平板电脑、手机、物联网设备)在中心服务器(如服务提供商)的协调下共同训练模型,其中客户端负责训练本地数据得到本地模型(local model)。中心服务器负责加权聚合本地模型,得到全局模型(global model),经过多轮迭代后最终得到一个趋近于集中式机器学习结果的模型w,有效地降低了传统机器学习源数据聚合带来的许多隐私风险。

联邦学习技术特点

(1)参与联邦学习的原始数据都保留在本地客户端,与中心服务器交互的只是模型更新信息;

(2)联邦学习的参与方联合训练出的模型w将被各方共享;

(3)联邦学习最终的模型精度与集中式机器学习相似;

(4)联邦学习参与方的训练数据质量越高,全局模型精度越高。

2、联邦学习算法原理

典型的联邦学习场景是在本地客户端设备负责存储和处理数据的约束下,只上传模型更新的梯度信息,在数千万到数百万个客户端设备上训练单个全局模型w。中心服务器的目标函数F(w) 通常表现为:

联邦学习算法原理

其中,m是参与训练的客户端设备总数,n是所有客户端数据量总和,kn是第k个客户端的数据量,Fk(w) 是第K个设备的本地目标函数。

联邦学习

其中,dk是第k个客户端的本地数据集,fi(w) =α(xi,yi,w) 是具有参数w的模型对数据集dk中的实例(xi,yi)产生的损失函数。dk中所有实例产生的损失函数之和除以客户端k的总数据量就是本地客户端的平均损失函数,损失函数与模型精度成反比,因此,机器学习的目标函数优化通常是让损失函数达到最小值。

联邦学习的目标函数优化算法中,通常采用大批量随机梯度下降(SGD)算法,即通过本地客户端模型训练的损失函数,乘以固定的学习率η ,计算出新一轮的权重更新。因此,本地客户端的模型权重更新如下:

联邦学习

第t轮通信中心服务器的模型聚合更新如下:

联邦学习

本文由作者-YANYI发布,版权归原作者所有,禁止转载。本文仅代表作者个人观点,与本网无关。本文文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

相关报告

智谱AI&amp2021联邦学习全球研究与应用趋势报告(95页).pdf
智谱AI&amp2021联邦学习全球研究与应用趋势报告(95页).pdf

论文摘要:现代移动设备可以访问大量适合学习模型的数据,这反过来又可以大大改善设备上的用户体验。例如,语言模型可以改进语音识别和文本输入,图像模型可以自动选择好的照片。然而,这些丰富的数据通常是隐私敏感的、数量庞大的,或者两者兼而有之,这可能会妨碍使用传统方法登录到数据中心并在那里进行训练。由此,学者们提出一

Wordpay:2017全球支付报告(57页)(57页).pdf
Wordpay:2017全球支付报告(57页)(57页).pdf

在线支付的权威指南 全球 支付报告 2017年11月 研究方法 全球支付趋势 核心洞见 市场指南 支付方式定义 目录 本报告基于一级和次级数据来源撰写而成。一级(一手)数据来源,是指Worldpay自 身的调查研究;次级数据来源,是指权威第三方供应商数据或其他公共数据资源。本报 告也总结了Worldpay几

移动通信网络中的联邦学习白皮书(24页).pdf
移动通信网络中的联邦学习白皮书(24页).pdf

 随着5G应用日趋多样化,网络的业务识别能力面临多重挑战:加密应用越来越多,人工分析识别率下降;业务类型越来越多,人工分析成本越来越高;应用更新越来越频繁,人工分析响应速度无法及时识别;异厂家UPF数据无法集中、2B数据不出厂、不同UPF业务分布不均等原因,导致依靠单一UPF上的业务样本数据进行业务识别模型训

垃圾分类影响下的固废大格局-热话题与冷思考.pdf
垃圾分类影响下的固废大格局-热话题与冷思考.pdf

 TongjiTongji UniversityUniversity1907-2019何品晶二级教授、博士生导师同济大学 固体废物处理与资源化研究所 所长Waste Management(Elsevier) 主编环境卫生工程主编Email: ; Http:/垃圾分类影响下的固废大格局垃圾分类影响下的固废大格局 

美国医院协会:美国医院和卫生系统人力资源战略规划趋势洞察报告(英文版)(21页).pdf
美国医院协会:美国医院和卫生系统人力资源战略规划趋势洞察报告(英文版)(21页).pdf

 美国的医院和卫生系统是社区的中心,既是关键服务的提供者,也是规模最大的雇主。他们通过建立和扩大富有活力的劳动力队伍来培训未来的医疗保健提供者,并培养未来的领导者,以有效跟上医疗保健趋势、不断发展的技术和更广泛的社会文化趋势。在整个医疗保健领域,职位空缺创历史新高。福布斯利用美国劳工统计局(BLS)的数据估计

联邦学习场景应用研究报告(2022年)(69页).pdf
联邦学习场景应用研究报告(2022年)(69页).pdf

联邦学习联邦学习场景应用场景应用研究报告研究报告 (2022 年)年)中国信息通信研究院泰尔终端实验室中国信息通信研究院泰尔终端实验室 2022022 2 年年 2 2 月月前前 言言数据作为数字经济和信息社会的核心资源,被认为是继土地、劳动力、资本、技术之后的又一个重要生产要素,其在企业数字化转型中发挥 

北京金融科技产业联盟:联邦学习技术金融应用白皮书(124页).pdf
北京金融科技产业联盟:联邦学习技术金融应用白皮书(124页).pdf

 年来,数字经济蓬勃发展,已经成为带动中国经济增长的核心动力。 

使联邦机构以证据为基础:学习议程的关键作用(英文版)(55页).pdf
使联邦机构以证据为基础:学习议程的关键作用(英文版)(55页).pdf

 学习议程提供了一种工具,可作为组织战略规划的一个方面,特别侧重于为决策者、组织领导者和利益相关者生成相关知识。学习议程有时被描述为联邦机构研究和评估活动的战略证据构建计划。然而,在实践中可能远不止这些。一个具有包容性和战略性的学习议程提供了一系列重要问题和解决问题的计划,这些问题平衡了不同组织决策者的兴趣、

会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部