上海品茶

您的当前位置: 上海品茶 > 上海品茶 > 行业知识 > 联邦学习是什么?流程是怎样的?应用价值有哪些?

联邦学习是什么?流程是怎样的?应用价值有哪些?

1 联邦学习的定义

联邦学习最初的定义是一种借助多方客户端的私有数据集来训练全局共享模型的分布式机器学习算法框架。从广义上来说,联邦学习指数据所有者不需要上传私有数据集即可结合多方数据来训练全局共享模型的方法,得到的模型的效果和直接整合数据到数据中心或一台机器上进行训练得到的模型的效果相近,同时也保护了数据的安全,避免泄露数据隐私。

2 联邦学习的典型工作流程

联邦学习工作流程

(1) 问题确定:模型开发者需要明确使用联邦学习来解决的问题。

(2)客户端配置:客户端(例如,在手机上运行的应用程序)将被部署配置来收集本地模型训练所必需的数据集。在一般情况下,应用程序可能已经存储了数据(例如,短信应用程序存储文本消息,照片管理应用程序存储照片)。在某些情况下,可能需要维护其他数据,例如用户交互数据,为监督学习任务提供标签。

(3)仿真原型(可选):模型开发者使用辅助数据集在联邦学习仿真环境中对模型的体系结构进行原型设计并测试学习模型超参数。

(4)联合模型训练:开始执行多个联邦训练任务以训练多个模型结构或具有不同优化超参数的模型。

(5)(联合)模型评估:在模型经过充分训练之后,将对模型进行分析和评估,挑选出较好的模型。对模型的分析可能包括在数据中心的标准数据集上计算度量标准,或者进行联合评估——将模型推送给受约束的一些客户端,用他们的本地客户端私有数据集进行评估。

(6)部署:最后,一旦选择好模型后,它将经历一个标准模型启动过程。包括人工的质量检测,实时A/B测试(通常通过在某些设备上使用新模型以及在其他设备上使用上一代模型来比较它们的内部性能)和分阶段推出(以便在影响太多用户之前可以发现存在的问题并回滚)。模型的特定启动过程由应用程序的所有者设置,通常与模型的训练方式无关。此步骤也同等地应用于通过联邦学习和传统数据中心方法训练的模型。

3 联邦学习的分类

Qiang Yang等人根据参与方数据分布的不同,将联邦学习分为三类,分别是横向联邦学习(Horizontal Federated Learning,HFL)、纵向联邦学习(Vertical Federated Learning,VFL)、迁移联邦学习(Transfer Federated Learning,TFL)。

联邦学习分类

(1)横向联邦学习,又称基于样本的联邦学习。一般用于实体间用户特征重叠较多,而用户重叠较少的情况下。

(2)纵向联邦学习,又称基于特征的联邦学习。一般适用于企业间具备相同或者类似的用户空间,但是却拥有不同的特征空间。

(3)联邦迁移学习则适用于参与方不仅样本维度而且拥有完全不同的特征空间,例如一个在中国的电商公司和一个在印度的社交网络公司。

4 联邦学习技术的应用

联邦学习技术的行业应用最早出现在2018年,主要应用于包括IT科技、安全防护、金融、智慧城市、医疗健康、智慧零售、电信、教育等领域。

例如:

IT行业应用:用户数据保护、隐私数据安全流转、可扩展分布式数据协作、联合学习、联合计算、数据共享、模型训练、面向产业应用的工具组件、数据脱敏及去标识化、加密算法支持、DMZ区建设、大数据安全等;

电信业应用:车联网通信、智能手机、联邦节点管理、边缘节点管理、数据采集、模型训练、推理判断及智能预测、识别业务流量后的带宽控制、阻塞控制、业务保障,用户信用评估、用户满意度提升等;

金融领域:金融风险管理、数据安全、隐私保护、小微信贷、深度联合建信用模型、客服、侦测欺诈、高性能分布式异构计算技术、软硬件解决方案、提升金融服务质量、安全深入地挖掘数据价值等等.

推荐阅读:《智谱AI&清华大学:2021联邦学习全球研究与应用趋势报告(95页).pdf》

本文由作者C-C发布,版权归原作者所有,禁止转载。本文仅代表作者个人观点,与本网无关。本文文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

相关报告

智谱AI&amp2021联邦学习全球研究与应用趋势报告(95页).pdf
智谱AI&amp2021联邦学习全球研究与应用趋势报告(95页).pdf

论文摘要:现代移动设备可以访问大量适合学习模型的数据,这反过来又可以大大改善设备上的用户体验。例如,语言模型可以改进语音识别和文本输入,图像模型可以自动选择好的照片。然而,这些丰富的数据通常是隐私敏感的、数量庞大的,或者两者兼而有之,这可能会妨碍使用传统方法登录到数据中心并在那里进行训练。由此,学者们提出一

Wordpay:2017全球支付报告(57页)(57页).pdf
Wordpay:2017全球支付报告(57页)(57页).pdf

在线支付的权威指南 全球 支付报告 2017年11月 研究方法 全球支付趋势 核心洞见 市场指南 支付方式定义 目录 本报告基于一级和次级数据来源撰写而成。一级(一手)数据来源,是指Worldpay自 身的调查研究;次级数据来源,是指权威第三方供应商数据或其他公共数据资源。本报 告也总结了Worldpay几

移动通信网络中的联邦学习白皮书(24页).pdf
移动通信网络中的联邦学习白皮书(24页).pdf

随着5G应用日趋多样化,网络的业务识别能力面临多重挑战:加密应用越来越多,人工分析识别率下降;业务类型越来越多,人工分析成本越来越高;应用更新越来越频繁,人工分析响应速度无法及时识别;异厂家UPF数据无法集中、2B数据不出厂、不同UPF业务分布不均等原因,导致依靠单一UPF上的业务样本数据进行业务识别模型训

垃圾分类影响下的固废大格局-热话题与冷思考.pdf
垃圾分类影响下的固废大格局-热话题与冷思考.pdf

TongjiTongji UniversityUniversity1907-2019何品晶二级教授、博士生导师同济大学 固体废物处理与资源化研究所 所长Waste Management(Elsevier) 主编环境卫生工程主编Email: ; Http:/垃圾分类影响下的固废大格局垃圾分类影响下的固废大格局 

美国医院协会:美国医院和卫生系统人力资源战略规划趋势洞察报告(英文版)(21页).pdf
美国医院协会:美国医院和卫生系统人力资源战略规划趋势洞察报告(英文版)(21页).pdf

美国的医院和卫生系统是社区的中心,既是关键服务的提供者,也是规模最大的雇主。他们通过建立和扩大富有活力的劳动力队伍来培训未来的医疗保健提供者,并培养未来的领导者,以有效跟上医疗保健趋势、不断发展的技术和更广泛的社会文化趋势。在整个医疗保健领域,职位空缺创历史新高。福布斯利用美国劳工统计局(BLS)的数据估计

联邦学习场景应用研究报告(2022年)(69页).pdf
联邦学习场景应用研究报告(2022年)(69页).pdf

 联邦学习联邦学习场景应用场景应用研究报告研究报告 (2022 年)年)中国信息通信研究院泰尔终端实验室中国信息通信研究院泰尔终端实验室 2022022 2 年年 2 2 月月前前 言言数据作为数字经济和信息社会的核心资源,被认为是继土地、劳动力、资本、技术之后的又一个重要生产要素,其在企业数字化转型中发挥

北京金融科技产业联盟:联邦学习技术金融应用白皮书(124页).pdf
北京金融科技产业联盟:联邦学习技术金融应用白皮书(124页).pdf

 年来,数字经济蓬勃发展,已经成为带动中国经济增长的核心动力。 

使联邦机构以证据为基础:学习议程的关键作用(英文版)(55页).pdf
使联邦机构以证据为基础:学习议程的关键作用(英文版)(55页).pdf

学习议程提供了一种工具,可作为组织战略规划的一个方面,特别侧重于为决策者、组织领导者和利益相关者生成相关知识。学习议程有时被描述为联邦机构研究和评估活动的战略证据构建计划。然而,在实践中可能远不止这些。一个具有包容性和战略性的学习议程提供了一系列重要问题和解决问题的计划,这些问题平衡了不同组织决策者的兴趣、  

会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部