上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

甲方视角下的联邦学习平台安全性评估——邱震尧(28页).pdf

编号:91562 PDF 28页 4.35MB 下载积分:VIP专享
下载报告请您先登录!

甲方视角下的联邦学习平台安全性评估——邱震尧(28页).pdf

1、甲方视角下的甲方视角下的联邦学习平台安全性评估联邦学习平台安全性评估中国银联中国银联 邱震尧邱震尧甲方视角下的甲方视角下的联邦学习平台安全性评估联邦学习平台安全性评估目录目录n 联邦学习概述联邦学习概述n 联邦学习安全基础联邦学习安全基础n 方案安全性评估方案安全性评估n 安全问题案例安全问题案例n 总结语总结语MPC(Multi-Party Computation,多方安全计算)一直是学术界比较火的话题,但在产业界的存在感较弱,直到谷歌提出了基于 MPC 的在个人终端设备的“联邦学习”(Federated Learning)的概念,使得 MPC 技术一夜之间在产业界火了起来。联邦学习,是一种

2、机器学习框架,目的为在满足用户隐私保护、数据安全和合规的要求下,进行进行跨机构的数据使用和机器学习建模。跨机构的数据使用和机器学习建模。联邦学习是多方安全计算在AI领域的一个场景应用。狭义的多方安全计算大多由密码学领域的学者提出,一狭义的多方安全计算大多由密码学领域的学者提出,一般具备可形式化证明的安全性。而联邦学习方案大多由般具备可形式化证明的安全性。而联邦学习方案大多由人工智能领域的学者提出,因此在安全性方面值得安全人工智能领域的学者提出,因此在安全性方面值得安全领域专业人士的进一步关注。领域专业人士的进一步关注。联邦学习简介联邦学习简介国内对联邦学习进行了扩展与细分:根据多参与方之间数据

3、分布的不同,把联邦学习拓展为横向联邦学习和纵向国内对联邦学习进行了扩展与细分:根据多参与方之间数据分布的不同,把联邦学习拓展为横向联邦学习和纵向联邦学习。联邦学习。联邦学习分类联邦学习分类数据需求方、数据提供方通过在双方本地部署的隐私计算平台进行信息互通。利用安全求交技术进行数据需求方、数据提供方通过在双方本地部署的隐私计算平台进行信息互通。利用安全求交技术进行建模样本选择;在建模过程中,双方的原始数据均不出库,通过隐私计算相关技术实现模型共建。建模样本选择;在建模过程中,双方的原始数据均不出库,通过隐私计算相关技术实现模型共建。数据不动模型动密码学/系统级的方法保障参数传递的“可算不可见可算

4、不可见”模型无损,共同获益纵向联邦学习工作原理纵向联邦学习工作原理一方提供特征及正负样本标签数据,一方提供特征数据,进行纵向联合建模。一方提供特征及正负样本标签数据,一方提供特征数据,进行纵向联合建模。需求案例银行等金融机构对于不同客户的数据特征积累有限,为了提升营销对象的精准性,通常需要接入更多的外部数据源进行联合建模,提升模型效果。解决方案通过纵向联邦学习,在数据提供方、数据需求方的特征数据、样本标签数据、样本ID数据等不出库的条件下共建模型,满足各方的隐私保护需求 当前纵向联邦建模是隐私计算最为火热的技术之一,在金融领域的营销、风控等场景下,均有较多的应用与实践。其他场景应用场景:应用场

5、景:精准营销精准营销潜客挖掘潜客挖掘目录目录n 联邦学习概述联邦学习概述n 联邦学习安全基础联邦学习安全基础n 方案安全性评估方案安全性评估n 安全问题案例安全问题案例n 总结语总结语样本对齐安全基础样本对齐安全基础基于基于RSARSA的方案的方案其他类型的样本对齐方案还包括基于其他类型的样本对齐方案还包括基于DHDH(Diffie-HellmanDiffie-Hellman)、)、OTOT(不经意传输)的方法等。(不经意传输)的方法等。基于RSA的样本对齐方案的交互过程不完全对等,适用于双方样本ID数量相差较大的情况。同态加密(Homomorphic Encryption,HE)是指满足密文

6、同态运算性质的加密算法,即数据经过同态加密之后,对密文进行特定的计算,得到的密文计算结果在进行对应的同态解密后的明文等同于对明文数据直接进行相同的计算,实现数据的“可算不可见”。同态加密的实现效果如图1所示。n定义定义n分类分类n 应用情况应用情况全同态加密仍处于方案探索阶段,现有算法存在性能方面距离可全同态加密仍处于方案探索阶段,现有算法存在性能方面距离可行工程应用还存在一定的距离。行工程应用还存在一定的距离。因此,实际应用中的同态加密算法多选取半同态加密(如加法同态),用于在特定应用场景中实现有限的同态计算功能。用于在特定应用场景中实现有限的同态计算功能。当前比较成熟是Paillier算法

7、。联合建模安全基础联合建模安全基础 同态加密同态加密联合建模安全基础联合建模安全基础同态加密同态加密其他类型的联合建模方案还包括基于其他类型的联合建模方案还包括基于SSSS(秘密共享)的方法等。(秘密共享)的方法等。(图片来源:微众银行)目录目录n 联邦学习概述联邦学习概述n 联邦学习安全基础联邦学习安全基础n 方案安全性评估方案安全性评估n 安全问题案例安全问题案例n 总结语总结语方案安全性评估方案安全性评估n为什么要做安全性评估为什么要做安全性评估?隐私计算相关厂商和产品处于市场百花齐放的状态,有必要对外部引入的产品设置一定的准入门槛需求旺盛产品繁杂标准缺失合规要求为打破数据孤岛,使数据通

8、过流通充分发挥价值,跨机构间数据联合应用的需求场景越来越多联邦学习技术本身的标准化程度不高,缺少安全最佳实践,且第三方测评缺乏针对安全性的统一标准随着数据安全法、个人信息保护法等法律法规的相继出台,国家针对数据安全合规的要求趋紧方案安全性评估方案安全性评估n 联邦学习安全性评估思路联邦学习安全性评估思路影响因素:影响因素:知识产权问题,即是否提供源代码(代码审计和代码扫描)n安全性说明文档(算法安全、通信安全)安全性说明文档(算法安全、通信安全)自证材料自证材料风险评估准备风险评估准备风险评估准备风险评估准备n第三方检验报告(信通院、第三方检验报告(信通院、BCTCBCTC)重要参考重要参考n

9、 基本评估要求示例基本评估要求示例分类分类内容评估要求安全扫描安全扫描平台部署及组件安全扫描消除扫描所有警告或对其进行合理解释,确认安全性资质要求资质要求第三方检测报告具有信通院、BCTC等出具的第三方检测报告项目合作经历确认具备大型项目支持能力,有与多家大型企业合作落地内容技术要求技术要求MPC底层能力同态加密支持Paillier实现方法,确认密钥长度不小于2048秘密分享算法支持两方模式和三方模式数据求交PSI求交过程仅获取交集共有IDPSI求交过程中采用的密码算法安全强度不低于RSA-2048PSI求交前对所有样本ID进行HMAC-SM3预处理(密钥每次更换)PSI求交双方所拥有的密钥信

10、息对等联邦建模具备主流LR、SecureBoost等联邦学习算法,平台具备分箱、归一化、特征删选的数据处理能力联邦预测预测不泄露明文风险识别与分析风险识别与分析关键问题关键问题n 联合求交(联合求交(PSIPSI)对等安全性对等安全性联合求交方案应尽量保证参与双方的对等性,例如双方应掌握各自的公私钥对,且交互过程传输的加密数据应保证同等的安全强度。如联合求交采用由一方掌握私钥的方案,则应建议业务主办方作为掌握私钥的参与方。1撞库风险撞库风险在联合求交中,若以用户信息(如手机号、身份证号、银行卡号等)作为样本ID,参与对方可能会扩大样本ID范围,将不属于自己的用户信息与业务主办方的用户信息进行撞

11、库,获取仅属于业务主办方的用户信息。因此,应建议业务主办方在联合求交时对对方发送的密文样本ID数量进行初步判断,尽可能避免上述情况的发生。3密钥长度密钥长度无论采用何种联合求交算法,其中涉及的加密算法及密钥不应低于2048位RSA密钥的安全性。2信息泄露信息泄露在联合求交中,包含用户信息的样本ID不可仅进行哈希处理后外发,应进一步采用HMAC等方法对样本ID进行预处理,否则可能通过彩虹表等方式破解。4n 联合建模联合建模建模方案建模方案基于联邦学习的LR、XGBoost等建模方案应具有业界公认的学术论文作为支撑,且方案描述或代码实现应与论文方案保持对应。1可信第三方可信第三方一些联合建模方案(

12、如基于秘密共享的方案)需要可信第三方角色的参与,在仅存两个参与方的场景中,任何一方作为可信第三方都会产生一定的安全优势。因此,应优先采用无需可信第三方的方案,否则,应建议业务主办方同时承担可信第三方的角色。3同态加密同态加密联合建模过程一般采用Paillier同态加密作为基础算法,与RSA算法的安全性相似。因此,无论采用何种建模方案,同态加密的安全强度应不低于2048位密钥长度的Paillier算法。2n 通信安全通信安全外部攻击外部攻击应分析方案是否存在外部攻击者发起中间人攻击、身份伪造、重放攻击的可能性。如无法判断,应建议参与方之间采用安全的专线连接。1密文传输密文传输应通过抓包分析结果,

13、确保交互过程中不存在涉及敏感数据的明文信息。2关键问题关键问题目录目录n 联邦学习概述联邦学习概述n 联邦学习安全基础联邦学习安全基础n 方案安全性评估方案安全性评估n 安全问题案例安全问题案例n 总结语总结语方案安全问题案例:方案安全问题案例:PSIPSI协议应用不当协议应用不当离散对数困难问题离散对数困难问题对于素数,生成元(,为公共参数),任意整数(保密):计算=()是容易的;计算=log是困难的。该方案将需要保密的样本该方案将需要保密的样本IDID直接作直接作为底数,为为底数,为Diffie-HellmanDiffie-Hellman协议的协议的误用(底数应为公开的生成元误用(底数应为

14、公开的生成元)。)。可考虑改为:()=()()=()方案安全问题案例:方案安全问题案例:密钥长度不足密钥长度不足Paillier同态加密算法的密钥长度应与RSA算法的密钥长度要求等效(2048位及以上)方案安全问题案例:方案安全问题案例:模型保护不对等模型保护不对等某平台使用迭代仿射变换同态加密算法替代常用的Paillier算法,被证明不安全。方案安全问题案例:方案安全问题案例:密码算法不安全密码算法不安全方案安全与开发安全理想与现实的差距理想与现实的差距开发安全问题案例:开发安全问题案例:编码或组件不安全编码或组件不安全方案安全与开发安全理想与现实的差距理想与现实的差距开发安全问题案例:开发

15、安全问题案例:编码或组件不安全编码或组件不安全目录目录n 联邦学习概述联邦学习概述n 联邦学习安全基础联邦学习安全基础n 方案安全性评估方案安全性评估n 安全问题案例安全问题案例n 总结语总结语总结语总结语n需要全面考虑联邦学习平台的安全性问题:需要全面考虑联邦学习平台的安全性问题:联邦学习是实现隐私计算与数据安全流通的关键技术之一。作为一个新领域,目前在技术方案与产品方面仍处于百花齐放的状态,不同厂商的联邦学习平台在算法方案、编码开发、运营支持等层面均有所差异。n针对联邦学习平台的安全性评估意义重大:针对联邦学习平台的安全性评估意义重大:由于涉及到数据操作等敏感因素,为符合数据安全法和个人信息保护法的最新要求,避免敏感数据泄露事件的发生,联邦学习平台的安全性评估对于企业安全特别是数据安全具有至关重要的意义。THANKS

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(甲方视角下的联邦学习平台安全性评估——邱震尧(28页).pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部