《6-4 阿里云隐私计算工程化最佳实践.pdf》由会员分享,可在线阅读,更多相关《6-4 阿里云隐私计算工程化最佳实践.pdf(18页珍藏版)》请在三个皮匠报告上搜索。
1、阿里云隐私计算工程化最佳实践数智可信 有融乃大分享人:梁爱平目 录PART 01PART 02PART 03PART 04隐私计算工程化思考01PART 跨地域、跨机房、跨网络 不同的硬件资源 使用人员非专业运维人员 系统、流程、协议绝对安全 支持复杂的网络环境 降低用户非必要授权隐私计算工程的挑战 多版本代码维护和产品迭代 部署和升级操作简单 多端多版本的兼容 成本和性能如何折中 尽可能利用用户已有资源 智能优化计算和传输链路 支持各种定制数据源等 支持定制化的计算资源 支持定制化的传输通道工程化设计02PART解决方案联合洞察联合建模安全多方计算安全技术&理论差分隐私联邦机器学习软件技术S
2、GX硬件技术任务管理 API审批管理 API数据管理 API租户管理 API系统配置 APILibOS产品能力DataTrust产品定制化能力云上数据产品差分隐私&数据加噪PSI任务系统配置密钥配置计算资源配置审批管理服务任务审批租户审批任务管理服务租户管理服务项目管理用户管理DA任务训练任务预测任务联合预测商家数据产品数据管理服务元数据管理融合数据下载无量引擎(协议编译、任务调度、资源管理)无量工程框架数据审批模型审批本地计算引擎MaxCompute计算引擎Hadoop计算引擎Blink计算引擎云上协调中心(CSCC)本地安全计算中心(LSCC)执行算子(异构数据加载、异构传输通道、多语言协
3、议计算、业务自定义计算)同态加密算子执行环境(镜像容器、部署运行、服务发现、服务治理等)工程架构图混合云版本独立版本参与方A节点管控工作台安全计算引擎联邦学习系统设置安全调度执行框架多方安全计算隐匿查询任务管理项目管理数据中心运维管理K8S计算引擎本地计算引擎分布式计算引擎直 连获取指令参与方B节点管控工作台安全计算引擎联邦学习系统设置安全调度执行框架多方安全计算隐匿查询任务管理项目管理数据中心运维管理K8S计算引擎本地计算引擎分布式计算引擎获取指令指令、数据安全通道OSSKafa网络连接方式物理机/ECS一台:16核32G物理机/ECS一台:16核32G 混合云版本:使用云上分布式计算资源
4、独立版本:操作在一个端上p 稳定性较强p 运维成本较低p 安全防御性较高p 客户定制化诉求p 数据放在本地产品版本独立部署架构:客户私域CSCC+客户私域LSCCvCSCCLSCC任务审批管理多方任务调度引擎(SDF逻辑调度)本地调度执行引擎(SS协议调度)数据源管理系统配置元数据中心项目管理任务管理运维管理项目配置EventBusMinIO直连KafkaMaxCompute计算引擎本地计算引擎数据通道数据通道客户私域A客户私域B全局数据监控vLSCC任务审批管理本地调度执行引擎(SS协议调度)数据源管理系统配置MaxCompute计算引擎本地计算引擎数据传输通道事件通道云上部署架构:云上CS
5、CC+客户私域LSCCCSCC多方任务调度引擎(SDF逻辑调度)元数据中心项目管理任务管理运维管理项目配置OSS数据传输通道ODPS直连MQ命令通道LSCC任务审批管理本地调度执行引擎(SS协议调度)数据源管理系统配置本地计算引擎本地计算引擎命令通道数据通道数据通道客户私域A客户私域B公有云EventBus事件通道LSCC任务审批管理本地调度执行引擎(SS协议调度)数据源管理系统配置MaxCompute计算引擎本地计算引擎DataTrust模块插件化、适配多种异构环境配置源路由数据源路由计算引擎路由配置源插件本地数据库本地文件数据源插件MySQLRDSPostgreSQLODPS计算引擎插件O
6、DPS本地计算传输通道插件OSSMeta协议编译任务调度任务启动任务初始化协议编译任务调度任务初始化ODPSHologresHiveKafkaHadoopSpark专线RPC配置源路由数据源路由计算引擎路由配置源插件本地数据库本地文件数据源插件MySQLRDSPostgreSQLODPS计算引擎插件ODPS本地计算HologresHiveHadoopSpark落地实践03PART政务-服务 防疫跨部门协同,助力街道推进疫苗接种 精准定位:街道有居民个人ID(手机号或者身份证号)以及个人的住址信息;医院有疫苗接种所有名单。在保护个人隐私信息的前提下,社区街道期望仅获得所在辖区内的未接种疫苗人员名
7、单。业务效果客户痛点解决方案 安全多方计算:通过DataTrust安全对方计算技术,在原始数据不泄露前提下,得出双方数据交集,实现数据最小化使用。灵活部署:提供轻量级和多种数据库兼容的部署方案。服务效率:电力-资源调度发挥数据要素经济价值,提高电力供给精准度 供给结构优化:由于双碳和供给调配需要,电力公司需精准调配企业供电,希望借助税务部门掌握的企业信息,更加准确的判断企业经营活动。数据特征少:希望借助税务部门掌握的企业信息,更加准确的判断企业经营活动。业务效果客户痛点解决方案 联合学习:通过DataTrust联合学习模块,建模数据包括电力公司供电时长、能效、时效等供电能力数据,税务部门企业纳
8、税条目、金额、周期等反应企业实际经营状况的数据。本地训练,模型中间结果信息进行交互。可视化方案:数据配置、数据链路的可视化。预测精准度:在不共享税务原始数据的前提下,只给出企业供电预测值,即满足了税务部门要求,又满足了电力公司的精 准 调 配 目 的,预 测 精 准 度 大 幅 提 升rmse:3259-2824。金融-营销提升信用卡业务惠民便民服务质效 政策维度:2021年中国银保监会,要求银行不得以发卡量、客户数量等作为单一或主要考核指标,睡眠用户任何时点均不得超过20%。市场维度:银行业需选择深耕细作模式,精准化触达增量用户,精细化运营存量用户,同时提升用户粘性。业务效果解决方案 精准触
9、达:通过DataTrust的PSI技术,实现数据的共享,满足监管同时,给真正有需求的用户带来权益。高时效性:营销场景需要高时效保障,计算效率业内领先,能做到*级响应。用户活跃度:银行卡用户消费粘性提升*%百分点。长期睡眠用户降低*%点;消费余额:同时拉动了信用卡的交易金额;客户痛点金融-风控数据共享实现联合风控,实现生息资产最大化 建模样本/特征少:政策合规要求和同业竞争,客户信息在银行间流动困难。城商行/农商行,需要联合外部数据改善客户体量和地域的局限性。大行则需要多维度的数据提高建模的准确性。业务效果客户痛点解决方案 风险等级和定价:外部多方数据通过DataTrust的联邦学习模块,重构A
10、BC卡模型,进行精准风险评级和定价。联合排黑:多家银行,借助DataTrust的MPC模块,进行黑名单、多头等查询,实现联防联控方案。提高准入率:通过多维度数据,同时回捞优质客户,避免过度风控,在维持逾期率的同时,提高贷款通过率。生息资产:银行通过优化评级体系和限制多头信贷,完善KYC审核,降低信贷风险,实现生息资产最大化。价值主张04PART政策引爆,供需驱动,产业价值循环启动。从产业及数据要素经济主体地位来看,数据“电网”是未来的基础设施,助力打破数据垄断和孤岛,释放数据价值。银行电力电商零售医保政务新能源保险汽车房地产商家隐 私 计 算 数 据 流 通 网 络电商银行全域参谋场景营销精细运营金融营销联合风控活卡绑卡保险电力商业保险精准医保数据风控电力调配金融营销其它汽车线索评级政务治理数据变现