上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

金融服务业新一代数据共享:利用隐私增强技术解锁全新价值(36页).pdf

编号:12609 PDF 36页 1.45MB 下载积分:VIP专享
下载报告请您先登录!

金融服务业新一代数据共享:利用隐私增强技术解锁全新价值(36页).pdf

1、白皮书 世界经济论坛与联合呈现 2019年9月 金融服务业新一代数据 共享:利用隐私增强技 术解锁全新价值 世界经济论坛 91-93 route de la Capite CH-1223 Cologny/Geneva Switzerland 电话:+41 (0)22 869 1212 传真:+41 (0)22 786 2744 电邮:contactweforum.org 网址:www.weforum.org 2019世界经济论坛 版权所有 保留一 切权利。严禁以任何方式(包括复印和 刻录)或通过任何信息存储和检索系统 复制或传播本出版物的任何内容。 本白皮书由世界经济论坛出版,致力于推动某一项

2、目、领域洞察或某种互动的发 展。本报告所述调查结果、诠释和结论均在世界经济论坛的推动和支持下完成, 但并不一定代表世界经济论坛或其成员、合作伙伴及其他利益相关者的观点。 3金融服务新一代数据共享:利用隐私增强技术解锁全新价值 目录 序言 4 前言 5 第一章:金融行业隐私现状 6 数据共享的收益 6 数据共享的潜在弊端 6 改变数据共享现状 7 第二章:隐私增强技术 8 第一项技术:差分隐私 9 第二项技术:联合分析 11 第三项技术:同态加密 13 第四项技术:零知识证明 15 第五项技术:安全多方计算 17 第三章:金融服务业应用 20 为金融机构解锁新价值 20 为客户解锁新价值 22

3、为监管部门解锁新价值 24 结语 25 附录 26 技术优势和限制 26 相关阅读资料 29 鸣谢 30 尾注 32 4金融服务新一代数据共享:利用隐私增强技术解锁全新价值 序言 Matthew Blake 世界经济论坛 未来金融和货币体 系部门负责人 现今,数据之于第四次工业革命转型的重要意义不言而喻,数据被喻为新一代的石油、黄金,炙手可 热。毫无疑问,在数据变得日益重要的同时,企业的工作重点也在转变。然而,媒体竞相报道各企业 积累海量数据的竞赛,却甚少关注企业对发掘机构间数据共享潜能的兴趣。尤其在金融服务行业,企 业对机构间协作的需求大大增加,涵盖了从改进欺诈检测手段到赋能新型个人理财咨询

4、服务的各种应 用场景。 当然,数据共享存在风险。企业在发掘数据潜在价值时,须妥善降低对客户隐私的影响、保障数据安 全,并对竞争性敏感信息加以管控。从过往经验来看,金融服务行业在隐私保护与数据应用上的目标 往往是矛盾的,需要在数据共享价值与潜在的隐私风险间进行权衡,这也直接导致许多原本似乎很有 希望落地的数据共享项目被束之高阁。 新兴的“隐私增强技术”或将通过消除(或降低)过往的相关协作风险,从根本上推动数据共享领域 的变革。随着隐私增强技术的成熟,企业会期望利用这些技术重新审核许多搁置的数据共享项目,借 此探索此前难以实现的项目机会。 隐私增强技术可以为金融业带来巨大价值 前提是行业高管和监管

5、部门能够了解这些需要应用到复 杂数学和计算的技术以及具体应用。本文旨在概述当前最有前景的一些技术,帮助读者理解有关理 论概念,并展示如何在金融体系中应用这些技术。我们希望通过这种方式助力打造高效协作的金融环 境,期望金融机构、消费者和更广泛的金融体系都能从数据共享中受益。 Jesse McWaters 世界经济论坛 金融业创新项目 主管 Rob Galaski 管理咨询 银行业及资本市场 全球领导人 5金融服务新一代数据共享:利用隐私增强技术解锁全新价值 前言 古有盲人摸象的故事,形容不窥得事物全貌无法得出正确的 结论。如今,金融服务业面临着同样的问题。在“消费者( 客户)是否值得信赖”、“交

6、易商是否互相串通”或“某项 交易是否是欺诈性交易”等重要问题上,每个机构都仅握有 一块拼图(即数据),但因为各自手上的数据有限,金融机 构就像故事中的盲人一样,都存在得出错误结论的风险。而 信息分享是解锁事物全貌、全面了解事物的关键,可惜金融 机构间数据共享并不容易。由于面临数据存储、管理和共享 方面的诸多限制,因此,金融机构至今仍无法对客户和运营 环境有全面的了解。 完整的数据才能发挥最大的价值,但获取最大价值的过程却 十分复杂,其间还伴随目标冲突:例如,金融机构通过数据 共享将能更好地识别隐藏的交易欺诈模式,减少金融犯罪检 测误报。但是金融机构对于披露与自身客户有关的竞争信息 相当谨慎,通

7、常尽量避免违反隐私监管规定。值得一提的 是,数据共享不仅能使金融机构受益,还能让客户得到更加 个性化、更为具体和细致的建议,但客户可能担心自身信息 被误用、滥用或在未经本人同意的情况下被共享。 这些都说明了数据共享的矛盾:数据共享可以创造价值,但 对于信息被共享的个体而言,其隐私信息不再是秘密,对于 开展数据共享的机构而言,其机密性也会受到影响。各方已 投入大量精力希望以一种机构、客户、行业协会和监管机构 都能够接受的方式平衡目标之间的冲突,保障金融体系的运 营。“隐私增强技术”能够使机构、客户和监管部门在不损 害“数据所有者”(客户)隐私和“数据管理者”(金融机 构)机密性的情况下发掘共享金

8、融数据的价值。这些技术并 不新鲜,但近年来的巨大发展已使其从单纯的探索性研究转 变为可服务于生产实践的技术,或将为数据共享带来根本性 的改变。 本文就隐私增强技术的工作原理及其可能为金融机构带来的 价值作简要概述,供各金融子行业(如保险、银行、投资管 理)高管使用。我们将围绕下述议题进行分析和论述: 第一章:金融行业隐私问题现状概览 第二章:隐私增强技术工作原理介绍 第三章:隐私增强技术如何应用于数据共享 本文包含三个章节: 第一章: 金融行业隐私现状 第6页 第二章: 隐私增强技术 第8页 第三章: 金融服务中的应用 第20页 6金融服务新一代数据共享:利用隐私增强技术解锁全新价值 第一章:

9、金融行业隐私现状 因在数据使用上相互竞争,金融机构往往难以就如何存储、管理和共享数据达成一致。金融机构、监管部门和消费者间的矛盾 冲突也由来已久。 我们将在下文探讨这三个领域的目标冲突(数据共享的益处与弊端)。 金融机构监管部门消费者(客户) 数据共享的益处 金融机构可从以下三种数据共享方式中受益: 输入式数据共享 (从第三方获取数据) 输出式数据共享 (向第三方提供数据) 协作式数据共享 (与第三方就形式相近的数据互通有无) 首先,输入式数据共享使机构可借助更多信息来丰富其决策 系统,获得更高质量的输出结果,助力精准运营。例如,贸 易公司可使用汤森路透的MarketPsych Indices

10、1 等第三方服 务,基于社交媒体数据的分析支撑采购/销售相关决策,或更 准确地了解市场行情;其次,输出式数据共享使机构可在自 身缺乏相关能力的情况下,借他山之石攻玉(并最终使客户 受益)。例如,智能投资顾问Wealthsimple可通过安全链接 将客户投资组合信息导入M,2 使客户可同时查看日常 支出和投资余额,进而全面了解自身的财务状况;最后,协 作式数据共享使机构能够获得单靠自身之力所无法得到的海 量数据,从而收获更深、更广的洞察。例如,六家北欧银行 近期宣布合作开发共享的“了解客户”(KYC)实用程序3, 以强化其金融犯罪防御系统的能力。 对于监管部门而言,数据共享提供了将金融数据的控制

11、权和 所有权交还客户的机会,进而促进创新和竞争,这在监管法 规中均有体现:如英国的开放银行标准(Open Banking Standard)、欧盟的欧盟支付服务修订法案第二版 (PSD2)、澳大利亚的消费者数据权利法案(Consumer Data Right)以及新加坡、中国香港和日本所采取的其他形式 的开放应用程序接口(API)监管条例。这些法规中均有相应 条文规定机构应按客户要求将其拥有的客户数据(如交易数 据)提供给经认可的第三方,使市场的新参与者得以访问这些 数据并制定新的价值主张,监管部门认为这将最终改善公民的 财务状况。4 对于客户而言, 数据共享使其可获得更高质量的产品和更高效

12、的服务。 例如, Lenddo通过分析客户的社交媒体数据、 通信数 据和交易数据为其提供更高质 (即准确性可能更高) 的信用评 分。 5 客户正逐步认识到个人信息的价值, 愈发倾向于仅在交换 中获得实际利益时才会共享其个人信息 (直接向金融机构提供 更多信息或授权其作为代表与第三方共享数据) 。 6 数据共享的潜在弊端 一些因素会阻碍金融服务中的数据共享。对于金融机构而 言,任何输出式数据共享都使其面临可能被第三方滥用竞争 性信息(如客户身份及特征)的风险;此外,数据共享还可 能违反诸如通用数据保护条例(GDPR)等隐私监管法 规,或因必需流程(如建立新机制以确保知情同意)过于复 杂而导致投入

13、超出数据共享所能带来的益处。随着人工智能 和其他高级分析技术应用的不断增加,大型金融机构的高管 已经开始担忧因掌握过多客户数据而使其感到不安进而对金 融机构心生恐惧。 监管部门长期以来通过限制数据共享的方式达成其一项重要 职责,即保持消费者金融和非金融信息的机密性。7 例如, 美国1999年金融服务现代化法案(Gramm-Leach-Bliley Act of 1999)要求金融机构了解其客户敏感信息是如何被共 享的,并允许金融机构选择退出数据共享或采取特定措施保 护共享内容。8 近年来,全球监管部门还推出了新的更为严格 的客户隐私保护要求:例如,欧盟的GDPR规定机构应让客户 能够更便捷的查

14、阅保存在机构处的个人信息;其他法规则禁 止公司跨国共享个人身份信息(PII)以保护本国客户隐私, 这或将阻止跨国机构分析其整个组织所拥有的内部数据。这 些要求意味着无法共享某些类型的数据,或因共享变得过于 昂贵、复杂且耗时而使机构不愿更多开展数据共享。 7金融服务新一代数据共享:利用隐私增强技术解锁全新价值 数据共享的潜在益处数据共享的潜在弊端 金融机构 监管部门 消费者(客户) 改变数据共享现状 如图所示,金融服务业中的每个利益相关者都面临隐私相关冲突,而这些冲突一直阻碍着数据共享巨大价值的实现。新兴的隐 私增强技术能够使金融机构、消费者和监管部门能够在竞争机会与保护义务之间取得平衡,实现既

15、符合监管原则,又保护消费 者隐私,并保持金融机构业务流程机密性的数据共享。这些技术或将扩大金融服务中数据共享范围,从而使金融机构掌握全局 信息,进而为自身、消费者、监管部门乃至全社会创造全新价值。 丰富决策系统 促进创新和竞争 获得更高质的产品和服务滥用个人信息 泄露竞争性信息 利用第三方能力 提供有效的系统监察 获得更高效的产品和服务泄露敏感信息 侵犯客户隐私 违反隐私监管法规 形成更大规模的数据因“了解过多”而吓退客户 虽然客户寻求从自身数据共享中获得更多利益,但他们也愈 发警惕其数据可能被滥用:Harris Poll的一项调查显示,只有 20%的美国消费者“完全信任”与其打交道的公司会妥

16、善保 护其信息隐私。9 2018年发生的几起备受关注的安全和隐私泄露事件 (包 括Cambridge Analytica10、 Capital One11、 Google +12 和 Aadhaar13 等) 无疑加剧了客户的担忧。 客户担心其数据可能被 用于会损害自身权益的情形 (如身份盗用) , 更有可能被未经授 权的第三方得知自己的隐私信息 (如敏感的购买记录) 。 14 8金融服务新一代数据共享:利用隐私增强技术解锁全新价值 第二章:隐私增强技术 数据作为第四次工业革命的动力,推动了人工智能和互联设备等新技术的发展。为了真正从这些新技术中受益,机构要充分利 用内外部所能获取的数据。管理

17、数据隐私的技术能够帮助机构发掘新价值。我们将在下文介绍五类关键技术15。 我们将探索各隐私增强技术的潜在益处,以假设的案例演示技术运用,通过既往隐私泄露实例展示相应隐私增强技术的用处, 并评估其在金融服务中的可行性。随后,我们将探讨如何结合这些技术在金融行业打开数据共享协作的新局面。 差分隐私 在数据集(DataSet) 中添加噪声,防止通过 逆向工程分析还原个人 数据 零知识证明 用户能够在不透露自身 有价值信息的情况下证 明自己的合法权益 联合分析 各方仅共享分析数据所 得洞察而不共享数据 本身 安全多方计算 各参与方对数据进行分 析,输出计算结果,并 保证任何一方均无法得 到除应得的计算

18、结果之 外的其他任何信息 同态加密 在不解密的条件下对加 密数据进行分析并共享 9金融服务新一代数据共享:利用隐私增强技术解锁全新价值 第一项技术:差分隐私 原理揭示: 假设一组10名从事相同工作的个人想要共享薪资信息, 以了 解自己的薪资是偏高还是偏低, 但又不想向其他任何人透露 自己的实际薪资。 为此, 他们找到一个独立且受信任的第三 方充当中介, 中介会将所有人输入的信息匿名化, 同时根据 汇总数据得出有用洞察。 中介对他们的数据取平均值, 并告 知10人的平均薪资为50K。 这对于个人是很有用的信息, 因 为他们可以确定自己的薪水是偏高还是偏低。 一旦知道了房间里众人的平均薪资,此人就

19、可推断出第十 人的确切薪资为45K,并可公开或使用该私人信息。 为防止这种侵犯隐私的行为,中介可在他/她的平均值计算 中添加噪声。例如,调查员可删除十人中某一人的答案, 并用一个在收到的答案范围内(即39K和58K之间)的随机 数进行代替。 概述: 当机构想要与第三方共享数据时,删除或匿名化个人身份信息的方式并非总能充分保护数据库中个体的隐私。例如,将数 据与其他数据集相结合就可重新识别数据库中的特定个体。对此,一种行之有效的解决方法是在流程中(输入、计算或输 出)添加噪声,确保特定数据“行”的保密性,但仍可通过查询汇总数据获得有意义的洞察。例如,人口普查数据通常采 用添加噪声的方式实现匿名化

20、处理,以保护受访个体的隐私;美国也将在2020年的联邦人口普查中应用差分隐私技术。16 2006年,Cynthia Dwork等人17 发表了有关“差分隐私”的标志性论文,提出了一种普遍适用的方法来计算为保护数据库 中每一个体的隐私所需添加的噪声量,18 后经大量深入研究提升其效率和可扩展性后,该方法目前已投入各种实际应用。 目前,差分隐私已在苹果等公司的大规模生产中得以运用(如自动完成网上搜索19),并已嵌入各种广泛运用的分析和机器 学习库中(如PyTorch20 和TensorFlow21)。 注:差分隐私本身并非一种技术或机制,而是对添加噪声的各种技术和方法的一种度量,这些添加噪声的技术

21、和方法可限制各不相关方试图从分析结果中推 断出输入数据的能力。 45K “房间里10人的平均薪资为50K” “房间里10人的平均薪资为51K” 该人知道自己和其他八人的薪资 受信任的中介将删除其中一个答 案,并将其替换为随机数:55K 但是, 如果某人已经知道房间中其他八人的薪资, 只剩一人 的信息未知。 随后照常计算平均薪资, 中介提供了51K这一带有轻微噪声 的答案, 同时任何第三方都无法逆向分析得出输入数据。 55K39K50K 54K45K58K50K47K57K 55K39K50K 54K 58K50K47K57K45K45K 45K55K 55K 39K50K 54K45K58K5

22、0K47K57K 45K47K39K50K 54K55K58K50K47K57K 10金融服务新一代数据共享:利用隐私增强技术解锁全新价值 知道其他八人薪资的那个人无法推断出房间里最后一人的确切薪资,因为添加噪声会带来两个不确定性: 八个已知薪资的任何一个都可能被一个未知数所代替,当得知平均数为51K时,只能推定未知薪水范围为36K-74K。而这 个范围太大,没有任何价值。 如删除的刚好是未知薪资,甚至无法逆推出薪资范围。 想要窥探他人隐私的人不知道发生了以上两种情况中的哪一种,因此无法逆推出房间中最后一人的薪资信息。同时,其他 人仍然可以定向确定自身薪资高低。 如果不信任中介能够对个人信息保

23、密,那么他们也可在与中介共享之前即在个人输入数据中添加噪声。例如,每人都可在 提供给中介的薪资数上增加或减少一定的数额(如2K),输出数据的大方向仍将是正确的,每个人既可确定自己的薪水高 低,同时又能保护其输入的隐私信息。 隐私泄露实例探讨: 二十世纪九十年代中期,美国某州政府保险机构公开了经匿名 处理的健康记录,以鼓励医疗保健领域的公共研究,其间使用 了多种技术对数据进行匿名处理,例如删除地址、将姓名替换 为随机字符串等。但是,研究人员仍然能够将该信息与可从公 开渠道获取的选民登记数据进行比较和关联,进而重新识别数 据库中的特定个体,22 甚至此前向公众保证患者隐私受保护的 州官员亦被识别出

24、。与其直接公开数据库,不如仅提供数据集 查询功能,再应用差分隐私系统在反馈结果中添加噪声,从而 防止患者个人信息泄露。例如,研究人员可以查询“邮政编码 为ABCDE的人中有多少人患有糖尿病?”,差分隐私系统则会 回复“邮政编码为ABCDE的人中有12,045人患有糖尿病”,这 是围绕真实值的“模糊”响应。如果查询过于具体,例如“邮 政编码为ABCDE的人中有多少人患有菲尔德病(一种极为罕 见的疾病)?”,回复可能是只有一两个人患有这种疾病,这 可能泄露私人信息。为了保护这部分人的隐私,差分隐私系统 会添加噪声,返回诸如“邮政编码为ABCDE的人中有五人患 Fields症”之类的回复,而这与现实

25、情况大不相同。 金融服务业的应用: 该技术已足够成熟, 可应用于金融机构; 其益处显而易见, 并且 将其整合到现有数据系统中不会增加过多成本。 添加噪声在数 据精度和隐私保护之间作取舍, 因此该技术最适合评估总体趋 势, 而不适用于异常检测 (如欺诈分析) 或精确的模式匹配 (如 光学字符识别) 。 目前Immuta等多家公司已开发出差分隐私解 决方案, 为金融机构提供服务。 11金融服务新一代数据共享:利用隐私增强技术解锁全新价值 第二项技术:联合分析 原理揭示: 假设三家电子邮件提供商想要帮助用户减少收到的垃圾邮 件数量,一种方式是基于各自数据集分别对被报告为垃圾 邮件的电子邮件进行分析,

26、开发各自的垃圾邮件过滤器。 集合三家机构信息的数据规模使得这一引擎更具优势,所 有用户都可从中受益。但是,该解决方案的问题在于:1) 各电子邮件提供商的用户可能都不希望与第三方共享自己 的邮件(即使已经声明共享目的是为用户自身利益而改进 垃圾邮件过滤器);2)各机构均面临竞争性信息(如用户 相关信息)被公开的风险;3)该共享数据库还有可能成为 恶意第三方集中攻击的目标 破坏一个数据库就可访问 三家电子邮件提供商所有用户的敏感信息。尽管这种共享 数据的方法达到了改进反垃圾邮件引擎的预期目标,但同 时也带来了巨大的风险。 在这种情况下,三家机构可能会重复工作,因为垃圾邮件 发送者的特征可能在三个用

27、户群中均有出现。此外,分析 或输入数据集的任何差异都可能导致各自的垃圾邮件检测 引擎出现漏洞。 为解决漏洞问题, 这些机构可将其报告的垃圾邮件数据合并 到中央数据库中, 而后创建一个共享的垃圾邮件检测引擎。 概述: 如某家机构想要分析跨多个数据库或设备保存的大量数据,可将所有数据整合入一个数据库中,再对整个信息集合进行分 析,但这就出现了三个问题:1)在某些情况下,机构可能无权将本地存储的数据向外传输(例如,基于不同司法管辖区就 隐私或其他本地化的限制);2)数据可能为敏感信息(如就医记录、私人交易信息)且数据主体(即客户)可能不愿意共 享此类信息;3)数据集中化风险:如果中央数据库被第三方恶

28、意攻击,就会集中泄露大量敏感信息。所以,机构和数据主 体可能都不愿意以这种方式共享数据。对此,解决方案是分析不同的数据集,然后共享分析所得洞察。23 近年来,联合分析作为此类问题的解决方案,已被谷歌等大型科技公司广泛用于学习个人计算设备(如手机和笔记本 电脑)中的用户输入数据。24 该领域的研究仍在继续,联合分析模型已与人工智能等其他新兴技术结合使用:2019年3 月,TensorFlow(一个广泛使用的机器学习开源库)发布了名为TensorFlow Federated的开源框架,25 该框架支持基于联 合数据集的机器学习。 供应商A 反垃圾邮件引擎A: 主题为“您违反了国 际税法”的邮件是垃

29、 圾邮件。 反垃圾邮件引擎B: 正文以“我是尼日利 亚的特雷奥拉亲王” 开头的邮件是垃圾 邮件。 反垃圾邮件引擎C: 使用地址 FreeMoviesspam. com的是垃圾邮件 发送者 供应商B供应商C 供应商A供应商B 共享数据库 供应商C 共享的反垃圾邮件引擎: 主题为“您违反了国际税法”的邮件是垃圾邮件。 正文以“我是尼日利亚的特雷奥拉亲王”开头的邮件是垃圾邮件。 使用地址FreeM的是垃圾邮件发送者。 12金融服务新一代数据共享:利用隐私增强技术解锁全新价值 而使用联合分析就可在不产生新风险的情况下达到同样的 目的。三家机构可共享其垃圾邮件检测模型并创建汇总模 型,而不用共享底层原始

30、数据。 通过这种方法仍然可以建立强大的反垃圾邮件引擎,同时 降低共享底层数据所带来的风险。各机构能够从更大规模 的数据中获益,同时,因未与其他电子邮件提供商共享用 户数据,从而不会违反在共享用户数据方面需遵循的限制 性规定。从安全性角度来看,也不存在恶意第三方会集中 攻击的目标。 值得一提的是,该模式下得到的模型与通过将初始训练数 据合并到中央数据库得到的模型并不完全等效;多数情况 下,通过联合机器学习训练的模型不如在集中化数据集上 训练的模型。用例一中就有一个此类示例。 供应商A供应商B供应商C 反垃圾邮件引擎A: 主题为“您违反国际 税法”的邮件是垃圾 邮件。 反垃圾邮件引擎B: 正文以“

31、我是尼日利 亚的特雷奥拉亲王” 开头的邮件是垃圾 邮件。 反垃圾邮件引擎C: 使用地址 FreeMoviesspam. com的是垃圾邮件发 送者。 共享的反垃圾邮件引擎: 主题为“您违反了国际税法”的邮件是垃圾邮件。 正文以“我是尼日利亚的特雷奥拉亲王”开头的邮件是垃圾邮件。 使用地址FreeM的是垃圾邮件发送者。 隐私泄露实例探讨: 2017年,安全研究人员能够通过名为ai.type26 的Android应用 程序访问3,100万名用户的个人信息,该应用程序是第三方键 盘,允许用户自定义手机/平板电脑键盘并提供个性化的输入 联想建议。ai.type程序收集了各种数据(如能够提供数据输入 建

32、议的联系信息或改进自动联想功能的击键历史),存储于 一个中央数据库中;然后,该数据库会先删除其中的私人信息 (如密码字段),再分析数据从而为用户提供自动输入填充功 能。但是,研究人员能够在清理私人信息之前访问数据库,并 能公开所有3,100万名用户的电子邮箱地址、密码和其他敏感 信息。ai.type原本可以使用联合分析在每个用户的手机上创建 本地预测模型,而不是将所有数据集中到一个数据库,然后再 汇总3,100万名用户的模型而非数据本身,从而保护每个用户 的输入历史记录。27 随后再将汇总模型通过更新推送回到每个 手机中,并不断重复学习过程,这样就可以使键盘基于汇总模 型对全体用户的学习分析提

33、供高级建议。这也是谷歌和苹果在 Android和iOS的默认键盘上采用的方法。28 金融服务业的应用: 尽管此项技术已被熟知并且已足够成熟,但目前在金融服务中 的应用仍然有限。当存在大量单独的数据源(如手机、物联网 (IoT)设备、笔记本电脑等)时,联合分析能够发挥最大的 价值。在数十万个单独数据源中存储敏感信息,如此规模在金 融服务实践中是罕见的。金融机构会集中存储交易信息和客户 信息等数据,且多数地区均由排名前十的机构占据了绝大部分 市场份额。但无论如何,联合分析作为一种技术上成熟的方 法,是能够为金融服务行业带来益处的。第三章中探讨了一个 相关用例。 13金融服务新一代数据共享:利用隐私

34、增强技术解锁全新价值 第三项技术:同态加密 原理揭示: 假定Susan希望深入分析自己的健康记录,以识别并预测潜在的健康风险,但她自身并无能力做这样的分析,需借助第三 方 该领域的领军企业HealthAnalytics Co.进行分析。为了与HealthAnalytics Co.共享数据,Susan可将自己所有的健康 记录放入一个盒子中,再将盒子寄给分析公司,但这会产生一些风险:盒子可能在传输中或在HealthAnalytics Co.的办公室 被未经授权的第三方拦截;此外,HealthAnalytics Co.雇员也可能非法使用这些资料。 避免冒险,Susan可使用加密技术保护自己的信息。为

35、此,Susan会将所有健康记录放入保险箱,并在不附密钥的情况下将 其寄给HealthAnalytics Co.,再通过其他渠道将密钥单独发送给该公司。这消除了非原定接收方获取保险箱内文件的风险: 即使有恶意第三方企图在传输间或在HealthAnalytics Co.办公室获取保险箱内文件,因没有密钥,也无法得逞。恶意方必须 同时攻破HealthAnalytics Co.的数据库和Susan用于共享其数据访问密钥的传输渠道。 概述: 某些情况下需由第三方进行数据分析,原因包括: 第三方具备数据管理方所没有的能力,并且愿意在不共享其所用底层函数的情况下提供分析服务; 第三方能访问数据管理方无法访问

36、的其他辅助性数据,从而能提供更好的分析和洞察,这是数据管理方独自分析所不可 及的。 但与联合分析一样:1)数据管理方可能无权转移数据;2)如果数据管理方并不信任第三方,或者担心第三方或其合作伙 伴的内部人员滥用数据,则数据管理方不愿进行数据共享;3)如果第三方发生信息泄漏,原数据管理方可能因先前与第三 方共享了数据而被客户追究责任。为解决这些问题,可使用同态加密(HE)技术对数据加密,以便在进行数据分析时维持 信息不可读。并且,分析结果对除原定接收方(通常为输入数据的所有者)以外的任何人也都不可读。 “RSA”加密系统是首批广泛用于传输数据的加密方案之一,在1977年问世后,同态加密理论也在1

37、978年被首次提出。29 在RSA加密系统下,(公开)密钥被用于加密数据并维持数据不可读;而后,该数据可被传输至原定接收者,接收者再使 用另一种(私人)密钥对其进行解密;1978年,有人提出:能否使用加密数据执行不同类型的函数(如加法、乘法),而 无须首先解密数据并因此暴露敏感信息;此后三十多年间,开发的各类解决方案已能使用加密数据执行特定函数,但仍未 开发出可执行任何转换的全同态加密系统;2009年,Craig Gentry开发出了首个全同态加密(FHE)系统30,自2010年以 来,全同态加密系统的效率和可行性得到了显著提升。 Susan将自己的健康记录放入一个盒子,寄给分析公司,公司对记

38、 录进行分析,生成报告,并将报告寄回给Susan。 S HealthAnalytics Co. 数据可能在传输中被 非法访问。 数据也可能在HealthAnalytics Co. 被有权进入办公室的人非法访问。 14金融服务新一代数据共享:利用隐私增强技术解锁全新价值 通过提升恶意方的执行难度, 安全风险得以降低。 但该公司 得到密钥后会否将这些文件用于非预期目的或复制这些文件 就不再是Susan能够掌控的了。 因此, 这种形式的 “加密” 也 并非完全可靠。 为全方位保护自己的数据, Susan可借助同态加密 一种 特殊的保险箱。 她将自己的健康记录锁入这个特殊的保险 箱, 在不附密钥的情况

39、下将其寄给HealthAnalytics Co.。 如 果第三方试图在传输过程中或在HealthAnalytics Co.的办 Susan将自己的健康记录放入上锁的保险箱,寄给分析公 司,并向该公司单独发送密钥以便其分析保险箱内数据。该 分析报告被放入另一个上锁的保险箱,并寄回给Susan。 Susan将自己的健康记录放入一个同态加密的保险箱,寄给 分析公司。该公司像分析其内的健康记录一样分析此保险 箱,并生成另一个也只能由Susan解锁的保险箱。此保险箱 被寄回给Susan,Susan再用密钥将其转换为分析报告。 SHealthAnalytics Co. 数据可能在HealthAnalyti

40、cs Co.被该公司内部能同时接 触保险箱和密钥的员工非法访问, 或在分析期间 (数据被 从保险柜中取出后) 被公司外部的恶意方非法访问。 公室获取保险箱内文件, 因没有密钥, 将无法打开保险箱。 不 同于之前的情况, HealthAnalytics Co.无须打开这种特殊 的保险箱, 就可完成所需分析。 对这个特殊保险箱进行的分 析将其转换为另一个包含分析结果的特殊保险箱, 同样也只 能使用仍由Susan持有的密钥才能解锁。 HealthAnalytics Co.随后将此保险箱寄回给Susan, Susan再用自己的密钥解 锁保险箱, 并阅读该公司对其健康记录的分析。 该公司本身 无法读取健

41、康记录, 甚至无法读取其数据分析结果, 因为记 录和分析结果都受特殊保险箱的保护。 在整个传输/存储过 程中, 信息也受Susan所持同一密钥的保护。 SHealthAnalytics Co. 隐私泄露实例探讨: 2018年,Cambridge Analytica被卷入了数据泄露事件,此前 该公司已收集了超过5,000万脸谱(Facebook)公司用户的数 据。31 该公司向一个性格测试应用程序公司购买数据,此应用 程序通过收集用户的姓名、电子邮箱地址、个人资料照片、社 交网络、喜好和其他信息,再向用户返回高水平的个性特征 图解。此应用程序存储了其“抓取”的数据,然后与第三方 Cambridg

42、e Analytica共享,而Cambridge Analytica利用这些 数据建立了详细的消费心态档案,以向目标受众投放数字广 告。脸谱公司本可强制实施同态加密,或涉事的性格测试应用 程序公司也可主动采用此法,以树立负责任的数据管理方形 象。同态加密虽然可能不是防止数据滥用最高效或最直接的方 法,却不失为一种可行的办法。使用同态加密,用户数据在被 共享给第三方性格测试应用程序前将被加密。然后,该应用程 序将分析此加密数据,并将个性特征图解返回给个人用户。 应用程序本身无法读取用户的个性特征图解。用户可使用基 于自己脸谱账户密码的私钥解密这些分析结果,而Cambridge Analytica

43、或其他任何第三方均无法使用数据,甚至无法读取 数据。 但一定要注意,以同态或其他方式加密数据并不意味着免除机 构的隐私义务。经加密的数据本质上仍属于个人信息,需要有 力的管理和监督以确保数据共享和使用方式合乎道德规范。 金融服务业的应用: 以当前的技术成熟度,同态加密未能实现大规模应用有两个关 键原因:技术的局限性及公认标准缺失。 许多同态加密方案仅能执行一种类型的运算(例如,加法或乘 法,而非两者皆可),且分析全同态加密(可能采取任何一种 加密算法)数据要比分析未加密数据慢几个数量级。因此,该 技术仅能用于采用特定函数的场景(同态加密案例),或者计 算速度和计算成本并非优先考虑因素的场景(全

44、同态加密案 例)。但这些技术近期的快速发展和改进(几秒到几分钟)使 应用同态加密来保护高度敏感信息成为可能。目前,该领域的 开发活动仍十分活跃,诸如Ziroh Labs和Inpher等初创公司已 经开发了在实际用例中具备计算可行性的同态加密或全同态加 密方案。 传统加密系统存在公认标准,具备高度的互操作性,因而应用 广泛。由于目前尚未建立起针对同态加密或全同态加密方案的 公认标准,各类同态加密方案的可用性均大为受限。目前推 进的一些举措(如同态加密标准化)正力图为此技术建立共 同标准。 15金融服务新一代数据共享:利用隐私增强技术解锁全新价值 原理揭示: 假定Peggy想向Victor证明她能

45、分辨出装在两个完全相同 的玻璃杯中的两种苏打水的区别。Peggy还有另外两个要 求:她不想让Victor知道区分两种苏打水的方法(例如,通 过甜度不同来区分),也不想让Victor知道每杯苏打水的品 牌。如果Peggy能满足上述要求,她就完成了“零知识证 明” 既证明了自己能分辨两种饮料的区别,又未暴露 与自己或玻璃杯内饮料相关的其他任何信息。 为此,Peggy应品尝每个玻璃杯里的饮料,然后背对桌 子;接着,Victor应随机调换玻璃杯位置或者保持它们原 本的位置(概率各约50%),然后让Peggy再次品尝每个 玻璃杯里的饮料;Peggy应回答指出是否调换了玻璃杯 的位置,但不透露每个玻璃杯内

46、苏打水的品牌,亦不解 释她是如何得知玻璃杯是否换过位置。第一次进行测试 时,Peggy仅凭猜测就有50%的正确几率。但是,若她能 分辨两种苏打水的区别,则应在重复测试过程时能够始终 回答正确,且她靠猜测得到正确答案的几率应大大降低。 到第20次测试时,Peggy猜对的几率大约为百万分之一, 因此Victor有理由确定Peggy的确知道这两种苏打水的区 别。这就是零知识证明,因为Victor既不知道每杯苏打水 的区别,也不知道Peggy是如何分辨出两杯苏打水之间的 区别的。 第四项技术:零知识证明 概述: 一些情况下,用户期望共享特定信息,同时又不泄露其他任何数据。当用户对另一方会否将此信息用于

47、非预期用途存疑 时,采用这一方式共享信息就非常重要。例如,在填写租赁申请表时,某人要证明自己的收入超过了房东的最低要求, 但同时又不愿让对方得知自己确切的收入信息 如果他的收入远高于最低要求,则房东有可能很快寻机提高租金。在此 情况下,接收收入证明的第三方可利用其收到的额外信息(确切的薪资)得出申请人希望保密的其他信息。零知识证明 (ZKP)使一方能向另一方证明某些特定信息,而无须共享除预期信息以外的任何信息。 1985年,Shafi Goldwasser(麻省理工学院)、Silvio Micali(麻省理工学院)和Charles Rackoff(多伦多大学)在论文 交互式证明系统的知识复杂性

48、(The Knowledge Complexity of Interactive Proof-Systems)中首次提出了零知识证 明。32 此后,零知识证明不断发展,涵盖了广泛的用例,包括证据不可区分证明、非交互式证明和可抵抗量子攻击的证明 等。与联合分析一样,该技术也结合其他新兴技术使用 最著名的是结合分布式账本使用,从而在完全隐私的情况下跨 P2P系统转移资产。 Peggy尝了两杯饮料, 但什么也没告诉Victor。 然后,Victor随机调换杯 子的位置,这一过程不 让Peggy看见。 Peggy再次品尝每种饮 料,然后告诉Victor是否 调换了玻璃杯的位置。 多次重复这个过程,直

49、到Victor确信Peggy不是 靠猜测。 SV P P V V 16金融服务新一代数据共享:利用隐私增强技术解锁全新价值 隐私泄露实例探讨: 2019年1月,美国某大型零售商的一名员工被捕,因其涉嫌将 客户的信用卡号透露给同伙,然后由同伙使用窃取的信用卡信 息进行购物。33 该员工会在客户购物时记住他们的卡号并抄录 下来,随后将号码通过短信发送给同伙。在2018年到2023年 期间,零售商遭遇的无卡交易欺诈涉案总值预计将达1,300亿 美元,其中与上述案件类似的信用卡盗刷不容忽视。34 而今我 们可设想采用零知识证明支付系统来避免此类损失:零知识 证明支付系统允许个人在零售商处验证其银行信息和余额,而 无须向任何第三方(如收银员)透露账户信息和信用卡验证值 (CVV)代码。 金融服务业的应用: 随着技术方法不断成熟,零知识证明近期终于投入了实际 应用,例如,支付(如Zcash35)、互联网基础设施(如 NuCypher36)和数字身份(如Nuggets37)等用例。荷兰国际 集团(ING)等大型机构已投入资金在金融服务领域推广零知 识证明技术的运用,38 并且该技术还有望在广泛推动分布式账 本技术发展中发挥关键作用(因为它使个人和机构能够保护公 共分布式账本上的私人信息)。 17金融服务新一

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(金融服务业新一代数据共享:利用隐私增强技术解锁全新价值(36页).pdf)为本站 (风亭) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部