上海品茶

北京金融科技产业联盟:2023金融数据要素流通技术与应用研究报告(59页).pdf

编号:147816 PDF   DOCX  59页 2.18MB 下载积分:VIP专享
下载报告请您先登录!

北京金融科技产业联盟:2023金融数据要素流通技术与应用研究报告(59页).pdf

1、金融数据要素流通技术与应用研究 北京金融科技产业联盟 2023 年 11 月 版权声明 本报告版权属于北京金融科技产业联盟,并受法律保护。转载、编摘或利用其他方式使用本报告文字或观点的,应注明来源。违反上述声明者,将被追究相关法律责任。编制委员会 编委会成员:何 军 聂丽琴 高鸿升 编写组成员:夏知渊 丁文定 郭相林 相 妹 陈 曦 杜妮娜 李如先 何东杰 张伊祎 徐 静 汪小益 张延楠 昌文婷 彭 晋 张晓蒙 李 力 周蓓杰 唐仕豪 强 锋 李 茂 吴叶国 杨煜东 任 妍 王 超 倪 壮 朱振超 李克鹏 王礼斌 刘站奇 陈 鑫 蒋嘉琦 贾金龙 黄翠婷 陈 涛 高强裔 吴紫园 窦永金 杨 波

2、胡师阳 邱晓慧 聂春祺 夏斯媛 吴嫣雯 章立强 赵怀衡 程安明 李 倩 崔如德 钱 勇 范力欣 葛 娴 黄安埠 王 雪 李武璐 李 原 曹 雷 周奕希 雷 武 李 博 汪 洋 郑华祥 陈嘉俊 张敬之 曹旭涛 时 代 张嘉熙 董婉婷 黄 淼 周岳骞 张亚申 王健宗 黄章成 李泽远 蒋美献 顾逸晖 张佳辰 于 博 夏家骏 高志民 李炳帅 编 审:黄本涛 郭 栋 刘宝龙 1 参编单位:北京金融科技产业联盟秘书处 中国工商银行股份有限公司 联易融数字科技集团有限公司 北京数牍科技有限公司 杭州趣链科技有限公司 蚂蚁科技集团股份有限公司 北京市竞天公诚律师事务所 深圳微言科技有限责任公司 阿里云计算有限

3、公司 蓝象智联(杭州)科技有限公司 腾讯云计算(北京)有限责任公司 度小满科技(北京)有限公司 同盾科技有限公司 北京国家金融科技认证中心有限公司 北京银联金卡科技有限公司 北京瑞莱智慧科技有限公司 深圳致星科技有限公司 上海富数科技有限公司 深圳前海微众银行股份有限公司 2 建信金融科技有限责任公司 平安银行股份有限公司 深圳市洞见智慧科技有限公司 浙商银行股份有限公司 华控清交信息科技(北京)有限公司 北京冲量在线科技有限公司 深圳壹账通智能科技有限公司 神谱科技(上海)有限公司 上海光之树科技有限公司 华为云计算技术有限公司 3 目 录 前言.1一、概述.3(一)金融行业数据流通的意义.

4、3(二)主要技术概述.5二、现状和痛点.8(一)现状分析.8(二)流通合法合规要点.9(三)流通技术难点.15三、体系框架.18(一)框架总述.18(二)规范体系.19(三)服务模式体系.19(四)规则机制体系.20(五)支撑能力体系.23四、流程与技术.27(一)数据要素流通主要业务流程.27(二)数据要素流通技术.36五、典型案例.41六、总结与展望.50附录:术语解释.52 1 前言 数据作为基础资源和生产要素进入经济活动,已经获得广泛认可,并已被各类组织视为重要资产,而数据资产的价值倍增和数据要素市场化配置的关键在于安全高效的流通交易。我国数据要素流通交易的潜力巨大,每年全社会数据量增

5、长约 40%,但真正被利用数据的增长率只有 5.4%1,主要囿于数据要素流通不畅,交易体系不健全,数据产权制度、交易定价制度、会计制度、收益分配制度、中介服务制度以及安全治理制度尚不完善等。因此,围绕“数据二十条”,为充分激活金融数据价值,在法律法规、金融监管等不断完善的基础上,亟须探索金融数据的流通体系、流通业务流程以及相关技术应用。数据流通,泛指数据要素从一个主体或机构流转到另一个主体或机构的过程,流通对象可以是明文数据、脱敏数据、数据服务或数据价值。广义上,数据流通全过程覆盖数据全生命周期,涵盖数据治理、数据安全分类分级、数据资产化、数据开放共享、数据交易以及数据运营等。狭义上,数据流通

6、指的是在符合法律 1.肖钢.加快构建数据要素流通交易制度N.人民政协报,2022 年 5 月 18 日(第 3 版)2 法规要求前提下,运用流通技术按照一定的数据标准和市场流通模式实现数据从提供方传递到需求方的过程。本报告从金融行业视角,聚焦狭义上的“数据流通”做出一系列积极有效的思考。梳理了我国金融数据流通的现状,分析了金融数据流通在合法合规方面的痛点以及流通技术方面的难点。进而,重点提出推动金融数据流通的体系框架,并就金融数据要素流通的业务全流程做出详细介绍,旨在提出金融数据要素流通的整体解决方案,并通过金融行业先行先试形成数据流通领域的行业标杆,更好地激发数据要素市场新活力,释放数据要素

7、新动能,创造我国数字经济时代新的竞争优势。报告关于“金融数据流通”的探讨具有重要的现实意义。3 一、概述(一)金融行业数据流通的意义(一)金融行业数据流通的意义 1.1.数据要素助力金融智能发展数据要素助力金融智能发展 2020 年 4 月 9 日,中共中央、国务院发布中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见,指出数据成为继土地、劳动力、资本、技术后的第五大生产要素。2022年 12 月印发的中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见(以下简称“数据二十条”),提出构建数据基础制度体系和多层次数据交易市场体系等战略性举措。数据要素作为数据经济时代的全新生产

8、要素,在推进经济高质量发展中具有显著的战略意义。在国家、行业等多层面获得了广泛重视,数据要素在社会经济及金融行业中的地位日益凸显,为大力推进产业数字化转型、加快推动数字产业化、更好地服务实体经济发展提供重要支撑。金融是典型的数据密集型行业,数据要素正成为金融行业高质量发展的重要驱动力。2021 年 12 月,中国人民银行印发金融科技发展规划(2022-2025 年),该规划依据中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要制定,提出新时期金融科技发展指导意见,明确金融数字化转型的总体思路、发展目标、重点任务和实施保障。同时明确 4 坚持“数字驱动”的发展原则,以加

9、强金融数据要素应用为基础,加快金融机构数字化转型,注重金融创新的科技驱动和数据赋能。为适应数据要素市场化发展战略,金融监管部门不断强化金融业数字化转型指导和规范,金融机构持续推进金融科技应用创新,通过数据驱动金融业务创新,提升企业级数据能力,实现金融数据价值的业务赋能,推动金融业数据要素市场建设。具体地,金融机构在长期业务发展中积累了海量数据基础,运用大数据、人工智能等技术,充分挖掘数据价值并应用在客户营销、智能风控、普惠金融、企业和个人征信、信用评级等各类业务场景。通过多维数据的分析挖掘,提升金融产品风险定价的有效性和精准度;将数据要素应用在各创新场景中,拓宽金融行业服务边界,捕捉个人和企业

10、潜在需求,丰富金融服务内涵。2 2.金融数据流通加速数字化转型金融数据流通加速数字化转型 2022 年 3 月 25 日,中共中央、国务院发布中共中央、国务院关于加快建设全国统一大市场的意见,再次提到加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范,深入开展数据资源调查,推动数据资源开发利用。对此,积极探索以更高效、更佳的组织方式、更安全的治理来破除数据壁垒、实现数据流通共享势在必行,要持续加大数据开放力度,努力推动数据 5 跨地区、跨行业的互联互通,有利于激发数据流通活力,培育更加完善、成熟的数据要素市场体系。数据自主有序流通交

11、易,是激发数据要素价值、扩大数据生产力乘数效应的重要途径,可以使沉淀的数据资产成为“活水”,以合法合规形式在不同行业、不同机构间进行流转、整合、共享,为推动实体经济发展发挥更加充分的作用。为快速响应国家对数据要素市场建设的要求,承接数据要素流通交易的发展需求,金融机构在利用自身数据优势的同时,也不断加强内、外部数据的融合应用,在跨机构、跨行业之间进行数据流通共享能够形成更强有效的互补,发挥更加显著的作用。通过跨行业、跨机构的数据流通,金融机构可以全面掌握客户信息和需求,进而制定更优的智能风控、营销等策略,为企业最大限度降低风控成本、带来更大的经济效益,进一步加速金融数字化转型发展。(二)主要技

12、术概述(二)主要技术概述 1.1.数据整合技术是流通的前提数据整合技术是流通的前提 数据整合技术是数据流通的基础和前提,为数据共享提供标准化、结构化的数据。数据整合技术通过脱敏、去标识化、匿名化、大数据技术与分析技术等确保数据的可用性、隐私性。依托 6 数据脱敏、去标识化、匿名化技术进行敏感信息处理,仅保留标准化的数据格式和属性;依托大数据技术与分析技术对需求匹配和运营环节进行分析,大幅提升了数据流通市场的要素流通效率。通过以上数据整合技术对来自金融行业不同应用场景的数据源进行数据整合,使之具备一致、标准的格式,从逻辑上实现数据的集中存储与处理。2 2.开放共享技术促进价值流通开放共享技术促进

13、价值流通 开放共享技术作为整个数据流通过程中的关键技术,可以有效促进价值流通。开放共享技术为各种数据源构建一套在安全网络中的数据表示、索引、定位、查询、交换和数据追溯审计等功能的统一标准,解决数据流通过程中非敏感数据的跨机构、跨部门、跨系统间的安全交换问题。此外,对于数据隐私性较高且无法直接共享的数据,可以使用隐私计算技术进行价值共享,保护数据内容不出库。数据开放共享主要通过数据水印技术、API技术、数字证书、TLS、数据加密、量子传输及量子密钥分发等技术为参与共享的机构提供数据存储以及接入、数据安全传输、数据一致性校验、数据合规审计等功能,方便机构将已有数据快速接入到整个数据流通系统。依托数

14、据水印技术对数据产品分级和数据权属登记等 7 环节进行隐藏信息嵌入,进一步加强数据流通应用的监管审查和权属鉴别能力;依托 API 技术,可以在数据要素流通中为不同平台提供低敏感数据的共享服务。3.3.安全合规技术支撑可信流通安全合规技术支撑可信流通 安全合规技术凭其技术特点,能够很好地满足金融数据流通的安全合规需求,支撑金融数据要素的可信流通。近年,在大环境发展过程中,金融机构对数据流通的安全合规要求越来越高,如何在安全合规的前提下充分挖掘数据资产价值成了金融机构关注的重点。密码技术、隐私计算和区块链技术凭其技术特点,为建设高效、安全的数据要素市场提供技术基础,能够很好地满足金融数据流通的安全

15、合规需求,支撑金融数据要素的可信流通。依托密码技术可以保障金融安全,同时,密码技术又是隐私计算和区块链技术的基础技术支撑;依托隐私计算技术,可以有效解决数据流通过程中数据隐私问题,借助可信硬件技术可以帮助机构和部门在保护数据隐私的前提下发挥数据的价值;依托区块链技术,可以在金融数据合规共享流通场景下,为数据真实性、数据确权等合规问题提供帮助,实现全流程可记录、可验证、可追溯、可审计。8 二、现状和痛点(一)现状分析(一)现状分析 在我国,自 2014 年最早的 3 家数据交易机构(中关村数海大数据交易平台、北京大数据交易服务平台和香港大数据交易所)建立以来,在不断发展中形成了多种流通模式。从流

16、通交易场所角度来看,目前市场上既有数据交易所形式的场内交易,也有企业与企业之间直接发生数据交互的场外交易。场内交易一定程度上利于监管,但需付出额外成本;场外交易虽灵活多样,却易出现违规行为。从市场主体关系角度来看,数据流通主要为两种模式,一是通过流通交易中介形成的撮合型模式,二是通过数据服务商进行的数据综合流通模式。其中,撮合型模式由各大数据交易机构作为中介提供撮合平台,匹配买卖双方的供给和需求促成数据流通交易;数据综合流通模式侧重于数据“采集-加工-销售”的服务流通交易,由数据服务商作为中间代理,与多家数据提供方合作采集数据,进行数据加工处理,面向市场中所有数据需求方提供数据服务,完成数据供

17、需双方的流通交易业务。从技术支撑角度来看,数据流通主要有如下三种模式:1.0模式是通过数据交易平台就数据所有权进行交易,但由于数据确权相关法律法规不明晰,该模式有较高的数据安全风险,因此近些年该模式增长逐渐放缓。2.0 模式将加工处理完的单方结果数 9 据以 API 形式输出,该模式下按照数据分类沉淀的 API 接口日调用量达上亿次,满足较广的服务覆盖范围,且一定程度保护了用户隐私信息以及降低二次利用可能性,但同时降低了数据价值融合的可行性。隐私计算有望发展为数据服务 3.0 模式,直接作用于数据使用方面,能够通过协议或算法使得数据计算服务在不泄漏原始数据的前提下充分挖掘数据价值,如图 1 所

18、示。图 1 数据流通模式现状 综上,整体来看我国数据流通模式机制仍在不断发展完善,各数据交易机构运营尚未达到预期效果。金融机构引入外部数据、金融数据服务对外输出等还面临诸多困难和挑战。(二)流通合法合规要点(二)流通合法合规要点 金融数据的流通需依照个人信息保护、数据安全及金融监管相关法律法规和标准(以下统称“实体规范”)来实施。为此,10 需分析实体规范所包含的要素、实体规范的内容以及对应的合规要点。1.1.数据合规实体规范的分析维度数据合规实体规范的分析维度 数据合规实体规范事实要素包括数据主体、数据内容、数据控制权归属、数据流通方向和数据流通范围,如图 2 所示。图 2 数据合规实体规范

19、的五个分析维度 数据主体身份是数据合规分析的起点。金融机构运营过程中,涉及两类数据主体:金融机构自身的运营数据和来自客户的数据。客户数据可以进一步分为法人或其他组织数据,以及自然人数据。不同数据主体需要符合不同的监管逻辑和保护要求。法人和其他组织需要满足数据安全的合规要求;自然人除了满足数据安全要求,还需要符合个人信息保护的特殊要求。数据内容是确定合规义务的基础。数据内容包括描述数据主体的特征类数据、自然人身份识别类数据、金融机构资产存量状 11 态数据、交易数据、状态变化的过程类数据和金融机构管理数据。根据中华人民共和国数据安全法(以下简称数据安全法)的分类分级保护原则,应根据数据内容的不同

20、分级并采取不同等级的数据保护措施。数据控制权归属是确定数据合规责任主体的关键。数据控制权既具有技术属性又具有契约属性。在技术属性方面,数据控制者可以使用访问权限、保密等技术手段在其控制域内进行控制。在契约属性方面,数据控制权可以通过契约方式进行传递,例如在委托受托关系中,受托方必须按照合同约定的处理方式和处理目的进行数据处理。数据流通方向是确定数据供需义务及资质要求的关键。数据流通过程中,参与方的角色决定了其合规义务及资质要求,即数据提供方需承担数据来源合法性、数据主体授权充分性等合规责任;而数据接收方需承担网络安全、数据安全等合规义务,如数据存储和传输过程中的技术处理措施。数据流通范围是区分

21、“内部共享”和“对外提供”两种不同合规要求的关键。从法律视角来看,可将数据流通范围分为同一法人主体内部流转和不同法人主体之间的流转。对比而言,后者需要承担更重的内部合规责任和外部赔偿责任。2 2.数据合规相关法律法规及标准数据合规相关法律法规及标准 我国数据安全和保护的法律法规日益完善,网络信息治理和数据保护基础法律的“三驾马车”中华人民共和国网络安 12 全法(以下简称网络安全法)数据安全法和中华人民共和国个人信息保护法(以下简称个人信息保护法)均已施行,为企业合法处理数据、保障数据安全等提供了较为明确的指引。金融业作为强监管行业,根据相关法律等,对应推行实施了系列行业标准、规范,形成如下数

22、据安全体系,为金融数据的开放共享、规范使用、安全流通起到基础支撑作用。金融数据合规相关体系如图 3 所示。图 3 金融数据合规相关体系 3 3.个人信息保护合规要点个人信息保护合规要点 个人信息保护法为个人信息处理提供了重要指引。金融机构作为个人信息处理者需关注处理权限及合规义务两方面内容。其中,处理权限绝大部分来源于个人信息主体的明示同意,而金融机构的角色决定了其合规义务的承担。13 第一,知情同意原则是个人信息处理活动中的黄金原则,是尊重个人意志的核心体现。而对于法人、其他组织等非个人客户则不存在个人信息保护的要求,但存在对数据的保密义务。第二,“告知”和“取得同意”具有不同的内涵。个人信

23、息保护法第 13 条确立了七项处理个人信息的合法性基础,仅第一项需要取得个人信息主体的同意,其余项则不需要获取;但是,无论适用何种合法性基础来处理个人信息,均需履行充分告知的义务。因此在讨论数据授权时,应拆分为两部分:告知的充分性,授权的充分性。第三,“匿名化数据”是相对概念,现实中不存在绝对匿名化的数据。在适用该定义时应将参与加密过程的知情人员排除在外(因为这部分人员知晓数据的映射关系,可以复刻重做数据),如果数据对于其他人而言是匿名化的,则不属于个人信息,可以正常使用。第四,委托处理、共同处理、数据提供的个人信息合规要求有明显区别;不同的法律关系下,各参与方角色负有不同的合规义务,具体见表

24、 1。各方在合作前需考虑法律关系定性问题,合理预设合同条款,保护自身利益,把控合规风险。表 1 各参与方角色负有不同的合规义务 法律关系 角色 合规义务 委托处理关系 委托方 需事先进行个人信息保护影响评估 需对受托方的个人信息处理活动承担责任 14 受托方 需按照个人信息处理协议约定的目的、方式、范围处理个人信息 委托关系结束后通常需要对数据进行删除或匿名化处理 对外提供关系 提供方 需事先进行个人信息保护影响评估 针对对外提供行为,需获得个人信息主体的单独同意 接收方 需对个人信息提供方提供行为的合法性负合理、必要的审查义务 若超出个人信息主体原始的同意授权范围,则需要向个人信息主体重新获

25、取同意 合作处理关系 各合作方 各合作方应按照个人信息处理协议的约定开展处理活动,不得超出约定范围 个人信息的共同处理者对个人信息处理活动向个人信息主体承担连带责任 4 4.数据安全合规要点数据安全合规要点 金融机构在经营管理过程中涉及重要数据、个人金融信息、数据分类分级、数据出境等多个涉及数据安全合规的场景和方面。第一,金融行业在数据流通中需遵守 数据安全法 第 21 条规定的数据分类分级保护制度,依据金融数据安全 数据安全分级指南 金融数据安全 数据安全评估规范(征求意见稿)个人金融信息保护技术规范 等相关法规和标准开展数据分类分级工作。第二,在数据出境场景下,应履行数据安全法数据出境安全

26、评估办法等法律法规所规定的数据出境安全评估义务。第三,履行数据安全法对“重要数据处理者”的要求:明确数据安全负责人和管理机构,落实数据安全保护责任;定期开展数据处理活动风险评估;以及在中国境内运营中收集和产生的重要数据的出境安全管理。15 5 5.金融行业数据合规的特殊要求金融行业数据合规的特殊要求 金融行业的数字化发展使得金融机构持有大量重要金融数据,数据安全与风险防范成为国家和监管部门的关注重点。近年来,国内外数据监管法律法规日益严格,我国数据立法进程加速,金融数据受到高度重视。金融行业针对征信业务等方面制定了重要的监管要求。第一,征信业务应具备合法资质。需要明确的是,何为“征信信息”“征

27、信业务”,征信业务管理办法第 3 条规定,判断信用信息的标准是“依法采集”“为金融等活动提供服务”“识别判断企业和个人信用状况”。因此,同一信息在不同使用主体和目的下的定性不同,会导致资质要求不同。如数据提供方在采集或生成数据时并无金融服务和识别信用意图,则此时作为该机构不需具备征信业务资质。第二,金融机构及非银行支付机构使用电子认证服务。金融机构在客户身份验证时,应遵循“最小必要原则”,避免过度收集信息,并承担数据安全责任。此外,2021 年 6 月 1 日,中国人民银行组织起草了中华人民共和国反洗钱法(修订草案公开征求意见稿),明确金融机构使用第三方识别客户身份时,应对第三方的反洗钱能力承

28、担责任。(三)流通技术难点(三)流通技术难点 金融数据要素需要依托可靠的数据流通交易平台积极融入大市场。平台支撑实现流通、共享、交易闭环,涉及多领域技术 16 融合。目前在数据流通管理、数据资产管理、数据质量管理、数据流通技术平台、数据安全技术平台、数据集成技术平台等相关技术平台的交互融合联动,在金融数据流通全生命周期中提供技术支撑能力方面尚面临诸多困难和挑战。同时,隐私计算推动金融数据安全流通的实际应用中,仍面临如何平衡安全与效率、安全标准有待健全、方案的可解释性与灵活性亟待提升、技术公平与普惠性、可监管待改善等诸多挑战。1.1.跨领域技术融合问题跨领域技术融合问题 数据流通平台是数据流通交

29、易的重要载体,可以促进数据资源整合、规范交易行为、降低交易成本、增强数据流动性,实现数据流通的全流程闭环。完成数据流通的全流程涉及提供供需撮合的平台门户建设、存证监管的区块链技术、数据产品服务的大数据、数据中台、流通管理平台、传统 API 数据服务、隐私计算等多领域技术。融合多项技术构建大型综合数据流通平台存在一定技术挑战,同时,大型金融机构经过多年技术沉淀,许多系统往往都有着复杂的架构,且各系统间紧密连接,完成行业级数据流通技术平台的建设或集成会牵一发而动全身。很多时候只能从一个简单的测试场景做起,再逐渐稳步过渡到新的系统。2.2.技术安全性问题技术安全性问题 市场各参与主体之间的信任和技术

30、安全是流通共享的基础,安全性也关系着市场信任。作为实现数据安全与隐私保护的关键 17 技术之一,隐私计算主要解决数据不出本地的情况下,数据安全使用和数据价值的流通,在“可用不可见”基础上,为数据要素合规安全流通提供重要保障。银行等金融机构在实际应用隐私计算落地典型场景中,考虑到数据高度敏感,业务涉及机构众多且不同机构之间信任度不一,对联邦学习等隐私计算技术的需求主要体现在安全性、可用性、易用性、灵活性以及产品或方案标准化的可靠保障。隐私计算的相关标准是否健全,隐私保护效果是否可验证,隐私计算流程是否可解释等等,这些都是金融机构在大规模商业化前可能会关心的问题。对此,还需增强隐私计算全流程安全性

31、。一是可证安全,明确算法本身带来的隐患或信息泄露以及已有的攻击手段及可能带来的信息泄露。二是流程可监管,包括事前的授权、事中的监控、事后的审计,能够快速发现安全风险。3.3.可用可用且且高效问题高效问题 当前,联邦学习、多方安全计算等隐私计算技术,以及区块链技术已经进入商业落地使用阶段,商业化进程的不断加速,数据安全保护问题逐渐揭开迷雾,随之而来要形成规模化、标准化推广和应用。基于数据流通的主要技术现状,与现实业务应用需求的矛盾,和市场规模化发展的矛盾,核心挑战来到新的维度如何在保证安全的基础上,提升效率和有效性,破解安全和性能的平衡点。18 金融行业有海量的数据,应用隐私计算实现海量数据流通

32、,亟需突破现有的性能瓶颈,寻求安全和效率的平衡。一是满足高稳定性要求,可监控、可回滚,具备一定的网络/节点容错性,提供高可用性;二是满足高性能要求,在安全、准确的前提下,提升计算效率,且能够支持大规模数据的计算。三、体系框架(一)框架总述(一)框架总述 在法律法规、监管合规要求下,数据高效流通交易、数据要素市场规范发展,有赖于行之有效的流通模式等规则机制和安全可靠的技术能力支撑。针对现阶段市场发展面临的挑战,报告提出包含规范体系、规则机制、技术体系三层的金融数据流通体系框架,自上而下指导和促进、自下而上支撑和推进,以保障数据来源可确认、使用范围可界定、流通过程可追溯、安全风险可防范。在规范体系

33、的顶层指导下,通过规则机制和支撑能力体系双轮驱动,形成场内外多层次数据流通服务模式,共同推动金融数据流通市场高质量发展。金融数据流通体系框架如图 4 所示。19 图 4 金融数据流通体系框架(二)(二)规范体系规范体系 国家战略规划、法律法规和行业标准规范整体构成金融数据流通体系框架中的规范体系,提供顶层指导和合规保障,促进建立良好的数据流通市场环境。围绕“数据二十条”不断丰富完善各方面制度体系和配套的政策,数据要素市场正在加速培育中,践行着大数据、数字经济发展的国家战略。(三)服务模式(三)服务模式体系体系 基于金融数据流通现状和当下国内各地数据交易所的发展,报告的体系框架中提出流通服务模式

34、体系。一方面,在跨行业跨机构间,根据数据安全分类分级的不同,可以对应匹配数据集、数据 API 或隐私计算流通服务模式;在同领域或同行业机构间,可以通过数据共享与交换实现数据流通。20 另一方面,现如今各地数据交易所积极创新,不局限于供需撮合,根据金融数据流通交易的场所可分为场内、场外交易。综合金融业数据流通诉求、数据交易所模式以及数据要素市场的发展,实现数据安全合规、大规模、高效率流通交易,场内、场外以及数据集、API 服务、隐私数据服务等模式交互融合,建立多层次、多样化的数据流通服务模式体系。(四)规则机制体系(四)规则机制体系 数据流通规则机制体系分为管控机制、管理机制、市场机制三个层次,

35、分别规范和促进金融数据流通的可行、能行和易行。管控机制是金融数据有序流通的前提,保障数据流通源头的合法合规;管理机制是金融数据流通的核心基础,促进数据安全和数据质量的把控,以及数据用途与流通模式的合理匹配;市场机制是金融数据流通的关键,合作生态和定价收益等体系的建立有助于催化数据流通市场的高效发展。1 1.管控管控机制机制 管控机制层面由数据登记和公证体系、数据信用体系等组成。(1)登记和公证体系 建立数据登记和合规公证体系,保障数据合法合规。登记构成要件包括登记机构、数据来源说明、数据授权书、安全等级和保密要求等,由数据公证机构对材料进行核查和确认,出具公证证明,确保数据主体与数据来源合法合

36、规,保障交易数据真实可靠以及数据承载的数据主体权益,为数据要素交易流通提供参考 21 依据,有助于维护数据交易市场秩序,促使其稳定、健康、快速发展。(2)数据信用体系 建立数据信用体系,加强数据流通监管。打造数据交易市场社会信用体系,逐步完善数据交易中失信行为认定、失信惩戒、异议处理和信用修复等机制。加强与社会信用体系的同步建设、协同联动、相互促进,强化数据从创建到流通再到应用的全生命周期的过程信用监管,维护市场主体权益。制定交易数据“负面清单”,明确国家秘密、商业机密、个人隐私领域不能或严格限制交易的数据项。建立交易诚信“黑名单”机制,将违规操作的市场主体纳入黑名单,限制数据要素交易活动并责

37、令限期整改。2 2.管理管理机制机制 管理机制层面由安全管理体系、质量管理体系、流通规则体系等组成。(1)安全管理体系 建立数据安全管理体系,促进数据可信流通。强调数据交易的可追溯性,记录、追溯数据交易的事前磋商与验证、交易流程和数据触达情况等。建立数据要素流通使用全过程的合规公证、安全审计、算法审查、监测预警机制,促进不同场景下数据要素安全可信流通。根据数据内容、应用场景等制定数据分类分级的保护标准,以实现针对性、分等级、差异化的数据隐私保护和安全防护。22 (2)质量管理体系 建立数据质量管理体系,提高数据流通效率。大力推进金融数据标准化建设,统一金融数据的规则和技术要求,促进金融数据规范

38、定义、规范标识、规范使用,增强数据的可用性。加强金融机构数据的质量管理,进一步完善金融数据质量监管规则,将数据质量情况作为金融机构、公司治理风险管控的重要考量因素,加强评估考核和监督检查。(3)流通规则体系 建立统一规范的流通规则体系,构建在使用中流通、场内场外相结合的交易制度。数据流通应体现为多层次的市场交易体系,并根据具体的类型和场景,适用不同的交易规则,包括集团内、金融行业内、跨行业、跨境的数据开放、共享、交换、交易等场内和场外的流通方式。建立数据用途和用量控制制度,实现数据使用“可控可计量”。3 3.市场机制市场机制 市场机制层面由合作生态体系、定价收益体系、需求管理体系等组成。(1)

39、合作生态体系 构建以交易所、数据服务商和第三方机构共同构成的数据流通合作生态体系。交易所可以夯实数据要素治理基础,负责标准化数据产品的交易撮合、价格生成、清结算等工作;数商可以提高数据要素应用水平,负责对多源异构数据的汇聚对接、清洗加 23 工、质量管控、可信流通,将非标准化数据转化为标准化产品;第三方机构可以释放数据要素流通活力,提供数据集成、数据经纪、数据评估、数据审计、数据公证等市场服务,加快构建数据要素社会信用体系。(2)定价收益体系 构建数据定价体系。推动数据要素由市场评价贡献、按贡献决定报酬的相关机制。充分发挥市场在资源配置中的决定性作用,扩大数据要素市场化配置范围和按价值贡献参与

40、分配渠道,完善数据要素收益的再分配调节机制,保护数据要素各参与方的劳动收益,促进劳动者的贡献和劳动报酬相匹配,强化基于数据价值创造的激励导向。通过数据产权制度保障数字权益、保障各相关主体基于数据市场评价贡献决定报酬分配。(3)需求管理体系 建立需求管理体系,以选择实现数据应用为导向,梳理应用所需数据,开展专项数据治理。再通过迭代的方式,逐步实现体系化数据治理。新模式既满足监管对数据的要求,同时也涵盖监管要求的数据价值实现。加快培育供求匹配高效、标准制度统一、市场运行规范、产品质量可控的数据要素市场。(五)支撑能力体系(五)支撑能力体系 从广义数据流通来看,实现数据流通全流程不仅需要狭义层面的流

41、通技术,还需要数据治理、数据运营、服务创新等多方面的能力支撑,共同构成金融数据流通的支撑能力体系。24 本节主要就治理、运营和创新支撑能力展开介绍。流通技术将结合数据流通全生命周期在 5.2 章节详细论述。1.1.治理能力治理能力 (1)统一数据标准:统一数据标准:大规模、成体系的数据要素流通和交易往往需要借助专业化的平台,为便于海量数据的处理和服务,需要对多源数据要素、技术接口、处理规程等进行标准化。(2)数据分类分级:数据分类分级:不同敏感级别、重要性级别的数据,需要采取的不同的保护措施,在数据汇集、传输、存储、加工等各环节均有不同要求,因此对数据资源目录进行梳理,并根据国家和各领域的管理

42、要求进行分类分级,是保障数据安全的前提条件。(3)数据质量监控:数据质量监控:数据质量是保障数据服务成效的重要环节,为形成数据要素顺畅流动的机制,需要在数据流通全流程的重要节点设置数据质量监控点,并结合最终用户反馈,形成质量检测闭环的定期评估,一方面将质量问题的处置前置,降低处置成本;另一方面,对于突发性的数据质量问题及时甄别,及时处置,确保整体数据可信、可用。2.2.运营能力运营能力 (1)挖掘需求:数据要素价值发挥依赖业务场景,一方面促进供需的高效交流,形成对营销、风控等多种场景的数据服务;25 另一方面,借助服务中介机构,其优势是对行业有深入的理解和服务经验,支持其挖掘合规、创新等各类潜

43、在的场景。(2)形成数据产品:数据保护要求不断提升,直接的数据集交换难以成为主要的流通模式,数据产品和服务则有可能成为数据要素流通的核心。因此,结合各类场景的业务需求,清晰定义数据产品和服务的主要功能和交互界面,是实现数据要素价值交换的可行方式,同时,也有利于评估流通价格。(3)活跃数据流通与交易:数据要素流通的关键在激发各方的动力,包括数据供应者和使用者的动力,一方面依托政策推动作用,逐步丰富数据供给,同时,依托生态建立多方共赢的权益激励机制,通过多层次的数据中介丰富数据产品服务形式,增进数据服务的成效;此外,加强数据合规和安全保障措施,免除各参与方的顾虑。3.3.创新能力创新能力 (1)服

44、务创新:服务创新:通过繁荣生态的方式引入多方参与,实现数据流通服务的创新。比如市场生态合作方联合共建,围绕特定领域的数据分析场景征集数据分析方法、丰富数据服务产品,为数据流通的供需双方创造价值,并可以凸显统一流通平台的生态赋能价值。26 (2)技术融合创新:技术融合创新:随着新技术持续发展,数据处理和数据保护技术不断进步,多种技术融合可能对处理效率和处理方式都有重要的改进,如 AI 用于数据标签和数据任务调度等场景,可以显著地降本增效,有利于降低数据交易成本,更广泛地发挥数据价值,因此,跟踪技术前沿发展,设置沙箱等方式探索新技术应用场景,可以支持相关企业在促进数据要素流动方面获得竞争优势。27

45、 四、流程与技术 数据要素流通包含开放、共享、交换、交易等多种形式,不同的流通形式在业务流程和所需技术支撑方面都略有差异。在市 场中,数据交易是流通的一种重要形式,促进了数据价值的复用和充分的利用。数据交易的业务流程相对复杂,且具有典型意义,因此本报告以交易为例,阐述和分析数据要素流通的业务全流程和涉及的技术能力。(一)数据要素流通主要业务流程(一)数据要素流通主要业务流程 数据交易业务流程主要包含数据产品上架、需求发布、分类分级登记和确权、数据资产评估和定价、供需匹配、数据产品分级流通、交易存证管理、监管通道、运营分析和数据产品下架等流程,具体如图 5 所示。图 5 数据流通交易业务流程 2

46、8 1.1.数据产品上架数据产品上架 数据提供方提出数据上架申请,服务提供方对上架申请进行审批,对数据进行合规评估和数据质量评估等操作后完成上架。上架完成后即可形成待流通的数据要素目录,呈现到数据要素流通市场。数据产品合规评估,是数据流通交易中必不可少的部分,是流通交易的数据产品更合规、更高效的前提。数据产品合规评估应当从数据供应方、数据来源、数据可交易及数据流通 4 个方面进行。数据质量评估,是保证数据分析应用的基础,是获取数据价值的重要保障。根据目前业界对于数据质量的衡量标准,可基于数据完整性、唯一性、有效性、一致性、准确性和及时性 6 个维度来评估数据质量。数据产品说明及上架,数据上架的

47、同时配套提供产品说明书便于数据产品的广泛流通,应包含基本信息、数据字典、数据价格、交付方式和应用场景等。2.2.数据需求发布数据需求发布 数据需求发布是由数据使用方向服务提供方提出数据流通的需求,请求获得待流通的数据要素。数据需求发布前,应对数 29 据需求方进行资质审查。数据需求方应证明其数据资源的应用需求符合国家法律要求。3.3.数据分类分级数据分类分级 金融数据安全分类分级可参照金融数据安全 数据安全分级指南(JRT 0197-2020),待流通交易的金融数据产品需进行分类标识管理和分级保护;依据数据安全级别对应匹配恰当的安全管理策略、保障措施和流通模式等;并按照数据级别明确使用方对待流

48、通数据的使用权限。数据分类分级需要数据要素流通过程中相关的责任方来进行,包括但不限于数据提供者、数据评估方和数据使用方,各方均可根据相关条例对数据进行分类分级。数据分级,从安全合规性要求、数据保护要求的角度出发,按照数据对国家安全、公共利益或个人、组织合法权益的影响和重要程度,将数据分为一般数据、重要数据、核心数据。数据分类,不同行业和不同场景中都有不同的方法,在金融行业通常可根据数据的生产来源和数据使用形式对数据进行分类。按照生产来源,即数据产生的实际业务和场景,主要分为公共数据、企业数据、金融个人信息等。按照数据的使用呈现形式,可分为数据产品和数据服务两个基础大类,其中数据产品可通过 30

49、 不同技术实现流通,又可分为数据集、数据 API、数据报告、数据模型。4.4.数据确权数据确权 数据确权是实现数据安全有序流通的重要前提,本质上就是确定数据的权利属性,主要包含两个层面:第一是确定数据的权利主体,即谁对数据享有权利,第二是确定权利的内容,即享有什么样的权利。数据从产生到消亡的生命周期中,数据确权环节就是针对特定的数据资产明确定义数据所有者、数据生产者、数据使用者和数据管理者的过程。数据流通市场中,金融机构大多作为数据需求方、数据使用者,合约相关方应当向金融机构提供数据各所属权利方的说明或授权文件,以保证金融机构使用流通数据的合法合规性。5.5.数据资产数据资产化化 数据资产化是

50、数据通过流通交易给使用者或所有者带来经济利益的过程,是实现数据价值的核心,具体实现包括两个阶段:数据资产价值评估和数据定价。数据资产价值评估,是对数据资产使用价值进行度量,与数据定价有着密不可分的内在联系,是数据市场化定价的重要依据,进而推动数据流通。31 数据定价,在“价格反映价值”的核心原则下,遵循真实性、收益最大化、公平、无套利、隐私保护和计算效率等六大基本原则。数据如何定价直接影响大数据交易平台以及卖方的盈利,对大数据交易平台如何选择适当的盈利模式具有参考意义。目前,较普遍的数据定价机制有:一是互联网服务商等推出的以自身为主的数据服务平台或产品采取每分钟计价模式和持续折扣模式,二是数据

51、交易平台结合数据质量、完整性、稀缺性等对数据集标价,如贵阳大数据交易所。6.6.数据流通需求匹配数据流通需求匹配 数据资源匹配,通过数据流通交易共享服务平台,为市场主体提供多种流通交易服务,助力解决数据流通市场效率问题。主要包括数据源本体库和数据资源需求与服务匹配两大模块,具体是:a.数据资源本体库。针对数据交易平台上的服务功能各异、种类繁多,本体异构,缺乏统一的定义和描述方法的情况,构建数据源服务本体库,通过数据资源本体库提供联盟领域内的共享概念,使需求和服务间的概念能够在语义层进行匹配。b.数据资源需求与服务匹配模块。根据数据资源本体库提供的概念语义信息,将数据资源需求描述和服务描述中对应

52、属性信 32 息进行语义匹配,确定信息之间语义匹配程度。该模块主要分三部分,数据资源需求与服务描述、数据资源需求与服务匹配引擎和数据资源需求与服务匹配结果排序。7.7.数据产品分类流通数据产品分类流通 数据产品应是来源合法、标的明确、范围确定、标识清晰、价值可估的流通数据。在数据分级保护、分类管理的业务流程后,用于对应的分类流通。(1)明文数据产品 根据数据分级对社会秩序、公共利益、行业发展、信息主体均无影响的数据,可通过API、数据集等方式进行明文数据传输。(2)脱敏数据产品 脱敏数据是对数据中较敏感的信息进行变形、转换和混淆,同时保证数据可被合理地流通利用。数据脱敏业务流程主要包括敏感数据

53、梳理、敏感数据识别、脱敏算法选择、脱敏任务执行和脱敏结果输出。(3)敏感数据产品服务 高敏感等级的数据可通过高安全保障的隐私计算技术实现流通。并结合计算合约、存证等机制,控制数据的具体使用目的、方式和次数,避免数据在流通过程中遭到泄露或滥用。33 密文数据流通的流程大致如下:首先,数据提供方、算法提供方及结果使用方在数据流通前对将要使用的数据及其用途(即场景)达成一致,形成计算合约,随后开始执行数据流通任务;其次,数据计算方提供平台算力,执行基于密文的数据融合计算;最后,数据需求方接收数据融合计算结果,用于某特定业务场景。另外,数据流通过程可结合基于区块链技术的存证机制,保障数据流通全流程可审

54、计、可追溯。8.8.存证管理存证管理 存证管理,包括业务记录存证与计算过程存证,在数据要素流通业务过程中,确保流通全生命周期的安全可控,确保各参与方忠实履行各方职责和任务,不进行系统破坏、数据窃取等恶意攻击行为,有助于解决流通合规问题。业务记录存证实现了对各方关于数据要素流通业务中的业务信息(包含数据介绍、流通对象、业务范围、授权信息等)、业务流程与状态、操作记录等信息进行存证的功能,便于对数据要素流通业务流程进行有效监控,业务记录存证组件记录用户登录、数据使用、数据授权、任务发起、任务配置、模型使用和计费等信息,可使用区块链等技术存储存证信息。34 计算过程存证实现了对于数据要素流通环节中所

55、涉及数据和相关数据处理与计算过程进行存证的功能,便于对数据要素流通环节中所涉及数据计算过程(包含隐私计算、联邦学习等)进行存证,确保计算准确性和安全性,计算过程存证组件记录联合建模计算任务中的随机数、秘密分片、密文、梯度数据和模型参数等计算过程数据,可使用基于哈希函数的 Merkle 树等确保存证的隐私性,使用区块链等技术保障存证的不可篡改。9.9.监管通道监管通道 建立监管审计机制,为数据流通业务流程上进一步提供安全保障。基于存证管理,通过为监管机构开设监管账号,部署监管节点,并给予相关监管权限,以实现存证信息传输同步、数据核验、监管审计任务发起、审计结果查看等功能。业务记录审计能够实现审计

56、方对于数据要素流通中各参与方的业务信息、业务流程与状态、操作记录等信息进行监管审计。计算过程审计可对于数据要素流通过程中的计算(隐私计算、联邦学习等)过程进行统计分析和审计,有效控制数据的使用目标、方式和次数,识别计算任务的完成过程中是否存在异常或恶意操作,对异常使用进行告警,并通过适当机制通知数据提供方。35 10.10.运营分析运营分析 数据要素流通平台的运营分析能力,在数据要素管理基础上体现为支持数据供应方、数据使用方和平台方等多方的要素流通情况分析。具体场景有:(1)数据流通统计报表制作:支持数据供应方提炼数据使用指标,针对客户、客户行为、数据产品和数据产品交易情况进行多维分析和统计;

57、支持数据使用方制作和查询数据产品使用报表;(2)支持平台生成数据交易报表,供结算和审计使用:根据供需双方的使用情况,可视化实现数据要素流通报表,多维分析数据使用情况,包括但不限于数据产品使用量、数据产品成本、数据产品的交易主体分析等,并自动生成包括结算报表在内的各类结算依据,供数据要素结算和审计使用。(3)支持平台生成对于事后数据提供方方违约使用数据产品的行为进行监控和干预,数据需求方可通过数据仲裁中心维权,确保数据需求方依法依约使用;数据需求方多次违约不予以改正可以限制其数据要素流通角色正常开展。11.11.数据产品下架数据产品下架 数据产品具有一定的时效性,数据提供方和服务提供方在完成数据

58、产品流通交付后,需对数据产品进行下架。数据需求 36 方和数据交易平台还应按照规范和数据提供方的要求对数据进行销毁,实现数据流通全流程闭环。数据提供方和服务提供方需要事先建立数据下架的策略和管理机制。同时,需建立数据产品下架的审批机制,以符合数据产品下架的策略和管理制度的要求。另外,需要记录数据产品下架审批的操作过程,并记录数据产品下架的具体操作过程,以满足安全审计的要求。数据提供方和服务提供方下架数据产品时,需保证该数据产品不在流通使用环节,并与其他数据产品没有任何依赖关系,以避免影响其他数据产品的流通。数据产品被下架后,需要保证对数据及数据的存储介质通过相应的操作手段,使数据产品在数据流通

59、平台上彻底丢失且无法通过任何手段恢复。(二)数据要素流通技术(二)数据要素流通技术 1.1.隐私计算隐私计算 隐私计算将数据可见的具体信息部分和不可见的计算价值部分进行分离,实现“数据可用(可计算)不可见(不可获取)”,进而消除各个数据协同方之间对于数据安全和隐私泄漏的顾虑,从而以技术手段有效地破解“数据孤岛”困境,其本质是一种由多个参与方在安全信任的条件下进行联合计算的技术,各个参与 37 方在不泄露各自原始数据和商业隐私的前提下,通过加密协作机制对数据进行联合计算和分析,实现数据的融合价值。多方安全计算技术的安全性和准确性有严格的密码学领域证明,因此在数据要素流通中被主要应用于涉及高敏感数

60、据流通的应用场景,多方安全计算技术可以解决多方参与的联合统计、联合查询、联合建模、联合预测等应用。联邦学习是实现“数据可用不可见”的一种关键技术。在数据要素流通中,联邦学习更多地用于解决联合建模的业务问题,比如信贷风控中的常用的逻辑回归建模评分、精准营销中的常用的 XGBOOST 分类等建模。可信执行环境常用于多方数据汇聚的中心化计算模式,能够满足业务数据隐私保护下的高性能计算需求。也可在联邦学习、多方安全计算等技术基础上融合可信执行环境,提升隐私计算任务的安全性。2.API2.API 技术技术 API的设计多为RESTFUL(Reprentational State Transfer),称为

61、 RESTFUL API。其架构元素包括资源(网络上的一个实体)、同一资源定位符(一个资源的地址)、状态转换(客户端与服务端互动的过程,通常涉及服务器端数据和状态的变化过程)。38 在数据要素流通中,API 接口用于为不同平台提供低敏感数据的共享服务,数据提供方收集到数据资源后,对数据进行融合、清洗、增值等,最后形成数据接口提供给相关参与方。3.3.脱敏、去标识化、匿名化脱敏、去标识化、匿名化 数据脱敏是指对原始数据中的敏感字段采取替换、过滤、加密、遮蔽或者删除等处理,从而降低数据敏感度和减少个人隐私风险。去标识化是指对标识符进行处理,使其处理后的信息无法识别到特定个人信息主体,而匿名化要求经

62、过处理无法识别特定个人且不能复原。去标识化所规定的防止重标识主要针对的是个人信息控制者以外的其他信息接收者,匿名化所规定的防止重识别通常还包括了个人信息控制者本身。4.4.区块链区块链 区块链具备数据可溯源、不可篡改、智能合约自动执行和去中心化等技术特点,利用密码学技术和分布式共识协议保证网络传输与访问安全,实现数据多方维护、交叉验证、全网一致、不易篡改。区块链技术实现数据流通的全流程链上可追溯,满足监管审计需求,促进和保障数据的有序流通,可实现以下支撑能力:实现上链前数据真实性交叉验证,上链后数据实现不可篡改性和可 39 追溯性;通过数字身份实现数据确权,实现数据管理、转移和交易;通过智能合

63、约保障了数据用途和用量的可控可管。5.5.数据水印技术数据水印技术 数据水印技术,是运用计算机算法在载体对象嵌入隐藏信息,使得数据具备追溯数据版权所有者、分发对象等信息的能力的技术。数据水印包括结构化数据水印和非结构化数据水印,前者适用于关系型数据库及结构化数据的水印;后者适用于文本、图片、音视频等非结构化数据的水印。用于数据要素流通的数据产品分级流通和数据权属登记环节,能够起到事中威慑作用,当发生数据产品非法扩散事件时,可对泄密样本进行溯源,得出泄密责任主体。也可用于数据产品版权的权属登记,既能保护原始数据,又能对数据产品进行鉴别。6.6.密码技术密码技术 密码技术是数据安全、网络安全、个人

64、信息保护的底层技术支撑和通用能力,也是隐私计算技术(多方安全计算、联邦学习、差分隐私等)的主要底层算法,是保障金融安全的关键核心技术,支持金融科技创新应用的基石。数据要素流通中涉及密码技术主要包含:数字签名、对称非对称加密、杂凑函数、密钥协商、同态加密、不经意传输、秘密分享、零知识证明等。40 其中,数字签名能确定消息不可抵赖性和保障消息的完整性,可以用于数据流通授权。群签名和环签名支持一个群体中的任意一个成员可以以匿名的方式代表整个群体对消息进行签名,有助于组织成员间高效协同。7.7.大数据技术大数据技术与分析技术与分析技术 数据分析技术应用于数据要素流通的需求匹配和运营分析环节,有助于提升

65、数据流通市场效率。在需求匹配中,通过智能推荐,根据数据供需方的历史行为进行建模进而提供丰富精准的数据产品推荐服务。在运营分析中,通过交易平台客户行为数据的积累和挖掘,对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息。41 五、典型案例 1.1.车贷风控应用车贷风控应用 当客户向银行提出车贷申请时,银行需要整合各种资讯再使用申请评分卡(A 卡)评估用户逾期还贷的违约风险。但仅使用人行征信数据和行内积累的数据,对好与坏客户的区分能力有限。为了提升评分卡的区分能力,银行联合其他数据方建立新的评分卡。同时,为了保障客户信息安全,选用联邦学习技术进行建模。在本案例中,银行通过

66、隐私计算技术与数据合作方之间进行数据流通,分享处理后的还款表现数据等给合作方用以建立评分卡,进而银行通过匿踪查询服务获得用户借贷逾期风险评分,同时排查多头借贷和超额借贷的情况,对于高风险用户,可以得到来自平台的高风险报警。某银行机构基于安全隐私计算平台中的联邦学习技术,联合其他数据方进行联邦建模,在保护客户隐私数据不泄漏的情况下,利用外部数据建立模型,在双方或多方合作中线上保障特征变量交换时的数据安全,具体框架如下图 6 所示。42 图 6 车贷风控案例框架 该银行应用安全隐私计算产品的联邦学习功能,融合多方的黑灰产行为等特征,模型的 KS 提升 30%以上,每年阻止数亿资金的风险贷款申请。2

67、.2.车险智能核保车险智能核保 保险机构自有数据无论从维度还是总量上来看都比较有限,要丰富用户画像及保险精算模型构建,需要引入互联网消费、通讯、车联网数据等大量外部数据,其中涉及个人信息隐私部分必然要予以合规授权和保护。因此,在监管合规前提下,保险机构通过数据流通等充分利用多方数据要素,寻找优质车险客户是提升保险盈利能力的合规方式。本案例中,基于联邦学习、多方安全计算技术等,提出车险智能核保方案,安全、有效地使用多方数据,实现保险公司、国 43 家信用大数据中心、互联网平台等多方数据不出私域的安全流通、联合建模,将保险公司的理赔数据,与大数据中心的个人、车辆等多维度数据融合,丰富车辆及驾驶者的

68、精准画像,训练智能核保模型,预测客户出险概率,筛选优质低风险潜在客户,从而向营销、核保等环节,提供车险智能核保模型支撑,为保险公司个性化报价提供重要参考,提高保险产品盈利能力,如图 7 所示。本案例已在 8 省 13 个城市落地应用,共核保 5 亿元,智能核保模型服务的日均调用量超过 1000 次。通过智能核保服务,将保险公司的车险赔付率由 75%降到 51%,有效为保险公司提高了车险产品的利润率。图 7 车险智能核保案例框架 44 3.3.政务金融协同政务金融协同检测预警检测预警 基于区块链、隐私计算技术,联合政务、金融等机构数据形成融资征信联盟,构造更全面的企业信用画像,助力一站式高效融资

69、服务业务办理,解决信用信息不准确、获取成本高的行业难题;构建外贸企业信用评价模型,利用政务外贸订单数据和来自海关、银行、中信保等业务协同部门的多维涉企信息,建立外贸企业信用评价模型,将企业划分为多个等级,为商业银行提供贷前准入控制、供应授信决策参考、推送优质企业名单;打破“信息孤岛”的壁垒,推动政务数据与金融数据互通,助力企业信用体系高效、健康发展。平台从政策资讯推送、金融产品管理、在线融资申请、融资进度跟踪、融资结果反馈、融资明细查询等维度提供外贸企业融资的全生命周期服务,打造专注于外贸企业的金融服务平台,如图所示。为政务金融协同预警系统外贸企业提供信用报告在线授权功能,企业用户在申请融资时

70、可授权相关政务机构或指定的商业银行查询其信用报告,企业无需线下提交纸质授权书或在其他系统中执行二次操作。政务金融协同检测预警案例框架如图 8 所示。45 图 8 政务金融协同检测预警案例框架 4.ID4.ID 去标识化流通去标识化流通 金融业务场景中很重要的一点是对个人客户进行风险识别。但单一一家金融机构的数据往往具有局限性,为取得更好的风险识别效果,就需要联合其他机构的数据。多方数据关联融合过程不可避免地要传输个人身份信息。直接传输身份信息风险很高,因此需先进行脱敏处理。现阶段,行业内脱敏方式一般为散列化,即通过 Hash 算法将个人身份信息处理为不可识别的字符串。但这样的散列化脱敏方式具有

71、一定被还原的安全隐患。为解决这一安全隐患,某公司与公安部门进行深度合作,基于密码学算法,引入 xID 去标识化技术,构建了一套数据去标识 46 化技术体系,能够实现身份信息类数据的去标识化处理,可为应用机构的身份信息类数据生成不同且不可逆的 xID 标记信息,并在受控的状态下实现 xID 映射。当 A 机构(数据需方)发起数据查询请求的时候,首先通过 xID 生成服务,将客户 ID 明文生成为 xIDlabel(A),然后通过业务调用请求,将含有 xIDlabel(A)的信息发送给 B 机构(数据供方)。由于 xIDlabel(A)是 A 机构独有的 xID 信息,对于 B 机构而言,他是无法

72、直接识别的。因此B 机构需要将 xIDlabel(A)通过 xID 映射服务转换为自己能够识别的 xIDlabel(B),然后以 xIDlabel(B)检索用户数据,最后将查的结果返回给 A 机构,从而完成本次数据流通的交互。在数据流通中的调用流程如图 9 所示。图 9 ID 去标识化案例框架 47 某国有银行联合风控项目中,通过采用 xID 去标识化技术,在满足业务风控需求的同时,对客户身份信息起到了很好的保护效果。5.5.金融综合数据共享金融综合数据共享 目前,各商业银行向当地人行报送金融明细数据和其他业务数据的频率较低,数据时效性难以保证,一方面导致人行不能进行高效监管,另一方面导致人行

73、向各商业银行的风险信息传递滞后,无法及时发现风险。商业银行进行尽调和风控时,希望拿到丰富的数据对客户更精准的画像,但出于数据隐私、安全、权属等方面的考虑,银行在传统模式下不愿、不敢与同业共享数据,导致商业银行进行风险预警研判时缺少重要的数据来源。由于缺乏一个能有效保护数据隐私的政银企数据互联通道,导致分散在不同地域、不同机构的金融数据价值未被充分释放,难以发挥数据价值服务于中小微企业融资、信用体系建设、普惠金融等领域。依托区块链技术底层基础设施,结合隐私计算等前沿技术,建设“基于区块链的省级金融数据交换平台”,打通省内金融同业数据、省内银政数据、跨省数据、省级与国家级数据共享通道,在保护各方数

74、据隐私的前提下,实现数据的“可用不可见共享”,48 充分释放数据价值,赋能金融业务场景。人行地方分支行通过省级平台归集来自地方政府和行业相关部门、地方性金融机构和其他机构的数据,对接人民银行数据交换管理平台进行数据上报。也支持接收来自人民银行数据交换管理平台的数据,数据的哈希、上报和接收的记录均被记录在区块链上存证。金融综合数据共享案例框架如图 10 所示。图 10 金融综合数据共享案例框架 6.6.面向线上信贷审批的数据匿踪查询面向线上信贷审批的数据匿踪查询 线上信贷业务具有单笔授信额度小、审批速度快、无需抵押担保、贷款期限短等特点,但业务增长的同时也带来了多头信贷风险。通常,多头借贷客户大

75、多存在资金困难、还款能力不足、逾期风险较高,因此,防止多头借贷是金融机构进行风险管控的必要措施。当前依赖人行征信查询和机构间信息共享的方法存在同业机构不愿、征信查询记录易受污染等痛点。针对现存场景痛 49 点,本案例使用基于隐匿查询的实现方案,提供了防范多头借贷的新措施。合作主要由协调方和成员方组成。银行方作为协调方,承担管控和中心协调网络转发职能。其他各银行作为合作成员,通过私有化部署的隐私计算节点实时查询其他成员数据,并提供查询服务。当客户到某联盟成员 A 申请贷款时,该成员会通过隐私计算方式查询该客户在所有联盟成员的借贷申请查询记录,成员 A可以基于该结果,结合内部的风控策略决定是否提供

76、贷款。本案例使用了秘密共享、不经意传输、隐私信息检索等隐私计算技术,通过中心节点转发成员之间的调用请求,做到查询成员与数据提供成员身份的互盲,一是被查询成员的借贷相关信息不出域,二是查询发起机构的用户信息保护,中心节点无法解密获取隐私信息。同时,所有参与成员必须经过中心协调方对成员的认证、审批,有效控制了数据质量受污染的情况,通过隐私计算的加持,缓解了客户借贷行为信息不愿共享的难题,保护数据隐私的同时实现了数据价值融合共创。50 六、总结与展望 金融行业天然具有鲜明的数字基因,数字驱动金融行业飞速发展,深刻影响着市场参与主体、数据交易市场发展形态、重塑金融服务格局等。鉴于金融行业在国民经济中的

77、枢纽地位,充分发挥金融的资源配置功能和专业服务优势,做好数据要素市场建设的支持者、规则的贡献者、交易的参与者,为加速实现数据要素市场化配置、打造我国数字经济新优势积极贡献金融力量。本报告立足金融行业的数据流通,提出了金融数据流通体系框架和全生命周期流程,为构建行业级数据流通交易平台、建立金融数据要素流通新模式提供金融方案,从而推动数据资源配置程序合规化、效率最大化和效能最优化,促进数据要素跨地区、跨机构、跨层级合规有序流通,为探索数据要素化路径提供金融实践经验,为推动数据要素市场生态加速发展发挥示范先行作用。金融行业与数据要素市场发展相辅相成。数据要素市场不断规范发展,有助于金融机构高效率进行

78、大规模的数据融合应用,实现风险管理实时化、决策支持智能化、资源配置精准化发展。金融行业参与、服务数据要素市场建设,同时,数据要素市场也是金融市场的重要组成部分,正如服务其他要素市场一样,金融机构将为数据要素流通市场提供包括直接相关的金融中介服务 51 和数据交易计费和支付结算,以及衍生的数据信用市场,如数据估值、数据抵押登记、数据银行、数据证券化、数据保险、数据信托、数据租赁等全方位、开创性的金融支持服务。未来,还需要深入探索金融数据流通交易的有效路径,促进金融市场与数据要素市场深度联动,助推我国数据要素市场生态繁荣,同时依法合规推动数据要素在金融领域的有序流通和高效应用,共同为我国经济高质量

79、发展提供驱动力,为数字经济创新发展提供新动能。52 附录:术语解释 数字经济(Digital Economy)数字经济是指以使用数字化的知识和信息作为关键生产要素、以现代信息网络作为重要载体、以信息通信技术的有效使用作为效率提升和经济结构优化的重要推动力的一系列经济活动。来源:二十国集团数字经济发展与合作倡议(2016)数据(Data)数据,是指任何以电子或者其他方式对信息的记录。来源:中华人民共和国数据安全法第三条 数据要素市场场(Data Elements Market)数据要素市场就是将尚未完全由市场配置的数据要素转向由市场配置的动态过程,其目的是形成以市场为根本调配机制,实现数据流动的

80、价值或者数据在流动中产生价值。来源:国家工业信息安全发展研究中心中国数据要素市场发展报告(20202021)数据资产资产化(Data Capitalization)对数据的采集、处理到利用并产生价值的过程就是数据资产化。来源:叶雅珍,刘国华,朱扬勇.数据资产化框架初探.大数据J,2020,6(3):2020019-1 数据流通(Data Flow)数据流通是某些信息系统中存储的数据作为流通对象,按照一定规则从供应方传递到需求方的过程。来源:中国信息通信研究院数据流通关键技术白皮书 1.0(2018)53 数据共享(Data Sharing)数据共享就是让在不同地方使用不同计算机、不同软件的用户能够读取他人数据并进行各种操作运算和分析。来源:百度百科 数据交易(Data Trading)大数据交易实质是以大数据为标的,双方订立买卖法律合同的商事交易。来源:陈炀.我国大数据交易的风险问题及规则的构建J.商情,2020,(2):198.数据安全(Data Security)数据安全,是指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。来源:中华人民共和国数据安全法第三条

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(北京金融科技产业联盟:2023金融数据要素流通技术与应用研究报告(59页).pdf)为本站 (伊人) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
会员动态
会员动态 会员动态:

 wei**n_... 升级为标准VIP   wei**n_... 升级为标准VIP 

wei**n_...  升级为至尊VIP 137**64... 升级为至尊VIP

139**41... 升级为高级VIP  Si**id  升级为至尊VIP

 180**14... 升级为标准VIP  138**48... 升级为高级VIP

 180**08...  升级为高级VIP wei**n_...  升级为标准VIP

wei**n_... 升级为高级VIP 136**67...  升级为标准VIP

136**08... 升级为标准VIP 177**34...  升级为标准VIP 

186**59... 升级为标准VIP 139**48... 升级为至尊VIP 

 wei**n_... 升级为标准VIP 188**95...  升级为至尊VIP 

 wei**n_...  升级为至尊VIP wei**n_... 升级为高级VIP 

 wei**n_... 升级为至尊VIP  微**... 升级为至尊VIP 

 139**01...  升级为高级VIP 136**15... 升级为至尊VIP 

jia**ia...  升级为至尊VIP  wei**n_... 升级为至尊VIP 

 183**14... 升级为标准VIP wei**n_... 升级为至尊VIP

 微**... 升级为高级VIP wei**n_... 升级为至尊VIP 

 Be**en 升级为至尊VIP 微**...   升级为高级VIP

186**86... 升级为高级VIP    Ji**n方... 升级为至尊VIP

 188**48... 升级为标准VIP wei**n_... 升级为高级VIP 

 iam**in... 升级为至尊VIP   wei**n_...  升级为标准VIP

 135**70... 升级为至尊VIP  199**28... 升级为高级VIP 

wei**n_... 升级为至尊VIP  wei**n_... 升级为标准VIP

 wei**n_... 升级为至尊VIP  火星**r... 升级为至尊VIP 

139**13... 升级为至尊VIP 186**69...  升级为高级VIP

 157**87...  升级为至尊VIP 鸿**...  升级为至尊VIP

 wei**n_... 升级为标准VIP 137**18...  升级为至尊VIP

wei**n_...  升级为至尊VIP  wei**n_...  升级为标准VIP

139**24... 升级为标准VIP   158**25... 升级为标准VIP 

wei**n_... 升级为高级VIP  188**60... 升级为高级VIP 

Fly**g ...  升级为至尊VIP  wei**n_... 升级为标准VIP

186**52...  升级为至尊VIP 布**  升级为至尊VIP

186**69...  升级为高级VIP wei**n_... 升级为标准VIP 

139**98... 升级为至尊VIP 152**90... 升级为标准VIP 

 138**98... 升级为标准VIP  181**96... 升级为标准VIP

 185**10... 升级为标准VIP wei**n_...   升级为至尊VIP

 高兴 升级为至尊VIP  wei**n_... 升级为高级VIP

wei**n_...  升级为高级VIP  阿**...  升级为标准VIP

wei**n_... 升级为高级VIP  lin**fe... 升级为高级VIP

wei**n_... 升级为标准VIP  wei**n_...  升级为高级VIP

wei**n_... 升级为标准VIP  wei**n_... 升级为高级VIP 

wei**n_...  升级为高级VIP  wei**n_... 升级为至尊VIP 

 wei**n_... 升级为高级VIP  wei**n_... 升级为高级VIP

180**21... 升级为标准VIP    183**36...  升级为标准VIP

 wei**n_... 升级为标准VIP wei**n_... 升级为标准VIP  

 xie**.g... 升级为至尊VIP 王** 升级为标准VIP 

172**75... 升级为标准VIP  wei**n_... 升级为标准VIP

  wei**n_... 升级为标准VIP   wei**n_... 升级为高级VIP

135**82...   升级为至尊VIP  130**18... 升级为至尊VIP

 wei**n_... 升级为标准VIP  wei**n_...  升级为至尊VIP

wei**n_... 升级为高级VIP   130**88... 升级为标准VIP

张川 升级为标准VIP  wei**n_... 升级为高级VIP