《上海数据集团&华为云:2023城市数据空间CDS白皮书(48页).pdf》由会员分享,可在线阅读,更多相关《上海数据集团&华为云:2023城市数据空间CDS白皮书(48页).pdf(48页珍藏版)》请在三个皮匠报告上搜索。
1、践行深度用云城市数据空间CDS白皮书版权所有 华为技术有限公司2023。保留一切权利。非经华为技术有限公司书面同意,任何单位和个人不得擅自摘抄、复制本手册内容的部分或全部,并不得以任何形式传播。免责声明商标声明 、华为、是华为技术有限公司商标或者注册商标。在本手册中以及本手册描述的产品中,出现的其它商标,产品名称,服务名称以及公司名称,由其各自的所有人拥有。本文档可能含有预测信息,包括但不限于有关未来的财务、运营、产品系列、新技术等信息。由于实践中存在很多不确定因素,可能导致实际结果与预测信息有很大的差别。因此,本文档信息仅供参考,不构成任何要约或承诺,华为不对您在本文档基础上做出的任何行为承
2、担责任。华为可能不经通知修改上述信息,恕不另行通知。扫码了解更多扫码获取电子版前言今世界,新一轮科技革命和产业变革深入发展、加速演进、裂变创新,开辟了人类生产生活新空间,拓展了社会治理的新疆域。近几年,以土地生产要素为主的城市经济增长动力逐步减弱,而数据成为继土地、劳动力、资本、技术之后的“第五个关键生产要素”,日益成为经济发展的新引擎。数据要素正在驱动构建数字敏捷型经济形态,重建模型化知识产品,重塑市场化信任规则,重构生态化共治规制。工业经济筑造了城市空间,数字经济将开创数据空间。像城市空间一样,数据空间要围绕数据要素高效合规流通,探索构建新生产关系,创造新权属、新信任、新规则、新基础设施、
3、新模式。长期以来,我国政府高度重视发展数字经济,将其上升为国家战略,提出加快建设数字中国,率先探索数字化转型之路。数据要素流通是培育数据要素市场的基本前提,是推动数字经济发展的必然要求和核心引擎,是促进数字政府持续长效运营、激活政府公共数据的社会化价值和市场化潜力重要手段。2023年10月,国家数据局正式挂牌掀开了我国数据要素市场化的序幕,进一步加快统筹全国统一的数据大市场建设。上海数据集团有限公司和华为技术有限公司联合编制本白皮书,在业内首次发布城市数据空间CDS(City Data Spaces)理念,利用各自在数据要素领域积累的经验,取长补短,在洞察分析国外数据空间和国内数据要素发展现状
4、基础上,提出城市数据空间的“2+1+1”的架构体系顶设,即制度和组织2个保障参考体系、1个基础设施、1个数据生态,并且在基础设施中进一步提出,构建城市数据空间基础设施的“1+4+2”统一基础架构,即1个城市数据底座,4个数据分层(数据资源、数据治理、数据资产和数据交易),以及2个治理框架(安全可信和合规可控),旨在鼓励行业内外各单位共同探讨,并推动在行业中形成统一的认知。F O R E W O R D当02编制委员会P R E P A R A T I O N C O M M I T T E E编 写 单 位编制委员会上海数据集团有限公司华为云计算技术有限公司上海数据集团有限公司:朱宗尧 李小山
5、 傅行晓 高晓丽 周 强 夏佳斌华为云计算技术有限公司:尚海峰 胡玉海 马 运 徐 俊 悦 怡 王 飞 刘鹏宇 方 芳 滕奉涛 高 卓 张志刚 季 亮 朱 杰 陈 勇 郭奕浩 郑 辉 宋晔志鹏 殷润悦前言今世界,新一轮科技革命和产业变革深入发展、加速演进、裂变创新,开辟了人类生产生活新空间,拓展了社会治理的新疆域。近几年,以土地生产要素为主的城市经济增长动力逐步减弱,而数据成为继土地、劳动力、资本、技术之后的“第五个关键生产要素”,日益成为经济发展的新引擎。数据要素正在驱动构建数字敏捷型经济形态,重建模型化知识产品,重塑市场化信任规则,重构生态化共治规制。工业经济筑造了城市空间,数字经济将开创
6、数据空间。像城市空间一样,数据空间要围绕数据要素高效合规流通,探索构建新生产关系,创造新权属、新信任、新规则、新基础设施、新模式。长期以来,我国政府高度重视发展数字经济,将其上升为国家战略,提出加快建设数字中国,率先探索数字化转型之路。数据要素流通是培育数据要素市场的基本前提,是推动数字经济发展的必然要求和核心引擎,是促进数字政府持续长效运营、激活政府公共数据的社会化价值和市场化潜力重要手段。2023年10月,国家数据局正式挂牌掀开了我国数据要素市场化的序幕,进一步加快统筹全国统一的数据大市场建设。上海数据集团有限公司和华为技术有限公司联合编制本白皮书,在业内首次发布城市数据空间CDS(Cit
7、y Data Spaces)理念,利用各自在数据要素领域积累的经验,取长补短,在洞察分析国外数据空间和国内数据要素发展现状基础上,提出城市数据空间的“2+1+1”的架构体系顶设,即制度和组织2个保障参考体系、1个基础设施、1个数据生态,并且在基础设施中进一步提出,构建城市数据空间基础设施的“1+4+2”统一基础架构,即1个城市数据底座,4个数据分层(数据资源、数据治理、数据资产和数据交易),以及2个治理框架(安全可信和合规可控),旨在鼓励行业内外各单位共同探讨,并推动在行业中形成统一的认知。F O R E W O R D当02编制委员会P R E P A R A T I O N C O M M
8、 I T T E E编 写 单 位编制委员会上海数据集团有限公司华为云计算技术有限公司上海数据集团有限公司:朱宗尧 李小山 傅行晓 高晓丽 周 强 夏佳斌华为云计算技术有限公司:尚海峰 胡玉海 马 运 徐 俊 悦 怡 王 飞 刘鹏宇 方 芳 滕奉涛 高 卓 张志刚 季 亮 朱 杰 陈 勇 郭奕浩 郑 辉 宋晔志鹏 殷润悦目录D I R E C T O R Y1.1 国外数据空间现状1.2 国内数据要素现状1.3 国内主要挑战国内外现状与主要挑战0105-102.1 城市数据空间的内涵2.2 城市数据空间的体系架构2.3 城市数据空间的制度参考体系2.4 城市数据空间的组织参考体系2.5 城市数
9、据空间的基础设施架构2.6 城市数据空间的数据生态2.7 城市数据空间的运行模式城市数据空间顶设与模式0211-363.1 上海数据集团城市数据空间实践3.2 某医疗集团数据可信流通探索实践3.3 华为产业数据空间探索实践最佳实践案例0337-42发展与展望0443-45目录D I R E C T O R Y1.1 国外数据空间现状1.2 国内数据要素现状1.3 国内主要挑战国内外现状与主要挑战0105-102.1 城市数据空间的内涵2.2 城市数据空间的体系架构2.3 城市数据空间的制度参考体系2.4 城市数据空间的组织参考体系2.5 城市数据空间的基础设施架构2.6 城市数据空间的数据生态
10、2.7 城市数据空间的运行模式城市数据空间顶设与模式0211-363.1 上海数据集团城市数据空间实践3.2 某医疗集团数据可信流通探索实践3.3 华为产业数据空间探索实践最佳实践案例0337-42发展与展望0443-45061.1 国外数据空间现状2、IDS数据空间IDS(International Data Spaces)是在欧洲数据战略下的最佳实践,是基于工业4.0下发展的子项目,随着更多的国家和组织参与进来,该项目上升为欧盟资助的重点项目。IDSA(Inter-national Data Spaces Association)协会已发展成员130多个,其中以欧洲企业为主,也包括微软、I
11、BM等美国企业,以及华为、海尔和信通院等中国企业和机构。IDS核心理念是欧洲的价值观和数据主权,即数据隐私保护和安全,提倡机会均等,确保数据创建者的数据主权和参与者之间的信任。通过IDS 1、欧洲数据战略欧洲长期存在数据挑战,依赖于谷歌、亚马逊、Facebook等提供的数字应用和服务,同时欧洲的云计算、人工智能、5G通信等关键基础技术发展也相对落后。在此背景下,欧洲已意识到其在数字经济所处的被动局面,于2020年2月发布塑造欧洲数字未来的数据战略,并陆续出台了通用数据保护条例、数字市场法、数字服务法等一系列政策和法律框架,致力于构建欧洲“数字主权”,增强数字创新能力。欧洲数据战略提出四大核心措
12、施:加强数据全周期治理、加大数据基础设施投资、赋能个人和中小企业,以及构建九大领域数据空间建设(制造、环保、移动、卫生、金融、能源、农业、公图1 IDS数据空间参考架构国内外现状与主要挑战BrokerClearing HouseData SpaceAPPData consumerAPP StoreIdentity Vocabulary ProviderConnectorIDS Data exchange and data processing along the data value chainData sharing in aDataAPPData ProviderUsage Policie
13、sUsage PoliciesConnectorIDS Data共管理、技能)。其中,数据空间作为核心概念,进一步拉动欧洲对安全、高效和可信的云基础设施投资建设。061.1 国外数据空间现状2、IDS数据空间IDS(International Data Spaces)是在欧洲数据战略下的最佳实践,是基于工业4.0下发展的子项目,随着更多的国家和组织参与进来,该项目上升为欧盟资助的重点项目。IDSA(Inter-national Data Spaces Association)协会已发展成员130多个,其中以欧洲企业为主,也包括微软、IBM等美国企业,以及华为、海尔和信通院等中国企业和机构。ID
14、S核心理念是欧洲的价值观和数据主权,即数据隐私保护和安全,提倡机会均等,确保数据创建者的数据主权和参与者之间的信任。通过IDS 1、欧洲数据战略欧洲长期存在数据挑战,依赖于谷歌、亚马逊、Facebook等提供的数字应用和服务,同时欧洲的云计算、人工智能、5G通信等关键基础技术发展也相对落后。在此背景下,欧洲已意识到其在数字经济所处的被动局面,于2020年2月发布塑造欧洲数字未来的数据战略,并陆续出台了通用数据保护条例、数字市场法、数字服务法等一系列政策和法律框架,致力于构建欧洲“数字主权”,增强数字创新能力。欧洲数据战略提出四大核心措施:加强数据全周期治理、加大数据基础设施投资、赋能个人和中小
15、企业,以及构建九大领域数据空间建设(制造、环保、移动、卫生、金融、能源、农业、公图1 IDS数据空间参考架构国内外现状与主要挑战BrokerClearing HouseData SpaceAPPData consumerAPP StoreIdentity Vocabulary ProviderConnectorIDS Data exchange and data processing along the data value chainData sharing in aDataAPPData ProviderUsage PoliciesUsage PoliciesConnectorIDS Da
16、ta共管理、技能)。其中,数据空间作为核心概念,进一步拉动欧洲对安全、高效和可信的云基础设施投资建设。4、欧洲模式主要特点IDS数据空间的核心理念是保护欧洲的数据主权,欧洲发布多部法律法规为数据保驾护航。基于统一的基础架构(GAIA-X+IDS),以及去中心化的数据交换模式,降低了使用成本和门槛,提升了中小企业的广泛参与。集中力量构建九大领域数据空间建设,为推进数据高效流通使用、赋能实体经济,提供了丰富的最佳实践。从技术到标准体系,全流程保障数据的安全可信,以及数据空间之间的平等互信、互操作性。工欲善其事,必先利其器。通过开发多种便捷灵3、IDS与GAIA-X组合2020年欧洲发布欧洲数字主权
17、报告,明确建设欧洲的下一代数字基础设施,建立数字主权的最高标准。由德国和法国联合倡议GAIA-X计划启动,GAIA-X遵循欧洲数据战略要求,致力于实现跨行业共享,避免数据孤岛,打造安全可靠的数据基础设施,培育开放的数据生态系统,以推动欧洲经济增长和创新。GAIA-X生态系统架构分为两个部分:数据生态系统和基础设施生态系统。两者构成了一个不可割裂的整体。联接两个生态系统的关键服务是联合服务,由身份与信任、合规、主权数据交换以及联合目录四个部分组成。GAIA-X和IDS形成一个完整的组合架构,GAIA-X专注于主权云服务和云基础设施,而IDS1.2 国内数据要素现状国内数据要素发展经历了预热阶段、
18、起步阶段、落地阶段,已进入深化阶段。1、国内数据要素政策进入体系化深化阶段2014年大数据首次写入政府工作报告以来,数据与实体经济不断融合加深,数字产业、数字应用等都飞速发展。2019年,十九届四中全会首次将数据列为新型生产要素,数据要素市场配置上升为国家战略,一批批关于构建更加完善的数据要素市场化配置体制机制的意见、“十四五”数字经济发展规划、关于构建数据基础制度更好发挥数据要素作用的意见等文件相继出台,数据要素政策体系架构初步形成,已进入体系化深化阶段。0807专注于数据和数据主权。GAIA-X和IDS相互补充和联合,以保护整个生态系统中端到端数据价值链的数据主权。数据空间,欧洲致力于建设
19、一个以用户为中心,独立于供应商的数据生态系统和市场,以低成本和低门槛方式向所有人开放,促进数据供需双方的连接。IDS数据空间参考架构定义了一个去中心化的数据生态系统,数据提供者和消费者之间通过Connector(可信连接器)进行数据的共享交换,连同Identity Provider(认证服务)、Broker(数据交易监管服务),Clearing House(结算服务),APP Store(应用商店服务)一起构成了完整的数据空间系统。IDS实现数据主权的核心技术是“使用控制”,数据供需双方配置相应的数据控制策略后,由Connector(可信连接器)负责执行,将数据的控制策略转化为形式化语言,与数
20、据内容一起流转到对端并执行控制。图2 GAIA-X生态系统架构图3 国内数据要素发展历程 GAIA-X联合服务身份与信任主权数据交换联合目录合规GAIA-X基础设施生态硬件节点规则&策略基础服务标准数据存储互操作性GAIA-X数据生态IDS数据空间数据消费者数据连接器数据清算数据提供者活的数据控制工具、数据可信连接器等,确保了欧洲数据战略的落地,也促进了IDS数据空间的推广,已成为广泛接受的产业标准。起步阶段落地阶段深化阶段NOW“大数据”开始成为热点2014年3月2015年8月2016年3月2016年12月2017年10月2019年10月2020年4月2020年4月2020年5月2021年3
21、月2022年12月2023年10月国家层面开始“大数据”顶层设计国家大数据战略从“数据大国”迈向“数据强国”大数据首次写入政府工作报告国务院印发促进大数据发展的行动纲要十三五规划纲要第二十七章“实施国家大数据战略”工信部发布大数据产业发展规划国务院办公厅公共数据资源开发利用试点方案数据要素市场化配置上升国家战略国务院关于新时代加快完善社会主义市场经济体制的意见提出“加快培育发展数据要素市场”十九届四中全会首次公开提出“数据可作为生产要素按贡献参与分配”中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要十九大报告提出“推动大数据与实体经济深度融合”国务院关于构建更加完善的要
22、素市场化配置体制机制的意见数据被正式列为新型生产要素预热阶段国家数据局正式挂牌中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见(数据二十条),为推动数据要素发展筑牢政策基础4、欧洲模式主要特点IDS数据空间的核心理念是保护欧洲的数据主权,欧洲发布多部法律法规为数据保驾护航。基于统一的基础架构(GAIA-X+IDS),以及去中心化的数据交换模式,降低了使用成本和门槛,提升了中小企业的广泛参与。集中力量构建九大领域数据空间建设,为推进数据高效流通使用、赋能实体经济,提供了丰富的最佳实践。从技术到标准体系,全流程保障数据的安全可信,以及数据空间之间的平等互信、互操作性。工欲善其事,必先
23、利其器。通过开发多种便捷灵3、IDS与GAIA-X组合2020年欧洲发布欧洲数字主权报告,明确建设欧洲的下一代数字基础设施,建立数字主权的最高标准。由德国和法国联合倡议GAIA-X计划启动,GAIA-X遵循欧洲数据战略要求,致力于实现跨行业共享,避免数据孤岛,打造安全可靠的数据基础设施,培育开放的数据生态系统,以推动欧洲经济增长和创新。GAIA-X生态系统架构分为两个部分:数据生态系统和基础设施生态系统。两者构成了一个不可割裂的整体。联接两个生态系统的关键服务是联合服务,由身份与信任、合规、主权数据交换以及联合目录四个部分组成。GAIA-X和IDS形成一个完整的组合架构,GAIA-X专注于主权
24、云服务和云基础设施,而IDS1.2 国内数据要素现状国内数据要素发展经历了预热阶段、起步阶段、落地阶段,已进入深化阶段。1、国内数据要素政策进入体系化深化阶段2014年大数据首次写入政府工作报告以来,数据与实体经济不断融合加深,数字产业、数字应用等都飞速发展。2019年,十九届四中全会首次将数据列为新型生产要素,数据要素市场配置上升为国家战略,一批批关于构建更加完善的数据要素市场化配置体制机制的意见、“十四五”数字经济发展规划、关于构建数据基础制度更好发挥数据要素作用的意见等文件相继出台,数据要素政策体系架构初步形成,已进入体系化深化阶段。0807专注于数据和数据主权。GAIA-X和IDS相互
25、补充和联合,以保护整个生态系统中端到端数据价值链的数据主权。数据空间,欧洲致力于建设一个以用户为中心,独立于供应商的数据生态系统和市场,以低成本和低门槛方式向所有人开放,促进数据供需双方的连接。IDS数据空间参考架构定义了一个去中心化的数据生态系统,数据提供者和消费者之间通过Connector(可信连接器)进行数据的共享交换,连同Identity Provider(认证服务)、Broker(数据交易监管服务),Clearing House(结算服务),APP Store(应用商店服务)一起构成了完整的数据空间系统。IDS实现数据主权的核心技术是“使用控制”,数据供需双方配置相应的数据控制策略后
26、,由Connector(可信连接器)负责执行,将数据的控制策略转化为形式化语言,与数据内容一起流转到对端并执行控制。图2 GAIA-X生态系统架构图3 国内数据要素发展历程 GAIA-X联合服务身份与信任主权数据交换联合目录合规GAIA-X基础设施生态硬件节点规则&策略基础服务标准数据存储互操作性GAIA-X数据生态IDS数据空间数据消费者数据连接器数据清算数据提供者活的数据控制工具、数据可信连接器等,确保了欧洲数据战略的落地,也促进了IDS数据空间的推广,已成为广泛接受的产业标准。起步阶段落地阶段深化阶段NOW“大数据”开始成为热点2014年3月2015年8月2016年3月2016年12月2
27、017年10月2019年10月2020年4月2020年4月2020年5月2021年3月2022年12月2023年10月国家层面开始“大数据”顶层设计国家大数据战略从“数据大国”迈向“数据强国”大数据首次写入政府工作报告国务院印发促进大数据发展的行动纲要十三五规划纲要第二十七章“实施国家大数据战略”工信部发布大数据产业发展规划国务院办公厅公共数据资源开发利用试点方案数据要素市场化配置上升国家战略国务院关于新时代加快完善社会主义市场经济体制的意见提出“加快培育发展数据要素市场”十九届四中全会首次公开提出“数据可作为生产要素按贡献参与分配”中华人民共和国国民经济和社会发展第十四个五年规划和2035年
28、远景目标纲要十九大报告提出“推动大数据与实体经济深度融合”国务院关于构建更加完善的要素市场化配置体制机制的意见数据被正式列为新型生产要素预热阶段国家数据局正式挂牌中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见(数据二十条),为推动数据要素发展筑牢政策基础10092、“数据二十条”为推动数据要素发展筑牢政策基础2022年12月,国家“数据二十条”发布,明确了数据基础制度体系的基本架构,提出建立保障权益、合规使用的数据产权制度,建立合规高效、场内外结合的数据要素流通和交易制度,建立体现效率、促进公平的数据要素收益分配制度,建立安全可控、弹性包容的数据要素治理制度。在“数据二十条”的
29、指导下各地各部门不断完善相关制度体系和配套政策,制定相关细则。3、数据局组建推动数据要素统筹管理和协调发展2023年初党和国家机构改革方案提出组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等工作。国家数据局的组建有利于破除“九龙治水”的数据治理环境,平衡数据要素安全和发展的辩证关系,从而进一步推动数据要素的统筹规划,推进多层次数据要素市场建设。4、上海进一步明确加快构筑数据要素体系重点工作缺数据,高价值数据更缺,数据入场难对政府公共数据来说,国家层面还没有明确公共数据的开放范围,有些数据不能给;有些数据质量参差不齐,
30、担心使用后承担风险,数据不敢给。同时,有些数据维护政府需要投入经费保障,额外带来较大工作量,数据不想给。对于企业数据来说,政府行业部门缺少指导,担心合规风险,数据不能给;没有安全交易渠道,担心数据泄露和扩散,数据不愿给。对于个人数据,缺少相关法律政策指导,隐私数据不敢用。有些稀缺数据,数据资源来源垄断,1.3 国内主要挑战上海围绕“经济、生活、治理”三大领域,全面推进城市数字化转型,深入贯彻网络强国、数字中国、智慧社会战略部署,落实党中央、国务院决策部署,践行“人民城市人民建,人民城市为人民”重要理念,按照上海市数据条例和中共上海市委、上海市政府关于全面推进上海城市数字化转型的意见上海市促进城
31、市数字化转型的若干政策措施等文件精神,加快实现超大城市治理体系和治理能力现代化。缺少可替代方案。总体上,国内市场不仅缺少数据,更缺少高价值数据,以及相关的数据供需方的利益保障机制。缺治理,高质量数据更缺,闭环监管难数据要素缺少有效治理,有些数据入市后缺乏可靠的质量保障措施,无法快速响应新场景和新需求。数据要素的高效流通依赖于数据的高质量供给,而系统化的数据治理是高质量数据的必要保障,当前我们治理能力和水平参差不齐,基本还处在数据规范的可管可控阶段,缺少在数据安全保障、数据分类分级、数据融合加工、数据分析应用、数据质量提升、数据产品开发等方面的深化治理,缺少数据治理的标准要求和考核体系,缺少数据
32、质量的监管、跟踪、反馈、完善的闭环机制,缺少税收、法律等配套体系的建立,形成完整的监管服务流程。缺标准,实施细则待探索,供需互信难目前多个省市已发布数据条例,以地方性立法的形式明确开展公共数据授权运营,如北京市公共数据专区授权运营管理办法、浙江省公共数据授权运营管理办法等,但国家层面暂时没有“公共数据”、“企业数据”和“个人数据”的细则规定或指导意见,在数据要素市场供需双方互信不足,落地过程中涉及的法律、税收等诸多细则还有待探索和实践,导致各地实施的方案流派不同,比如公共数据,有的地方纳入政务平台的数据开放体系,与政务数据共平台运营;有的地方单独建设数据开放体系,政务数据只是其中一种数据资源来
33、源,各种落地方式不同。缺工具,数据权益待保护,数据确权难由于数据具有低成本、易复制等特点,数据参与主体多元化、使用场景多样化,使得数据要素权益保障变得复杂。数据供需双方在数据使用上,缺少工具来落实公共数据、企业数据和个人数据的不同权益保障,以及不同权益下的数据使用策略,包括数据的使用时间、访问权限、使用频次等。工具的安全性和操作便捷性,将大幅度降低用户进入市场的门槛,促进数据要素市场的用户参与规模。缺生态,生态环境待培育,创新驱动难在数据开发方面,手中掌握一定规模数据的企业,并具备开发能力的各类“数商”,各自占山为王,生态封闭。在数据消费方面,政府与企业在数字化转型中,有大量的ToB、ToC应
34、用场景,但缺少对数据业务创新的动力,偏好零风险的成功实践。在人才供给上,高校科研机构,因缺少仿真“数据要素实训环境”,数据类人才供给缓慢,创新人才不足。总体上,缺少生态培育土壤、场景创新机制,需要数据提供方、场景应用方、数据监管方、技术服务方以及法律合规机构等共同积极参与,稳步构建覆盖数据要素流通各环节、全链条的市场生态环境。图4 国内主要挑战“五缺”缺数据缺治理缺标准缺工具缺生态国内主要挑战“五缺”高价值数据更缺数据入场难高质量数据更缺闭环监管难实施细则待探索供需互信难数据权益待保护数据确权难生态环境待培育创新驱动难10092、“数据二十条”为推动数据要素发展筑牢政策基础2022年12月,国
35、家“数据二十条”发布,明确了数据基础制度体系的基本架构,提出建立保障权益、合规使用的数据产权制度,建立合规高效、场内外结合的数据要素流通和交易制度,建立体现效率、促进公平的数据要素收益分配制度,建立安全可控、弹性包容的数据要素治理制度。在“数据二十条”的指导下各地各部门不断完善相关制度体系和配套政策,制定相关细则。3、数据局组建推动数据要素统筹管理和协调发展2023年初党和国家机构改革方案提出组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等工作。国家数据局的组建有利于破除“九龙治水”的数据治理环境,平衡数据要素安全和
36、发展的辩证关系,从而进一步推动数据要素的统筹规划,推进多层次数据要素市场建设。4、上海进一步明确加快构筑数据要素体系重点工作缺数据,高价值数据更缺,数据入场难对政府公共数据来说,国家层面还没有明确公共数据的开放范围,有些数据不能给;有些数据质量参差不齐,担心使用后承担风险,数据不敢给。同时,有些数据维护政府需要投入经费保障,额外带来较大工作量,数据不想给。对于企业数据来说,政府行业部门缺少指导,担心合规风险,数据不能给;没有安全交易渠道,担心数据泄露和扩散,数据不愿给。对于个人数据,缺少相关法律政策指导,隐私数据不敢用。有些稀缺数据,数据资源来源垄断,1.3 国内主要挑战上海围绕“经济、生活、
37、治理”三大领域,全面推进城市数字化转型,深入贯彻网络强国、数字中国、智慧社会战略部署,落实党中央、国务院决策部署,践行“人民城市人民建,人民城市为人民”重要理念,按照上海市数据条例和中共上海市委、上海市政府关于全面推进上海城市数字化转型的意见上海市促进城市数字化转型的若干政策措施等文件精神,加快实现超大城市治理体系和治理能力现代化。缺少可替代方案。总体上,国内市场不仅缺少数据,更缺少高价值数据,以及相关的数据供需方的利益保障机制。缺治理,高质量数据更缺,闭环监管难数据要素缺少有效治理,有些数据入市后缺乏可靠的质量保障措施,无法快速响应新场景和新需求。数据要素的高效流通依赖于数据的高质量供给,而
38、系统化的数据治理是高质量数据的必要保障,当前我们治理能力和水平参差不齐,基本还处在数据规范的可管可控阶段,缺少在数据安全保障、数据分类分级、数据融合加工、数据分析应用、数据质量提升、数据产品开发等方面的深化治理,缺少数据治理的标准要求和考核体系,缺少数据质量的监管、跟踪、反馈、完善的闭环机制,缺少税收、法律等配套体系的建立,形成完整的监管服务流程。缺标准,实施细则待探索,供需互信难目前多个省市已发布数据条例,以地方性立法的形式明确开展公共数据授权运营,如北京市公共数据专区授权运营管理办法、浙江省公共数据授权运营管理办法等,但国家层面暂时没有“公共数据”、“企业数据”和“个人数据”的细则规定或指
39、导意见,在数据要素市场供需双方互信不足,落地过程中涉及的法律、税收等诸多细则还有待探索和实践,导致各地实施的方案流派不同,比如公共数据,有的地方纳入政务平台的数据开放体系,与政务数据共平台运营;有的地方单独建设数据开放体系,政务数据只是其中一种数据资源来源,各种落地方式不同。缺工具,数据权益待保护,数据确权难由于数据具有低成本、易复制等特点,数据参与主体多元化、使用场景多样化,使得数据要素权益保障变得复杂。数据供需双方在数据使用上,缺少工具来落实公共数据、企业数据和个人数据的不同权益保障,以及不同权益下的数据使用策略,包括数据的使用时间、访问权限、使用频次等。工具的安全性和操作便捷性,将大幅度
40、降低用户进入市场的门槛,促进数据要素市场的用户参与规模。缺生态,生态环境待培育,创新驱动难在数据开发方面,手中掌握一定规模数据的企业,并具备开发能力的各类“数商”,各自占山为王,生态封闭。在数据消费方面,政府与企业在数字化转型中,有大量的ToB、ToC应用场景,但缺少对数据业务创新的动力,偏好零风险的成功实践。在人才供给上,高校科研机构,因缺少仿真“数据要素实训环境”,数据类人才供给缓慢,创新人才不足。总体上,缺少生态培育土壤、场景创新机制,需要数据提供方、场景应用方、数据监管方、技术服务方以及法律合规机构等共同积极参与,稳步构建覆盖数据要素流通各环节、全链条的市场生态环境。图4 国内主要挑战
41、“五缺”缺数据缺治理缺标准缺工具缺生态国内主要挑战“五缺”高价值数据更缺数据入场难高质量数据更缺闭环监管难实施细则待探索供需互信难数据权益待保护数据确权难生态环境待培育创新驱动难城市数据空间顶设与模式2.1 城市数据空间的内涵1、理念城市数据空间是城市发展的高阶演进和新引擎人口、活动和空间是城市发展的三个基本要素,人口发展推动了社会活动,社会活动扩大了城市空间,从而推动城市发展不断演进。从农业社会、工业社会到当今数字社会,城市空间也从单个地理中心往城市群/城市带高阶发展,比如长三角、京津冀、粤港澳大湾区城市群等。数字社会释放了城市海量数据,也开辟出了城市数据新空间。城市数据量从TB到PB级海量
42、持续增加,使数据成为城市的“石油能源”、“信息高速公路”。从海量数据中挖掘的数据要素价值,激发了更大的经济和社会价值,成为城市发展的新引擎。城市数据空间是践行城市数据战略的重要举措数字化和科技创新作为先进生产力,打破了城市空间的时空限制,城市智能化、共享化、信息化重构了时空关系,在传统“地理空间”的基础上形成了“要素流动空间”。一般来说,超大和特大级城市作为城市资源要素流动的关键枢纽,承担了70%以上的要素流动,突显出了城市级的数据战略意义。城市数据空间是促进城市数据要素高效合规流通的重要基石城市数据空间提供城市数据要素高质量供给和交易能力,不断推动数据要素的高效合规流通,成为城市数字的重要基
43、石。城市数据空间包括公共数据空间、行业数据空间、企业数据空间和个人数据空间,这些空间场景不同,但遵循统一的城市数据空间规范体系和服务能力。图5 城市数据空间理念展、强化数字关键能力、优化数字发展环境。作为重要参考和借鉴,我们可以勾勒出城市数据空间的4个主要特征:数据生态系统人口活动空间城市城市群/带国家全球城市城市群/带国家全球城市数据空间是践行城市数据战略的重要举措城市数据空间理念组织体系制度体系数据基础设施维维维维维度度度度度nn321+1土地经济 工业社会工业经济数字新产业数字化变革数字社会 数字经济农业社会要素流动空间地理空间科技创新、数字化驱动12城市数据空间顶设与模式2.1 城市数
44、据空间的内涵1、理念城市数据空间是城市发展的高阶演进和新引擎人口、活动和空间是城市发展的三个基本要素,人口发展推动了社会活动,社会活动扩大了城市空间,从而推动城市发展不断演进。从农业社会、工业社会到当今数字社会,城市空间也从单个地理中心往城市群/城市带高阶发展,比如长三角、京津冀、粤港澳大湾区城市群等。数字社会释放了城市海量数据,也开辟出了城市数据新空间。城市数据量从TB到PB级海量持续增加,使数据成为城市的“石油能源”、“信息高速公路”。从海量数据中挖掘的数据要素价值,激发了更大的经济和社会价值,成为城市发展的新引擎。城市数据空间是践行城市数据战略的重要举措数字化和科技创新作为先进生产力,打
45、破了城市空间的时空限制,城市智能化、共享化、信息化重构了时空关系,在传统“地理空间”的基础上形成了“要素流动空间”。一般来说,超大和特大级城市作为城市资源要素流动的关键枢纽,承担了70%以上的要素流动,突显出了城市级的数据战略意义。城市数据空间是促进城市数据要素高效合规流通的重要基石城市数据空间提供城市数据要素高质量供给和交易能力,不断推动数据要素的高效合规流通,成为城市数字的重要基石。城市数据空间包括公共数据空间、行业数据空间、企业数据空间和个人数据空间,这些空间场景不同,但遵循统一的城市数据空间规范体系和服务能力。图5 城市数据空间理念展、强化数字关键能力、优化数字发展环境。作为重要参考和
46、借鉴,我们可以勾勒出城市数据空间的4个主要特征:数据生态系统人口活动空间城市城市群/带国家全球城市城市群/带国家全球城市数据空间是践行城市数据战略的重要举措城市数据空间理念组织体系制度体系数据基础设施维维维维维度度度度度nn321+1土地经济 工业社会工业经济数字新产业数字化变革数字社会 数字经济农业社会要素流动空间地理空间科技创新、数字化驱动1214132、“五可”原则城市数据空间的数据要素,遵循“五可”原则:“可发现、可访问、可开发、可共享、可流通”。城市数据空间的4个主要特征城市数据空间是城市数字化转型的具体表现和关键路径。数字中国发展报告提出数字化的四个方面建设:夯实数字底座、全面赋能
47、经济发可发现:如何让数据消费者在城市数据空间中,可快速高效地找到想要的数据,无论是通过场景找数据,还是通过主题汇聚数据,最终实现数据要素供需方的发现和连接?当前简单数据目录已图6 城市数据空间的4个主要特征图7“五可”原则展、强化数字关键能力、优化数字发展环境。作为重要参考和借鉴,我们可以勾勒出城市数据空间的4个主要特征:经不能再满足城市级大规模应用的需求,需要结合AI关键能力,从场景化自然语言转换、多语义关联到大模型数据聚合等技术,实现基于数据地图模式的自助问答、自动发现能力。可发现是推广城市数据要素的可获得性的关键能力。可访问:数据消费者找到所需的数据后,可快速、可便捷地访问数据。基于通用
48、的数据安全基础上,首先要确保可访问数据的可信、可控能力,基于全流程、全生命周期的可信可控是可访问的关键基础,包括数字身份可认证,数据不可篡改,访问操作可审计追溯等;也包括基于数据安全合规、数据权益保障的前提下的访问权限、访问范围等策略控制。尤其,需要解决跨多个认证体系的联合认证问题。打造坚实的城市数据空间可信可控能力,需要经历千锤百炼的锻造,数据所在的安全环境重要性远比数据本身价值意义更大,一旦风险泄露,数据价值将可能全部失去。可开发:城市数据空间的强大生命力,在于它的开放性,需要构建一个庞大的数据生态系统,但落地到技术层面,主要是数据的可开发性。需要站在开发者角度,从开发的全流程剖析,明确各
49、个阶段数据的开发对象、开发方式、开发环境、开发赋能等。可开发周期内容,仍要遵循数据的合规使用,涉及测试数据申请、销毁、范围控制等处理。提供简便快速的开发套件,测试沙箱等模块,加快数据产品的行业场景应用。可共享:城市数据空间的数据共享,是基于安全可信的数据共享基础设施。围绕数据全生命周期,对数据的登记、离线、消亡等不同阶段采取不同策略,包括使用时间、次数、方式等控制,对数据使用进行更精细化的管理。可流通:数据进入到流通环节,才能发挥出市场配置作用,数据的可流通性是城市数据空间的发展动力,必须加强对数据资产化,数据产品化和城市数据空间具备完善的制度体系保障,为城市数据空间的发展,提供法律法规保障,
50、加强立法体系化建设,建立公平公正的城市数据运行环境。城市数据空间具备完善的组织体系保障,有清晰的组织架构、明确的组织目标,统筹协调各个部门工作,有例行的联席工作组运作,进行工作推进和问题升级,通过自身不断的组织优化匹配城市数据空间的发展。城市数据空间具备先进的数据基础设施,以安全可信可控为关键基础,提供城市数据的共享交换基础服务,位于数据空间中的企业和个人能够获取其他参与者提供的数据,并在数据共享中获益。数据生态系统数据基础设施制度体系组织体系城市数据空间具备丰富的数据生态系统,共同以城市数据空间为起点,以发展和繁荣城市数据产业为目标,由数据提供方、数据消费方、数据经纪方、数据开发方等各参与方
51、,一起联合构建一个全新的城市级数据生态系统,以数据要素市场化配置为驱动力,推动城市数据高价值高质量释放。数据商品化的流通环节打通,支撑商业生态系统的数据要素流通。3、重要意义(一)促进数据要素高效合规流通,提升城市运作效率城市数据空间实现数据要素的开放与共享,为数据要素汇集、资源整合提供解决方案能力,有助于推进城市数据资源的开发利用与价值实现。同时,城市数据空间有助于提升政府治理水平与服务效能。政府通过与企业、社会组织等深入合作,实现基于跨部门、跨行业的数据统筹管理,有助于提升城市在公共交通、医疗、教育、文化及政务服务等各领域的公共服务水平。(二)激发城市数据效能,打造城市经济繁荣的新引擎城市
52、数据空间推动数字经济和实体经济深度融合,是推动各类要素快速流动、各类市场主体深度合作、各类场景融合创新的新引擎。城市数据空间促进市场体系中生产、分配、流通、消费各环节有机衔接,促进产业全要素的互联互通,增强经济发展动力,畅通经济循环,实现产业链韧性生产和健康发展。(三)提升城市智能化水平,推进城市智慧化进程城市数据空间通过运用AI城市模型赋能、多元数据要素融合、多样场景数据贯通等手段,推动智慧医疗、智慧金融、智慧出行、智慧物流等智慧化进程,打造城市智能体,提升城市运行效率,让城市像生命体一样更加智能。通过数智融合,加快数据的智能监测、预测、控制等手段,解决城市发展所面临的问题,为城市的可持续发
53、展开辟新的道路。城市数据空间数据要素“五可”原则可发现可访问可开发可共享可流通14132、“五可”原则城市数据空间的数据要素,遵循“五可”原则:“可发现、可访问、可开发、可共享、可流通”。城市数据空间的4个主要特征城市数据空间是城市数字化转型的具体表现和关键路径。数字中国发展报告提出数字化的四个方面建设:夯实数字底座、全面赋能经济发可发现:如何让数据消费者在城市数据空间中,可快速高效地找到想要的数据,无论是通过场景找数据,还是通过主题汇聚数据,最终实现数据要素供需方的发现和连接?当前简单数据目录已图6 城市数据空间的4个主要特征图7“五可”原则展、强化数字关键能力、优化数字发展环境。作为重要参
54、考和借鉴,我们可以勾勒出城市数据空间的4个主要特征:经不能再满足城市级大规模应用的需求,需要结合AI关键能力,从场景化自然语言转换、多语义关联到大模型数据聚合等技术,实现基于数据地图模式的自助问答、自动发现能力。可发现是推广城市数据要素的可获得性的关键能力。可访问:数据消费者找到所需的数据后,可快速、可便捷地访问数据。基于通用的数据安全基础上,首先要确保可访问数据的可信、可控能力,基于全流程、全生命周期的可信可控是可访问的关键基础,包括数字身份可认证,数据不可篡改,访问操作可审计追溯等;也包括基于数据安全合规、数据权益保障的前提下的访问权限、访问范围等策略控制。尤其,需要解决跨多个认证体系的联
55、合认证问题。打造坚实的城市数据空间可信可控能力,需要经历千锤百炼的锻造,数据所在的安全环境重要性远比数据本身价值意义更大,一旦风险泄露,数据价值将可能全部失去。可开发:城市数据空间的强大生命力,在于它的开放性,需要构建一个庞大的数据生态系统,但落地到技术层面,主要是数据的可开发性。需要站在开发者角度,从开发的全流程剖析,明确各个阶段数据的开发对象、开发方式、开发环境、开发赋能等。可开发周期内容,仍要遵循数据的合规使用,涉及测试数据申请、销毁、范围控制等处理。提供简便快速的开发套件,测试沙箱等模块,加快数据产品的行业场景应用。可共享:城市数据空间的数据共享,是基于安全可信的数据共享基础设施。围绕
56、数据全生命周期,对数据的登记、离线、消亡等不同阶段采取不同策略,包括使用时间、次数、方式等控制,对数据使用进行更精细化的管理。可流通:数据进入到流通环节,才能发挥出市场配置作用,数据的可流通性是城市数据空间的发展动力,必须加强对数据资产化,数据产品化和城市数据空间具备完善的制度体系保障,为城市数据空间的发展,提供法律法规保障,加强立法体系化建设,建立公平公正的城市数据运行环境。城市数据空间具备完善的组织体系保障,有清晰的组织架构、明确的组织目标,统筹协调各个部门工作,有例行的联席工作组运作,进行工作推进和问题升级,通过自身不断的组织优化匹配城市数据空间的发展。城市数据空间具备先进的数据基础设施
57、,以安全可信可控为关键基础,提供城市数据的共享交换基础服务,位于数据空间中的企业和个人能够获取其他参与者提供的数据,并在数据共享中获益。数据生态系统数据基础设施制度体系组织体系城市数据空间具备丰富的数据生态系统,共同以城市数据空间为起点,以发展和繁荣城市数据产业为目标,由数据提供方、数据消费方、数据经纪方、数据开发方等各参与方,一起联合构建一个全新的城市级数据生态系统,以数据要素市场化配置为驱动力,推动城市数据高价值高质量释放。数据商品化的流通环节打通,支撑商业生态系统的数据要素流通。3、重要意义(一)促进数据要素高效合规流通,提升城市运作效率城市数据空间实现数据要素的开放与共享,为数据要素汇
58、集、资源整合提供解决方案能力,有助于推进城市数据资源的开发利用与价值实现。同时,城市数据空间有助于提升政府治理水平与服务效能。政府通过与企业、社会组织等深入合作,实现基于跨部门、跨行业的数据统筹管理,有助于提升城市在公共交通、医疗、教育、文化及政务服务等各领域的公共服务水平。(二)激发城市数据效能,打造城市经济繁荣的新引擎城市数据空间推动数字经济和实体经济深度融合,是推动各类要素快速流动、各类市场主体深度合作、各类场景融合创新的新引擎。城市数据空间促进市场体系中生产、分配、流通、消费各环节有机衔接,促进产业全要素的互联互通,增强经济发展动力,畅通经济循环,实现产业链韧性生产和健康发展。(三)提
59、升城市智能化水平,推进城市智慧化进程城市数据空间通过运用AI城市模型赋能、多元数据要素融合、多样场景数据贯通等手段,推动智慧医疗、智慧金融、智慧出行、智慧物流等智慧化进程,打造城市智能体,提升城市运行效率,让城市像生命体一样更加智能。通过数智融合,加快数据的智能监测、预测、控制等手段,解决城市发展所面临的问题,为城市的可持续发展开辟新的道路。城市数据空间数据要素“五可”原则可发现可访问可开发可共享可流通城市数据空间体系架构由四个部分组成(2+1+1):首先是2个保障参考体系(制度参考体系和组织参考体系),其中,制度参考体系从立法和法规角度,发布城市数据空间相关政策制度,构建从地方数据条例、管理
60、办法、实施细则到地方标准的四位一体式法规体系,提供全方位保障。组织参考体系,从地方数据局到协同各级责任主体及标准委员会,形成清晰的组织架构保障。其次是1个基础设施,基础上设施不是我们传统讲的计算、存储和通讯基础设施,数据基础设施是新型的基础设施,主要解决数据找得到,在哪里,可流通,可信任的问题。最后是1个数据生态,包括参与到数据要素全生命周期流通里面的所有参与方,以及为这些参与方构建起来的生态培育环境。城市数据空间体系架构的四个组成部分,相互依赖又有机协同。制度和组织参考体系是空气和水分,基础设施是肥沃的黑土地,数据生态是繁荣的枝叶,数据要素高效合规流通是经脉主干道。2.2 城市数据空间的体系
61、架构上海长三角区域长三角区域全球全球中国中国基础设施组织制度城市数据空间合法合规|公平公正职责明确|高效协同2.3 城市数据空间的制度参考体系当前各省市已陆续推出数据要素的相关政策规定,以制度化管理推动数据要素的合法使用和开发利用,比如上海发布上海数据条例、公共数据授权运营管理办法、公共数据开放实施细则。总体上看,城市数据空间制度体系采用四位一体(地方性法规、地方政府规章、地方规范性文件、地方标准)方式进行构建,其中地方性法规定地方总体政策原则和法律规范,对有关数据要素活动各方的法律责任进行详细规定。地方政府规章依据地方性法规定地方策略和规范,明确数据要素活动各方的职责范围、工作推进方式等。地
62、方规范性文件针对落地过程中实施细则或实施方案,地方因地制宜做出针对性规范要求,地方标准规定地方的数据要素活动相关标准规范。图9 城市数据空间的制度体系国家相关政策发文4位一体(法规、规章、规范性文件、标准),统筹协同地方性法规(如上海数据条例)地方政府规章(如上海市公共数据共享实施办法(试行))地方规范性文件(如上海市公共数据开放实施细则)地方标准图8 城市数据空间体系架构1615城市数据空间的制度参考体系数据要素高效合规流通数据生态零售汽车教育社交工业电商煤矿金融游戏政府医疗城市数据空间体系架构由四个部分组成(2+1+1):首先是2个保障参考体系(制度参考体系和组织参考体系),其中,制度参考
63、体系从立法和法规角度,发布城市数据空间相关政策制度,构建从地方数据条例、管理办法、实施细则到地方标准的四位一体式法规体系,提供全方位保障。组织参考体系,从地方数据局到协同各级责任主体及标准委员会,形成清晰的组织架构保障。其次是1个基础设施,基础上设施不是我们传统讲的计算、存储和通讯基础设施,数据基础设施是新型的基础设施,主要解决数据找得到,在哪里,可流通,可信任的问题。最后是1个数据生态,包括参与到数据要素全生命周期流通里面的所有参与方,以及为这些参与方构建起来的生态培育环境。城市数据空间体系架构的四个组成部分,相互依赖又有机协同。制度和组织参考体系是空气和水分,基础设施是肥沃的黑土地,数据生
64、态是繁荣的枝叶,数据要素高效合规流通是经脉主干道。2.2 城市数据空间的体系架构上海长三角区域长三角区域全球全球中国中国基础设施组织制度城市数据空间合法合规|公平公正职责明确|高效协同2.3 城市数据空间的制度参考体系当前各省市已陆续推出数据要素的相关政策规定,以制度化管理推动数据要素的合法使用和开发利用,比如上海发布上海数据条例、公共数据授权运营管理办法、公共数据开放实施细则。总体上看,城市数据空间制度体系采用四位一体(地方性法规、地方政府规章、地方规范性文件、地方标准)方式进行构建,其中地方性法规定地方总体政策原则和法律规范,对有关数据要素活动各方的法律责任进行详细规定。地方政府规章依据地
65、方性法规定地方策略和规范,明确数据要素活动各方的职责范围、工作推进方式等。地方规范性文件针对落地过程中实施细则或实施方案,地方因地制宜做出针对性规范要求,地方标准规定地方的数据要素活动相关标准规范。图9 城市数据空间的制度体系国家相关政策发文4位一体(法规、规章、规范性文件、标准),统筹协同地方性法规(如上海数据条例)地方政府规章(如上海市公共数据共享实施办法(试行))地方规范性文件(如上海市公共数据开放实施细则)地方标准图8 城市数据空间体系架构1615城市数据空间的制度参考体系数据要素高效合规流通数据生态零售汽车教育社交工业电商煤矿金融游戏政府医疗图12 城市数据空间的基础设施架构1817
66、2.5 城市数据空间的基础设施架构1、统一基础架构(1+4+2)城市数据空间基础设施的统一基础架构,包括1个城市数据底座,4个数据分层(数据资源、数据治理、数据资产和数据交易),以及2个治理框架(安全可信和合规可控)。1个城市数据底座:打造城市级数据交换的可信可控坚实底座。4个数据分层:围绕数据全生命周期,数据分层治理,精细化管理。2个治理框架:数据安全可信治理、数据合规可控治理。城市数据空间基础设施涵盖了城市全场景数据的接入、治理、开发、流通、应用五个领域,通过汇聚各方数据,提供“采-治-算-流-用”全生命周期的支撑能力,构建全方位的数据流通体系。合规可控图11 城市数据空间的组织职能组织架
67、构是城市数据空间体系建立和持续运行的基本保障,各个职能主体的功能范围参考如下:图10 城市数据空间的组织参考体系国家数据局某数据局“一局”数据标准化技术委员会市、区大数据中心“一中心”数据集团“一集团”城市数据空间的组织参考体系围绕“采集、归集、治理、应用、安全、运营”的数据全生命周期,规划标准体系、打破部门“数据孤岛”,实现互联互通,从而推动政务服务从“群众跑腿”向数据跑路”转变。负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字城市、数字经济规划和建设;推动数据要素的市场化、价值化,推动数据条例、数据管理办法。落实以政务数据为主的公共数据归集、共享开放;联合各个行业
68、主管部门进行公共数据治理、监管,提升公共数据质量。构建数据要素市场、激发数据要素潜能、保障数据安全;作为城市数据空间建设、运营主体,承担城市数据要素的授权运营;围绕数字产业化、产业数字化以及数据生态领域开展布局,成为城市数据要素交汇、供给、配置的核心枢纽。数据标准化技术委员会数据集团数据局大数据中心1个底座+4个数据分层(数据资源、数据治理、数据资产、数据交易)+2个治理框架(安全可信、合规可控)数据资产入表“一数标委”2.4 城市数据空间的组织参考体系城市数据空间的组织体系有清晰明确的组织框架,可参考为:“一局、一中心、一集团、一数标委”。图12 城市数据空间的基础设施架构18172.5 城
69、市数据空间的基础设施架构1、统一基础架构(1+4+2)城市数据空间基础设施的统一基础架构,包括1个城市数据底座,4个数据分层(数据资源、数据治理、数据资产和数据交易),以及2个治理框架(安全可信和合规可控)。1个城市数据底座:打造城市级数据交换的可信可控坚实底座。4个数据分层:围绕数据全生命周期,数据分层治理,精细化管理。2个治理框架:数据安全可信治理、数据合规可控治理。城市数据空间基础设施涵盖了城市全场景数据的接入、治理、开发、流通、应用五个领域,通过汇聚各方数据,提供“采-治-算-流-用”全生命周期的支撑能力,构建全方位的数据流通体系。合规可控图11 城市数据空间的组织职能组织架构是城市数
70、据空间体系建立和持续运行的基本保障,各个职能主体的功能范围参考如下:图10 城市数据空间的组织参考体系国家数据局某数据局“一局”数据标准化技术委员会市、区大数据中心“一中心”数据集团“一集团”城市数据空间的组织参考体系围绕“采集、归集、治理、应用、安全、运营”的数据全生命周期,规划标准体系、打破部门“数据孤岛”,实现互联互通,从而推动政务服务从“群众跑腿”向数据跑路”转变。负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字城市、数字经济规划和建设;推动数据要素的市场化、价值化,推动数据条例、数据管理办法。落实以政务数据为主的公共数据归集、共享开放;联合各个行业主管部门进
71、行公共数据治理、监管,提升公共数据质量。构建数据要素市场、激发数据要素潜能、保障数据安全;作为城市数据空间建设、运营主体,承担城市数据要素的授权运营;围绕数字产业化、产业数字化以及数据生态领域开展布局,成为城市数据要素交汇、供给、配置的核心枢纽。数据标准化技术委员会数据集团数据局大数据中心1个底座+4个数据分层(数据资源、数据治理、数据资产、数据交易)+2个治理框架(安全可信、合规可控)数据资产入表“一数标委”2.4 城市数据空间的组织参考体系城市数据空间的组织体系有清晰明确的组织框架,可参考为:“一局、一中心、一集团、一数标委”。2017图13 城市区块链平台 2、城市数据底座孤立的数据价值
72、并不显著,只有当数据像水一样流动起来,才能打破“数据壁垒”,最大化释放其价值。然而当前企业保存下来的数据,由于技术与流动性问题,只有10%的数据能得到分析,数据孤岛、多样性设备、业务迁移成为数据“流不动”的主要瓶颈。产生上述问题的根本原因在于,企业在建设数据基础设施时,从满足客户的诉求出发并考虑投资成本问题,会选择不同的计算资源、网络资源和存储资源来分别满足客户的不同诉求,各类定制化的需求配置导致数据孤岛的产生。城市数据底座作为城市数据空间基础设施,采用集约化建设和管理的重要方法和手段,向下能提高资源利用率,向上能作为能力层提供计算、存储、大数据分析、人工智能等统一服务。充分利用云计算的先进技
73、术,按照“集约高效、共享开放、安全可靠、按需服务”的原则,以“云网合一、云数联动”为技术构架,构建物理分散、逻辑统一、开放兼容的城市数据底座。城市数据底座,包括城市存算融合平台、城市区块链平台、城市隐私计算平台、城市数字信任平台和城市数智融合平台。城市存算融合云平台存储、服务器、网络是基础设施城市数据底座的重要组成,数据存得好、算力算得快、网络传得稳,数据底座才能充分发挥数据的要素价值。数据生命周期的起点是将采集的数据进行存储,从而给数据处理和应用提供原材料。产生的各类数据与物理世界完成交互后,最终处理的结果又回到数据存储进行保存,提升模型、算法的精确性和可用性。城市存算融合平台支撑存储和计算
74、的融合优化,包括交易型数据与生产型存储相融合,提升性能增强可靠性;数据分析与分析型存储融合,提高效率提升准确性。在存储层,通过重定义存储架构,将块、文件、对象、HDFS等多种存储服务融合,打通数据孤岛,解决多样性数据存储和共享问题;在算力层,通过将数据库、大数据、AI多引擎融合分析和多样性算力统一调度,降低海量数据处理难度,实现高效分析;在管理层,通过将AI融入存储全生命周期管理,从资源规划、业务发放、系统调优、风险预测、故障定位等方面实现智能运维,从容应对数千节点规模的复杂管理。城市区块链平台 随着城市数据交易体系逐步完善,政府对政务服务流程、改善营商环境的力度不断加大,市民和企业对数据价值
75、的期待也越来越高。跨企业、部门协同和数据互认最多的是公共数据,企业数据仍是流通的关键环节和主要难点。由于政府部门、企事业单位原有系统众多、分散建设,跨企业、部门之间缺乏有效协同机制,难以真正实现业务协同;此外,各企事业单位数据在原有共享机制下无明确标识和校验,也无法记录数据共享后是否被篡改,难以真正做到“数据互认”。同时,也需要一个统一办理调度平台,在安全环境中打通各企业、部门业务流程,让企事业间的数据可灵活共享调用与可信互认,实现“身份通、数据通、事项通”,最终“业务通”。因此,区块链技术的“不可篡改、共享账本、全程可追溯”等特点,符合城市数据空间中的信息公开、安全互信等需求。同时,使用区块
76、链的非对称式加密技术、公私钥机制来确保公众及政府部门的数据资产安全,可以解决数据开放共享所衍生的信息安全问题,消除各方对隐私泄露的顾虑,保证数据存储与安全的“权责清晰”,又实现在各企业、政府单位之间数据实时共享互认与灵活调用。按照“基础设施统一建设和运营,应用系统独立运行和管理”模式,城市区块链平台可基于开源区块链技术,并结合分布式并行计算、容器、数据管理、安全加密等核心技术,支撑城市数字化增强能力政务金融港口物流制造医疗.可信共享计算沙箱分布式身份跨链服务基础能力联盟管理节点管理用户管理运维监控告警日志分布式账本共识机制合约引擎机密机制轻节点应用场景城市区块链平台2017图13 城市区块链平
77、台 2、城市数据底座孤立的数据价值并不显著,只有当数据像水一样流动起来,才能打破“数据壁垒”,最大化释放其价值。然而当前企业保存下来的数据,由于技术与流动性问题,只有10%的数据能得到分析,数据孤岛、多样性设备、业务迁移成为数据“流不动”的主要瓶颈。产生上述问题的根本原因在于,企业在建设数据基础设施时,从满足客户的诉求出发并考虑投资成本问题,会选择不同的计算资源、网络资源和存储资源来分别满足客户的不同诉求,各类定制化的需求配置导致数据孤岛的产生。城市数据底座作为城市数据空间基础设施,采用集约化建设和管理的重要方法和手段,向下能提高资源利用率,向上能作为能力层提供计算、存储、大数据分析、人工智能
78、等统一服务。充分利用云计算的先进技术,按照“集约高效、共享开放、安全可靠、按需服务”的原则,以“云网合一、云数联动”为技术构架,构建物理分散、逻辑统一、开放兼容的城市数据底座。城市数据底座,包括城市存算融合平台、城市区块链平台、城市隐私计算平台、城市数字信任平台和城市数智融合平台。城市存算融合云平台存储、服务器、网络是基础设施城市数据底座的重要组成,数据存得好、算力算得快、网络传得稳,数据底座才能充分发挥数据的要素价值。数据生命周期的起点是将采集的数据进行存储,从而给数据处理和应用提供原材料。产生的各类数据与物理世界完成交互后,最终处理的结果又回到数据存储进行保存,提升模型、算法的精确性和可用
79、性。城市存算融合平台支撑存储和计算的融合优化,包括交易型数据与生产型存储相融合,提升性能增强可靠性;数据分析与分析型存储融合,提高效率提升准确性。在存储层,通过重定义存储架构,将块、文件、对象、HDFS等多种存储服务融合,打通数据孤岛,解决多样性数据存储和共享问题;在算力层,通过将数据库、大数据、AI多引擎融合分析和多样性算力统一调度,降低海量数据处理难度,实现高效分析;在管理层,通过将AI融入存储全生命周期管理,从资源规划、业务发放、系统调优、风险预测、故障定位等方面实现智能运维,从容应对数千节点规模的复杂管理。城市区块链平台 随着城市数据交易体系逐步完善,政府对政务服务流程、改善营商环境的
80、力度不断加大,市民和企业对数据价值的期待也越来越高。跨企业、部门协同和数据互认最多的是公共数据,企业数据仍是流通的关键环节和主要难点。由于政府部门、企事业单位原有系统众多、分散建设,跨企业、部门之间缺乏有效协同机制,难以真正实现业务协同;此外,各企事业单位数据在原有共享机制下无明确标识和校验,也无法记录数据共享后是否被篡改,难以真正做到“数据互认”。同时,也需要一个统一办理调度平台,在安全环境中打通各企业、部门业务流程,让企事业间的数据可灵活共享调用与可信互认,实现“身份通、数据通、事项通”,最终“业务通”。因此,区块链技术的“不可篡改、共享账本、全程可追溯”等特点,符合城市数据空间中的信息公
81、开、安全互信等需求。同时,使用区块链的非对称式加密技术、公私钥机制来确保公众及政府部门的数据资产安全,可以解决数据开放共享所衍生的信息安全问题,消除各方对隐私泄露的顾虑,保证数据存储与安全的“权责清晰”,又实现在各企业、政府单位之间数据实时共享互认与灵活调用。按照“基础设施统一建设和运营,应用系统独立运行和管理”模式,城市区块链平台可基于开源区块链技术,并结合分布式并行计算、容器、数据管理、安全加密等核心技术,支撑城市数字化增强能力政务金融港口物流制造医疗.可信共享计算沙箱分布式身份跨链服务基础能力联盟管理节点管理用户管理运维监控告警日志分布式账本共识机制合约引擎机密机制轻节点应用场景城市区块
82、链平台图14 城市隐私计算平台图15 城市数字信任平台21转型。面向政务、数据交易、司法、征信、溯源、供应链、金融等领域提供PaaS服务,实现城市区块链应用的规范化开发部署和集约化建设运营,确保整体合规性和安全性。城市隐私计算平台随着数据融合需求日益迫切,保障数据要素持有者权益是实现数据要素有效开发利用的关键。然而,传统隐私保护技术无法保护数据在计算过程中的隐私安全,难以保障数据要素持有者权益不受损害。隐私计算技术因能在保护数据隐私同时开发利用数据价值,备受各界广泛关注。隐私计算是指在保护平台上各类数据本身不对外泄露的前提下,实现数据共享、分析、计算、建模的技术集合,达到数据“可用不可见”的目
83、的。在充分保护平台数据和隐私安全的前提下,实现数据价值的转化和释放。目前常见的技术路线主要有三种,即多方安全计算(Secure Multi-party Computation,MPC)、联邦学习(Federated Learning,FL)、可信执行环境(Trusted Execution Environment,TEE)。城市隐私计算平台融合大数据跨源查询、机器学习、多方安全计算、可信硬件等功能,逐步推动建立隐私计算联盟,提供联邦分析、联邦学习、联邦预测等各类功能,提供安全沙箱、同态加密、减分隐私、安全聚合,确保原始数据“可用不可见”,并为不同参与方机构包括城市数据集团、大数据中心、监管机构
84、、审计机构、社会面机构(如银行、电信或其他数据提供方)部署隐私计算节点,支持配置数据源、执行作业等操作。城市数字信任平台城市数字信任平台通过数字化技术、智能算法模型和制度规则体系,构建安全、便捷、合规、高效的统一身份管理和统一身份认证体系。整合部署在本地或云端的各业务系统的所有数字身份,可实现一个可信身份凭证打通所有应用系统,一次认证,处处可用,并提供统一的数字证书的分发与管理,为物理世界的个人、组织、智能终端、程序等各类实体与其数字空间中的数字孪生体(数字市民、数字政府、数字组织和数字资产等)的映射提供信任担保,以触发数字孪生体间的数据交换行为。通过提供分布式身份,以数字身份卡包等APP、小
85、程序为载体,自主管理自己的身份和授权,对原本分散在各大互联网平台/系统中的数字身份进行归集,让身份的控制权回归用户,保护用户隐私和身份主权,并提供法人、自然人本身的电子证照、属性身份管理、展示与核验的服务能力。城市数字信任平台可以支撑城市数据空间构建完整的数字身份安全体系,包括:统一身份管理:覆盖各类组织/机构、个人、物、应用等实体身份认证体系的延伸和升级,面向平台中的一切联网实体提供“安全、中立、权威”的智能化数字身份服务。统一身份认证:构建多维身份验证机制,提供完整的面向法人、自然人的身份认证服务能力,提供数字身份管理能力。可信身份凭证:根据业务场景要求,提供法人、自然人相关联的数字信息、
86、电子证照等关联数据,或经相关运算输出与个人身份相关的匿名化或去标识化等各类可信身份凭证。分布式数字身份:以数字身份卡包的形式,支持APP前端界面展示与集成,提供身份管理、认22普惠金融政务数据开放产业互联联邦分析联邦学习隐私计算联盟安全聚合节点可信计算节点可信计算节点可信计算节点申报材料|流水纳税|资产交易|信用公共信任域参与方信任域企业政府个人.密码学沙箱MPC机密计算TEE密文最终服务对象法人、自然人数据需求方数据开发利用方数据监管方分布式身份身份认证授权签署身份凭证电子证照数字证书身份认证授权核验身份凭证数字签名证照核验安全审计身份认证授权核验身份凭证数字签名身份关联安全审计授权核验签名
87、核验安全审计公共数据授权运营服务平台最终对象服务模组数据使用服务模组数据运营服务模组统一身份管理统一身份认证可信身份凭证分布式身份数字证书数据授权、汇聚、存储、加工、流通各个环节及相关软硬件能力支撑服务能力分布式数字身份子系统支撑能力组织架构身份管理身份核验单点登录数据授权运营方平台运营方数据提供方(公共数据)法人自然人物应用数据提供方(国资国企)身份认证加密传输数据提供方(社会数据)身份认证加密传输身份认证加密传输图14 城市隐私计算平台图15 城市数字信任平台21转型。面向政务、数据交易、司法、征信、溯源、供应链、金融等领域提供PaaS服务,实现城市区块链应用的规范化开发部署和集约化建设运
88、营,确保整体合规性和安全性。城市隐私计算平台随着数据融合需求日益迫切,保障数据要素持有者权益是实现数据要素有效开发利用的关键。然而,传统隐私保护技术无法保护数据在计算过程中的隐私安全,难以保障数据要素持有者权益不受损害。隐私计算技术因能在保护数据隐私同时开发利用数据价值,备受各界广泛关注。隐私计算是指在保护平台上各类数据本身不对外泄露的前提下,实现数据共享、分析、计算、建模的技术集合,达到数据“可用不可见”的目的。在充分保护平台数据和隐私安全的前提下,实现数据价值的转化和释放。目前常见的技术路线主要有三种,即多方安全计算(Secure Multi-party Computation,MPC)、
89、联邦学习(Federated Learning,FL)、可信执行环境(Trusted Execution Environment,TEE)。城市隐私计算平台融合大数据跨源查询、机器学习、多方安全计算、可信硬件等功能,逐步推动建立隐私计算联盟,提供联邦分析、联邦学习、联邦预测等各类功能,提供安全沙箱、同态加密、减分隐私、安全聚合,确保原始数据“可用不可见”,并为不同参与方机构包括城市数据集团、大数据中心、监管机构、审计机构、社会面机构(如银行、电信或其他数据提供方)部署隐私计算节点,支持配置数据源、执行作业等操作。城市数字信任平台城市数字信任平台通过数字化技术、智能算法模型和制度规则体系,构建安
90、全、便捷、合规、高效的统一身份管理和统一身份认证体系。整合部署在本地或云端的各业务系统的所有数字身份,可实现一个可信身份凭证打通所有应用系统,一次认证,处处可用,并提供统一的数字证书的分发与管理,为物理世界的个人、组织、智能终端、程序等各类实体与其数字空间中的数字孪生体(数字市民、数字政府、数字组织和数字资产等)的映射提供信任担保,以触发数字孪生体间的数据交换行为。通过提供分布式身份,以数字身份卡包等APP、小程序为载体,自主管理自己的身份和授权,对原本分散在各大互联网平台/系统中的数字身份进行归集,让身份的控制权回归用户,保护用户隐私和身份主权,并提供法人、自然人本身的电子证照、属性身份管理
91、、展示与核验的服务能力。城市数字信任平台可以支撑城市数据空间构建完整的数字身份安全体系,包括:统一身份管理:覆盖各类组织/机构、个人、物、应用等实体身份认证体系的延伸和升级,面向平台中的一切联网实体提供“安全、中立、权威”的智能化数字身份服务。统一身份认证:构建多维身份验证机制,提供完整的面向法人、自然人的身份认证服务能力,提供数字身份管理能力。可信身份凭证:根据业务场景要求,提供法人、自然人相关联的数字信息、电子证照等关联数据,或经相关运算输出与个人身份相关的匿名化或去标识化等各类可信身份凭证。分布式数字身份:以数字身份卡包的形式,支持APP前端界面展示与集成,提供身份管理、认22普惠金融政
92、务数据开放产业互联联邦分析联邦学习隐私计算联盟安全聚合节点可信计算节点可信计算节点可信计算节点申报材料|流水纳税|资产交易|信用公共信任域参与方信任域企业政府个人.密码学沙箱MPC机密计算TEE密文最终服务对象法人、自然人数据需求方数据开发利用方数据监管方分布式身份身份认证授权签署身份凭证电子证照数字证书身份认证授权核验身份凭证数字签名证照核验安全审计身份认证授权核验身份凭证数字签名身份关联安全审计授权核验签名核验安全审计公共数据授权运营服务平台最终对象服务模组数据使用服务模组数据运营服务模组统一身份管理统一身份认证可信身份凭证分布式身份数字证书数据授权、汇聚、存储、加工、流通各个环节及相关软
93、硬件能力支撑服务能力分布式数字身份子系统支撑能力组织架构身份管理身份核验单点登录数据授权运营方平台运营方数据提供方(公共数据)法人自然人物应用数据提供方(国资国企)身份认证加密传输数据提供方(社会数据)身份认证加密传输身份认证加密传输2423证、证照、授权等服务能力,保证数据真实可信、保护用户隐私安全、可移植性强、去中心化,让个人能自主管理本人身份。数字证书:根据组织/机构、个人、物、应用的身份管理、发放、核验相应的数字证书。城市数智融合平台数据从产生到发挥要素价值的过程困难且漫长,包括数据采集、数据存储、数据处理加工、数据流通、数据分析、数据应用等,每一个过程都充满大大小小的挑战。“AI+数
94、据”双轮驱动,是解决数据从要素到用起来、实现数据价值化鸿沟的重要策略。城市数智融合平台把这些系统和高价值的数据统一、融合起来进行高效治理,以充分发挥AI的能力,有效地实现降本增效。通过整合所有云原生数据湖的组件,包括大数据、AI、数据仓库等一系列的处理引擎,让引擎之间的元数据进行统一管理,为上层业务开发者提供更方便的使用。通过统一元数据工具,可以把多种多样数据处理引擎的基础元数据进行精细管理,实现统一权限控制,统一事务机制,统一数据索引。同时湖仓一体化构建,将数据真正无缝地衔接在一起形成统一数据湖。融合AI人工智能,将进一步释放数据价值,一站式AI开发生产线,让原来认知、感知、决策这一系列的A
95、I复杂功能得到极大简,构建起面向未来数据和智能融合的一个基础基石。3、数据资源层数据资源是释放数据要素价值的“原材料”。随着数字经济的迅猛发展,各类主体在生产、经营、管理、服务、消费等过程中产生大量数据。在推进数据开发利用、释放数据价值过程中,不同类型数据面临不同的重点任务与关键问题,分类推进数据要素探索已成为当前共识。按照数据资源相关权益归属的不同,将数据分为公共数据、企业数据、个人数据三大类型,提出“建立公共数据、企业数据、个人数据的分类分级确权授权制度”,突出不同类型的重点关切,探寻相应的突破方向。公共数据公共数据是在各级党政机关、企事业单位依法履职,或提供公共服务过程中产生的数据。公共
96、数据不仅包含来自政务体系的数据,还包括来自公共事业的数据(包括科研、教育、文化、供水、供电、公交等公共事业)。公共数据,归国家或全民所有,由政府或其他公共部门代为行使管理、开放等职责。在保障国家安全、商业秘密安全、个人信息安全的前提下,通过公共数据的授权运营模式进行市场化运营,是城市公共数据汇聚、开发和价值释放的主要路径。公共数据授权主体依托公共数据运营服务平台,为各数据要素参与方,提供技术、工具、和增值开发服务,加速公共数据的市场化利用。目前,公共数据已在金融行业的风险洞察、信用评估等领域发挥价值。在各地陆续出台的公共数据授权运营实施方案中,也不断提出在健康医疗、交通运输、商贸物流、工业制造
97、、社会治理、生态环保、教育、体育、文旅、科研等更多领域,充分释放公共数据价值。企业数据企业在开展业务、提供服务和进行日常经营管理中,产生了各类数据,尤其是处于数字化转型进程中的现代化企业,积累了海量数据资源,特别是互联网、金融、先进制造等行业。现代企业利用数据湖仓等技术,进行企业数据管理,这些数据经过不同程度的加工、整理与分析,形成了企业数据资产。这些数据资产是企业进行丰富的数据应用、参与数据要素流通的基础。数据资源富集的企业,在产业链上下游的数据融通提效、精准营销、用户画像、线上线下体验提升等领域,发挥着重要作用。数据综合能力强的企业,除供给数据资源外,还利用数据服务能力,提供综合性数据产品
98、与解决方案。这些数据产品和数据服务,共同构成了企业数据要素的流通形态。个人数据个人在城市工作、生活中,在不同的工具使用和服务过程中,产生的了大量个人数据,其中不乏像医疗、出行等许多具有较高商业利用价值的数图16 城市数智融合平台数据湖统一存储 HDFS|对象存储2423证、证照、授权等服务能力,保证数据真实可信、保护用户隐私安全、可移植性强、去中心化,让个人能自主管理本人身份。数字证书:根据组织/机构、个人、物、应用的身份管理、发放、核验相应的数字证书。城市数智融合平台数据从产生到发挥要素价值的过程困难且漫长,包括数据采集、数据存储、数据处理加工、数据流通、数据分析、数据应用等,每一个过程都充
99、满大大小小的挑战。“AI+数据”双轮驱动,是解决数据从要素到用起来、实现数据价值化鸿沟的重要策略。城市数智融合平台把这些系统和高价值的数据统一、融合起来进行高效治理,以充分发挥AI的能力,有效地实现降本增效。通过整合所有云原生数据湖的组件,包括大数据、AI、数据仓库等一系列的处理引擎,让引擎之间的元数据进行统一管理,为上层业务开发者提供更方便的使用。通过统一元数据工具,可以把多种多样数据处理引擎的基础元数据进行精细管理,实现统一权限控制,统一事务机制,统一数据索引。同时湖仓一体化构建,将数据真正无缝地衔接在一起形成统一数据湖。融合AI人工智能,将进一步释放数据价值,一站式AI开发生产线,让原来
100、认知、感知、决策这一系列的AI复杂功能得到极大简,构建起面向未来数据和智能融合的一个基础基石。3、数据资源层数据资源是释放数据要素价值的“原材料”。随着数字经济的迅猛发展,各类主体在生产、经营、管理、服务、消费等过程中产生大量数据。在推进数据开发利用、释放数据价值过程中,不同类型数据面临不同的重点任务与关键问题,分类推进数据要素探索已成为当前共识。按照数据资源相关权益归属的不同,将数据分为公共数据、企业数据、个人数据三大类型,提出“建立公共数据、企业数据、个人数据的分类分级确权授权制度”,突出不同类型的重点关切,探寻相应的突破方向。公共数据公共数据是在各级党政机关、企事业单位依法履职,或提供公
101、共服务过程中产生的数据。公共数据不仅包含来自政务体系的数据,还包括来自公共事业的数据(包括科研、教育、文化、供水、供电、公交等公共事业)。公共数据,归国家或全民所有,由政府或其他公共部门代为行使管理、开放等职责。在保障国家安全、商业秘密安全、个人信息安全的前提下,通过公共数据的授权运营模式进行市场化运营,是城市公共数据汇聚、开发和价值释放的主要路径。公共数据授权主体依托公共数据运营服务平台,为各数据要素参与方,提供技术、工具、和增值开发服务,加速公共数据的市场化利用。目前,公共数据已在金融行业的风险洞察、信用评估等领域发挥价值。在各地陆续出台的公共数据授权运营实施方案中,也不断提出在健康医疗、
102、交通运输、商贸物流、工业制造、社会治理、生态环保、教育、体育、文旅、科研等更多领域,充分释放公共数据价值。企业数据企业在开展业务、提供服务和进行日常经营管理中,产生了各类数据,尤其是处于数字化转型进程中的现代化企业,积累了海量数据资源,特别是互联网、金融、先进制造等行业。现代企业利用数据湖仓等技术,进行企业数据管理,这些数据经过不同程度的加工、整理与分析,形成了企业数据资产。这些数据资产是企业进行丰富的数据应用、参与数据要素流通的基础。数据资源富集的企业,在产业链上下游的数据融通提效、精准营销、用户画像、线上线下体验提升等领域,发挥着重要作用。数据综合能力强的企业,除供给数据资源外,还利用数据
103、服务能力,提供综合性数据产品与解决方案。这些数据产品和数据服务,共同构成了企业数据要素的流通形态。个人数据个人在城市工作、生活中,在不同的工具使用和服务过程中,产生的了大量个人数据,其中不乏像医疗、出行等许多具有较高商业利用价值的数图16 城市数智融合平台数据湖统一存储 HDFS|对象存储2625据。目前,个人数据大多由政府公共部门和平台型企业实际持有,个人对不同类型个人数据的掌控能力均有限,如何有效保障个人的隐私和权益,仍然是目前个人数据的焦点。在个人信息保护法施行前,大量个人数据被“一揽子授权”,个人在使用服务过程中可能需要提供许多与服务无关的数据。个人信息保护法规定了个人数据收集与处理的
104、最小必要原则和单独同意原则,实现了初步的个人数据分级、分步骤授权模式。未来,在遵循相关法规和用户意愿、保护数据隐私和安全的基础上,以更简洁清晰的开发利用场景,更加细化、完备的数据要素分级授权体系,实现个人对数据处理范围的高效控制,是城市个人数据流通利用的重要方向。多元数据融合在具体业务场景中的数据类型,实际往往不是单个类型的数据要素,更多的是公共数据、企业数据和个人数据的组合,即多元数据要素融合。多元数据要素融合,有助于进一步发挥出市场数据要素的潜力,甚至开辟出新的市场增长机会。数据要素在运用过程中,可以和金融、信用、医疗、制造、物流等数据深度融合,通过数字化进一步实现市场供需匹配,涌现如普惠
105、金融、普惠医疗、智慧出行等一批批创新场景,从而增加要素使用机会并提升配置效率,创造更高的市场价值。数据要素在促进其他要素使用效率提高的同时,也能够通过打破信息壁垒,为各种要素之间的优化组合与合理配置创造有利条件,促进市场主体间的协同创新,提升城市经济的发展水平。4、数据治理层数据治理基本框架城市数据空间的数据治理是指以区域为单位对城市发展有价值的信息进行识别、收集和组织,建立管理、服务和运营体系,以实现城市管理者及数据使用者对数据可视、可管和可用的需求。其特点在于数据来源多样、网络环境复杂、利益相关方众多、应用场景不断涌现等。因此,城市数据空间的数据治理需要管理和技术相结合,实现各管理组织、规
106、划、制度、流程、标准等工作中的协调性和一致性。在整体数据治理工作中,基本框架如下:城市数据空间数据治理的核心活动包括元数据管理与资源资产编目、数据标准管理、数据质量管理、数据分类分级、数据安全管理、以及AI数据工程建设等几大方面。这些活动能够有效地提高数据质量和可用性,从而提升城市管理水平,并推动城市发展。城市数据空间主要承载城市区域范围内的公共数图18 数据治理基础内容公共数据特性要求加大供给进一步提升质量高效共享企业数据特性要求明确量化规则明确价值评估规则个人数据特性要求安全合规隐私计算高效共享数据治理基础内容(共性要求)数据标准元数据与编目数据质量数据分类分级数据安全AI数据工程图17
107、数据治理的基本框架城市数据空间数据使用者城市数据空间治理需求方数据可视数据可管数据可用城市数据空间服务运营者城市数据空间治理成果数据交换数据共享数据交易AI训练推理.城市数据空间数据治理核心活动元数据与编目数据标准数据质量数据分类分级数据安全AI数据工程城市数据空间数据提供者公共数据企业数据个人数据城市数据治理服务提供方咨询系统工具运维其他.治理成果提出需求提供支持反馈意见提供服务提供数据指导监督满足需求据、企业数据和个人数据,因此,城市数据空间的治理有别于传统企业、政府数据治理,而需要兼顾三类数据需求,既要支持传统数据分析消费,又要提供用于AI训练的高质量语料数据。2625据。目前,个人数据
108、大多由政府公共部门和平台型企业实际持有,个人对不同类型个人数据的掌控能力均有限,如何有效保障个人的隐私和权益,仍然是目前个人数据的焦点。在个人信息保护法施行前,大量个人数据被“一揽子授权”,个人在使用服务过程中可能需要提供许多与服务无关的数据。个人信息保护法规定了个人数据收集与处理的最小必要原则和单独同意原则,实现了初步的个人数据分级、分步骤授权模式。未来,在遵循相关法规和用户意愿、保护数据隐私和安全的基础上,以更简洁清晰的开发利用场景,更加细化、完备的数据要素分级授权体系,实现个人对数据处理范围的高效控制,是城市个人数据流通利用的重要方向。多元数据融合在具体业务场景中的数据类型,实际往往不是
109、单个类型的数据要素,更多的是公共数据、企业数据和个人数据的组合,即多元数据要素融合。多元数据要素融合,有助于进一步发挥出市场数据要素的潜力,甚至开辟出新的市场增长机会。数据要素在运用过程中,可以和金融、信用、医疗、制造、物流等数据深度融合,通过数字化进一步实现市场供需匹配,涌现如普惠金融、普惠医疗、智慧出行等一批批创新场景,从而增加要素使用机会并提升配置效率,创造更高的市场价值。数据要素在促进其他要素使用效率提高的同时,也能够通过打破信息壁垒,为各种要素之间的优化组合与合理配置创造有利条件,促进市场主体间的协同创新,提升城市经济的发展水平。4、数据治理层数据治理基本框架城市数据空间的数据治理是
110、指以区域为单位对城市发展有价值的信息进行识别、收集和组织,建立管理、服务和运营体系,以实现城市管理者及数据使用者对数据可视、可管和可用的需求。其特点在于数据来源多样、网络环境复杂、利益相关方众多、应用场景不断涌现等。因此,城市数据空间的数据治理需要管理和技术相结合,实现各管理组织、规划、制度、流程、标准等工作中的协调性和一致性。在整体数据治理工作中,基本框架如下:城市数据空间数据治理的核心活动包括元数据管理与资源资产编目、数据标准管理、数据质量管理、数据分类分级、数据安全管理、以及AI数据工程建设等几大方面。这些活动能够有效地提高数据质量和可用性,从而提升城市管理水平,并推动城市发展。城市数据
111、空间主要承载城市区域范围内的公共数图18 数据治理基础内容公共数据特性要求加大供给进一步提升质量高效共享企业数据特性要求明确量化规则明确价值评估规则个人数据特性要求安全合规隐私计算高效共享数据治理基础内容(共性要求)数据标准元数据与编目数据质量数据分类分级数据安全AI数据工程图17 数据治理的基本框架城市数据空间数据使用者城市数据空间治理需求方数据可视数据可管数据可用城市数据空间服务运营者城市数据空间治理成果数据交换数据共享数据交易AI训练推理.城市数据空间数据治理核心活动元数据与编目数据标准数据质量数据分类分级数据安全AI数据工程城市数据空间数据提供者公共数据企业数据个人数据城市数据治理服务
112、提供方咨询系统工具运维其他.治理成果提出需求提供支持反馈意见提供服务提供数据指导监督满足需求据、企业数据和个人数据,因此,城市数据空间的治理有别于传统企业、政府数据治理,而需要兼顾三类数据需求,既要支持传统数据分析消费,又要提供用于AI训练的高质量语料数据。2827运维元数据元数据质量管理元数据运营分析元数据API管理元模型管理采集元数据CDHiSales.结构化数据非结构化数据产生元数据公共数据企业数据个人数据消费元数据元数据查询/搜索元数据血缘分析元数据影响分析数据标准合规检查元数据中心管理流程管理规范图19 元数据管理架构注册元数据存量增量业务、技术、操作元数据图20 数据一张图数据从哪
113、里来数据源持有权金融公共数据汇聚、联接、开放、共享制造科技医疗交通能源教育环境个人数据采存&算管用数据资产视图:将原始数据资源治理为高质量、高价值的数据资产,利用数据资产视图提升数据产品开发效率1数据专区/集市医疗专区空间交通专区空间金融专区空间公共专区空间公共产品城市治理社区网格交通产品交通大脑金融征信产品数字风控数字征信生命健康产品普惠医疗应急防控数据产品行业知识图谱发现新型语义智能构建AI大模型训练数据产品视图:按数据属性划分物理/逻辑数据空间专区,专业化管理数据产品信息视图,为数据要素流通提供基础政务信息数据开发车路协同低碳出行数字信贷e生报2数据开发商数据提供者企业数据数据做什么用数
114、据加工使用权数据到哪里去数据产品经营权数据流通数据流通视图:联通各数据专区空间,建立数据要素流通统一大市场,从城市数据空间角度建设数据流通视图3产品登记上架数据接入认证合规交易安全可信监测预警质量评估数据消费者可控可计量可信可证链可用不可见元数据管理架构包括产生、采集、注册和运维四个方面工作。在城市数据空间中建立元数据中心,实现业务元数据和技术元数据之间的连接,通过下面四步全面管理元数据的生命周期:1)当公共数据、企业数据和个人数据进入城市在城市数据空间中可以分别从数据资产、数据产品和数据流通的视角,来形成整体的数据地图。首先,数据资产视角主要关注数据从哪里来,即城市数据空间中的数据资产。这张
115、图展示了城市数据空间中的各种数据来源,包括政府部门、企业、社会组织、个人等,以及这些数据的类型、格式、质量等信息。通过这张图,可以为数据的后续处理和利用提供基础。其次,数据产品视角主要关注数据做什么用,即城市数据空间中的数据产品。这张图展示了城市数据空间中的各种数据产品,包括数据分析报告、数据可视化、智能决策支持系统等,以及这些数据产品的应用场景、用户群体等信息。通过这张图,可以为数据的应用和价值实现提供支持。最后,数据流通视角主要关注数据到哪里去,即公共数据、企业数据和个人数据各自的内涵和特性不同,故三类数据的治理方法和目标也有所不同。“取之于民、用之于民、造福于民”是公共数据治理的原则,它
116、要求在保护国家安全、商业秘密安全、个人信息安全的前提下,根据用途持续扩大供给使用范围,让公共数据价值更好地惠及全社会,这就涉及到如何增加供给规模、提高供给质量和效率的关键问题。对于企业数据,主要治理活动存在于企业内部管理中,数据在被提供至城市数据空间前,已经完成了一定程度的治理,因此在城市数据空间中的治理目标将不再是规范化和标准化,而是如何量化企业数据的价值贡献,促进数据价值的“显性化”。对于个人数据,大多数由公共部门和企业实际持有,自然人对这些数据的自主掌控性较弱,加之可以运用AI大模型等能力开展深入挖掘,这部分数据与其他相关数据结合后的价值可以被不断放大,治理中需要警惕这部分数据不被相关利
117、益方获取滥用,因此个人数据治理的关键问题是如何在加强相关个人权益保护的基础上开发利用。元数据管理及资源、资产编目在城市数据空间中,无论是结构化数据还是非结构化数据,都需要通过元数据管理来进行数据治理工作。因此,元数据管理需要贯穿从数据进入、汇聚、加工、产品化、估值、流通到消费的全生命周期。为了实现有效的元数据管理,建立以下主要管理框架和策略:数据空间时,将同时取得相应的元数据;2)之后通过统一的元模型,从各类数据源建立的采集通道中自动采集元数据;3)接着基于增量和存量两种场景,完成城市数据空间元数据的注册工作;4)最后确保元数据的运维工作得到有效实施。建立元数据管理的基础能力后,对后续开展数据
118、消费的关键作用就是对相关数据资源、资产开展编目工作,形成层级化、结构化的数据资源资产目录,从而为城市数据空间建立完善的“数据一张图”。2827运维元数据元数据质量管理元数据运营分析元数据API管理元模型管理采集元数据CDHiSales.结构化数据非结构化数据产生元数据公共数据企业数据个人数据消费元数据元数据查询/搜索元数据血缘分析元数据影响分析数据标准合规检查元数据中心管理流程管理规范图19 元数据管理架构注册元数据存量增量业务、技术、操作元数据图20 数据一张图数据从哪里来数据源持有权金融公共数据汇聚、联接、开放、共享制造科技医疗交通能源教育环境个人数据采存&算管用数据资产视图:将原始数据资
119、源治理为高质量、高价值的数据资产,利用数据资产视图提升数据产品开发效率1数据专区/集市医疗专区空间交通专区空间金融专区空间公共专区空间公共产品城市治理社区网格交通产品交通大脑金融征信产品数字风控数字征信生命健康产品普惠医疗应急防控数据产品行业知识图谱发现新型语义智能构建AI大模型训练数据产品视图:按数据属性划分物理/逻辑数据空间专区,专业化管理数据产品信息视图,为数据要素流通提供基础政务信息数据开发车路协同低碳出行数字信贷e生报2数据开发商数据提供者企业数据数据做什么用数据加工使用权数据到哪里去数据产品经营权数据流通数据流通视图:联通各数据专区空间,建立数据要素流通统一大市场,从城市数据空间角
120、度建设数据流通视图3产品登记上架数据接入认证合规交易安全可信监测预警质量评估数据消费者可控可计量可信可证链可用不可见元数据管理架构包括产生、采集、注册和运维四个方面工作。在城市数据空间中建立元数据中心,实现业务元数据和技术元数据之间的连接,通过下面四步全面管理元数据的生命周期:1)当公共数据、企业数据和个人数据进入城市在城市数据空间中可以分别从数据资产、数据产品和数据流通的视角,来形成整体的数据地图。首先,数据资产视角主要关注数据从哪里来,即城市数据空间中的数据资产。这张图展示了城市数据空间中的各种数据来源,包括政府部门、企业、社会组织、个人等,以及这些数据的类型、格式、质量等信息。通过这张图
121、,可以为数据的后续处理和利用提供基础。其次,数据产品视角主要关注数据做什么用,即城市数据空间中的数据产品。这张图展示了城市数据空间中的各种数据产品,包括数据分析报告、数据可视化、智能决策支持系统等,以及这些数据产品的应用场景、用户群体等信息。通过这张图,可以为数据的应用和价值实现提供支持。最后,数据流通视角主要关注数据到哪里去,即公共数据、企业数据和个人数据各自的内涵和特性不同,故三类数据的治理方法和目标也有所不同。“取之于民、用之于民、造福于民”是公共数据治理的原则,它要求在保护国家安全、商业秘密安全、个人信息安全的前提下,根据用途持续扩大供给使用范围,让公共数据价值更好地惠及全社会,这就涉
122、及到如何增加供给规模、提高供给质量和效率的关键问题。对于企业数据,主要治理活动存在于企业内部管理中,数据在被提供至城市数据空间前,已经完成了一定程度的治理,因此在城市数据空间中的治理目标将不再是规范化和标准化,而是如何量化企业数据的价值贡献,促进数据价值的“显性化”。对于个人数据,大多数由公共部门和企业实际持有,自然人对这些数据的自主掌控性较弱,加之可以运用AI大模型等能力开展深入挖掘,这部分数据与其他相关数据结合后的价值可以被不断放大,治理中需要警惕这部分数据不被相关利益方获取滥用,因此个人数据治理的关键问题是如何在加强相关个人权益保护的基础上开发利用。元数据管理及资源、资产编目在城市数据空
123、间中,无论是结构化数据还是非结构化数据,都需要通过元数据管理来进行数据治理工作。因此,元数据管理需要贯穿从数据进入、汇聚、加工、产品化、估值、流通到消费的全生命周期。为了实现有效的元数据管理,建立以下主要管理框架和策略:数据空间时,将同时取得相应的元数据;2)之后通过统一的元模型,从各类数据源建立的采集通道中自动采集元数据;3)接着基于增量和存量两种场景,完成城市数据空间元数据的注册工作;4)最后确保元数据的运维工作得到有效实施。建立元数据管理的基础能力后,对后续开展数据消费的关键作用就是对相关数据资源、资产开展编目工作,形成层级化、结构化的数据资源资产目录,从而为城市数据空间建立完善的“数据
124、一张图”。元数据安全扫描识别安全隐私风险数据安全治理分组、标识和标注制定安全策略按等级制定约束执行安全策略保护、控制和稽查控制=流转监控、SOD吃药=脱敏打针=加密手术=集中管控图21 元数据安全治理流程城市数据空间中的数据流通。这张图展示了城市数据空间中的数据流通路径,包括数据采集、存储、处理、分析、共享等环节,以及这些环节中的数据要素、数据流向、数据安全等信息。通过这张图,可以为数据的安全和可控提供保障。综合这三个视角形成的完整数据地图,帮助我们全面了解在城市数据空间中的数据从哪里来、做什么用、到哪里去以及中间经历了哪些环节最后产生了什么价值,帮助城市管理者和数据消费者更好的管理和使用数据
125、。数据标准管理城市数据空间的建设,需要面向公共数据、企业数据和个人数据三类数据制定统一规范、统一标准,并达成各方共同认识。对于结构化数据,可以构建的数据标准模型主要包括:数据的定义和描述:元模型应该清晰地定义和描述数据的名称、含义、类型、格式、来源、范围、约束、质量等基本属性,以便于数据的识别、理解和使用。数据的分类和分级:元模型应该根据数据的用途、敏感性、安全性、共享性等因素,对数据进行合理的分类和分级,以便于数据的管理、授权和服务。数据的关系和映射:元模型应该描述数据之间的逻辑关系和物理映射,以便于数据的整合、分析和查询。数据的变化和版本:元模型应该记录数据的变化历史和版本信息,以便于数据
126、的更新、追溯和审计。数据权责管理:明确业务规则责任主体、数据维护责任主体、数据看护责任主体等,以便开展数据权责划分和数据质量改进。对于非结构化数据,可以构建的标准体系包括:内容模型、内容分类、编码命名、内容格式、内容本体、版本策略、元数据、内容指标和内容接口等。数据质量管理在城市数据空间的公共数据、企业数据和个人数据三类数据中,需要更加强调的是公共数据的数据质量要求。当前对于公共数据的治理还需明确权责体系,需要进一步推动公共数据从开发利用到治理完善的闭环驱动机制落地,实现公共数据质量的持续改进和高效供给。相比之下,企业数据则具有明确的数据Owner权责体系,且已经完成了一定程度的治理,部分重点
127、行业监管机构也提出了严格的数据标准和质量要求。并且企业自身受市场驱动也有自己的数据治理体系,可持续对数据进行质量提升。而个人数据当前主要问题不是数据质量的问题,而是隐私数据保护法律规范的遵从要求,需要基于隐私数据合规的前提下合理使用数据、合规治理数据,才能实现对个人数据的可控和可信。数据分类分级根据数据来源可以分为公共数据、企业数据和个人数据;根据内容可以分为结构化数据和非结构化数据;根据业务属性可以进行资源和资产的分类编目。数据分类是进行数据分级管理的基础,以便采取不同的管理措施和应用策略。在元数据的管理模型中,可以针对不同数据分类设计分级管理模型。例如,结构化数据按照逻辑实体和属性进行数据
128、分级,包括数据安全分级标识、数据敏感性标识、隐私数据标识等管理标签;非结构化数据则可以在其“内容分类标准”和“内容本体标准”中提供数据内容的分类、分级、敏感度、密级等方面的规范性标识。有了以上基础,数据管理者和消费方就能够明确区分空间内哪些数据密级高、哪些数据属于个人隐私类数据、哪些数据可以被快速获取等,并为三类数据进一步制定安全管理流程和制定安全技术标准提供依据。3029元数据安全扫描识别安全隐私风险数据安全治理分组、标识和标注制定安全策略按等级制定约束执行安全策略保护、控制和稽查控制=流转监控、SOD吃药=脱敏打针=加密手术=集中管控图21 元数据安全治理流程城市数据空间中的数据流通。这张
129、图展示了城市数据空间中的数据流通路径,包括数据采集、存储、处理、分析、共享等环节,以及这些环节中的数据要素、数据流向、数据安全等信息。通过这张图,可以为数据的安全和可控提供保障。综合这三个视角形成的完整数据地图,帮助我们全面了解在城市数据空间中的数据从哪里来、做什么用、到哪里去以及中间经历了哪些环节最后产生了什么价值,帮助城市管理者和数据消费者更好的管理和使用数据。数据标准管理城市数据空间的建设,需要面向公共数据、企业数据和个人数据三类数据制定统一规范、统一标准,并达成各方共同认识。对于结构化数据,可以构建的数据标准模型主要包括:数据的定义和描述:元模型应该清晰地定义和描述数据的名称、含义、类
130、型、格式、来源、范围、约束、质量等基本属性,以便于数据的识别、理解和使用。数据的分类和分级:元模型应该根据数据的用途、敏感性、安全性、共享性等因素,对数据进行合理的分类和分级,以便于数据的管理、授权和服务。数据的关系和映射:元模型应该描述数据之间的逻辑关系和物理映射,以便于数据的整合、分析和查询。数据的变化和版本:元模型应该记录数据的变化历史和版本信息,以便于数据的更新、追溯和审计。数据权责管理:明确业务规则责任主体、数据维护责任主体、数据看护责任主体等,以便开展数据权责划分和数据质量改进。对于非结构化数据,可以构建的标准体系包括:内容模型、内容分类、编码命名、内容格式、内容本体、版本策略、元
131、数据、内容指标和内容接口等。数据质量管理在城市数据空间的公共数据、企业数据和个人数据三类数据中,需要更加强调的是公共数据的数据质量要求。当前对于公共数据的治理还需明确权责体系,需要进一步推动公共数据从开发利用到治理完善的闭环驱动机制落地,实现公共数据质量的持续改进和高效供给。相比之下,企业数据则具有明确的数据Owner权责体系,且已经完成了一定程度的治理,部分重点行业监管机构也提出了严格的数据标准和质量要求。并且企业自身受市场驱动也有自己的数据治理体系,可持续对数据进行质量提升。而个人数据当前主要问题不是数据质量的问题,而是隐私数据保护法律规范的遵从要求,需要基于隐私数据合规的前提下合理使用数
132、据、合规治理数据,才能实现对个人数据的可控和可信。数据分类分级根据数据来源可以分为公共数据、企业数据和个人数据;根据内容可以分为结构化数据和非结构化数据;根据业务属性可以进行资源和资产的分类编目。数据分类是进行数据分级管理的基础,以便采取不同的管理措施和应用策略。在元数据的管理模型中,可以针对不同数据分类设计分级管理模型。例如,结构化数据按照逻辑实体和属性进行数据分级,包括数据安全分级标识、数据敏感性标识、隐私数据标识等管理标签;非结构化数据则可以在其“内容分类标准”和“内容本体标准”中提供数据内容的分类、分级、敏感度、密级等方面的规范性标识。有了以上基础,数据管理者和消费方就能够明确区分空间
133、内哪些数据密级高、哪些数据属于个人隐私类数据、哪些数据可以被快速获取等,并为三类数据进一步制定安全管理流程和制定安全技术标准提供依据。30293231图22 面向AI的数据工程流程框架处理阶段计算处理存储处理数据获取三方收集、网络爬取、边缘汇聚数据预处理原始数据清晰、加工为可训练数据数据格式规整粗过滤及去重语言检测模糊重复删除图像、文本、语音、代码等海量原始数据多模态原始数据大容量存储虑毒&隐私处理数据提纯数据去重数据分词数据混合训练内置数据预处理框架预处理中间阶段的过程数据预处理后的数据数据加工过后的高质量数据集高质量数据集混合训练数据高性能存储多模态原始数据(PB级)AI语料训练数据管理和
134、治理流程,主要包括两大步骤:1)数据获取:通过多个渠道获取大规模的语料数据,包括文本、图像、音频和视频数据,这些数据来自城市感应器、社交媒体、市政机构、市民反馈等多个来源。获取到的数据集需要经过脱敏、合规、审批和汇聚等环节,最终在城市数据空间内进行统一存储,形成多模态的初始语料数据集。2)数据预处理:经过数据格式规整、粗过滤及去重、语言检测、模糊重复数据删除、数据滤毒、隐私处理、数据提纯、数据去重、数据分词和数据混合等环节。这些预处理环节中的算子或框架可以由数据治理服务方提供。经过预处理后,数据将变得更加高质量,形成高质量数据集和混合训练数据集,为后续的训练和分析提供可靠的基础。5、数据资产层
135、和数据交易层虽然“数据二十条”对数据要素确定了三权分置的数据产权制度,但落地在税收、法律等相关领域时,有些进展但尚有许多问题待探索和研究,包括数据资产评估、数据资产入表、数据产权登记、数据产品定价、数据商品流通等。财政部会计司于在2023年8月发布了企业数据资源相关会计处理暂行规定,就数据交易双方如何进行会计处理、数据资源是否可以作为资产入账等问题提出会计处理方法。中国资产评估协会于2023年10月发布了数据资产评估指导意见,规范资产评估机构及其资产评估专业人员在数据资产评估业务中的实务操作,明确了评估对象、数据质量评价、评估方法、披露要求等。这些进展让我们看到后续还会有更多的政策发布,对数据
136、资产和数据交易环节提供更具体的政策依据。数据安全治理数据安全是公共数据、企业数据和个人数据三类数据在城市数据空间管理中的核心诉求。进一步开展元数据管理,提升数据安全管理能力。在城市数据空间中开展数据安全治理主要过程,包括以下几个方面:元数据安全扫描:通过获取安全相关元数据并持续发现安全隐私风险,可以及时了解数据的来源、结构和安全风险,为后续的数据安全管理奠定基础。数据安全治理:包括资产注册、分组分类、标识、分布和标准管理等工作。通过对数据进行分类和标识,可以清晰地了解数据的性质和重要性,并建立起对数据的管理框架和规范,为后续的安全策略制定和执行提供依据。制定安全策略:这包括风险登记、流转与使用
137、约束、保护与留存规则等方面。通过对数据的风险评估和登记,制定相应的流转和使用约束,以及保护和留存规则,可以确保数据在流转和使用过程中的安全性和合规性。执行安全策略:这包括数据保护措施的实施,如脱敏、加密、隔离和入侵检测系统等,以及数据流转的控制和策略合规的稽核。通过这些措施,可以保护数据的完整性和可用性,同时确保数据的流转和使用符合相关的安全策略和合规要求。面向AI的数据工程建设AI和大模型随着应用越来越广泛和深入,未来在城市管理与运行中的重要性会越发凸显。各方对于语料训练数据既相互需要,但又无法确保数据不被对方滥用。因此可由城市管理方出任可信方,将城市数据空间作为AI语料数据的承载底座,实现
138、数据可信可用,在整个过程中还需要对AI语料数据进行治理以提升其数据质量、规范和数据安全。数据工程是面向AI和大模型开展数据处理、提升数据质量的高效方法,在这其中也可以同时运用多种先进技术、AI算法算子和自动化处理能力,示例流程如下图:3231图22 面向AI的数据工程流程框架处理阶段计算处理存储处理数据获取三方收集、网络爬取、边缘汇聚数据预处理原始数据清晰、加工为可训练数据数据格式规整粗过滤及去重语言检测模糊重复删除图像、文本、语音、代码等海量原始数据多模态原始数据大容量存储虑毒&隐私处理数据提纯数据去重数据分词数据混合训练内置数据预处理框架预处理中间阶段的过程数据预处理后的数据数据加工过后的
139、高质量数据集高质量数据集混合训练数据高性能存储多模态原始数据(PB级)AI语料训练数据管理和治理流程,主要包括两大步骤:1)数据获取:通过多个渠道获取大规模的语料数据,包括文本、图像、音频和视频数据,这些数据来自城市感应器、社交媒体、市政机构、市民反馈等多个来源。获取到的数据集需要经过脱敏、合规、审批和汇聚等环节,最终在城市数据空间内进行统一存储,形成多模态的初始语料数据集。2)数据预处理:经过数据格式规整、粗过滤及去重、语言检测、模糊重复数据删除、数据滤毒、隐私处理、数据提纯、数据去重、数据分词和数据混合等环节。这些预处理环节中的算子或框架可以由数据治理服务方提供。经过预处理后,数据将变得更
140、加高质量,形成高质量数据集和混合训练数据集,为后续的训练和分析提供可靠的基础。5、数据资产层和数据交易层虽然“数据二十条”对数据要素确定了三权分置的数据产权制度,但落地在税收、法律等相关领域时,有些进展但尚有许多问题待探索和研究,包括数据资产评估、数据资产入表、数据产权登记、数据产品定价、数据商品流通等。财政部会计司于在2023年8月发布了企业数据资源相关会计处理暂行规定,就数据交易双方如何进行会计处理、数据资源是否可以作为资产入账等问题提出会计处理方法。中国资产评估协会于2023年10月发布了数据资产评估指导意见,规范资产评估机构及其资产评估专业人员在数据资产评估业务中的实务操作,明确了评估
141、对象、数据质量评价、评估方法、披露要求等。这些进展让我们看到后续还会有更多的政策发布,对数据资产和数据交易环节提供更具体的政策依据。数据安全治理数据安全是公共数据、企业数据和个人数据三类数据在城市数据空间管理中的核心诉求。进一步开展元数据管理,提升数据安全管理能力。在城市数据空间中开展数据安全治理主要过程,包括以下几个方面:元数据安全扫描:通过获取安全相关元数据并持续发现安全隐私风险,可以及时了解数据的来源、结构和安全风险,为后续的数据安全管理奠定基础。数据安全治理:包括资产注册、分组分类、标识、分布和标准管理等工作。通过对数据进行分类和标识,可以清晰地了解数据的性质和重要性,并建立起对数据的
142、管理框架和规范,为后续的安全策略制定和执行提供依据。制定安全策略:这包括风险登记、流转与使用约束、保护与留存规则等方面。通过对数据的风险评估和登记,制定相应的流转和使用约束,以及保护和留存规则,可以确保数据在流转和使用过程中的安全性和合规性。执行安全策略:这包括数据保护措施的实施,如脱敏、加密、隔离和入侵检测系统等,以及数据流转的控制和策略合规的稽核。通过这些措施,可以保护数据的完整性和可用性,同时确保数据的流转和使用符合相关的安全策略和合规要求。面向AI的数据工程建设AI和大模型随着应用越来越广泛和深入,未来在城市管理与运行中的重要性会越发凸显。各方对于语料训练数据既相互需要,但又无法确保数
143、据不被对方滥用。因此可由城市管理方出任可信方,将城市数据空间作为AI语料数据的承载底座,实现数据可信可用,在整个过程中还需要对AI语料数据进行治理以提升其数据质量、规范和数据安全。数据工程是面向AI和大模型开展数据处理、提升数据质量的高效方法,在这其中也可以同时运用多种先进技术、AI算法算子和自动化处理能力,示例流程如下图:3433图24 城市数据空间的生态培育体系提供资产评估、担保抵押、权益保障等服务交易中介方,推动交易达成,包括公证、合同、商务等建立人才认证中心,以及为之配套的人才认证体系通过认证培训+实践的方式,为本地培育数据要素复合型人才提供产品开发、可信流通、应用开发测试等普惠性技术
144、培训服务提供端到端开发环境和一站式开发包,“拎包”入驻快速便捷在金融、医疗、公共服务、制造等优势领域,聚合行业生态进行价值数据产品开发,价值场景联合孵化在可信传输、隐私保护等方面,开展技术创新基于数字孪生技术,汇聚产业链营销生态,提供数据产品发布会、招商推介、展览展示、品牌营销等数据服务行业应用开发厂家根据客户需求定制数据产品支撑数据产品的市场营销,提供咨询服务图23 数据全生命周期安全安全可信合规可控数据准入校验数据硬件加密数据权限控制数据访问策略数据内容加密数据数据权限控制HTTPS证书(一)数据流通可信任城市数据流通的可信任是指数据在流通过程中,数据的真实性、完整性、保密性和合规性得到保
145、障。要确保各参与方身份可信、数据使用合规、数据安全和数据隐私保护。通过采用数字证书、电子签章等技术手段,确保参与方身份的真实性和合法性。建立信任管理服务平台,统一管理数据资产的权限、身份认证等信息,实现数据授权的自动化信任管理。采用数据加密、访问控制等技术手段,保障数据在流通过程中的安全性。(二)数据合规可追溯合规可追溯是城市数据流通中有效防范合规风险的重要手段,通过合约可信执行和过程可追溯两种方式,参与方可以对数据流通的各个环节进行有效追溯,及时发现和预防合规风险。合约可信执行是实现合规管理可追溯的基础,通过将合规规则和条件转化为合约,并将合约执行程序化,可以减少人工干预,确保合规规则的有效
146、执行。过程可追溯是合规管理可追溯的重要组成部分,通过对数据流通过程的各个环节进行记录和保存,可以为事后追溯和分析提供基础。通过区块链技术有效实现合规管理可追溯:不可篡改性:区块链上的所有数据都采用哈希算法进行加密,并存储在分布式账本上,任何节6、安全可信和合规可控治理框架城市数据要素要实现安全高效流通,需要在城市数据要素流通的全生命周期过程中设计安全可信和合规可控治理框架。点都无法修改或删除,从而保证数据的真实性和完整性。可追溯性:区块链采用链式结构存储数据,每个区块都包含前一个区块的哈希值,从而可以追溯到数据的来源和流转过程。去中心化:区块链网络由多个节点共同维护,任何节点都无法控制整个网络
147、,从而保证合规管理的透明度和公信力。(三)数据内容可信任需要全面确保数据内容安全可信,从根本上解决数据授权运营中存在的数据访问权限与敏感数据扩散的安全问题,提高数据流通合规的可信度,降低数据泄露的担忧,通过分类分级和脱敏溯源化解对数据无限制扩散的担忧,促进各方对数据共享的信心,提升数据授权运营的品质。(四)跨境数据监督发展安全的数据有序跨境流动是城市数据空间推进数字跨境贸易基础设施建设的基础。需要制定政策保障措施,建立数据安全保护能力认证、数据流通备份审查、跨境数据流动和交易风险评估等数据安全管理机制。2.6 城市数据空间的数据生态纯软件开发商根据客户需求定制开发数据产品本地人才的培养、认证体
148、系积极推动政策扶持,引入本地人才数据产品博览中心3433图24 城市数据空间的生态培育体系提供资产评估、担保抵押、权益保障等服务交易中介方,推动交易达成,包括公证、合同、商务等建立人才认证中心,以及为之配套的人才认证体系通过认证培训+实践的方式,为本地培育数据要素复合型人才提供产品开发、可信流通、应用开发测试等普惠性技术培训服务提供端到端开发环境和一站式开发包,“拎包”入驻快速便捷在金融、医疗、公共服务、制造等优势领域,聚合行业生态进行价值数据产品开发,价值场景联合孵化在可信传输、隐私保护等方面,开展技术创新基于数字孪生技术,汇聚产业链营销生态,提供数据产品发布会、招商推介、展览展示、品牌营销
149、等数据服务行业应用开发厂家根据客户需求定制数据产品支撑数据产品的市场营销,提供咨询服务图23 数据全生命周期安全安全可信合规可控数据准入校验数据硬件加密数据权限控制数据访问策略数据内容加密数据数据权限控制HTTPS证书(一)数据流通可信任城市数据流通的可信任是指数据在流通过程中,数据的真实性、完整性、保密性和合规性得到保障。要确保各参与方身份可信、数据使用合规、数据安全和数据隐私保护。通过采用数字证书、电子签章等技术手段,确保参与方身份的真实性和合法性。建立信任管理服务平台,统一管理数据资产的权限、身份认证等信息,实现数据授权的自动化信任管理。采用数据加密、访问控制等技术手段,保障数据在流通过
150、程中的安全性。(二)数据合规可追溯合规可追溯是城市数据流通中有效防范合规风险的重要手段,通过合约可信执行和过程可追溯两种方式,参与方可以对数据流通的各个环节进行有效追溯,及时发现和预防合规风险。合约可信执行是实现合规管理可追溯的基础,通过将合规规则和条件转化为合约,并将合约执行程序化,可以减少人工干预,确保合规规则的有效执行。过程可追溯是合规管理可追溯的重要组成部分,通过对数据流通过程的各个环节进行记录和保存,可以为事后追溯和分析提供基础。通过区块链技术有效实现合规管理可追溯:不可篡改性:区块链上的所有数据都采用哈希算法进行加密,并存储在分布式账本上,任何节6、安全可信和合规可控治理框架城市数
151、据要素要实现安全高效流通,需要在城市数据要素流通的全生命周期过程中设计安全可信和合规可控治理框架。点都无法修改或删除,从而保证数据的真实性和完整性。可追溯性:区块链采用链式结构存储数据,每个区块都包含前一个区块的哈希值,从而可以追溯到数据的来源和流转过程。去中心化:区块链网络由多个节点共同维护,任何节点都无法控制整个网络,从而保证合规管理的透明度和公信力。(三)数据内容可信任需要全面确保数据内容安全可信,从根本上解决数据授权运营中存在的数据访问权限与敏感数据扩散的安全问题,提高数据流通合规的可信度,降低数据泄露的担忧,通过分类分级和脱敏溯源化解对数据无限制扩散的担忧,促进各方对数据共享的信心,
152、提升数据授权运营的品质。(四)跨境数据监督发展安全的数据有序跨境流动是城市数据空间推进数字跨境贸易基础设施建设的基础。需要制定政策保障措施,建立数据安全保护能力认证、数据流通备份审查、跨境数据流动和交易风险评估等数据安全管理机制。2.6 城市数据空间的数据生态纯软件开发商根据客户需求定制开发数据产品本地人才的培养、认证体系积极推动政策扶持,引入本地人才数据产品博览中心城市数据空间的数据生态,包括授权运营方、数据供给方、数据消费方,以及为数据全生命周期服务的数商(数据开发商、数据经纪人、第三方服务机构、行业应用开发商、本地人才等)。数据生态的培育体系主要基于2中心2平台开展,围绕城市数据要素高效
153、合规流通为目标,提供高质量的数据人才、数据产品、数据认证和数据相关服务。2中心是人才认证中心和数据产品博览中心;2平台是开发赋能平台和创新孵化平台。人才认证中心面对数据要素发展战略对人才需求的挑战,建立人才认证中心,构建以及为之配套的人才认证体系。通过认证培训+实践考核的方式,为本地培育数据要素复合型人才,面向未来、为城市产业链源源不断输送人才。数据产品博览中心基于数字孪生沉浸式技术,建立线上数据产品的2.7 城市数据空间的运行模式城市数据空间的运行模式,需要根据数据的分类分级,选择不同的运行模式,对于每一种模式没有绝对合适,都是基于业务场景来判断,能推动业务健康发展的模式,才是真正的好模式。
154、目前看分成以下三种模式:(1)中心化模式:即数据被集约式共享,被授权给不同的运营单位进行使用。当前的公共数据授权运营方式就是我们认为的中心化模式。(2)去中心化模式:即数据供给来源于任何地方,不呈现集中模式,基于平等和对等网络接入和访问数据,类似欧洲IDS数据空间,该模式激发了企业数据的大规模应用。(3)混合模式:在中心化和去中心化模式之间,我们认为还在混合模式。从循环机制来看,存在三种循环模式,即城市内循环、国内跨城循环、国际跨境循环。其中城市内循环是大循环,也是循环主体。不同的循环方式,对城市数据空间的要求不同。当前越来越多出现跨多个城市的城市群,如长三角、京津冀、博览中心,通过数字虚拟化
155、互动体验,提供数据产品的产品发布会、招商推介、展览展示、品牌营销等服务,以及产品技术的系列化数字沙龙活动、圆桌论坛等,激发产业数据产品应用场景不断创新。开发赋能平台提供产品开发、可信流通、应用开发测试等普惠性技术培训服务,提供端到端开发环境和一站式开发包,快速便捷地实现“拎包”入驻。发布开发测试规范,以保障在开发环境中的数据安全性和合规性,做到数据在开发周期内的可信可控。创新孵化平台面对技术创新挑战,优先在金融、医疗、公共服务、制造等优势领域,引入行业专家,联手高校科研,聚合行业生态进行价值数据产品开发、价值场景联合孵化。同时在可信传输、隐私保护、数据回收、数据确权等方面,开展关键技术和课题的
156、研究、攻关和创新。粤港澳大湾区等城市群,这些城市群正在将城市内循环外溢到国内跨城循环,形成双循环模式,进一步促进城市群的区域规模效应,也同时外溢到国际跨境循环,甚至出现三循环模式,加强对国外先进城市的数据对接,推进跨境贸易。城市内循环模式关注数据要素在城市内流通的高效性和合规性,是最主要的循环模式。国内跨城循环模式需要关注城市带/城市群,甚至在整个国内的各个城市之间的数据要素流通。加强城市与城市之间、城市与国家中心之间的互通,建立区域和全国的互通接口和协议标准化,打通数据壁垒,实现互操作性,进一步释放数据价值。国际跨境循环模式需要关注跨境数据的安全、敏感性,是否存在违反国家安全法律的规定。对影
157、响或者可能影响国家安全的数据处理、数据跨境传输等活动依法依规进行国家安全审查。维护国家安全和利益,保障跨境数据用于合法用途,防范数据出境安全风险。反对数据霸权和数据保护主义,有效应对数据领域“长臂管辖”。34图25 城市数据空间内外3模式3循环0835城市数据空间的数据生态,包括授权运营方、数据供给方、数据消费方,以及为数据全生命周期服务的数商(数据开发商、数据经纪人、第三方服务机构、行业应用开发商、本地人才等)。数据生态的培育体系主要基于2中心2平台开展,围绕城市数据要素高效合规流通为目标,提供高质量的数据人才、数据产品、数据认证和数据相关服务。2中心是人才认证中心和数据产品博览中心;2平台
158、是开发赋能平台和创新孵化平台。人才认证中心面对数据要素发展战略对人才需求的挑战,建立人才认证中心,构建以及为之配套的人才认证体系。通过认证培训+实践考核的方式,为本地培育数据要素复合型人才,面向未来、为城市产业链源源不断输送人才。数据产品博览中心基于数字孪生沉浸式技术,建立线上数据产品的2.7 城市数据空间的运行模式城市数据空间的运行模式,需要根据数据的分类分级,选择不同的运行模式,对于每一种模式没有绝对合适,都是基于业务场景来判断,能推动业务健康发展的模式,才是真正的好模式。目前看分成以下三种模式:(1)中心化模式:即数据被集约式共享,被授权给不同的运营单位进行使用。当前的公共数据授权运营方
159、式就是我们认为的中心化模式。(2)去中心化模式:即数据供给来源于任何地方,不呈现集中模式,基于平等和对等网络接入和访问数据,类似欧洲IDS数据空间,该模式激发了企业数据的大规模应用。(3)混合模式:在中心化和去中心化模式之间,我们认为还在混合模式。从循环机制来看,存在三种循环模式,即城市内循环、国内跨城循环、国际跨境循环。其中城市内循环是大循环,也是循环主体。不同的循环方式,对城市数据空间的要求不同。当前越来越多出现跨多个城市的城市群,如长三角、京津冀、博览中心,通过数字虚拟化互动体验,提供数据产品的产品发布会、招商推介、展览展示、品牌营销等服务,以及产品技术的系列化数字沙龙活动、圆桌论坛等,
160、激发产业数据产品应用场景不断创新。开发赋能平台提供产品开发、可信流通、应用开发测试等普惠性技术培训服务,提供端到端开发环境和一站式开发包,快速便捷地实现“拎包”入驻。发布开发测试规范,以保障在开发环境中的数据安全性和合规性,做到数据在开发周期内的可信可控。创新孵化平台面对技术创新挑战,优先在金融、医疗、公共服务、制造等优势领域,引入行业专家,联手高校科研,聚合行业生态进行价值数据产品开发、价值场景联合孵化。同时在可信传输、隐私保护、数据回收、数据确权等方面,开展关键技术和课题的研究、攻关和创新。粤港澳大湾区等城市群,这些城市群正在将城市内循环外溢到国内跨城循环,形成双循环模式,进一步促进城市群
161、的区域规模效应,也同时外溢到国际跨境循环,甚至出现三循环模式,加强对国外先进城市的数据对接,推进跨境贸易。城市内循环模式关注数据要素在城市内流通的高效性和合规性,是最主要的循环模式。国内跨城循环模式需要关注城市带/城市群,甚至在整个国内的各个城市之间的数据要素流通。加强城市与城市之间、城市与国家中心之间的互通,建立区域和全国的互通接口和协议标准化,打通数据壁垒,实现互操作性,进一步释放数据价值。国际跨境循环模式需要关注跨境数据的安全、敏感性,是否存在违反国家安全法律的规定。对影响或者可能影响国家安全的数据处理、数据跨境传输等活动依法依规进行国家安全审查。维护国家安全和利益,保障跨境数据用于合法
162、用途,防范数据出境安全风险。反对数据霸权和数据保护主义,有效应对数据领域“长臂管辖”。34图25 城市数据空间内外3模式3循环0835最佳实践案例图26 上海数据集团城市数据空间38医疗健康便民服务数字生活保险报销供应中心开发中心审核中心数据治理|数据产品|数据服务|数据应用个人中心运营中心民生治理身份授权数字治理数据开发服务数据信任安全授权运营管理基础库|主题库|专题库大数据数据仓库数据治理ROMA隐私计算区块链企业数据政府数据社会数据数据底座数据平台基础设施平台普惠金融数字经济数据资产地图数据价值场景3.1 上海数据集团城市数据空间上海数据集团作为上海市公共数据授权运营主体,承担着构建数据
163、要素市场、激发数据要素潜能、保障数据安全的战略使命。通过整合公共数据空间、企业数据空间和个人数据空间,利用创新的技术寻找数据要素的价值场景,释放数据要素的生产力,帮助上海各政府机构、本地企业、民众挖掘和赋能数据要素的价值,为此联合华为云打造“城市数据空间”新范式。2023年,上海数据集团以公共数据为牵引,构建城市数据空间的关键基础设施“天机智信”平台。采用技术领先的湖仓一体、存算分离架构,满足以公共数据为牵引,融合企业数据、行业数据等多源数据汇聚、治理和开发利用,提供面向数据治理、数据产品、数据服务、数据应用的开发工具。围绕数据全生命周期,提供信任安全和授权运营的管理能力,以促进数据的社会化利
164、用。“天机智信”平台深度融合区块链、隐私计算等关键技术,依托“浦江数链”、“数字信任”体系提供身份可认证、访问可控制、授权可管理、安全可审计、过程可追溯的关键技术能力,打造城市级数据空间基础设施的标杆和示范。“天机智信”平台打造“1+2+4+X”整体架构,如下图所示:最佳实践案例图26 上海数据集团城市数据空间38医疗健康便民服务数字生活保险报销供应中心开发中心审核中心数据治理|数据产品|数据服务|数据应用个人中心运营中心民生治理身份授权数字治理数据开发服务数据信任安全授权运营管理基础库|主题库|专题库大数据数据仓库数据治理ROMA隐私计算区块链企业数据政府数据社会数据数据底座数据平台基础设施
165、平台普惠金融数字经济数据资产地图数据价值场景3.1 上海数据集团城市数据空间上海数据集团作为上海市公共数据授权运营主体,承担着构建数据要素市场、激发数据要素潜能、保障数据安全的战略使命。通过整合公共数据空间、企业数据空间和个人数据空间,利用创新的技术寻找数据要素的价值场景,释放数据要素的生产力,帮助上海各政府机构、本地企业、民众挖掘和赋能数据要素的价值,为此联合华为云打造“城市数据空间”新范式。2023年,上海数据集团以公共数据为牵引,构建城市数据空间的关键基础设施“天机智信”平台。采用技术领先的湖仓一体、存算分离架构,满足以公共数据为牵引,融合企业数据、行业数据等多源数据汇聚、治理和开发利用
166、,提供面向数据治理、数据产品、数据服务、数据应用的开发工具。围绕数据全生命周期,提供信任安全和授权运营的管理能力,以促进数据的社会化利用。“天机智信”平台深度融合区块链、隐私计算等关键技术,依托“浦江数链”、“数字信任”体系提供身份可认证、访问可控制、授权可管理、安全可审计、过程可追溯的关键技术能力,打造城市级数据空间基础设施的标杆和示范。“天机智信”平台打造“1+2+4+X”整体架构,如下图所示:40图27 某医疗集团数据空间393.2 某医疗集团数据可信流通探索实践医疗集团一般是由卫生工委领导、由卫生健康局举办的事业单位。医疗集团由总部(含下属辖区多家社区健康服务机构),成员单位(即各公立
167、医疗卫生机构,包括各个医院、疾病预防控制中心、慢性病防治院等),以及辖区其它医疗卫生机构组成。各地的医疗集团主要定位是站在卫检角度,负责区域医疗信息化工作,统筹信息化架构建设;如在重要慢性疾病管理、妇幼保健等方面,基于信息化手段提前识别、预防疾病,减轻后续治疗阶段的支付压力。随着医疗健康数据的新业务、新应用不断出现,医疗卫生机构对医疗健康数据的共享融合应用需求越来越多。比如:慢性病防治院的科研部门需要申请区域某个病种患病情况的数据集,例如包1个数据底座:采用自主创新、安全可信的技术路线,构建统一的数据汇聚、存储、治理加工、运维管理能力的数据底座;2套生命周期管理:建设数字信任和数据安全体系,实
168、现数据全流程汇聚、采集、存储、加工、服务、使用的安全保障能力,并在对外数据要素流通中通过可信计算系统实现数据不动、算法和模型可动,避免数据外泄,充分保障了数据隐私安全。通过可信存系统实现数据授权、数据使用、数据目录、数据服务等全流程的存证留痕不可抵赖第三方审计,为数据社会化利用提供安全和运营支撑;4类数据开发服务:提供数据治理、数据产品、数据服务、数据应用4类工具,为数据标的提供开发支持;提供对主数据、元数据、数据模型、数据标准、数据质量进行管理能力,形成整体多类数据的元数据管理、模型管理、数据质量管理等数据管控体系,打造数据资产管理能力;X个数据价值场景:面向上海城市数字化转型,重点面向数字
169、治理、数字经济及数字生活,支持X个数据价值场景的对外服务和发布。当前,以普惠金融场景为例,上海数据集团已经成功开放超过3000项公共数据,向33家金融机构提供超3700万次的数据标准化服务,帮助金融机构优化信贷评估模型,提升评估效率,为中小微企业完成了超过3000亿元的信贷评估发放,缓解中小微企业融资难,融资慢的问题。对于政府来说,也改善了区域营商环境,为社会经济长效发展注入动力。面向未来,上海数据集团将持续推进城市数据空间创新,以驱动城市数字经济高速增长。以全上海的城市数据授权运营为目标,实现公共数据、企业数据及其他数据的汇聚、供给、授权、运营及市场化开发利用,服务更多城市应用场景。含个人基
170、本信息、实验室检测信息、临床信息等,用于开展慢性病分析研究;区域内各医院的医生,需要调阅居民电子健康档案、患者统一视图;政府公共卫生部门为制定公共卫生政策,需要三医联动的数据进行联合建模分析。因此,医疗集团构建基于统一的临床医疗大数据平台与全民健康信息平台等的“医疗数据空间”,通过提供统一数据交换和各方连接器,结合区块链技术,为各方提供合法性认证、数据访问和使用控制策略、审计追溯等能力,实现数据在提供方与消费方数据空间交换过程中,端到端的安全保护。医疗集团数据空间相关方案,可以协助医院申请特定人群的体检数据,通过数据分析为社区老年人失能早期预警及综合干预技术提供数据参考。数据空间旨在通过激活医
171、疗健康行业数据,形成可开发利用、可流通的高价值数据资产,帮助行业完成疗法的更新开发、生物制药的改善研究、商业保险的精准建模等,赋能健康数字经济产业的应用落地,支撑建立健康数字经济生态圈。数据运营方可信认证中心交换数据目录市场数据使用控制中心审计追溯中心数据上架与订阅策略下发与控制日志存证和查证注册与认证数据提供方医疗集团(EDS连接器)数据消费方数据共享某某医院(EDS连接器)老年人体检数据高血压体检数据糖尿病体检数据1、查看/编辑/下载2、大数据分析/Bl3、SPSS数据分析文件数据集数据视图老年人体检数据高血压体检数据糖尿病体检数据40图27 某医疗集团数据空间393.2 某医疗集团数据可
172、信流通探索实践医疗集团一般是由卫生工委领导、由卫生健康局举办的事业单位。医疗集团由总部(含下属辖区多家社区健康服务机构),成员单位(即各公立医疗卫生机构,包括各个医院、疾病预防控制中心、慢性病防治院等),以及辖区其它医疗卫生机构组成。各地的医疗集团主要定位是站在卫检角度,负责区域医疗信息化工作,统筹信息化架构建设;如在重要慢性疾病管理、妇幼保健等方面,基于信息化手段提前识别、预防疾病,减轻后续治疗阶段的支付压力。随着医疗健康数据的新业务、新应用不断出现,医疗卫生机构对医疗健康数据的共享融合应用需求越来越多。比如:慢性病防治院的科研部门需要申请区域某个病种患病情况的数据集,例如包1个数据底座:采
173、用自主创新、安全可信的技术路线,构建统一的数据汇聚、存储、治理加工、运维管理能力的数据底座;2套生命周期管理:建设数字信任和数据安全体系,实现数据全流程汇聚、采集、存储、加工、服务、使用的安全保障能力,并在对外数据要素流通中通过可信计算系统实现数据不动、算法和模型可动,避免数据外泄,充分保障了数据隐私安全。通过可信存系统实现数据授权、数据使用、数据目录、数据服务等全流程的存证留痕不可抵赖第三方审计,为数据社会化利用提供安全和运营支撑;4类数据开发服务:提供数据治理、数据产品、数据服务、数据应用4类工具,为数据标的提供开发支持;提供对主数据、元数据、数据模型、数据标准、数据质量进行管理能力,形成
174、整体多类数据的元数据管理、模型管理、数据质量管理等数据管控体系,打造数据资产管理能力;X个数据价值场景:面向上海城市数字化转型,重点面向数字治理、数字经济及数字生活,支持X个数据价值场景的对外服务和发布。当前,以普惠金融场景为例,上海数据集团已经成功开放超过3000项公共数据,向33家金融机构提供超3700万次的数据标准化服务,帮助金融机构优化信贷评估模型,提升评估效率,为中小微企业完成了超过3000亿元的信贷评估发放,缓解中小微企业融资难,融资慢的问题。对于政府来说,也改善了区域营商环境,为社会经济长效发展注入动力。面向未来,上海数据集团将持续推进城市数据空间创新,以驱动城市数字经济高速增长
175、。以全上海的城市数据授权运营为目标,实现公共数据、企业数据及其他数据的汇聚、供给、授权、运营及市场化开发利用,服务更多城市应用场景。含个人基本信息、实验室检测信息、临床信息等,用于开展慢性病分析研究;区域内各医院的医生,需要调阅居民电子健康档案、患者统一视图;政府公共卫生部门为制定公共卫生政策,需要三医联动的数据进行联合建模分析。因此,医疗集团构建基于统一的临床医疗大数据平台与全民健康信息平台等的“医疗数据空间”,通过提供统一数据交换和各方连接器,结合区块链技术,为各方提供合法性认证、数据访问和使用控制策略、审计追溯等能力,实现数据在提供方与消费方数据空间交换过程中,端到端的安全保护。医疗集团
176、数据空间相关方案,可以协助医院申请特定人群的体检数据,通过数据分析为社区老年人失能早期预警及综合干预技术提供数据参考。数据空间旨在通过激活医疗健康行业数据,形成可开发利用、可流通的高价值数据资产,帮助行业完成疗法的更新开发、生物制药的改善研究、商业保险的精准建模等,赋能健康数字经济产业的应用落地,支撑建立健康数字经济生态圈。数据运营方可信认证中心交换数据目录市场数据使用控制中心审计追溯中心数据上架与订阅策略下发与控制日志存证和查证注册与认证数据提供方医疗集团(EDS连接器)数据消费方数据共享某某医院(EDS连接器)老年人体检数据高血压体检数据糖尿病体检数据1、查看/编辑/下载2、大数据分析/B
177、l3、SPSS数据分析文件数据集数据视图老年人体检数据高血压体检数据糖尿病体检数据41图28 华为内部数据空间图29 华为生态产业链上下游数据空间3.3 华为产业数据空间探索实践华为的数据流通模型经历了数据集成、数据共享到数据交换的三个阶段:第一阶段“数据清洁”,沿着企业业务流的各个应用对数据的消费,支撑主业务流集成打通与财报准确。第二阶段“数据共享”,企业内跨业务流的数据消费成为主流,建设数据底座、打破数据孤岛,实现企业的数据安全共享、敏捷自助,支撑企业数字化转型。第三阶段“数据交换”,提出了“数据成为企业高质量发展的核心竞争力”愿景,打开企业的边界延伸到供应商、合作伙伴及客户,甚至到一个行
178、业,在行业/企业之间形成一个数据开放共享空间。2017年,华为作为国内第一家正式加入国际数据空间协会(IDSA)(首次提出主权保护的“数据 空间”理念)的企业,开始对数据可控交换解决方案进行探索。2021年,基于多年不断的探索成果和内部实际诉求,正式启动企业数据交换空间的内部试点建设。实践一:华为内部各部门开通数据空间,实现高密、重要数据垮部门安全可控共享,月均共享数据1000+批次,促进高密、重要数据的有效利用。实践二:华为生态产业链上下游数据的可控交换。华为主导构建生态数据交换空间,为自身和15个上下游生态伙伴企业开通数据连接器,月均交换研发、供应、服务等领域数据3000+批次,支撑了质量
179、追溯、产品开发协同、能力提升等业务场景的可控数据交换,提升了与伙伴协同合作的深度和广度。41图28 华为内部数据空间图29 华为生态产业链上下游数据空间3.3 华为产业数据空间探索实践华为的数据流通模型经历了数据集成、数据共享到数据交换的三个阶段:第一阶段“数据清洁”,沿着企业业务流的各个应用对数据的消费,支撑主业务流集成打通与财报准确。第二阶段“数据共享”,企业内跨业务流的数据消费成为主流,建设数据底座、打破数据孤岛,实现企业的数据安全共享、敏捷自助,支撑企业数字化转型。第三阶段“数据交换”,提出了“数据成为企业高质量发展的核心竞争力”愿景,打开企业的边界延伸到供应商、合作伙伴及客户,甚至到
180、一个行业,在行业/企业之间形成一个数据开放共享空间。2017年,华为作为国内第一家正式加入国际数据空间协会(IDSA)(首次提出主权保护的“数据 空间”理念)的企业,开始对数据可控交换解决方案进行探索。2021年,基于多年不断的探索成果和内部实际诉求,正式启动企业数据交换空间的内部试点建设。实践一:华为内部各部门开通数据空间,实现高密、重要数据垮部门安全可控共享,月均共享数据1000+批次,促进高密、重要数据的有效利用。实践二:华为生态产业链上下游数据的可控交换。华为主导构建生态数据交换空间,为自身和15个上下游生态伙伴企业开通数据连接器,月均交换研发、供应、服务等领域数据3000+批次,支撑
181、了质量追溯、产品开发协同、能力提升等业务场景的可控数据交换,提升了与伙伴协同合作的深度和广度。在十多年的数字化转型中,城市中已经形成了大量的企业数据库、行业应用和公共数据集,分散在不同的业务主体中,需要打破孤岛,围绕应用需求把数据有序流动起来。最终目的是释放数据价值,激活数据要素潜能,提升城市居民的服务能级,提高城市治理精细化水平,打造城市数字经济创新发展高地,为赋能整体城市数字化转型奠定坚实基础。我们充分借鉴欧洲数据空间的成功经验,以及上海数据集团联合华为成功打造“天机智信”平台的实践经验,探索出城市数据空间的全新理念。城市的数字化转型提升了城市的运行效率,但在很大程度上仍没有激发出城市数据
182、的巨大价值。未来将从城市的数字化转型中开辟出数据要素新空间,全新的制度规则、权益体系、标准体系、交易规则、商业模式等将重新定义,迎来城市数据要素流量爆发的时代。展望未来的城市数据空间,具备公正、公平的制度体系,协同、高效的组织体系,数据要素从单一要素,演变到多要素融合体系,形成自治自律、持续创新、持续循环的城市数据空间。基础设施改造升级,数据要素流通更加高效和智能基础设施是未来数据要素市场的关键基础能力,打造城市资源集约共享、安全可信可控的坚实底座,以适应海量数据要素的流通需求。数据要素从市区县级到省级,再到国家级,甚至跨境下的数据流通大联网形态将会应运而生,搭建省际数据高速、国家数据高速、国
183、际数据高速大动脉,为数据要素供给、流通和交易提供四通八达的路网基础,加快内外融合大循环运转。城市数据空间的建设不仅局限于城市数据空间基础设施,还应该考虑构建智能化的城市数据开发,加速数据产品生产提效。利用AI技术,降低分析报告类数据产品开发门槛,从小时级的 SQL开发和分析可视化,到通过实时的对话式自助分析、图表绘制、文本生成能力完成数据分析报告,让更多数据消费者自主取数、高效用数。法规制度走向成熟稳定,城市数据空间进入深度使用通过数据要素实践的深入,以及行业应用的日益丰富,对于当前数据资源交换难、数据资产确权难、数据资产评估难、数据产品定价难等问题都将逐个突破,在国家统筹规划和领导下,法规体
184、制得到全面完善,未来从地方法规到国家法规,协同一致,管理和技术标准规范也逐步统一,政府监管运行机制也不断完善。这些变化和城市各个领域运行息息相关,也将推动城市数据空间形成进入深入认知和使用,推动海量ToC用户/ToB企业广泛参与。数据要素场景日益丰富,产业生态不断壮大随着数据要素在各个行业的应用场景越来丰富,基于产业上下游的各个参与方也越来越壮大,未来的产业生态仍将不断提速,围绕城市数据要素的高效合规流通,在细分领域更加专业,分工更加明确,数据产品不断迭代,应用场景更加丰富,形成良性可持续发展。同时涌现大量数据要素相关中介服务机构,提供数据相关的产品和服务,包括价值评估、担保抵押、权益保障、推
185、动交易达成等服务,形成百家争鸣的产业生态。城市发展进入高阶发展,充分发挥数据要素的创新引擎作用 城市数据空间驱动城市进入高阶发展,通过数据要素驱动商业模式创新、生产方式改变、业务体44发展与展望在十多年的数字化转型中,城市中已经形成了大量的企业数据库、行业应用和公共数据集,分散在不同的业务主体中,需要打破孤岛,围绕应用需求把数据有序流动起来。最终目的是释放数据价值,激活数据要素潜能,提升城市居民的服务能级,提高城市治理精细化水平,打造城市数字经济创新发展高地,为赋能整体城市数字化转型奠定坚实基础。我们充分借鉴欧洲数据空间的成功经验,以及上海数据集团联合华为成功打造“天机智信”平台的实践经验,探
186、索出城市数据空间的全新理念。城市的数字化转型提升了城市的运行效率,但在很大程度上仍没有激发出城市数据的巨大价值。未来将从城市的数字化转型中开辟出数据要素新空间,全新的制度规则、权益体系、标准体系、交易规则、商业模式等将重新定义,迎来城市数据要素流量爆发的时代。展望未来的城市数据空间,具备公正、公平的制度体系,协同、高效的组织体系,数据要素从单一要素,演变到多要素融合体系,形成自治自律、持续创新、持续循环的城市数据空间。基础设施改造升级,数据要素流通更加高效和智能基础设施是未来数据要素市场的关键基础能力,打造城市资源集约共享、安全可信可控的坚实底座,以适应海量数据要素的流通需求。数据要素从市区县
187、级到省级,再到国家级,甚至跨境下的数据流通大联网形态将会应运而生,搭建省际数据高速、国家数据高速、国际数据高速大动脉,为数据要素供给、流通和交易提供四通八达的路网基础,加快内外融合大循环运转。城市数据空间的建设不仅局限于城市数据空间基础设施,还应该考虑构建智能化的城市数据开发,加速数据产品生产提效。利用AI技术,降低分析报告类数据产品开发门槛,从小时级的 SQL开发和分析可视化,到通过实时的对话式自助分析、图表绘制、文本生成能力完成数据分析报告,让更多数据消费者自主取数、高效用数。法规制度走向成熟稳定,城市数据空间进入深度使用通过数据要素实践的深入,以及行业应用的日益丰富,对于当前数据资源交换
188、难、数据资产确权难、数据资产评估难、数据产品定价难等问题都将逐个突破,在国家统筹规划和领导下,法规体制得到全面完善,未来从地方法规到国家法规,协同一致,管理和技术标准规范也逐步统一,政府监管运行机制也不断完善。这些变化和城市各个领域运行息息相关,也将推动城市数据空间形成进入深入认知和使用,推动海量ToC用户/ToB企业广泛参与。数据要素场景日益丰富,产业生态不断壮大随着数据要素在各个行业的应用场景越来丰富,基于产业上下游的各个参与方也越来越壮大,未来的产业生态仍将不断提速,围绕城市数据要素的高效合规流通,在细分领域更加专业,分工更加明确,数据产品不断迭代,应用场景更加丰富,形成良性可持续发展。
189、同时涌现大量数据要素相关中介服务机构,提供数据相关的产品和服务,包括价值评估、担保抵押、权益保障、推动交易达成等服务,形成百家争鸣的产业生态。城市发展进入高阶发展,充分发挥数据要素的创新引擎作用 城市数据空间驱动城市进入高阶发展,通过数据要素驱动商业模式创新、生产方式改变、业务体44发展与展望参考引用1中国信息通信研究院,数据要素白皮书(2023年),20232中国社会科学出版社,全球城市竞争力报告2019-2020:跨入城市的世界300年变局(2019年2020年),20213International Data Spaces Association.IDSA-Position-Paper-
190、GAIA-X-and-IDS.20214汤珂,统筹构建规范高效数据交易场所,促进数据要素充分有序流通,20225翁翕,统筹构建规范高效的交易场所,为数据流通保驾护航,20226于施洋、王建冬、黄倩倩,论数据要素市场,20237于施洋,加快构建全国一体化的数据交易市场体系,20238黄丽华,建立数据要素流通全流程合规与监管体系,是实现安全高效流通的基本要求,20229华为公司,华为数据之道,202010中电子协会,非结构化数据管理解决方案白皮书,202011大数据技术标准推进委员会,数据资产管理实践白皮书(6.0),202312南数研究院,国家互联网信息办公室发布,202313国家互联网信息办公
191、室,数字中国发展报告(2022年),202314国家市场监督管理总局、国家标准化管理委员会,城市数据治理能力成熟度模型,202215中国信息通信研究院、华为技术有限公司,数据基础设施白皮书2019,2019REFERENCE COUNTING验场景升级。未来需要大力推动产业链多元化数据要素的组合迭代、交叉融合,围绕产业链部署创新链、围绕创新链布局产业链,发挥数据要素的创新引擎作用。最后,城市数据空间不仅仅是数据空间,更是城市生命力的空间,孕育城市发展驱动力和技术创新突破力,也是城市梦想和温度的空间,数据连接着人、责任和情感,从而让城市数据空间变得无限可能!城市数据空间不仅仅是单个城市的数据空间
192、,更是区域和全国的数据空间,也是全球的数据空间,我们从城市为起点开始启航,未来将延伸到数据的每一个角落,无论从广袤草原,还是到浩瀚星空。参考引用1中国信息通信研究院,数据要素白皮书(2023年),20232中国社会科学出版社,全球城市竞争力报告2019-2020:跨入城市的世界300年变局(2019年2020年),20213International Data Spaces Association.IDSA-Position-Paper-GAIA-X-and-IDS.20214汤珂,统筹构建规范高效数据交易场所,促进数据要素充分有序流通,20225翁翕,统筹构建规范高效的交易场所,为数据流通保
193、驾护航,20226于施洋、王建冬、黄倩倩,论数据要素市场,20237于施洋,加快构建全国一体化的数据交易市场体系,20238黄丽华,建立数据要素流通全流程合规与监管体系,是实现安全高效流通的基本要求,20229华为公司,华为数据之道,202010中电子协会,非结构化数据管理解决方案白皮书,202011大数据技术标准推进委员会,数据资产管理实践白皮书(6.0),202312南数研究院,国家互联网信息办公室发布,202313国家互联网信息办公室,数字中国发展报告(2022年),202314国家市场监督管理总局、国家标准化管理委员会,城市数据治理能力成熟度模型,202215中国信息通信研究院、华为技
194、术有限公司,数据基础设施白皮书2019,2019REFERENCE COUNTING验场景升级。未来需要大力推动产业链多元化数据要素的组合迭代、交叉融合,围绕产业链部署创新链、围绕创新链布局产业链,发挥数据要素的创新引擎作用。最后,城市数据空间不仅仅是数据空间,更是城市生命力的空间,孕育城市发展驱动力和技术创新突破力,也是城市梦想和温度的空间,数据连接着人、责任和情感,从而让城市数据空间变得无限可能!城市数据空间不仅仅是单个城市的数据空间,更是区域和全国的数据空间,也是全球的数据空间,我们从城市为起点开始启航,未来将延伸到数据的每一个角落,无论从广袤草原,还是到浩瀚星空。践行深度用云城市数据空
195、间CDS白皮书版权所有 华为技术有限公司2023。保留一切权利。非经华为技术有限公司书面同意,任何单位和个人不得擅自摘抄、复制本手册内容的部分或全部,并不得以任何形式传播。免责声明商标声明 、华为、是华为技术有限公司商标或者注册商标。在本手册中以及本手册描述的产品中,出现的其它商标,产品名称,服务名称以及公司名称,由其各自的所有人拥有。本文档可能含有预测信息,包括但不限于有关未来的财务、运营、产品系列、新技术等信息。由于实践中存在很多不确定因素,可能导致实际结果与预测信息有很大的差别。因此,本文档信息仅供参考,不构成任何要约或承诺,华为不对您在本文档基础上做出的任何行为承担责任。华为可能不经通知修改上述信息,恕不另行通知。扫码了解更多扫码获取电子版