《华为云&安徽省大数据中心:2023政务数据之道白皮书(47页).pdf》由会员分享,可在线阅读,更多相关《华为云&安徽省大数据中心:2023政务数据之道白皮书(47页).pdf(47页珍藏版)》请在三个皮匠报告上搜索。
1、践行深度用云政务数据之道白皮书编写单位及作者P R E P A R A T I O N C O M M I T T E E编 写 单 位编制委员会安徽省大数据中心华为云计算技术有限公司编委主任:钱 海 胡玉海编委委员:龚 炜 叶佳鹏 陈文权 王 飞编委成员:柏 君 程 菲 邓 东 胡雨亭 胡艺馨 胡忠媛 何洁和 霍卫峰 江 南 金智功 刘翔羽 卢 翔 倪海波 宋晔志鹏 孙长森 向嘉维 徐 航袁军红 殷润悦 赵丙文 陈士星 王慧敏 唐政府杨芳文(排名不分先后)前言 今时代,“大数据”已经不是一个概念名词,它已经真实 地渗透到每一个行业的业务领域,从业务活动的“衍生品”逐步转变为业务决策的“必需品
2、”,“数据”深度参与到各行各业的生产业务中,为数字化转型提供当代石油。政府行业尤其典型,各级政府在从管理型向服务型转变的过程,我们都能感觉到政府机构内部权力运行和对外优化服务的衔接越来越依赖数据和信赖数据,无论是我们现在坐在家里动动指尖就可以办成的某项政务服务事项,还是已经成为过去的科技抗疫联防联控机制的施行,政府部门统筹推进重点工作已经离不开政务数据的有效支撑,“数据”变得越来越重要。政务数据逐步汇聚融合开始呈现出爆发式增长,在对政务数据进行采集、存储、计算、管理和使用过程中,在政务数据逐步融合更多元的数据产生更高价值越来越开放的探索中,我们也越来越发现政府部门需要建立完善体制机制、管理规范
3、、平台能力以保障政务数据的有效性、安全性和可靠性。我们希望通过本白皮书,就如何更合规、更有效地挖掘政务数据价值与业界专家同仁共同探讨,共同推动政务数据充分共享和有序开发利用。本白皮书由华为公司联合政府行业领军的机构共同编制,充分融合了各方在数字化转型和数据管理体系构建等方面的理论和实践成果。聚焦政府行业在数据汇聚、治理、应用方面的发展现状和当前挑战,总结出了政务数据之道十步进阶,并将相关工程案例和实践经验进行总结,以为政务领域的数据治理提供方法论指导和实践探索参考。F O R E W O R D当02目录D I R E C T O R Y1.1 畅通数据资源循环,打通数字中国的“数据经脉”1.
4、3 促进公共数据开发,激活数字经济的“增长引擎”1.2 构建政务数据体系,构筑数字政府的“基础工程”数据成为时代最强音012.1 演进脉络:在政策要求和场景需求的双轮驱动下,数据应用不断创新迭代2.2 面临挑战:数据的应用效果面临挑战,需理论和实践结合不断螺旋上升政务数据发展现状023.1 内涵:推动政务领域数据管理转型的方法论和实践指引3.2 体系框架:以架构梳理为抓手,构建数据域整体政府3.3 核心价值:家底全面厘清、资产分布有序、源头治理有效、共享服务高效政务数据之道概述0305-0708--3940-4344-454.1 总体框架 4.2 定机制:建立适配的机制体
5、制4.3 立规范:制定统一规范制度4.4 建平台:统一规划数据平台4.5 理架构:构建统一数据架构4.6 推治理:推行数据源头治理4.7 通共享:提升共享服务水平4.8 提质量:完善质量评估能力4.9 重服务:构建数据服务体系4.10 保安全:保障数据全周期安全4.11 助流通:数据要素可信流通探索政务数据之道十步进阶045.1 安徽省5.2 上海市5.3 深圳市优秀实践05未来展望0605数据成为时代最强音2023年2月27日,中共中央、国务院印发了数字中国建设整体布局规划(以下简称“数字中国”),“数字中国”按照“2522”的整体框架进行布局,提出夯实数字基础设施和数据资源体系两大基础,明
6、确将畅通数据资源大循环作为夯实数字中国建设基础的关键一环,打通数字中国的“数据经脉”被提到了前所未有的高度,重点强调通过健全数据管理体制机制,强化数据资源储备,实现数据资源规模和质量的快速提升;通过加快构建一体化政务大数据体系,形成常态化供需对接机制,推动公共数据汇聚利用;通过加快建立数据产权制度、收益分配机制等,促进数据要素商业潜能有效释放,促进数字经济发展效益大幅增强。“数字中国”提出了通过夯实数字基础设施和数据资源体系,赋能数字技术与经济、政务、文化、社会、生态五大领域,形成五位一体的深度融合。数据是数字化、网络化、智能化的基础,通过与各环节的融合,深刻改变着人们的生活方式、生产方式、和
7、社会治理方式。夯实数据资源体系,畅通数据资源大循环的核心,是数据资源的跨领域、跨组织域、跨区域的汇聚利用,数据跨域互联互通是高质量数据资源供给的保障。这一点在数字政府建设过程中尤为突出,通过“十三五”时期在政务领域的整体规划,诸如全国政务云基础设施、数据共享交换体系、数据资源目录体系、一体化政务服务平台等基础能力已形成布局和广泛应用,在数字基础设施和数据资源体系方面已有一定的建设基础。可以说,通过数字政务领域的先行先试,带动和构建了政务数1.1 畅通数据资源循环,打通数字中国的“数据经脉”据体系的雏形,吹响了带动数字中国建设的先锋号。国务院关于加强数字政府建设的指导意见(国发202214号)作
8、为在数字政府建设方面的顶设指导,同样强调了“数据”对政府治理能力提升的重要作用,在“数据资源体系”构建方面提出了相关要求,突出强调加快“一体化政务大数据体系”的建设,从创新管理机制、深化高效共享、促进开发利用三个方面提出了要求。一是建立健全权威高效的政务数据共享协调机制,整合构建全国一体化政务大数据体系,增强数字政府效能,营造良好数字生态;二是推进政务数据开放共享、有效利用,加强数据资源整合和安全保护,同步构建完善数据全生命周期质量管理体系;三是促进数据高效流通使用,充分释放政务数据资源价值,推动政府治理流程再造和模式优化。全国一体化政务大数据体系建设指南(国办1.2 构建政务大数据体系,构筑
9、数字政府的“基础工程”06函2022102号)作为全国一体化政务大数据体系建设的“工程图纸”,对“十三五”时期我国政务数据体系建设进行了充分总结,同时面向未来发展演进提出了统筹机制、数据共享、应用支撑、标准规范、安全保障等方面的现状问题以及八个一体化的建设思路,也将一体化政务大数据的建设目标和实施路径一并提出。一是强化政府部门数据管理职责,明确数据归集、共享、开放、应用、安全、存储、归档等责任;二是强调数据治理,依法依规促进数据高效共享和有序开发利用,充分释放数据要素价值;三是建立全国标准统一、动态管理的政务数据目录,实行“一数一源一标准”,实现数据资源清单化管理。闻令而动,各级政府陆续推动政
10、务大数据体系的建设,整合过去“散、乱、小、杂”的数据平台和工具软件,开始用一体化的思路推动政务大数据体系建设,打造数字政府的“基础工程”,为后续公共数据、社会数据的融合开发奠定坚实基座;为充分发挥数据价值,构筑新的数字经济增长极蓄势储能。“数据”作为新型生产要素,具有无形性、非消耗性等特点,可以接近零成本无限复制,在数据生产、流通、使用等过程中,个人、企业、社会、国家等相关主体对数据有着不同利益诉求,且呈现复杂共生、相互依存、动态变化等特点。同时,“数据”从汇聚共享、开发利用到要素流通,正在逐步从幕后走向台前,在经济发展、城市治理、政务服务等越来越多的领域发挥决定作用。恰逢其时,中共中央、国务
11、院印发关于构建数据基础制度更好发挥数据要素作用的意见(以下简称“数据二十条”),为数据要素市场化发展解决了制度空白,提供了良好环境。“数据二十条”提出以促进数据合规高效流通使用、赋能实体经济为主线,以推进数据产权、流通交易、收益分配、安全治理为重点,整体性构建数据基础制度,充分实现数据要素价值、释放价值红利。随着“数据二十条”的发布,今年公共数据授权运营、数据要素开发成为行业热词,各地结合属地特点创新发展,在上海、南京、广州、深圳、北京等先进地市纷纷出台相关地方制度规范,有些地方同步进行了机构建设和开展实践探索。包括城市治理模式创新,通过数字化技术和数据资源的运用,提高城市治理效率和服务水平;
12、数字金融服务创新,发挥数据在金融领域的作用,推动数字金融的发展,包括数字货币、数字支付、数字化金融服务等;数字文化推广创新,挖掘数字文化价值,推动数字文化产业的发展,以数字媒体、数字艺术、数字游戏、数字出版等为重点,推动文化创意产业的数字化转型。政务数据作为政府履职过程中产生的生产数据,具有基础性和权威性,属于重要的数据要素类型,是公共数据、社会数据的融合开发过程中的主数据,发挥了“度量衡”作用。政务数据的汇聚治理是否充分、共享机制是否健全、质量情况是否达标将直接关系我国数据要素市场化是否能够繁荣发展的关键。相信随着政务数据共享和公共数据授权运营内外双循环的相互牵引,我国“数据产业”必将迎来蓬
13、勃发展。1.3 促进公共数据开发,激活数字经济的“增长引擎”0709政务数据发展现状092006-2020年国家信息化发展战略(中发办 2006 11号)初步提出以资源共享为战略方针政务信息系统整合共享实施方案(国发办 2017 39号)要求各部门地方加快信息系统整合共享,构建数据共享交换体系加快推进“互联网+政务服务”工作的指导意见(国发 2016 55号)启动“互联网+政务服务”建设,打通数据壁垒,实现各级各部门信息互联互通全国一体化政务大数据体系建设指南(国办函 2022 102号)提出统筹管理、数据目录、数据资源、共享交换、数据服务、算力管理、标准规范、安全保障八个一体化建设要求中共中
14、央、国务院印发了数字中国建设整体布局规划,畅通数据资源共享,推动公共数据汇聚利用,释放商业数据价值潜能政务信息资源目录编制指南(试行)(发改高技 2017 1272号)明确政务信息资源目录编制标准“互联网+政务服务”技术体系建设指南(国办函 2016 108号)为全国一体化政务服务平台提供了“工程图纸”,明确建设路径国务院印发关于加强数字政府建设的指导意见(国发 2022 14号)提出加快推进全国一体化政务大数据体系建设,加强数据治理中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见(数据二十条)促进数据合规高效流通使用,实现数据要素价值中共中央、国务院印发了党和国家机构改革方案,组
15、建国家数据局。负责数据要素基础制度建设,推进数字基础设施布局建设。从数据孤岛到整合共享从数据按需汇聚到数据资产管理关注授权运营和交易流通2015年,国务院印发促进大数据发展行动纲要(国发201550号),明确指出大数据成为提升政府治理能力的新途径,大数据应用能够推动政府数据开放共享,促进社会事业数据融合和资源整合,推动政府管理理念和社会治理模式进步。2016年,国务院先后印发政务信息资源共享管理暂行办法(国发201651号)、加快推进“互联网+政务服务”工作的指导意见(国发201655号)、“互联网+政务服务”技术体系建设指南(国办函2016108号)等一系列政策文件。对整合构建统一的数据共享
16、交换平台体系,打通数据壁垒,实现各部门、各层级数据信息互联互通提供了顶层规划和政策要求。在此期间,国家开始从打通数据壁垒、构建数据共享基础设施的角度出发,结合紧迫业务需求构建了国家、省、地市、区县四级的共享交换体系,通过前置机级联的方式初步实现了构建跨层级跨部门的数据传输,修筑了政务数据未来融合“十三五”期间,通过全国一体化政务服务平台、“互联网+监管”、全国信用信息系统、投资项目在线审批等业务需求驱动,逐步扩大到政府部门间的政务信息资源整合共享,在数据域初步实现了各行政层级行业数据的横向联通,以及跨层级数据的向上汇聚、基层回流和跨域流通。各地也因地制宜,一手治数据,一手抓应用,形成了各具特色
17、的政务数据的应用场景。进入“十四五”,政务数据的共享开放更加体系化,一体化政务大数据体系被正式提出,各地建设脉络基本清晰,政务数据面向未来的发展演进大致可分为数据共享交换、数据按需归集、数据资产管理、数据要素授权运营与交易流通四个阶段,每个阶段均有相关政策出台,指导全国各部门地方开展政务数据体系建设。1、数据共享交换阶段2.1 演进脉络:在政策要求和场景需求的双轮驱动下,数据应用不断创新迭代图1 政务大数据体系演进脉络10共享的“公路”基础设施,在国家层面关键信息化工程中发挥了重要作用。2、数据按需归集阶段在“放管服”改革实施过程中,一体化政务服务平台和“互联网+监管”等业务快速发展,各级政务
18、服务主管部门根据业务需要开始归集行业部门数据。2017年5月,国务院印发政务信息系统整合共享实施方案(国办发201739号)、政务信息资源目录编制指南(试行)(发改高技20171272号)等政策文件,要求各部门地方加快消除“僵尸”信息系统,整合部门内部信息系统,按照要求编制、完善政务信息资源目录。同时,基础信息资源库的构建也初步完成,针对具有共性需求的基础数据也启动了清洗和治理。在此期间人口、法人、空间地理、电子证照、社会信用等基础信息库实现了数据归集,并在应用场景中初步发挥了数据资源的支撑作用。比较典型的应用场景是在政府服务的出生证、社保等高频事项办理中,通过整合形成电子证照库,实现了指尖办
19、、无感办、最多跑一次等创新场景,极大提升了人民群众的服务体验和获得感。3、数据资产管理阶段随着人工智能、大数据、区块链等新兴技术的发展,政府部门对数据的需求已不仅限于共享交换,数据资源价值挖掘需求不断增加,数据资产的概念逐渐明确。2021年3月,十三届全国人大四次会议通过中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要,明确提出加强公共数据开放共享、推动政务信息化共建共用、提高数字化政务服务效能。2022年6月国务院印发加强数字政府建设的指导意见(国发202214号),同年10月国务院办公厅印发全国一体化政务大数据体系建设指南(国办函2022102号),提出了“全国一体
20、化政务大数据体系”的新概念,要求加强数据治理,依法依规促进数据高效共享和有序开发利用,充分释放数据要素价值,确保各类数据和个人信息安全。当前,各地政府也在积极探索数据资产价值挖掘新路径,以源头数据治理为抓手,从源头解决数据标准不一、质量低下等问题,高效推动数据的开发利用。结合人工智能、大数据、区块链等新兴技术,充分与政务服务、城市治理、普惠金融、经济运行等业务应用融合,持续的发挥数据价值,促进数据资源向数据资产快速转变。4、数据要素授权运营与交易流通阶段政务大数据经过多年的发展,国家已越来越重视“数据”,数据已与土地、劳动力、资本、技术一样,成为第五大生产要素。2022年12月,中共中央、国务
21、院联合印发关于构建数据基础制度更好发挥数据要素作用的意见,要求促进数据合规高效流通使用,实现数据要素价值。2023年2月,中共中央、国务院联合印发数字11中国建设整体布局规划,要求畅通数据资源共享,推动公共数据汇聚利用,释放商业数据价值潜能。并在同年3月,在国家层面组建国家数据局,主要负责数据要素基础制度建设,推进数字基础设施布局建设。数据要素蓬勃发展正当其时,各地积极推动数据交易所、大数据集团/公司的建设,不断探索数据要素授权运营与可信交易流通。运用隐私计算实现数据可用不可见、数据不出域等新模式,促进政务数据、公共数据、企业数据进行不同维度的融合,数据要素价值逐渐展现,为我国数字经济不断注入
22、新动能。结合政务大数据体系建设现状,我们能够看到其发展仍然存在体制机制不健全、政务数据家底不清、数据底座存在断点、数据共享不高效、数据要素流通难、数据安全难保障等问题。1、体制机制有待健全国家层面以及各地方未明确省政府、大数据主管部门以及业务部门之间的数据管理责任,在数据治理工作中,大数据主管部门与各业务部门协同难,省市两级政府也未建立相关体制机制、标准规范协同开展一体化政务大数据体系建设,导致省市两级工作开展思路与方式犹如百家争鸣。并且传统中心治理仅由大数据主管部门执行,业务部门未参与其中,导致数据治理工作成效甚微,数据质量问题难以解决,数据价值难以挖掘。2、政务数据家底不清政务信息化建设历
23、经多年,各级各部门拥有众多政务信息系统,数据体量巨大,但大数据主管部门在梳理政务数据目录时,仅围绕行政权力事项行权结果进行梳理,并未对全量数据进行盘点,导致大数据主管部门对政务数据的分布情况无法全盘掌握。目前各地均按照政务信息资源目录编制指南进行梳理,政务信息资源梳理各地的方法不尽相同,形成全国统一的政务数据“一本账”难度较大。3、数据底座存在断点政务大数据由数据共享交换演变而来,基本上各地都是从共享交换平台向政务大数据平台进行建设,数据采集、数据存储、数据治理、共享交换、数据开发、可视化展示、挖掘分析、数据开放等工具可能存在由多家厂商建设的情况,导致工作人员需要进行多次登录,无法提供一站式数
24、据管理,且各厂商之间可能存在工具不兼容、需定制开发等问题,增加建设运营维护成本。4、数据共享不高效各级各部门政务信息系统由不同厂商建设,数据2.2 面临挑战:数据的应用效果面临挑战,需理论和实践结合不断螺旋上升10标准不一,数据质量参差不齐。由于传统数据共享交换平台大多以离线批量集成,并且用数部门需向供数部门提交申请,供数部门审核通过后,用数部门才能拿到数据,流程周期冗长,导致数据难以高效的进行跨系统、跨部门、跨层级、跨地域流转,进而对各部门业务协同产生影响,造成政务服务事项办理难、电子证照应用难等问题频现,拉低政府服务效能,延缓数字政府建设进程。5、数据要素流通不畅数据要素流通处于起步阶段,
25、对于来源于不同业务部门的政务数据,无法制定出完善的数据产权制度,导致各部门间数据所有权不清晰;数据交易的商业模式也尚未形成完善的体系,导致数据在交易过程中缺乏相关的交易标准。6、数据安全保障难政务数据体量大,且分布于政府部门各业务系统中,数据中包含高价值隐私信息,一旦发生泄露或篡改等事故,将会造成巨大的影响与损失。当前政务数据安全保障存在以下问题,一是在政务数据采集、传输、存储、使用、共享、销毁整个生命周期中,各环节的安全责任体系难以划分,安全保障手段措施亦不同。二是政务数据安全通用基础技术能力如数据分类分级、身份认证、访问控制、日志管理等有待加强。三是安全运营管理力度急需提升,监控审计、应急
26、响应、攻防演练等重要系统数据安全运营重点事项流程仍需改进。四是工作人员存在安全意识不强,工作技能不足等问题。11政务数据之道概述12政务数据共享开放经历了多年发展已初成体系,各级政府都已建成数据共享交换、数据资源目录以及共享和开放门户等基础能力,政务数据在支撑政府运转,尤其是在政务服务领域的应用已经初具规模并显现成效。同时,我们也发现,目前政务数据的价值挖掘还远远不够。据统计,政府行业数据在各行业数据产量中占比22.4%,规模上占据优势。然而,政府数据的应用与体制机制、标准规范、数据质量、场景需求等因素密切相关,政务数据在支撑政府、赋能产业、服务社会等方面仍然有巨大潜力,更大价值的挖掘依然任重
27、道远。“政务数据之道”是从制度规范、平台建设、架构梳理、治理规划等多个维度系统性提出推动政务领域数据管理转型的方法论和工程实践。作为优秀实践的总结,基于数据底座支撑政务领域数据治理实践,通过构建管理架构、厘清数据目录、提升数据质量、促进数据共享、保障数据应用流程,将政务数据管理的方法论与实践融合,让政务数据不再深藏闺中,充分释放社会价值。政务数据来源于业务,最终服务于业务,不断融合迭代,通过统一平台联通数据价值的不断升华和持续释放,践行数据之道,绽放数据之美。实践证明,一个组织只有构筑一套适配组织特点的数据管理体系,才能确保关键数据资产有清晰的业务管理责任;才能保证IT建设有稳定的原则和依据,
28、作业人员有规范的流程和指导;才能当争议出现时,有裁决机构和升级处理机制;才能确保数据管理的持续性,人才、组织、预算有充足的保障。3.1 内涵:推动政务领域数据管理转型的方法论和实践指引3.2 体系框架:以架构梳理为抓手,构建数据域整体政府15“政务数据之道”打造了一套适应政务业务的架构体系,通过适配政府部门的政策、组织、流程体系,对数据架构、数据质量进行有效管理,最终目标是实现以业务场景为核心的政务数据的综合治理。“政务数据之道”需要通过一体化平台建设统一承载,确保数据应用成效。图2 政务数据之道体系框架政务数据之道体系框架以架构梳理为抓手,构建数据域整体政府以源头治理为核心,保障数据高质量赋
29、能价值链4 数据流通外循环:数据服务、数据产品 价值链2 数据质量提升:源头治理、入湖标准价值链1 数据资产一张图:数据架构、数据Owner数据共享开放管理政策数据架构管理政策数据治理管理政策政务数据管理总纲数据架构管理流程政策指引流程数 据架 构标 准管 理数 据治 理质 量管 理组织平台数据源管理流程数据质量管理流程技术安全价值链3 数据共享内循环:资源目录、供需对接 业务对象在履职过程打通维度数据在决策过程打通数据挖掘分析平台统一数据湖一站式数据治理平台管理安全运营安全建设领导小组首席数据官业务专员数据专员安全是底线16政务数据之道体系框架是在政务数据管理总纲和政策细则的整体牵引下,按总
30、纲和细则要求适配组织、规范流程以及构建安全防护能力。基于统一平台提供的存算、治理、分析等能力,开展数据架构梳理和数据源头治理工作。在此过程中,形成了2个纵向打通和4条价值链横向延伸,驱动政务数据管理体系在价值牵引下完成自我迭代和优化完善。2个纵向打通主要面向政务数据支撑业务场景的应用过程。一是“业务对象在履职过程中打通”,即以“业务对象”为核心开展数据治理,并将业务对象应用于在政府履职的全过程,贯穿于政府运行的生产业务,确保业务对象的质量和数据清洁,为业务顺畅开展和数据持续增值保驾护航;二是“维度数据在决策过程打通”,即面向支撑政府决策分析的场景,通过数据治理形成一系列的数据集市,并实现数据的
31、实时更新保障鲜活,在决策分析过程中,实现维度数据的灵活调用,以集约化、平台化的理念开展数据分析挖掘。4条价值链主要面向政务数据在核心场景中的增值过程。一是数据资产一张图。按照政府L1-L5的方法论进行政府数据域架构梳理,是数字政府在数据域的骨骼框架;二是数据质量提升。通过在制度、标准方面进行规范,将质量争议处置环节前置,确保数据高价值和应用成效;三是数据共享内循环。通过完善数据归集的时效性需求,提升共享交换的一站式能力,保障资源目录完整和供需对接顺畅;四是数据要素外循环。在数据产权明晰和安全保障前提下,为政务数据在社会面进行要素流通做好积累和沉淀。在此数据管理体系基础上,本白皮书提出建立适配的
32、机制体制、制定统一制度规范、统一规划数据平台、构建统一数据架构、推行数据源头治理、提升共享服务水平、构建数据服务体系、完善质量评估能力、保障数据全周期安全、数据要素可信流通探索的政务数据之道“十步进阶”。“十步进阶”以体制机制为抓手,以业务对象为核心,重塑政府数据架构,厘清数据家底,从源头开展数据治理,解决业务目标不明确、数据源头不清晰、数据语言不统一、数据质量不合格等问题,并以此加强数据汇聚融合、共享开放和开发利用,促进数据依法有序流动,充分发挥政务数据在提升政府履职能力、支撑数字政府建设以及推进国家治理体系和治理能力现代化中的重要作用。本白皮书旨在助力各级政府构建一套“家底全面厘清、资产分
33、布有序、治理完备、共享服务高效”的政务数据管理体系,通过加强基础能力建设,加大应用创新力度,推进资源开发利用与挖掘分析,不断发挥政务数据价值。本白皮书提出四个“一”的目标。1、助力厘清政务数据家底,梳理数据架构“一本账”本白皮书倡导以统一的方法论进行政务数据编目,盘点全量政务数据家底,形成统一政务数据架构,建立全量覆盖、互联互通的高质量数据资产一本账,配套政务数据架构同步更新机制,实现政务数据“一本账”管理。3.3 核心价值:家底全面厘清、资产分布有序、源头治理有效、共享服务高效152、政务数据归集,构建政务数据资产分布“一张图”本白皮书倡导按照“按需归集、应归尽归”的原则,将政务数据归集至政
34、务大数据平台,由平台统一对政务数据进行管理,同时牵引应用架构设计,合理规划数据分布,实现数据流向可追溯、质量问题可定责,打造政务数据资产分布“一张图”。3、推行数据源头治理,形成治理路径的“一标准”本白皮书倡导数据治理按照“一数一源一标准”的原则,从中心治理到源头治理,让业务部门参与数据治理,从源头解决数据质量低下、数据标准不一、数据源头不清等问题,助力政务数据高质量数据支撑各类应用。4、优化共享交换体系,实现共享服务的“一站式”本白皮书倡导从共享流程、授权时限、供需对接、成效评价等角度提升共享交换体系的能力,高效满足各地区各部门数据共享需求,助力各级各部门一网通办、跨区域通办、全省通办、跨省
35、通办等业务顺利开展,持续提升政府服务效能与履职能力。政务数据之道十步进阶政务数据之道基于当前政务大数据建设现状,对准当前阶段建设目标和面临的痛点难点,结合华为数据管理经验,总结全国多个省、市政务大数据建设经验,在管理机制、标准规范、平台技术、共享交换、数据架构、数据治理、数据服务、数据流通、数据质量、数据安全多个方面阐述政务大数据管理中的工作方法。政务数据之道方法论形成十项创新举措,包括:建立适配的体制机制、制定统一规范制度、统一规划数据平台、构建统一数据架构、提升共享服务水平、推行数据源头治理、构建数据服务体系、保障数据全周期安全、完善质量评估能力、数据要素可信流通探索。“政务数据之道”以体
36、制机制为抓手,业务对象为核心,重塑政府数据架构,厘清数据家底,从源头开展数据治理,解决业务目标不明确、数据源头不清晰、数据语言不统一、数据质量不合格等问题,并以此加强数据汇聚融合、共享开放和开发利用,促进数据依法有序流动,充分发挥政务数据在提升政府履职能力、支撑数字政府建设以及推进国家治理体系和治理能力现代化中的重要作用。4.1 总体框架图3 政务数据之道十步进阶19助流通 数据要素可信流通探索10可信计算流通数据API流通可信交换流通授权运营平台合规监管平台重服务 构建数据服务体系7面向业务自助分析数据服务体系规划数据服务设计与实现推治理 推行数据源头治理6通共享 提升共享服务水平5统一共享
37、平台共享流程标准化供需对接精准化授权时限规范化交换任务自动化理架构 构建统一数据架构4统一数据架构确定数据Owner数据分级分类数据源认证确定数据标准建平台 统一规划数据平台3政务云底座数据湖数据仓库数据治理平台数据分析挖掘平台2定机制 建立适配的体制机制保安全 保障数据全周期安全立规范 制定统一规范制度提质量 完善质量评估能力189数据入湖准备数据入湖治理统一入湖标准数据质量改进数据管理体系的构建是一项系统性工程,其有效运转离不开一套健全的数据管理组织体系。政务数据管理组织体系应该重点解决三个主要问题,一是组织机构的定位与职责,定义好相关组织的职能分工;二是如何理顺在政府条块化管理中的数据协
38、同关系,无论是国、省、市、区(县)的纵向关系,还是数据管理单位、数源部门、用数部门数据需求单位之间的关系,以匹配相应的流程机制;三是面向制度和流程的落地,要设置什么样的专职岗位来统筹好各部门的协调和分工,来保障政务数据管理工作的有效性。以问题为导向,体制机制设计的目标是形成纵横贯通的组织体系,行之有效的流程体系和任务明确的职能体系。主要包括以下两个方面:首先立足实际,合理构建机制流程大数据主管部门代表本级政府制定相关的数据管理办法、流程、方法和支撑系统,制定数据管理的战略规划和年度计划并监督落实;建立并维护数据架构,保障数据质量;披露重大数据问题,提升数据管理能力;推动数据文化的建立和传播等。
39、各领域的数据管理专业组织,向业务领域的最高主管汇报,承接并落实业务领域最高主管的数据管理责任;同时遵从本级大数据主管部门发布的统一数据管理办法、流程和规则要求。双向汇报的机制确保数据工作能充分融入业务,同时能够在应用系统中有效落地的关。4.2 定机制:建立适配的机制体制20图4 建立适配的体制机制 一体化政务大数据体系建设领导小组省级数源部门市级数源部门县级数源部门省级用数部门市级用数部门县级用数部门省级大数据主管部门市级大数据主管部门县级大数据主管部门跨 部 门 联 合 工 作 机 制跨层级联合工作机制数据汇聚共享清单数据汇聚需求清单数据汇聚需求清单数据服务需求清单数据服务需求清单数据服务需
40、求清单业务指导事务汇报业务指导事务汇报业务指导事务汇报省政府市政府县政府统筹指导统筹指导统筹指导在组织机构设置的基础上,需要构建跨层级联动和跨部门协同的流程机制,确保政务数据管理工作有序开展。一是构建跨层级联动机制。省级大数据主管部门需要指导地市制定数据质量评估机制、编制通用和行业数据标准等;市级数据管理单位需参照省级管理办法明确本市数据治理组织和协同工作,基于全省通用数据标准补充编制本市所需的数据标准,各市牵头梳理市级及以下建设的应用系统和数据资产,补充完善全省统一数据架构,协同推进数据治理实施;省内协同可采用“省级集中部署”或“省市两级部署”。二是构建跨部门协同机制。明确大数据主管部门对政
41、务大数据体系的统筹规划责任和各业务部门对业务数据质量管理责任,是确保政务大数据管理体系发挥作用的基石。业务即行为,行为即记录,记录即数据。每一个数据必须由对应的业务部门承担管理责任,且必须有唯一的数据负责人。各级业务部门主要负责本部门的数据治理工作,解决本部门当前存在的各种数据问题,如重复录入问题、数据多头管理问题、数据不一致问题等,梳理所有的应用系统及数据、业务架构和业务流程梳理、行业数据标准编制、数据资源编目、数据共享等工作。二是坚持创新,持续健全工作机制。以问题为导向,坚持持续创新。各地政府积极探索数据管理创新举措,据统计,截至2023年10月,全国已有13个省级单位发布首席数据官制度相
42、关建设方案,构建省、市、县多级首席数据官体系。在原有组织架构和制度保障基础上,进一步完善数据管理工作机制。一方面,通过明确数据管理专业领域职责,细化数据管理任务,增强目标的趋向推力,为数字政府改革建设和数据要素市场体系建设提升动能;另一方面,统筹数据汇聚治理、共享开放、开发利用、人才队伍建设战略规划和实施工作,创新设立部门首席数据官、数据官、数据专员等角色,进一步畅通决策、管理、执行的任务传导和横纵向协同联动,增强各项工作的一体化管理,保障公共数据资源价值有效释放,实现数据要素安全有序流通。通过践行首席数据官制度,建立健全数据管理统筹机制,构建数据架构,实现统筹管理一体化。191、数据架构管理
43、政策数据架构管理政策完成政务数据架构的内容和规范的定义,统一政务数据的度量衡,推动数据在各行业的统一认识。包括数据架构管理规范、业务对象管理规范、数据标准管理规范、数据指标管理规范、数据源认证规范。1)数据架构管理规范数据架构管理规范统一政务数据的定义,明确对数据架构的管理要求、责任分工、编码规范和管理流程,指导各行业政务数据的统一管理,实现业务与物理世界的紧密联系,形成政务数据统一规范、统一编码、统一架构的“一本账”管理。数据架构管理应遵循关键数据应被识别、分类、定义及标准化,数据的定义在全域范围内应唯一,数据标准制定要考虑跨业务要求;数据资产目录须反映各部门履职的业务过程,遵循统一的分类和
44、编目规范,为政务数据“一本账”管理服务,同时须满足各使用场景的技术理解和管理对接,保障互连共享的通畅性。此外,数据架构驱图5 政务数据管理总纲22政 务 数 据 管 理 总 纲数据架构管理政策政策指引数据治理管理政策数据共享开放管理政策数据架构管理规范业务对象管理规范数据标准管理规范数据指标管理规范数据源认证规范数据湖分层技术规范数据入湖技术规范数据质量技术方案数据开发技术方案数据服务技术方案数据共享开放管理规范数据安全管理规范数据分类管理规范数据分级管理规范标准规范指导实施规划设计入湖治理共享开放应用4.3 立规范:制定统一规范制度以政务数据管理办法为总纲,发布数据架构、数据治理和数据共享开
45、放管理政策,实现政务数据管理按照规划设计、入湖治理和开放利用的路线稳步推进,促进政务数据有效管理、质量提升、安全开放,实现数据管理标准规范一体化。动应用架构设计,合理规划数据分布;应用系统数据库的设计和开发要遵循数据架构,减少数据冗余,实现接口标准化。2)业务对象管理规范业务对象管理规范明确业务对象的定义、识别原则和管理方法,指导各部门有序开展业务对象识别工作,明确各业务对象的责任主体,确保数据资产目录有效构建以及数据治理工作的顺利实施。业务对象承载了业务运作和管理涉及的重要信息,是信息架构中最重要的管理要素。定义业务对象遵循:业务对象是指政府日常运行和履职过程中不可缺少的重要人、事、物等实体
46、;业务对象有唯一身份标识信息;业务对象相对独立并有属性描述;业务对象可实例化。3)数据标准管理规范数据标准管理规范规定了数据标准设计的职责分工、设计原则、设计规范以及管理流程的要求。数据标准是为了定义政府业务层面需共同遵守的属性层数据含义和业务规则,是政府各行业对某个数据的共同理解,这些理解一旦确定下来,就应作为政务数据的标准在政府内被共同遵守。4)数据指标管理规范数据指标管理规范明确了指标、复合指标、衍生指标、原子指标的定义、梳理规范、拆解规范与编码规范,实现数据指标的系统化管理。指标是衡量目标总体特征的统计数值,是能表征某一业务活动中业务状况的数值指示器。指标一般由指标名称和指标数值两部分
47、组成,指标名称及其含义体现了指标在质的规定性和量的规定性两个方面的特点;指标数值反映了指标在具体时间、地点、条件下的数量表现。数据指标体系将技术指标划分为原子指标、衍生指标和复合指标。5)数据源认证规范数据源认证规范明确了数据源的定义,数据源认证的职责分工、管理流程等内容,规范化数据源认证工作,确保数据源头的统一,以及跨流程、跨系统数据的唯一性和一致性,为实现一数一源打下坚实基础。数据源认证需要遵循以下原则:所有关键数据必须认证数据源,关键数据是指影响业务运行、关键数据统计的数据;数据Owner为关键数据指定源头,数据源必须遵从数据架构和标准;所有关键数据仅能在数据源录入、修改,全流程共享,其
48、他调用系统不能修改,下游环节发现的数据源质量问题,应当在数据源进行修正;数据Owner确保数据源的数据质量,对不符合数据质量标准的数据源,必须限期整改。2、数据治理管理政策数据治理管理政策明确了数据治理过程中各阶段工作需要遵守的技术规范,确保政务数据治理过程中整体架构一致性。包括数据湖分层技术规范、数据入湖技术规范、数据质量技术规范、数据开发技术规范、数据服务技术规范等。1)数据湖分层技术规范数据湖分层技术规范明确了数据入湖之后的统一组织方式,结合数据治理流程形成数据湖多层管理的结构,更清晰的展示数据治理的过程。数据湖分为贴源层、整合层、报告层和集市层。2)数据入湖技术规范数据入湖技术规范是数
49、据应用的基础,数据入湖技术规范明确了满足入湖的6项标准,包括明确数据Owner、符合数据标准、定义数据密级、明确数据源、数据质量评估、元数据注册。233)数据质量技术规范数据质量技术规范以提升政务数据质量为核心目标,明确数据在创建、维护、应用过程中的规则及质量要求,确保数据真实可靠。4)数据开发技术规范数据开发技术规范的目的是规范数据治理过程中涉及大量的数据开发工作,数据开发技术规范明确了数据开发过程中应遵循的库表组织形式、脚本组织形式等,统一政务各行业对数据治理的开发规范。5)数据服务技术规范数据服务技术规范明确了数据服务的管理原则、管理流程以及数据服务开发需要遵守的命名方式、接口格式等,明
50、确数据服务接口开发的流程和形式,形成统一的数据服务体系。3、数据共享开放管理政策数据开放管理政策明确了数据对外共享和开放需要遵循的流程,定义政务数据的分类分级以及全生命周期管理流程,保证政务数据共享及开放的合规、安全、可靠。包括数据安全管理规范、数据分类管理规范、数据分级管理规范和数据共享开放管理规范:1)数据安全管理规范数据安全管理规范明确政务数据各阶段的数据安全管理技术、措施和流程,保障数据在采集、传输、存储、处理、交换和销毁全生命周期过程中的使用安全,形成完善的数据安全体系。2)数据分类管理规范数据分类管理规范明确政务数据的分类形式、分类原则以及管理流程,所有政务数据应该参照数据分类管理
51、规范对数据进行分类,同时根据不同的分类提供相应的管理措施,通过数据分类提升整体数据共享开放的效率。3)数据分级管理规范数据分级管理规范明确政务数据的安全分级、分级原则以及管理流程,所有政务数据应该参照数据分级管理规范对数据进行安全分级,同时根据不同的安全级别进行相应的数据共享开放限制,保障数据在共享开放过程中的安全性。4)数据共享开放管理规范数据共享开放管理规范明确政务数据共享、开放的原则以及管理流程,规定各方在数据共享、开放过程中的责任和工作,保证各政府部门之间的数据共享的流程畅通,政务数据对社会公众、企业开放的安全可靠。一体化政务大数据体系建设需构建政务大数据平台,实现数据跨层级、跨地域、
52、跨系统、跨部门、跨业务进行汇聚、融合、治理、服务等功能。因此政务大数据平台的建设包括统一平台运营、统一数据湖、一站式数据治理平台、数据挖244.4 建平台:统一规划数据平台掘分析平台等,面向数据提供者、数据开发者、数据管理者和数据使用者打造集数据存算、数据治理的政务大数据平台,快速构建从规范设计、数据汇聚、数据开发、数据质量、数据资产、数据安全、数据服务的端到端运营能力。1、运营平台政务大数据平台提供统一运营服务,为管理者和使用者提升数据管理的体验与效率。1)统一管控为平台管理者和使用者提供统一用户鉴权、单点登录、角色分配,确保用户以合理的权限自动访问系统且操作空间互相隔离;基于数据治理业界成
53、功经验,为使用者提供数据治理流程导航与子系统入口,同时提供指标视图,使得数据治理过程更清晰更高效;为管理者提供统一日志告警、公告、菜单、资料管理等功能,从而高效率进行平台管理。2)流程贯通提供统一框架,支持各子系统间业务流程贯通。管理层面,要求数据源、数据湖仓等运维管理信息同步,确保一致性,支撑自动化维护工作;数据层面,数据标准、数据模型等全流程拉通,保障数据规范端到端一致性。图6 一体化政务大数据平台25一体化政务大数据平台一站式数据治理平台数据服务数据开发数据资产数据安全统一数据湖数据湖对象存储数据仓库数据汇聚数据挖掘分析平台BI可视化运营平台统一管控流程贯通资产共享数据运营数据源外部数据
54、省级数据市级数据标签画像AI人工智能规范设计区级数据数据质量3)资产共享资产管理可将数据治理过程产生的数据资产进行沉淀,通过归档形式进行共享,同时也可复制其他行业资产。其中数据资产类型包含:调研模版、流程设计、主题设计、数据码表、数据标准、关系模型、维度模型、业务指标、原子指标、衍生指标、复合指标、时间限定、开发脚本、开发作业、开发资源、质量指标、质量规则、规则模版、服务API和BI报表等。4)数据运营通过友好的可视化界面展示数据治理全过程的概要情况,涉及数据湖仓、数据源、数据作业、数据共享等各类信息,让数据和平台管理者对数据资源中心具有全局视角分析,拉通供需,有力支撑各业务的数据需求。2、统
55、一数据湖构建统一数据湖,避免多部门重复建设,按照“按需归集、应归尽归”原则将省市区全量政务数据采集入湖,实现数据跨层级、跨地域、跨系统、跨部门、跨业务汇聚融合,最终以统一标准在湖内完成政务数据治理和全生命周期管理。1)数据湖从省市区各种数据源,以批量和实时的方式将全量业务数据汇聚到数据湖,利用数据湖内丰富的计算引擎对数据进行加工,根据业务需要形成面向业务的专题集市。数据湖需要具有批流一体的数据加工能力,加快湖内数据的流转,更快的呈现数据价值,同时也要支持传统批量加工业务,实现数据入湖、数据存储、批流一体数据加工、多样性数据集市、数据智能、数据湖平台管理等功能。2)数据仓库为各类基础库、主题库、
56、专题库等建设提供软硬件支撑,更好支撑上层高并发应用。数据仓库需要支持MPP大规模并行处理引擎,通过分布式集群构成数据仓库,实现业务数据在多节点分散存储,数据分析任务可以被推送到数据所在位置就近执行,高效完成大规模数据处理任务,实现对数据分析应用的快速响应。3)对象存储针对文件、图片、视频等非结构化海量数据的存储,通过对象存储的低成本特性进行存储,实现存算分离,满足高伸缩性和高扩展性;为后续随业务扩展支持容量与性能的线性扩展,可以与数据湖和数据仓库搭配使用,实现存算能力的多样化。3、一站式数据治理平台一站式数据治理平台是政务数据形成最终可使用的数据资产的关键平台,利用一站式数据治理工具,进行政务
57、数据规范设计、架构梳理、源头治理、服务构建、共享交换等工序,最终实现政务数据高效治理、一本账管理、质量可控、便捷开放、安全流通。一站式数据治理平台主要涉及如下功能模块:1)规范设计为数据治理提供前期数据架构梳理、业务对象设计、数据标准构建、可视化数据建模、数据指标管理等5类规范设计,让数据治理工程得以高效实施。2)数据汇聚支持全量数据采集入湖进行汇聚融合,需要建设数据采集汇聚系统,对接多类型数据源进行多部26门、下级及外部数据采集,并对数据集成作业进行统一监控管理,实现统一数据源管理、统一集成管理、数据集成作业监控、批量数据集成、实时数据集成、实时数据同步、接口数据集成、IOT数据集成。3)数
58、据开发按照数据入湖标准,各部门对采集入湖后的数据进行一系列开发动作,首先完成数据源头治理,继而进行全量数据融合治理,实现政务基础库、主题库、专题库等的持续完善。数据开发工具需要支持一站式编排、调度、运维管控,实现数据集成、脚本开发、工作流编排、作业调度、运维监控、数据管理等一站式操作;支持组件化设计,适配云平台及主流数据库,提供统一的抽取、整合插件和准实时监控组件,满足作业流程的快速配置方案构建,具备高吞吐、高可用、高扩展特性,为海量数据的超大规模数据仓库建设提供抽取、整合、清洗、入库等集成业务。4)数据质量数据质量提升是政务大数据体系建设的关键目标,影响最终数据服务效果,同时也是体现数据治理
59、的成效之一。数据质量功能模块需要支持设计质量和执行质量的落地,包括数据质量稽核规则管理、数据质量问题管理、数据质量稽核作业、数据稽核运维功能。例如,数据质量实施过程中系统发现数据质量问题,需产生质量告警,并通过工单通知数据Owner进行处理。完成数据质量工程后,数据质量报告要提供对系统核心数据、系统监控、数据稽核等过程积累的各种信息进行汇总、梳理、统计和分析的功能;同时支持一个窗口集中展示数据质量状况,支持管理人员分析通过讨论总结经验、沉淀知识改进方法,不断提高数据质量问题的处理能力。5)数据资产通过对数据资产进行盘点,形成数据资产一张图,为业务应用和数据获取夯实基础。利用数据地图,可以帮助快
60、速精确查找业务所需的数据,并成为对数据资产管理进行有效监控的手段。通过数据地图的多级多类的资产目录,形成全面完整的数据资产体系,帮助梳理盘点数据资产,掌握数据资产现状。6)数据安全数据安全是政务大数据体系建设的重中之重,需要提供数据生命周期内统一的数据使用保护能力,通过敏感数据识别、分级分类、隐私保护、资源权限控制、数据加密传输、加密存储、数据风险识别以及合规审计等措施,建立安全预警机制,提升整体安全防护能力,让数据可用不可得,实现全程安全合规。7)数据服务完成统一治理后,数据应用的最后一公里是提供灵活高效的数据服务能力,进而支撑上层政务应用的调用。数据服务需要支撑数据服务体系的构建,提供数据
61、服务API,对上层应用对API的接入和调用进行统一管理;此外,数据服务能力还274.5 理架构:构建统一数据架构应提供实时接口服务、批量作业服务、文件传输服务,从数据定义、服务开发、服务应用、运行管控等,实现数据资源的闭环管理。4、数据挖掘分析平台政务数据具备权威性、公共性、专业性、广覆盖、高价值的特点,因此对完成汇聚和治理后的大体量政务数据进行数据挖掘是一项必不可少的工程,从而发现政务数据的潜在价值并进行最大化利用。1)BI可视化BI智能是大数据应用的重要一环,通过对政府业务数据进行展示、分析和挖掘,为政府业务决策提供指导,从而释放数据价值。2)标签画像数据标签是基于业务分析应用为驱动,支撑
62、政府内外部的各类应用场景,将数据价值赋能政务经营。通过体系化的标签全生命周期管理功能,支持标签和字段自由的条件组合,将具有某一特性的标签群体进行筛选,显示群体的标签画像特征;提供标签服务功能:在分析层,标签服务数据包含API名称、API描述、输入参数、返回值等数据存储在分析层中,将API注册到数据中台的统一数据服务,用于统一的对外提供标签服务。3)AI人工智能数据的深度应用离不开AI的加持,通过提供涵盖AI开发全流程,提供可编排、定制化的AI训推基础能力,使数据+AI高效落地。数据架构是政务数据统一定义,形成政府各行业对同一数据的统一认识,是业务和物理世界的关系纽带,是业务流打通、消除信息孤岛
63、和提升业务流集成效率的关键要素。通过明确对数据架构的管理要求,规范数据架构的建设和遵从原则,使政务数据资产得到有效管理和重用,实现政务数据目录一体化。数据架构定义的目的是构建政府业务层面需共同遵守的属性层数据含义和业务规则,是政府各行业对某个数据的共同理解,这些理解一旦确定下来,就应作为政务数据的标准在政府内被共同遵守。其构建过程包括三个方面:业务视角要求:用于统一业务侧语言和理解,明确定义每个属性所遵从的业务定义和用途、业务规则、同义词,并对名称进行统一定义,避免重复。技术视角要求:对IT实施形成必要的指引和约束,包括数据类型、长度,如果存在多个允许值,则应对每个允许值进行明确的限定。28管
64、理视角要求:明确各业务部门在贯彻数据标准管理方面应承担的责任,包括业务规则责任主体、数据维护责任主体、数据监控责任主体,因为很多情况下这些责任并不是由同一个业务部门来负责,所以必须在标准制订时就约定清楚。1、数据架构定义L1是业务域,是描述政务数据管理的最高层级分类。业界通常有两种数据资产分类方式:基于数据自身特征边界进行分类和基于业务管理边界进行分类。根据政府业务及政务组织的特点,采用基于业务管理边界进行分类,将不同业务部门定义为对应业务域,实现各业务之间的独立表示。L2是主题域,是互不重叠的数据分类,管辖一组密切相关的业务对象,通常同一个主题域有相同的数据Owner。L3是业务对象,是数据
65、架构的核心层,用于定义业务领域重要的人、事、物,架构建设和治理主要围绕业务对象开展。业务对象是5层架构的核心,其梳理应遵循如下原则:业务对象是指企业运作和管理中不可缺少的重要人、事、物。业务对象有唯一身份标识信息业务对象相对独立并有属性描述业务对象可实例化L4是逻辑数据实体,是指描述一个业务对象在某方面特征的一组属性集合。L5是属性,是信息架构的最小颗粒,用于客观描述业务对象在某方面的性质和特征。图7 数据架构定义 29数 据 架 构定 义示 例L1业务域L2主题域L3业务对象L4逻辑实体L5属性业务域是政务数据顶层分类,通过数据视角体现政府最高层面关注的业务领域主题域是互不重叠数据的高层面的
66、分类,用于管理其下一级的业务对象业务对象是业务领域重要的人、事、物承载了业务运作和管理涉及的重要数据逻辑实体是描述业务对象某种业务特征的属性集合属性是描述所属业务对象的性质和特征民政税务殡葬管理婚姻管理残疾人权益保护离婚登记结婚登记结婚登记业务表出具婚姻登记证明业务表登记证字号男方身份证号女方身份证号婚姻登记业务标识是否补办婚姻登记2、数据架构梳理以业务对象为核心,梳理各级各部门业务流程,从业务流程中各环节的输入输出数据中识别出业务对象,并根据库表信息梳理出逻辑实体与属性,最终确定数据架构五要素(数据Owner、数据源、数据分类、数据分级、数据标准),以此方法全量盘点政务数据家底,构建L1-L
67、5的政务数据目录,梳理流程见下图:数据架构梳理应遵循如下要求:关键数据应被识别、分类、定义及标准化,数据的定义在全省范围内应唯一,数据标准制定要考虑跨业务要求。数据目录须满足各业务环节的使用需求和报告分析最小粒度的要求。数据架构驱动应用架构设计,合理规划数据分布。应用系统数据库的设计和开发要遵循数据架构,减少数据冗余,实现接口标准化。3、数据架构五要素1)定数据Owner 数据Owner负责本领域数据管理体系建设、数据架构建设、数据质量管理。根据三定方案完成L1业务域定义,在业务域下根据部门职能划分主图8 数据架构梳理流程30按 照 政 务 数 据 之 道,重 塑 数 据 架 构L1L3L5L
68、2L4数据特征/业务管理边界按照部门职能划分定数据Owner梳理业务流程整理流程活动识别业务对象梳理逻辑实体定数据分类定数据源定数据标准定数据分级关联属性形成数据架构业务域主题域逻辑实体属性业务对象4.6 推治理:推行数据源头治理图9 数据源头治理31存量数据新生产数据省级各部门数据存量数据新生产数据市级数据互联网数据社会数据外部数据批量数据入湖实时数据入湖明确数据Owner发布数据标准认证数据源定义数据密级制定质量方案注册元数据制定入湖标准与管理机制,评估源头质量与治理目标发改数据池民政数据池教育数据池数据分层管理数据标准清单数据建模方案数据质控规则数据开发规范数据质量改进数据质量目标规划数
69、据质量控制数据质量改进数据质量度量数据入湖治理数据入湖标准数据入湖准备题域,并在主题域完成数据Owner定义。各级流程Owner就是该流程域的数据Owner,在大数据主管部门的统筹下负责所管理流程域的数据管理体系的建设和优化。各业务部门是执行规则,保证数据质量,进而推动规则优化的关键环节。2)定数据分类不同分类的数据,其治理方法有所不同,对数据管理要求也不一样,做好数据分类能够实现对各类数据的清晰管理。从数据来源来分,主要分为内部数据和外部数据。从数据组织形式来分,主要分为结构化数据和非结构化数据。同时结构化数据又可分为主数据、基础数据、事务数据、报告数据、观测数据和规则数据。3)数据源认证关
70、键逻辑实体需要进行数据源认证,以明确数据的唯一来源。数据源认证主要遵循以下标准:数据源是在信息链上正式发布数据的第一个数据存储系统;数据源是某项数据唯一的录入点;数据源必须是数据维护最为及时、正确、完整的数据存储系统;数据源所在系统的性能和可用性应当满足其他调用系统的数据访问需求。4)定数据标准对关键属性定数据标准,确保关键属性数据符合业务要求,保证流程上下游对数据合法性有统一定义,支撑流程高效率运转。5)定数据分级完成对应属性的数据分级定义,明确各属性的数据安全级别,为数据开放提供有力保障。全国一体化政务大数据体系建设指南中明确要求按照“谁管理谁负责、谁提供谁负责、谁使用谁负责”的原则推进数
71、据治理,数据治理是一个长期的过程,中心式的数据治理存在不清楚数据家底、不了解业务标准、数据治理工作量大等问题,因此需要在政务数据统一制度规范的指导下,推行数据在源头治理,数据质量在源头提升,根据业务实际情况和需求,有针对性的提升数据治理。321、数据入湖准备各业务部门作为数据源头管理责任方,需要根据数据架构梳理方法论的指导,完成数据资产目录梳理、业务标准设计、数据源认证、数据Owner定义以及数据分类分级等工作,完成数据摸底,形成本部门的数据架构,为数据入湖做好准备。2、数据入湖标准数据入湖是数据应用的关键,大数据主管部门需在数据入湖前严格按照入湖6项标准(明确数据Owner、发布数据标准、定
72、义数据密级、明确数据源、指定质量方案、元数据注册)检查各部门满足情况,全部满足即可入湖,若不满足,则告知相关部门进行补充。通过这6项标准保证入湖的数据都有明确的业务责任人,各项数据都可理解,同时都能在相应的信息安全保障下进行应用。1)明确数据Owner数据Owner由数据产生对应的流程Owner担任,是所辖数据端到端管理的责任人,负责对入湖的数据定义数据标准和密级,承接数据应用中的数据质量问题,并制定数据管理工作路标,持续提升数据质量。2)发布数据标准入湖数据要有相应的业务数据标准。业务数据标准描述需共同遵守的“属性层”数据的含义和业务规则,是对某个数据的共同理解,这些理解一旦明确并发布,就需
73、要作为标准在政府内被共同遵守。3)认证数据源通过认证数据源,能够确保数据从正确的数据源头入湖,认证数据源应遵循数据源管理的要求。数据源是指业务上首次正式发布某项数据的应用系统。认证过的数据源作为唯一数据源头被数据湖调用。当承载数据源的应用系统出现合并、分拆、下线情况时,应及时对数据源进行失效处理,并启动新数据源认证。4)定义数据密级定义数据密级是数据入湖的必要条件,为了确保数据湖中的数据能充分地共享,同时又不发生信息安全问题,入湖的数据必须要定密。数据定密的责任主体是数据Owner,数据Owner有责任审视入湖数据密级的完整性,并推动、协调数据定密工作。数据定级密度在属性层级,根据资产的重要程
74、度,定义不同等级。不同密级的数据有相应的数据应用要求,为了促进政务数据的应用,数据湖中的数据有相应的降密机制,到降密期或满足降密条件的数据应及时降密,并刷新密级信息。5)制定质量方案数据质量是数据应用结果的保证,数据入湖需要对数据指定数据质量方案、对数据进行评估,让数据的应用人员了解数据的质量情况,并了解应用该数据的质量风险。同时数据Owner可以根据数据质量评估的情况,推动源头数据质量的提升,满足数据质量的应用要求。336)元数据注册元数据注册是指将入湖数据的业务元数据和技术元数据进行关联,包括逻辑实体与物理表的对应关系,以及业务属性和表字段的对应关系。通过联接业务元数据和技术元数据的关系,
75、能够支撑数据应用人员通过业务语义快速地搜索到数据湖中的数据,降低数据湖中数据应用的门槛,能让更多的业务分析人员理解和应用数据。3、数据入湖治理满足6项入湖标准的数据可以将数据入湖到各业务部门的数据池中,并按照数据湖分层技术规范进行数据分层建模(贴源层、整合层、报告层、集市层),各部门在本部门数据池中对各自业务领域的数据进行清洗、转换、对比、加工等治理操作。数据入湖可根据不同业务场景分为批量数据入湖和实时数据入湖。1)贴源层:存储的是各部门各类系统入湖数据,入湖数据的物理模型和源系统模型保持一致,业务数据不做清洗转换。2)整合层:存储的是基础资产数据,是各部门经过初步治理后的数据资产,对入湖数据
76、进行标准化,在确保数据可信可靠基础上,按照数据标准规范进行清洗、转换,形成初步的数据资产,并按照数据资产目录组织存放。3)报告层:是根据业务应用需要,按照对象、事件(流)等融合汇总后的数据模型4)集市层:是为了直接满足各业务单元应用展现的需要而设计的数据模型。4、数据质量改进数据质量指“数据满足应用的可信程度”,数据质量管理是动态、持续的循环过程。构建数据质量持续改进体系,推动数据质量不断优化。数据质量改进我们从以下六个维度对数据质量进行描述。1)完整性:指数据在创建、传递过程中无缺失和遗漏,包括实体完整、属性完整、记录完整和字段值完整四个方面。完整性是数据质量最基础的一项。2)及时性:指及时
77、记录和传递相关数据,满足业务对信息获取的时间要求。数据交付要及时,抽取要及时,展现要及时。数据交付时间过长可能导致分析结论失去参考意义。3)准确性:指真实、准确地记录原始数据,无虚假数据及信息。数据要准确反映其所建模的“真实世界”实体。4)一致性:指遵循统一的数据标准记录和传递数据和信息,主要体现在数据记录是否规范、数据是否符合逻辑。5)唯一性:指同一数据只能有唯一的标识符。体现在一个数据集中,一个实体只出现一次,并且每个唯一实体有一个键值且该键值只指向该实体。6)有效性:指数据的值、格式和展现形式符合数据定义和业务定义的要求。4.7 通共享:提升共享服务水平提升政务数据共享服务水平是推动政府
78、数字化转型的关键一环,建立覆盖省、市、县等层级的省市一体化政务数据共享服务体系是未来提升共享服务能力的必然要求;同时,支持海量数据高速传输,实现数据分钟级、秒级共享,形成安全稳定、运行高效的数据供应链,是未来政务数据共享服务的建设目标。在数据共享开放管理规范的指导下,数据主管部门建设的政务大数据平台,需要实现数据申请流程的标准化。同时提供政务人员指尖办公体验,方便政务人员通过移动端查数、看数、申数、审数。提升政务数据共享服务水平,除了构建完备的数据共享服务平台,提供传统数据共享交换能力基础上,还需在共享流程标准化、供需对接精准化、授权时限规范化、交换任务自动化、共享成效能闭环等方面提供差异化竞
79、争力。1、共享流程标准化编制标准作业指引,实现数据运营流程标准化。提供数据共享指标监管的功能,并提供参阅材料、运营报告等自动化生成的能力,能够定期自动推送至单位/人。2、供需对接精准化为最大程度的保障用数安全和用数体验,提供数据项的列级共享(按数据项)、行级共享(按区域、时间等)的精细化授权功能,落实用数最小授权原则,相较整表共享,供需对接更精准、数据安全更有保障。图10 数据共享申请流程 34申请部门数源部门主管部门运营中心数据申请数源审核主管部门备案需求实施数据签收/评价获取数据(单位用数)成效反馈有条件审核通过实施完成无条件,数源、主管部门备案例如:政务大数据平台可以参照“购物车”模式,
80、提供“选数车”功能,用户将数据直接放入“选数车”,完成接口类型、数据项等关键配置勾选后,一键提交申请,实现供需双方精准对接。3、授权时限规范化通过建立数据Owner机制,指定经办人明确数据管理责任,通过简化流程,提升共享效率。同时配套移动端办公的便捷体验,上线移动端,查数、看数、申数、审数随时办理。例如:政务大数据平台可根据相关管理制度,设置审批时限,并匹配电子监察制度。根据先进省份的管理经验,超过5天未审核自动视为超时拒绝,同时根据数据申请的紧急程度(普通、加急、紧急)设置催办消息(24小时、12小时、6小时)。4、交换任务自动化交换任务的自动化程度是影响政务数据共享时效性的关键一环。将数据
81、资源目录中挂接的元数据自动映射至需要共享交换的物理数据,并持续维护映射关系。这样能够实现数源部门在完成授权后,第一时间通过交换引擎自动将数据汇入,用数部门在政务大数据平台申请获批后,无需人为干预,系统将自动实施数据推送。对于数据服务,同样可建立自动化构建以及订阅管理模式,实现服务调用精准授权。5、成效评价促迭代用数部门获取数据后,进入用户用数评价和成效反馈环节,可通过短信、通知等多种方式告知数源单位。通过对数据进行评价,释放用数部门参与数据治理活力,促进源头治理和多方共治,实现数据越用越优的目标。35数据质量提升是政务大数据体系的核心价值之一。以提升数据质量为目标,通过构建政务大数据的考核评估
82、机制,促进政务大数据良性发展。数据质量的持续提升覆盖政务数据管理的全生命周期,需要在建设领导小组的指导下有序开展。本白皮书建议,数据质量提升从质量设计、质量实施、质量运营三方面开展。一是质量设计。通过明确组织职责分工和数据质量规则,从而高效指导后续数据质量的实施。质量设计主要包含:1)定职责分工。质量管理组负责定期针对数据资源质量或者服务质量进行检测,保证数据的高可用性;考核评估组负责梳理出政务数据资源全生命周期的考核评价指标,建立起考核体系,通过考核提升优化。2)定质量标准。确立数据五要素,即数据Owner、定数据分类、定数据分级、定数据标准、做好数据源认证,从而有效指导数据质量检核规则的制
83、定。3)定检核规则。按照业务需求定义数据质量管理的规则,可对规则按不同维度进行分类管理。二是质量实施。按照质量设计中定义的标准进行数据质量规则开发,实现数据质量的有效实施,继而为下游应用或下游数据使用者提供高质量数据。具体来看,可定义数据质量规则大类,并基于大类进一步拓展小类。大类主要涉及数据完整性、4.8 提质量:完善质量评估能力1、数据服务体系规划数据服务体系的建设应面向数字政府建设的需求构建,主要包括以下几个方面:1)复用性。数据服务要满足可复用性,减少数据多次“搬家”。数据服务在长周期内会被多个用数部门消费,因此在数据服务消费需要面向场景进行设计,尽量避免重复建设,多次开发。2)可靠性
84、。数源部门在规划服务时应明确服务的用户是谁,并针对用户的场景和需求进行服务设计,同时定义SLA服务水平承诺,服务要有业务Owner负责服务规划和设计。3)规范性。应用只能通过服务接口向其他应用开放其数据和功能,服务接口要稳定,应用间的通信也必须通过这些服务接口进行,所有的服务需在统一的服务管控平台中进行注册和发布。大数据主管部门负责提供服务管控平台的注册和发布功能,通过服务管控平台可查询到发布的所有服务。4)集约化。应根据不同场景选择合适的服务化架构。服务化要采用合适的架构粒度,不是越“微”越好,也不是越“灵活”越好;服务规划需考虑价值,并优先将高价值的服务纳入立项预算;服务规划和设计人员在规
85、划和设计任何服务时,都应考虑到服务可能会被重用。2、数据服务的设计与实现对于政务系统用数,以提供数据API服务为主。首先,统一技术标准,数源部门的IT系统承建厂商在统一接口框架和标准下开发数据服务。然后,数源部门将数据服务编目和入湖至政务大数据平台,满足用数部门的实时数据需求,实现数据高效、复用、安全。1)在服务设计与实现阶段,要定义服务契约和数据契约,重点明确服务契约所涉及的服务责任主体、处理逻辑,并以数据契约规范服务的数据格式与数据的安全要求。包括服务契约和数据契约。服务契约包括服务的基本信息(数据服务提供方、数据服务的类型)、能力要求(服务的时效性、服务的处理逻辑、服务的安全策略、服务的
86、SLA要求)等;数据契约包括契约描述、输入和输出参数、业务数据资产编码、物理落地资产编码等。2)数据服务设计中应强调数据服务的颗粒度,数据服务颗粒度的合理设计直接影响着服务的复用性,细粒度设计合理的服务更容易被重用。同时,如果我们只考虑复用性,将导致产生大量颗粒度很小的数据服务,这将对数源系统的整体性能带来严重的影响,因此必须在服务粒度设计上保持可复用性和可用性的一种平衡。3)为确保服务设计后能快速、有序落地,要建立数据服务的开发、测试、部署流程,通过技术、自动化工具、管理协同机制,确保数据服务敏捷交付,缩短数据服务建设周期。3、打造业务自助分析的关键面向数字政府层面不同的用户受众统一构建数据
87、服务能力,面向不同的用户提供了差异性的能力和工具支撑:1)面向政务部门管理人员政务部门管理人员是政府典型的数据消费群体,可使用数据可视化工具获取数据分析结果,通过数据分析结果识别问题和风险,支撑政务决策。如近年来各级政府部门建设的可视化大屏。2)面向政务部门业务人员由于政务部门业务人员对数据缺乏加工能力,需要的更多是治理加工后的结果数据,鉴于此,政务部门业务人员可使用轻应用工具、可视化工具,辅助日常政务工作开展。3)面向数据分析师与数据科学家数据分析师与数据科学家运用数据分析、数据标注、数据训练、隐私计算等工具,可对结构化数据、文本、图片、音频或视频等数据进行数字化重现与认识,并能进行新的数据
88、洞察。4)面向IT开发人员面向承建政务系统的IT开发人员,提供云端数据开发、计算、分析、应用套件,支撑海量数据的分析与可视化,实现组件重用。本白皮书倡导安全要“人防+技防+物防”相结唯一性、有效性、一致性、准确性、及时性;小类主要包括非空约束、唯一性约束、代码值域约束、长度约束、取值范围约束、存在一致性约束、逻辑一致性约束、取值准确性约束、及时性约束等内容。三是质量运营。通过数据质量持续运营,促进数据质量不断提高,相互借鉴与改进。数据质量运营主要包含:1)指标体系。建立高质量数据认证体系,通过数据质量(及时性、标准性、准确性、完整性等)和服务质量(数据易用性、服务保障、共享成效等)两个维度评估
89、,实现高质量数据质量评估。2)质量报告。建立数据质量评分模型及报告模板,基于检核结果自动生成相应的质量报告。3)整改机制。建立下游数据使用者反馈整改责任机制,通过问题工单处理,实现数据问题全收集、处理全闭环、过程全监控。政务数据服务是指通过整合政府各部门的数据资源,为政府决策、公共服务和社会管理提供数据支持和服务。一方面是体现高效,数源部门建设政务系统时,需尽可能快速获取各种所需的数据,以支撑政务应用;另一方面要体现便捷,用数部门消费数据时,需要能够有更加灵活甚至是自助式地取数、用数方式。4.9 重服务:构建数据服务体系361、数据服务体系规划数据服务体系的建设应面向数字政府建设的需求构建,主
90、要包括以下几个方面:1)复用性。数据服务要满足可复用性,减少数据多次“搬家”。数据服务在长周期内会被多个用数部门消费,因此在数据服务消费需要面向场景进行设计,尽量避免重复建设,多次开发。2)可靠性。数源部门在规划服务时应明确服务的用户是谁,并针对用户的场景和需求进行服务设计,同时定义SLA服务水平承诺,服务要有业务Owner负责服务规划和设计。3)规范性。应用只能通过服务接口向其他应用开放其数据和功能,服务接口要稳定,应用间的通信也必须通过这些服务接口进行,所有的服务需在统一的服务管控平台中进行注册和发布。大数据主管部门负责提供服务管控平台的注册和发布功能,通过服务管控平台可查询到发布的所有服
91、务。4)集约化。应根据不同场景选择合适的服务化架构。服务化要采用合适的架构粒度,不是越“微”越好,也不是越“灵活”越好;服务规划需考虑价值,并优先将高价值的服务纳入立项预算;服务规划和设计人员在规划和设计任何服务时,都应考虑到服务可能会被重用。2、数据服务的设计与实现对于政务系统用数,以提供数据API服务为主。首先,统一技术标准,数源部门的IT系统承建厂商在统一接口框架和标准下开发数据服务。然后,数源部门将数据服务编目和入湖至政务大数据平台,满足用数部门的实时数据需求,实现数据高效、复用、安全。1)在服务设计与实现阶段,要定义服务契约和数据契约,重点明确服务契约所涉及的服务责任主体、处理逻辑,
92、并以数据契约规范服务的数据格式与数据的安全要求。包括服务契约和数据契约。服务契约包括服务的基本信息(数据服务提供方、数据服务的类型)、能力要求(服务的时效性、服务的处理逻辑、服务的安全策略、服务的SLA要求)等;数据契约包括契约描述、输入和输出参数、业务数据资产编码、物理落地资产编码等。2)数据服务设计中应强调数据服务的颗粒度,数据服务颗粒度的合理设计直接影响着服务的复用性,细粒度设计合理的服务更容易被重用。同时,如果我们只考虑复用性,将导致产生大量颗粒度很小的数据服务,这将对数源系统的整体性能带来严重的影响,因此必须在服务粒度设计上保持可复用性和可用性的一种平衡。3)为确保服务设计后能快速、
93、有序落地,要建立数据服务的开发、测试、部署流程,通过技术、自动化工具、管理协同机制,确保数据服务敏捷交付,缩短数据服务建设周期。3、打造业务自助分析的关键面向数字政府层面不同的用户受众统一构建数据服务能力,面向不同的用户提供了差异性的能力和工具支撑:1)面向政务部门管理人员政务部门管理人员是政府典型的数据消费群体,可使用数据可视化工具获取数据分析结果,通过数据分析结果识别问题和风险,支撑政务决策。如近年来各级政府部门建设的可视化大屏。2)面向政务部门业务人员由于政务部门业务人员对数据缺乏加工能力,需要的更多是治理加工后的结果数据,鉴于此,政务部门业务人员可使用轻应用工具、可视化工具,辅助日常政
94、务工作开展。3)面向数据分析师与数据科学家数据分析师与数据科学家运用数据分析、数据标注、数据训练、隐私计算等工具,可对结构化数据、文本、图片、音频或视频等数据进行数字化重现与认识,并能进行新的数据洞察。4)面向IT开发人员面向承建政务系统的IT开发人员,提供云端数据开发、计算、分析、应用套件,支撑海量数据的分析与可视化,实现组件重用。本白皮书倡导安全要“人防+技防+物防”相结374)集约化。应根据不同场景选择合适的服务化架构。服务化要采用合适的架构粒度,不是越“微”越好,也不是越“灵活”越好;服务规划需考虑价值,并优先将高价值的服务纳入立项预算;服务规划和设计人员在规划和设计任何服务时,都应考
95、虑到服务可能会被重用。2、数据服务的设计与实现对于政务系统用数,以提供数据API服务为主。首先,统一技术标准,数源部门的IT系统承建厂商在统一接口框架和标准下开发数据服务。然后,数源部门将数据服务编目和入湖至政务大数据平台,满足用数部门的实时数据需求,实现数据高效、复用、安全。1)在服务设计与实现阶段,要定义服务契约和数据契约,重点明确服务契约所涉及的服务责任主体、处理逻辑,并以数据契约规范服务的数据格式与数据的安全要求。包括服务契约和数据契约。服务契约包括服务的基本信息(数据服务提供方、数据服务的类型)、能力要求(服务的时效性、服务的处理逻辑、服务的安全策略、服务的SLA要求)等;数据契约包
96、括契约描述、输入和输出参数、业务数据资产编码、物理落地资产编码等。2)数据服务设计中应强调数据服务的颗粒度,数据服务颗粒度的合理设计直接影响着服务的复用性,细粒度设计合理的服务更容易被重用。同时,如果我们只考虑复用性,将导致产生大量颗粒度很小的数据服务,这将对数源系统的整体性能带来严重的影响,因此必须在服务粒度设计上保持可复用性和可用性的一种平衡。3)为确保服务设计后能快速、有序落地,要建4.10 保安全:保障数据全周期安全立数据服务的开发、测试、部署流程,通过技术、自动化工具、管理协同机制,确保数据服务敏捷交付,缩短数据服务建设周期。3、打造业务自助分析的关键面向数字政府层面不同的用户受众统
97、一构建数据服务能力,面向不同的用户提供了差异性的能力和工具支撑:1)面向政务部门管理人员政务部门管理人员是政府典型的数据消费群体,可使用数据可视化工具获取数据分析结果,通过数据分析结果识别问题和风险,支撑政务决策。如近年来各级政府部门建设的可视化大屏。2)面向政务部门业务人员由于政务部门业务人员对数据缺乏加工能力,需要的更多是治理加工后的结果数据,鉴于此,政务部门业务人员可使用轻应用工具、可视化工具,辅助日常政务工作开展。3)面向数据分析师与数据科学家数据分析师与数据科学家运用数据分析、数据标注、数据训练、隐私计算等工具,可对结构化数据、文本、图片、音频或视频等数据进行数字化重现与认识,并能进
98、行新的数据洞察。4)面向IT开发人员面向承建政务系统的IT开发人员,提供云端数据开发、计算、分析、应用套件,支撑海量数据的分析与可视化,实现组件重用。本白皮书倡导安全要“人防+技防+物防”相结图11 数据安全能力建设整体设计思路38政务数据安全体系建设全周期安全【1个目标】以一体化数据安全为目标【3个聚焦】人防+技防+物防【3个体系】管理安全、运营安全、技术安全安全管理体系安全运营体系安全技术体系数据安全常态化运营数据安全运营培训、安全检查、安全迎检、安全整改等数据安全一体化防控数据安全管理、数据审计、数据加密、数据脱敏等制度体系建设数据安全组织建设、数据安全管理制度、数据安全管理规范等合,动
99、态构建端到端安全防护能力。整体来看,数据安全能力建设的思路应以法律法规监管要求和业务发展需要为输入,在充分识别组织业务场景、风险现状的基础上,制定组织数据的分类分级标准,同时结合组织数据安全在管理、技术、运营维度的能力要求,满足数据生命周期各个过程域的安全。数据安全方案应以国家的相关政策和国内外数据安全的标准规范和最佳实践为指导,以“数据、人、场景”为核心,结合实际业务场景进行规划和设计,通过数据安全管理、数据安全运营和数据安全技术三个体系的服务内容,全方位实现数据防泄漏、防篡改、防滥用。数据安全管理体系包括成立数据安全工作领导小组,负责统筹、协调、指导、监督和检查政务数据全生命周期安全工作;
100、打造专业的数据安全运营团队,设置数据库管理员、安全审计人员、安全运维人员、数据备份管理人员、数据恢复管理人员等数据安全关键岗位,开展日常数据安全管理工作。数据安全运营体系需要形成以元数据及数据分类分级为基础,业务流数据流为主线的数据安全运营方法。具体包括建立接口调用对账机制,加强对外部系统异常调用监控能力,实现安全风险“早发现”;开展数据资产梳理、数据分类分级、人员账号核查、数据加密脱敏、数据备份恢复演练、数据库审计和接口审计、数据安全风险评估及应急处置等常态化数据安全运营工作,保障数据业务持续稳定运行;同时重视建设和完善数据运营安全场所建设运营,为数据运营人员提供集中管控、安全受控的操作环境
101、,对场所内的人员行为、操作情况进行安全监控与审计。图12 数据要素整体框架图39文旅医疗能源金融政府交通运营管理平台供应中心用户中心运营中心统一门户合规监管平台授权存证资产存证流通存证授权管理平台备案管理场景授权管理数据授权管理可信计算流通机密计算TEE可信交换流通参与方认证中心交换参与方-连接器数据策略控制中心数据流通审计中心数据API流通多方计算MPC联邦学习API管理API分析API调用TICSROMA ConnectEDS登记管理平台资产目录资产凭证资产审批计算存储网络平台安全边缘计算数据底座数据存算数据湖(MRS)数据仓(DWS)云基础设施数据库(GaussDB)云平台(华为云Sta
102、ck)数据智能开发体系数据开发(DataArts)AI平台(ModelArts)一站式数智融合集成平台(DataArk)数据存证(BCS)数据安全(DSC)应用开发(CodeArts)低代码开发(Astro)一站式应用技术集成平台(AppArk)软件工具链开发体系数据安全技术体系包括以数据资产梳理与数据流转监测为基础,采用云原生数据安全技术,通过对业务系统中的数据进行分级分类安全治理,结合访问控制、数据加密、数据脱敏等技术手段对不同用户角色、不同的数据访问行为进行管控、防护、脱敏、审计、分析等。通过数据安全管控平台对接管理各数据安全产品,保护云-管-端的全链路数据安全,实现在数据采集、传输、存
103、储、使用、共享、销毁等阶段的全生命周期的安全覆盖。数据要素作为数字经济时代的核心生产要素,其流通是数据价值实现的关键。政务数据与社会数据融合激发数据要素市场活力,成为发展数字经济的重要一环。在数据要素流通的建设中,一体化政务大数据平台需要具备的能力包括数据可信流通、高效运营开发和全流程的安全审计。数据要素流通方案体系结合可信智能计算、可信数据空间、数据安全、区块链等核心技术,打造“1”个底座+“2”套开发体系+“3”类流通+“4”大平台的一站式数据要素解决方案,为支撑数据要素各类创新应用场景孵化和繁荣生态构建提供有力保障。4.11 助流通:数据要素可信流通探索优秀实践安徽省围绕数据采集、汇聚、
104、治理、共享、开放等全生命周期,建设全省统一的数据标准规范,打造全国政务数据管理标杆。编制全省数据架构总体设计方案,出台首席数据官制度文件,形成跨部门数据协同机制,建立完善数据工程评估评价体系,总结推广数据工程实施经验,对相关部门数据工程实施情况进行评估评价。推进省有关部门高质量开展数据架构设计、数据资产梳理、数据治理、数据融合和数据开发利用工作,实行省市联动,开展数据工程试点。目前初步梳理业务对象4000+。安徽省制定数据战略愿景,基于政务数据之道方法论体系,梳理数据架构、建立组织保障运作机制、搭建统一数据湖:1.梳理数据架构:统建全省数据架构,打破部门边界,厘清省直单位4000+业务对象和与
105、之对应的库表信息,形成数据资产一张图,认定源头,一数一源多源校核,指定数据Owner;2.建立组织保障及运作机制:编制印发首席数据官制度、数据管理规范、数据治理实施指南等,从数据架构、机制建立、资产梳理、方案设计、治理实施、评估评价等方面,指导各部门按要求开展数据工程;3.搭建统一数据湖:提供数据服务能力、在全省数据基础平台上各部门进行数据采集、汇聚、治理等数据管理动作,解决数据多头汇聚、重复采集、流通不畅等问题。支撑场景创新应用在数据高质量汇聚治理的基础上,基于全省盘点的数据架构,重构人口、法人等公共业务对象,丰富数5.1 安徽省据模型。在便民利企、金融服务、助力乡村等方面深化数据赋能。数据
106、要素流通成为驱动数字经济的核心引擎。围绕公共数据授权运营和交易过程中遇到的“流通可信”、“开放效率”、“过程合规”等重大挑战,华为与上海数据集团有限公司合作,围绕数据要素市场化、价值化,基于数据要素流通交易创新方案,打造上海“城市数据空间”的关键基础设施“天机智信”平台。该平台具有数据采集、汇聚、存储、安全等基础功能,能够实现公共数据与行业数据、社会数据之间的有效整合。结合区块链、隐私计算和数据空间技术,平台可提供高质量的数据集和算法模型,充分挖掘并释放数据要素价值,赋能城市数字化转型。该平台包括:1.数字新底座:基于业界领先的湖仓一体架构,提供一站式的数据产品开发平台。通过自主研发的隐私计算
107、加区块链可信存证方案,确保敏感数据的可用不可见,全流程可查可追溯。5.2 上海市41务服务”、“织网工程”、商事主体登记及许可审批信息公示平台等应用提供数据支撑。同时深圳积极推动公共数据“一网共享”。一是健全统筹协调机制,成立市级公共数据共享协调专项小组,建立规则、统筹推进。二是构建多级共享通道,畅通省市区三级数据共享通道,促进跨层级、跨地域、跨系统、跨部门、跨业务的公共数据共享,赋能基层创新。三是优化完善数据中枢,推动49家数源单位在市公共数据开放平台向互联网开放数据。(来源深圳蓝皮书:深圳智慧城市建设报告(2022)、“深圳市政务服务数据管理局”)深圳市信息化建设起步较早,发展较好,通过政
108、务信息资源共享平台实现全市统一的数据共享交换;通过基础库和主题库的建设实现了人口、法人、房屋、公共信用、电子证照、事件等数据的整合;通过数据质量管理系统对政务数据进行质量管理;通过数据开放平台实现政府数据对公众的开放;通过数据服务支撑平台、决策分析应用支撑平台、资源共享服务对比平台支撑全市委办局、各区的数据共享和应用需求。深圳市在数据的建设上已有大量的实际基础和实施经验,只是由于独立立项分散建设的原因,造成各种数据管理系统、数据治理过程分散独立,大数据平台的建设,将以集约化、一体化、共享共治的思路,在这些已有建设成果的基础上进行设计和建设。为提升政务大数据的平台能力,构建全市统一的政务大数据平
109、台,更好的为各部门提供数据管理能力,启动深圳市大数据平台(一期)项目建设。深圳政务大数据基于四纵(数据资源管理系统、数据安全保障体系、数据标准规范体系、数据运2.数据开发平台:提供安全可信、高效敏捷的数据管理和开发平台,为数据开发商打造“拎包入住”的开发环境。3.授权运营平台:打造了一体化数据授权运营平台,为数据开发利用过程中的各市场主体提供统一的供需对接和交互平台,在数据交易场景中,实现数据、工具、算力、数据商品的授权和合规使用。4.繁荣应用生态:华为深度参与数据要素场景化链路打通,联合30余家生态伙伴、行业数商、第三方机构以及发达省市客户共同探索设计数据要素场景应用,如普惠金融、联合征信、
110、保险审核、商贸流通等,持续释放数据要素价值。未来华为将在上海深化区块链、隐私计算、AI大模型等先进技术的融合应用,以公共数据开发利用为牵引,促进各类多源数据的汇聚和供给,持续开展公共数据、企业数据及行业数据要素价值的突破与探索,打造更为丰富的数据产品服务各行业场景,推动数据要素的价值挖掘和深度开发利用。深圳市已建立全市统一的包括管理制度、信息资源库、信息共享平台和监督考核机制等方面在内的信息资源共享体系。其中,公共信息资源库包括人口、法人、房屋等六大基础库,社会建设等三大主题库以及相关业务库,数据总规模在全国各级城市中位居前列。政务信息资源共享平台已接入全市86家单位和全市11个区(新区、合作
111、区),资源目录累计8018类,为“互联网政5.3 深圳市422.构建全市统一大数据平台:政数局构建全市统一的政务大数据平台,包含数据采集工具、统一数据湖、数据治理工具、数据开放平台、BI工具、数据资源管理系统、数据安全平台、数据服务门户等整体政务大数据体系;各委办局不再分散建设。形成政数局建平台委办局用平台的建用分离模式,实现市大数据平台的一体化建设。3.构建多租户能力:委办局申请政务大数据资源后,拥有独立的使用体验,相互之间资源隔离,互不干扰。形成物理建设一套、逻辑使用多套的使用体验。4.多产品集成:通过一站式数智融合服务平台,将数据汇聚工具、数据湖、数据开放平台、BI报表工具、数据安全工具
112、等集成到一个界面,通过导航式菜单一站式完成数据治理,数据开发人员无需多次切换登录众多工具界面。5.建设统一数据湖:摸清数据资产家底,健全数据资源目录,建设城市级统一数据湖。6.构建统一安全保障体系:保障大数据资源在汇聚、清洗、融合、分析、使用的全流程中安全可控。营运维体系)四横(数据服务、数据融合、数据集成、数据算力)打造政务大数据底座,为政府各部门提供大数据门户、大数据商城、数据资源目录、数据汇聚、数据治理、数据开发、数据湖、数据开放服务、数据分析、数据可视化、数据资源管理、数据安全保障服务。后续,也将基于政务数据之道理念初步构建起市直机关单位互联互通的数据共享流转体系,为后续的全市一体化大
113、数据平台打下坚实基座。基于大数据底座,建立数据服务统一门户,统一应用接口、数据接口,为用数单位提供数据获取、分析、加工、处理等相关服务。深圳政务大数据平台建设,具备如下特色:1.构建数据商城:提供一站式服务(数据资源、工具、API),平台即服务,大数据基础资源服务化,平台工具服务化,实现各委办局按需订阅,分级运维;数据即服务,统一数据目录,构建城市数据湖,数据以服务的方式进行使用;应用即服务,提供互联网化应用服务能力,通过应用超市、应用API等形式提供服务。支撑各委办局快速建设主题库、开发大数据应用。43未来展望4443未来,数据成为我国经济发展的基础性、战略性资源已是大势所趋,数字政府建设将
114、越来越重视政务数据价值的挖掘,以应用场景为牵引,以提升政府治理能力为目标,持续推动政务数据质量提升,保障精准高效共享成为必然趋势。本白皮书认为政务数据管理将更加注重以场景为牵引,不断驱动业务和运营模式创新。无论是以一网通办、一网统管为抓手的智慧城市建设,还是以数据回流赋能基层为代表的治理精细化能力提升的要求,都将基于一体化的城市数据底座进行构建,华为云将持续做好政务领域、城市治理领域的黑土地,在“黑土地”之上通过“政务数据之道”牵引政务数据不断融合治理,不断繁荣上层应用,形成场景和数据相互促进、持续迭代的正循环。同时,我们也看到随着数据要素市场化的不断繁荣,创新型技术应用的不断普及,一方面政务
115、数据逐渐走出政务服务、数字政府的领域,开始在公共服务、城市治理、产业发展等更加丰富的场景里发挥价值。例如:数据+隐私计算促使政务数据与社会数据能够更好地融合,面向未来真正发挥数据“生产要素”的价值;另一方面数据与人工智能、区块链、云原生等创新能力进一步融合,碰撞出新的创新模式。例如:政务数据+人工智能将被更深度地利用于风险管理和城市场景的预测预警中,将事中事后处置变为事前告警预警。在未来,我们相信通过“政务数据之道”理念加持,匹配创新技术能力和商业模式组合,政务数据价值将得到充分释放,助力数字政府更加运转有序,数字经济不断繁荣发展,为数字中国的宏伟蓝图实现贡献力量。在场景+技术协同创新下促进数
116、据融合流通增值版权所有 华为技术有限公司2023。保留一切权利。非经华为技术有限公司书面同意,任何单位和个人不得擅自摘抄、复制本手册内容的部分或全部,并不得以任何形式传播。免责声明商标声明 、华为、是华为技术有限公司商标或者注册商标。在本手册中以及本手册描述的产品中,出现的其它商标,产品名称,服务名称以及公司名称,由其各自的所有人拥有。本文档可能含有预测信息,包括但不限于有关未来的财务、运营、产品系列、新技术等信息。由于实践中存在很多不确定因素,可能导致实际结果与预测信息有很大的差别。因此,本文档信息仅供参考,不构成任何要约或承诺,华为不对您在本文档基础上做出的任何行为承担责任。华为可能不经通知修改上述信息,恕不另行通知。扫码了解更多扫码获取电子版