上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

复旦智库:2021粤港澳大湾区政府数据开放报告(42页).pdf

编号:56350 PDF 42页 3.01MB 下载积分:VIP专享
下载报告请您先登录!

复旦智库:2021粤港澳大湾区政府数据开放报告(42页).pdf

1、1 001 lVgV9UkWcXfUyQvNyQvN6McMaQmOnNtRrQkPpOoMlOnNpObRmMxOwMmMtOuOtOtO 001 引言 大湾区数林概貌 大湾区数林指标 大湾区数林指数 大湾区数林标杆 数林建言 评估方法 附录 001 003 005 008 010 035 037 040 001 引言 粤港澳大湾区包括香港特别行政区、澳门特别行政区和广东省广州市、 深圳市、珠海市、佛山市、惠州市、东莞市、中山市、江门市、肇庆市, 是我国开放程度最高、经济活力最强的区域之一,在国家发展大局中具有 重要战略地位。2019 年 2 月 18 日,中共中央、国务院印发粤港澳大湾 区

2、发展规划纲要,明确“粤港澳大湾区不仅要建成充满活力的世界级城 市群、国际科技创新中心、一带一路 建设的重要支撑、内地与港澳深度合 作示范区,还要打造成宜居宜业宜游的优质生活圈,成为高质量发展的典 范。” 2020 年 10 月 11 日,中共中央办公厅、国务院办公厅发布深圳建 设中国特色社会主义先行示范区综合改革试点实施方案 (2020-2025年) , 提出要“试点推进政府数据开放共享。支持建设粤港澳大湾区数据平台”。 2021 年 9 月 22 日,广东省人民政府通过 广东省公共数据管理办法 , 要求“公共数据应当依法有序开放”。 粤港澳大湾区是我国政府数据开放的先行地区,进一步提升粤港澳

3、大 湾区的政府数据开放水平,不仅有利于促进数据要素在粤港澳大湾区的流 动和利用,还有利于充分发挥粤港澳综合优势,提升粤港澳大湾区在国家 经济发展和对外开放中的支撑引领作用。在此背景下,本报告对粤港澳大 湾区政府数据开放的现状和水平进行了研究和评价。 002 粤港澳大湾区政府数据开放报告是“中国开放数林指数”发布的 区域性系列报告之一。“中国开放数林指数”是我国首个专注于评估政府 数据开放水平的专业指数,由复旦大学数字与移动治理实验室制作出品。 “开放数林”意喻我国政府数据开放利用的生态体系,“开放数林指数” 自 2017 年 5 月首次发布以来,定期对我国地方政府数据开放水平进行综合 评价,精

4、心测量各地“开放数木”的繁茂程度和果实价值,助推我国政府 数据开放生态体系的培育与发展。 开放数据, 蔚然成林, 粤港澳大湾区的每一棵开放 “数木” 不仅枝繁叶密、 花开结果,更能根系相通、枝叶相连,终将成长为一片茂盛多样,互联互 通的粤港澳大湾区“开放数林”。 003 香港于 2011 年上线了政府数据开放平台“资料一线通”。自 2015 年 以来,粤港澳大湾区上线的地方政府数据开放平台数量持续快速增长(如 图 1 所示),目前,粤港澳大湾区的两个特别行政区与九个城市都已上线 了政府数据开放平台。各地平台上线时间的地理空间分布如图 2 所示,具 体上线时间如表 1 所示。 一、 大湾区数林概

5、貌 图 1 粤港澳大湾区政府数据开放平台数量 004 表 1 粤港澳大湾区平台上线时间一览表(按拼音首字母排序) 图 2 粤港澳大湾区政府数据开放平台上线时间的空间分布 005 2.1 评估指标体系 粤港澳大湾区政府数据开放报告在“中国开放数林指数”评估指 标体系的基础上,立足国家政策方向,根据粤港澳大湾区的区域特点和创 新实践,对部分指标进行了调整,如准备度层面增加了“数据集开放计划 指标,数据层增加了对数据描述说明中数据字典指标。最终确定的粤港澳 大湾区开放数林指数评估指标体系包括准备度、平台层、数据层、利用层 四个维度及下属多级指标(如图 3 所示): 准备度是“数根”,是数据开放的基础

6、,包括法规政策效力与内容、 组织与领导等两个一级指标。 平台层是“数干”,是数据开放的枢纽,包括发现预览、数据获取、 成果提交展示、互动反馈、个性化体验等五个一级指标。 数据层是“数叶”,是数据开放的核心,包括数据数量、数据质量、 数据规范、开放范围等四个一级指标。 利用层是“数果”,是数据开放的成效,包括利用促进、利用多样性、 成果数量、成果质量等四个一级指标。 二、 大湾区数林指标 数林指标 006 图 3 粤港澳大湾区开放数林指数评估指标体系 数林指标 007 利用层 数据层 平台层 准备度 数林指标 图 3 粤港澳大湾区开放数林指数评估指标体系 008 截至 2021 年 6 月,粤港

7、澳大湾区各地开放数林指数等级如表 2 所示, 各地指数综合得分可分为五个等级。深圳、香港开放数据综合等级最高, 为A+等级;广州、 东莞紧随其后, 为A等级;其次是江门、 澳门和中山等地。 在单项维度上,香港在准备度和利用层上表现最优,进入 A+ 等级;深圳在 平台层和利用层上处于领先地位,进入 A+ 等级。 三、 大湾区数林指数 数林指数 表 2 粤港澳大湾区各地开放数林指数等级 009 大湾区开放数林指数综合等级的空间分布如图 4 所示,颜色越深代表综合 等级越高,综合等级较高的地方主要集中在香港、深圳、东莞、广州这一 条绿色“林带”上。 图 4 粤港澳大湾区开放数林指数综合等级的空间分布

8、 数林指数 010 本章将重点推介粤港澳大湾区政府数据开放的标杆案例,以供各地进 行对标分析 。 4.1 准备度 4.1.1 法规政策 深圳制定并公布了地方性法规 深圳经济特区数据条例 , 如图5所示, 其中专门针对公共数据开放作出了要求,如图 6 所示。 四、 大湾区数林标杆 图 5 深圳经济特区数据条例 图 6 深圳经济特区数据条例中关于“数据开放”的内容条款 数林标杆 011 4.1.2 组织与领导 香港的年度开放数据计划由特别行政区政府的各部门分别制定,并在 香港资料一线通(DATA.GOV.HK)上发布,如图 7 所示。同时,用户还可 以在互联网上方便快捷地搜索到各部门的年度开放数据

9、计划, 如图8所示。 图 7 香港 资料一线通 上海品茶 图 8 “香港年度开放数据计划”网络搜索截图 数林标杆 012 在数据集开放计划中,香港在资料一线通平台公布了计划开放的数据 集列表,如图 9 所示。例如,香港房屋委员会 ( 房委会 ) / 房屋署 在 2021 至 2023 年开放数据计划中列明了已开放的数据集和计划开放的数据集,如 图 10 所示。 图 9 香港年度开放计划 - 数据集列表 数林标杆 013 图 10 香港房屋委员会 ( 房委会 ) / 房屋署 2021 至 2023 年开放数据计划 数林标杆 014 4.2 平台层 4.2.1 高级搜索功能 深圳、肇庆、佛山平台提供了

10、有多个筛选项的高级搜索功能,并同时 支持对数据集和利用成果的搜索,如图 11 所示。 图 11 深圳平台的高级搜索功能 数林标杆 015 4.2.2 可按时间段下载历史数据的功能 香港平台提供了可按时间段下载历史数据的功能,用户可根据特定时 间段下载数据集的各个历史版本,如图 12 所示。 图 12 香港平台的按时间段下载历史数据功能 数林标杆 016 数林标杆 图 13 广州平台公开的未开放数据请求和平台回复 4.2.3 未开放数据请求 深圳、广州平台提供了对未开放数据的请求功能,并对外公开了用户 的数据请求和平台的回复,如图 13 所示。此外,深圳平台还对用户的数据 请求进行了及时有效的回

11、复,如图 14 所示。 017 图 14 深圳平台对未开放数据请求的回复 4.2.4 意见建议 香港平台在意见建议提交页面特别提醒用户不要提供任何可识别个人 身份的信息,以保护用户的自身信息,如图 15 所示。 数林标杆 018 图 15 香港平台在意见建议提交页面对用户个人信息保护的提醒 数林标杆 019 广州平台对用户的意见建议进行了及时有效的回复(如图 16 所示), 并对外公开了用户的意见建议和平台的回复(如图 17 所示)。 图 16 广州平台对用户意见建议的回复 图 17 广州平台公开的用户意见建议和平台回复内容 数林标杆 020 4.2.5 数据纠错 深圳平台对用户的数据纠错进行

12、了及时有效的回复(如图 18 所示), 并对外公开了用户的纠错和平台的回复(如图 19 所示)。 图 18 深圳平台对用户数据纠错的回复 图 19 深圳平台公开的用户纠错和平台回复内容 数林标杆 021 4.3 数据层 4.3.1 数据数量 数据集是指由数据组成的集合,通常以表格形式出现,每一“列”代 表一个特定变量, 每一 “行” 则对应一个样本单位。 截至2021上半年, 深圳、 香港和广州开放的有效数据集的总数最高,均开放了超过一千个数据集(如 图 20 所示),其次是中山、东莞、佛山、珠海等地。 数据容量是指将一个地方平台中可下载的、结构化的、各个时间批次 发布的数据集的字段数(列数)

13、乘以条数(行数)后得出的数据总量。截 至 2021 上半年,东莞平台开放的有效数据集的容量最高,达到 2.6 亿,其 次是深圳和香港平台,总容量均超过了 5 千万(如图 21 所示)。 图 20 粤港澳大湾区各地平台有效数据集数量(单位:个) 数林标杆 022 图 21 粤港澳大湾区各地平台有效数据集容量(单位:万) 图 22 粤港澳大湾区各地平台单个数据集平均容量(单位:万) 报告进一步分析了地方开放的单个数据集平均容量,单个数据集平均 容量最高的是东莞,平均容量达到 31 万,其次是惠州、江门、香港、深圳 等地(如图 22 所示)。 数林标杆 023 4.3.2 数据质量 数据容量大、社会

14、需求高的优质数据集是开放数据的重点。报告对粤 港澳大湾区各地平台上所有可下载的数据集(共约 8610 个)按照数据容量 进行排序,最终选出排名居于前 1% 的数据集作为高容量数据集(共约 86 个)。高容量数据集数量的地区分布如图 23 所示,所有的高容量数据集集 中在 5 个地方,其中东莞的高容量数据集最多,其次是香港、惠州等地。 图 23 粤港澳大湾区高容量数据集的地区分布 数林标杆 024 表 3 粤港澳大湾区前十位高容量数据集 表 4 香港平台的前五位高容量数据集 数林标杆 表 3 是大湾区排在前十位的高容量数据集列表,这些数据集普遍具有 较高的条数和字段数,内容涉及面较广,主要涉及工

15、程项目、商事主体、 行政许可、交通等方面。表 4 是香港平台提供的前五位高容量数据集,主 要涉及地理、交通、环保、选举、研究数据等方面。 025 图 24 香港平台提供的历史数据存档与获取 数林标杆 在开放数据持续性上,澳门、中山、东莞能对平台上已开放数据集保 持常态化更新;香港平台为每个数据集留存了可按日下载的历史数据 ( 如图 24 所示 )。 在“无问题数据”这项指标下,高缺失数据集是指数据集中有 60% 以上的空缺数据;碎片化数据是指按照时间、行政区划、政府部门等被 人为分割的数据集,不利于数据的融合利用;低容量数据是指因数据量 本身稀少或颗粒度过大等原因造成的数据条数在三行或三行以内

16、的数据 集,其再利用价值较低;生硬格式转化是指平台将非结构化的 DOC、 PDF 等文件生硬地转化成 XLS、CSV、XML 等可机读格式。总体上, 存在数据质量问题较少的地方是香港、澳门、东莞、中山、江门等地。 026 4.3.3 数据规范 开放授权协议是指以契约的形式确定数据开放主体和数据使用者之间 有关数据利用的权利义务关系,有利于保障和规范数据的合理使用。香港 平台在数据使用条款中,对用户须遵守的条件作出了详细的要求,如图 25 所示。 深圳和江门为平台上开放的所有数据集均提供了可机读格式、非专属 格式和 RDF 格式。深圳平台提供了较为规范 RDF 格式(如图 26 所示)。 RDF

17、 格式(资源描述框架)作为 W3C 的推荐标准,使用了“主体谓词 客体”三元组形式来描述数据资源和它们之间的关系,使数据资源更易于 被机器阅读和理解,每一条数据都是一个唯一的资源 URI,有助于数据利用 者发现和链接相关数据资源。 图 25 香港平台提供的使用条款及条件 数林标杆 027 图 26 深圳平台为数据集提供了较为规范的 RDF 格式 香港平台为每个数据集的字段提供了详细的数据字典。如图 27 所示, 在香港平台上的开放数据字典中,提供了数据集介绍、数据集内可获取文 件的名称、格式和标注,并为每个字段提供名称、数据类别、内容长度、 度量单位、备注等信息。 数林标杆 028 数林标杆

18、029 图 27 香港平台为每个数据集的字段提供数据字典 4.4 利用层 4.4.1 利用促进 深圳举办了 2021 全球开放数据应用创新大赛(如图 28、图 29 所示), 推动数据跨域跨界融合,参赛者可利用香港、澳门及珠三角其他八个城市 开放的来自政府、企业、社会等多种渠道的数据。 数林标杆 030 图 28 2021 深圳全球开放数据应用创新大赛 图 29 2021 深圳全球开放数据应用创新大赛利用大湾区多地开放的数据 031 图 30 香港平台上展示的成果覆盖了多个领域 4.4.2 利用多样性 香港平台上展示的利用成果主题覆盖面较广(如图 30 所示),涵盖城 建住房、交通出行、卫生健

19、康、社会民生、财税金融等领域。 数林标杆 032 4.4.3 成果数量 香港平台上展示的利用开放数据产生的有效成果数量最多(如图 31 所 示),达到了 22 个。 图 31 香港平台上展示的有效成果 数林标杆 033 4.4.4 成果质量 香港与深圳平台上展示了相对较多的优质利用成果。如:香港平台上 的 Citymapper(如图 32 所示)综合利用了公交路线、巴士到站等数据, 为市民提供便捷的交通出行引导服务。 深圳平台上的小区罗盘 (如图33所示) 融合利用了交通、文旅等多种主题的开放数据,为市民提供选房指南; 图 32 香港平台展示的 Citymapper 服务应用 数林标杆 034

20、 图 33 深圳平台展示的“小区罗盘”小程序 数林标杆 035 5.1 数根:政策供给与组织保障 通过制定政策法规与文件促进和规范政府数据开放,对数据开放要求、 数据利用要求、数据开放全生命周期安全管理、保障机制等方面作出规定。 制定和公开政府数据开放的总体计划与方案;地方高层领导加大对政 府数据开放的重视和支持力度。 基于报告总体发现和各地先进经验,提出以下优化建议: 5.2 数干:持续运营与改善体验 提高数据发现和数据获取的便利度,提供和完善高级搜索和数据集预 览功能,降低开放数据获取门槛并提供按时间段下载历史数据的功能,加 强对未开放数据请求的回复及公开。 增强平台对开放数据利用的支撑作

21、用,完善利用成果提交功能,展示 多种利用成果类型及来源信息。 提升互动反馈的时效和质量,提供数据发布者联系方式,公开用户对 数据集及利用成果的评价,加强对意见建议和数据纠错的回复及公开,提 供权益申诉功能,并提醒用户在互动中注意保护自身的个人信息。 注重平台用户的体验及获得感,完善收藏和推送功能。 五、 数林建言 数林建言 036 5.3 数叶:容量提升与描述说明 提升有效数据集的数量与容量,开放高容量、高需求的优质数据集。 减少高缺失、碎片化、低容量的数据集,保持开放数据集的不断增长 和动态更新,并提供历史数据。 为单个数据集提供差异化的开放授权协议,在协议中详尽说明责任义 务。 提高开放数

22、据集可机读格式、非专属格式、RDF 格式的比例,为开放 数据集提供丰富的元数据信息和详细的数据字典说明。 5.4 数果:数据利用与生态培育 促进数据在开放之后的开发利用,包括综合性的开放数据利用比赛和 条线性的引导赋能活动,举办跨区域的开放数据创新利用大赛,在粤港澳 大湾区营造有利于政府数据开放利用的良好生态。 提高有效利用成果的数量和质量,清理与数据开放无关的、由政府自 身开发的、无法获取或无法正常使用的成果,为展示的利用成果标明其所 利用的开放数据集并提供链接。 提高开放数据利用者的多样性,提升利用成果形式与主题领域的多样 性。 数林建言 037 6.1 评估范围 指数出品方根据公开报道,

23、以及使用“数据开放” “数据公开” “公 共数据”“政务数据”“政府数据”“地名数据”“地名政府数据”“地 名开放数据”等关键词进行搜索,发现了截至 2021 年 6 月粤港澳大湾区 已上线的地方政府数据开放平台,并从中筛选出符合以下条件的平台: 1、原则上平台域名中需出现 gov,作为确定其为政府官方认可的数据 开放平台的依据。 2、平台所代表的地方政府的行政级别为地级及以上。 本次评估中,指数出品方共发现符合条件的地方平台 11 个,以此作为 本次评估的对象。具体地方、平台名称和平台链接如表 5 所示。 六、评估方法 评估方法 表 5 评估范围(按拼音首字母排序) 038 6.2 数据采集

24、与分析方法 准备度评估主要对相关法律法规、政策、总体计划与方案、领导讲话 的新闻报道等资料进行了描述性统计分析和文本分析。搜索方法主要包括 以下两种:一是在搜索引擎以关键词检索相关法规与政策文本、总体计划 与方案、有关地方党政领导讲话支持的新闻报道;二是在地方政府门户网 站以及政府数据开放平台上通过人工观察和关键词检索采集数据。评估范 围数据采集的截止时间为 2021 年 6 月。 平台层评估主要采用人工观察法对各地方政府数据开放平台上各项功 能进行观测并做描述性统计分析,数据采集截止时间为 2021 年 5 月。同时, 指数出品方还对平台的回复情况 ( 包括回复时间和回复质量 ) 进行了评估

25、, 回复情况采集截止时间为 2021 年 5 月。 数据层评估主要通过机器自动抓取各地方政府数据开放平台上开放的 数据,结合人工观察采集相关信息,然后对数据进行了描述性统计分析、 交叉分析、文本分析和空间分析。数据采集截止时间为2021年 5月,对“动 态更新”这一指标的评测时段为 2021 年 1 月至 2021 年 5 月。 利用层评估主要对各地方政府数据开放平台上展示的利用成果进行了 人工观察和测试,对 2019 年以来各地开展的开放数据创新利用比赛信息进 行了网络检索,并对采集到的数据进行了描述性统计分析。数据采集截止 时间为 2021 年 5 月。 此外,为确保数据采集准确全面,对部

26、分指标采用报告出品方自主采 集和向地方征集相结合的方式,从各地征集到的公开资料经验证后也纳入 评估数据。 评估方法 039 6.3 指数计算方法 指数出品方基于各地在各项评估指标上的实际表现从低到高按照 0-5 分共 6 档分值进行评分,其中 5 分为最高分,相应数据缺失或完全不符合 标准则分值为 0。对于连续型统计数值类数据则使用极差归一法将各地统计 数据结果换算为 0-5 分之间的数值作为该项得分。 各地平台在准备度、平台层、数据层、利用层四个维度上的指数总分 等于每个单项指标的分值乘以相应权重所得到的加权总和。最终,各地开 放数林指数等于准备度指数、平台层指数、数据层指数、利用层指数乘以 相应权重的加权平均分。各地开放数林指数计算公式如下: 评估方法 粤港澳大湾区开放数林指数 4525 1218

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(复旦智库:2021粤港澳大湾区政府数据开放报告(42页).pdf)为本站 (X-iao) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部