《复旦大学:2021年度中国地方政府数据开放报告(城市)(53页).pdf》由会员分享,可在线阅读,更多相关《复旦大学:2021年度中国地方政府数据开放报告(城市)(53页).pdf(53页珍藏版)》请在三个皮匠报告上搜索。
1、1City复旦智库报告中国地方政府数据开放报告城市001001引言 数林概貌 数林指数 数林标杆 数林建言 评估方法附录 0030034042本报告版权为复旦大学数字与移动治理实验室(复旦 DMG)所有,如需引用本报告内容,请参照以下规范:复旦大学数字与移动治理实验室.中国地方政府数据开放报告城市(2021年度)R/OL.(2022-01-20)引用日期,格式为 YYYY-MM-DD.http:/ 2017 年 5 月首次发布以来,定期对我国地方政府数据开放水平进行综合评价,精心测量各地“开放数木”的繁茂程度和果实价值,助推我国政府数据开放生态体系的建设与发展。2018
2、年以来,“中国开放数林指数”为国家互联网信息办公室信息化发展局监测我国公共信息资源开放情况提供数据支持。0022021 年起,指数制作方将原来的“副省级/地级”指数调整为“城市”指数,将直辖市、副省级城市和地级城市,都作为一个“空间”和“聚落”,而不仅仅是一个 层级 来进行评测,并发布中国地方政府数据开放报告城市(以下简称报告)。003数林概貌004截至 2021 年 10 月,我国已有 193 个省级和城市的地方政府上线了数据开放平台,其中省级平台20个(含省和自治区,不包括直辖市和港澳台),城市平台 173 个(含直辖市、副省级与地级行政区)。与 2020 年下半年相比,新增 51 个地方
3、平台,其中包含 3 个省级平台和 48 个城市平台,平台总数增长超 3 成。如图 1 所示,全国地级及以上政府数据开放平台数量增长显著,从2017 年的 20 个到 2021 下半年的 193 个。一、数林概貌 数林概貌 图 1 历年地级及以上平台数量增长情况005目前,我国 51.33%的城市(包括直辖市、副省级与地级行政区)已上线了政府数据开放平台。如图 2 所示,自 2012 年上海市和北京市等地率先上线数据开放平台以来,城市平台数量逐年增长,目前已达到 173 个。各城市平台上线时间如表 1 所示。图 2 历年城市平台数量增长情况 表 1 城市平台上线时间一览表(按拼音首字母排序)数林
4、概貌006 数林概貌截至 2021 年 10 月,全国各地上线的城市数据开放平台的地区分布如图 3 所示,颜色越深,代表平台上线时间越早。目前,所有直辖市,以及浙江省、广东省、山东省、四川省与广西壮族自治区等省(自治区)域内的所有下辖城市都已上线了政府数据开放平台,形成我国最为密集的城市 开放数林。同时,在东中部地区的安徽省、湖北省、湖南省以及西南地区的贵州省、东北地区的黑龙江省等地,城市平台也不断上线并逐渐相连成片。然而,部分城市的数据开放平台仍然是“孤独的绿洲”,在其四周的城市均未上线平台。图 3 城市平台上线时间的地理空间分布007 图 4 2017-2021 年城市平台分布中国开放数林
5、指数自 2017 年首次发布以来,已满五年。五年来,全国各地的政府数据开放平台已逐步相连成片、蔚然成林。图 4 为 2017 年到2021年期间,地级以上城市(含直辖市)数据开放平台区域分布的变化情况。数据容量是指将一个地方平台中可下载的、结构化的、各个时间批次发布的数据集的字段数(列数)乘以条数(行数)后得出的数量,体现的是平台上开放的可下载数据集的数据量和颗粒度。图 5 列出了城市数据容量排在前十的地方,并反映了地方数据容量和有效数据集总数、单个数据集平均容量之间的关系。数据容量更能体现一个地方的数据开放总量,单个数据集平均容量也更能反映一个地方开放数据集的平均水平。例如,东莞市开放的有效
6、数据集总数并不靠前,但数据容量在全国领先,单个数据集平均容量最高。数林概貌 图 5 城市数据容量(前十名)、有效数据集总数与单个数据集平均容量比较 008数林指数0092021 年度全国城市开放数林的指数分值、排名和等级如表 2 所示。上海市的综合表现最优,青岛市和烟台市也总体表现优秀,进入第一等级“五棵树”。福州市、深圳市、济南市、杭州市、临沂市、日照市与潍坊市也表现较优,进入第二等级“四棵树”。其次是德州市、台州市、温州市、贵阳市、无锡市等城市。在四个单项维度上,在全国所有 173 个城市中,上海市在准备度、平台层和利用层上都排名第一,烟台市在数据层排名第一。二、数林指数 数林指数010
7、数林指数 表 2 中国开放数林指数城市综合排名(前五十名)011 数林指数 四个直辖市开放数林指数分值和排名如表 3 所示,上海市综合表现最优,位列第一,其次是北京市、天津市和重庆市。副省级开放数林指数排名前十的地方如表 4 所示,青岛市综合表现最优,位列第一,深圳市、济南市和杭州市也表现优异。表 3 直辖市 表 4 副省级城市(前十名)012 数林指数地级开放数林指数排名前十的城市如表 5 所示,烟台市综合表现最优,位列第一,福州市、临沂市、日照市和潍坊市等地也表现优异。表 5 地级城市(前十名)013“数林匹克”指数数据开放是一场马拉松,而不是速滑赛,不在于一个地方是否跑得早、跑得急,而在
8、于这个地方能否跑得长、跑得稳,能持续、稳定地向社会提供优质数据,并坚持不懈地推动开放数据的开发利用。报告继续通过“数林匹克”四年累计分值,反映一个地方在过去四年(2018 年-2021 年)开放数据的持续水平。城市“数林匹克”累计分值由 2018 年到 2021 年这四年该城市的年终(即下半年)开放数林综合指数的分值累加而成,以反映一个城市在过去四年(2018年-2021年)开放数据的持续水平。表6是2018-2021城市“数林匹克”累计分值前二十名的地方,上海市分值最高,其次是贵阳市、青岛市、深圳市与济南市,分值都在 210 分以上。表 6 城市“数林匹克”累计分值(前二十名)数林指数014
9、数林标杆015三、数林标杆3.1 数根:准备度3.1.1 法规政策效力与内容深圳市制定并公布了地方性法规深圳经济特区数据条例,其中专门针对公共数据开放作出了原则性要求,如图 6、图 7 所示。图 6 深圳经济特区数据条例 图 7 深圳经济特区数据条例中关于“数据开放”的内容条款0163.1.2 领导重视丽水市委常委、常务副市长杜兴林于 2021 年 7 月在 2021 丽水数据开放创新应用大赛颁奖典礼上发表了推动政务数据开放相关内容的讲话(来源网址:https:/ 8 所示。图 8 丽水市市委常委、常务副市长杜兴林关于推动政务数据开放工作的讲话017 图 10 深圳市平台公开的有条件开放数据申
10、请结果 图 9 深圳市平台的有条件开放数据申请公开栏目3.2 数干:平台层3.2.1 有条件开放数据申请结果公开深圳市平台对外公开了用户申请有条件开放数据的结果,如图 9、图10 所示。018 图 11 丽水市平台的社会数据提交功能3.2.2 社会数据提交功能丽水市平台提供了社会数据提交功能,用户可将其采集、整理的数据提交给平台,从而扩大了平台数据的来源范围,如图 11 所示。0193.3 数叶:数据层3.3.1 数据容量数据容量更能反映一个地方数据开放的总量,单个数据集平均容量也更能反映一个地方开放数据集的平均水平,东莞市数据开放平台所开放的无条件数据的数据容量和单个数据集平均容量均在全国领
11、先。东莞市平台所开放的无条件开放数据的数据容量将近 4 亿,单个数据集平均容量超 88万,如图 12 所示。图 12 东莞市数据开放平台0203.3.2 高容量数据集高容量数据集的利用价值更高,应当成为数据开放的重点。表 7 是2021 下半年城市开放的数据容量最高的前十位数据集列表,这些数据集普遍具有较高的条数、字段数和下载量,内容主要涉及工商、人社、市场监管、行政执法等方面。表 7 城市开放的前 10 个高容量数据集一览表 表 8 城市优质 API 接口列表3.3.3 优质 APIAPI 接口适用于提供实时动态的高容量数据,以促进高价值数据的开放与利用。优质 API 接口需要满足接口可调用
12、、至少每日更新、数据集容量高等标准。目前,深圳市平台提供了多个优质 API 接口,如表 8 所示。0213.3.4 关键数据集报告列举了各地国家政策和地方规章要求重点和优先开放的五项关键数据集,如表 9 所示。贵阳市与深圳市开放的数据覆盖了所有五项关键数据集,其中,深圳开放的疫情防控数据在数量、颗粒度与更新及时性等方面都在全国领先,如图 13 所示。表 9 关键数据集列表 图 13 深圳市开放的疫情防控类数据0223.4 数果:利用层3.4.1 跨域比赛协同深圳市举办了 2021 全球开放数据应用创新大赛推动数据跨域跨界融合,参赛者可利用香港、澳门及珠三角其他八个城市开放的来自政府、企业、社会
13、等多种渠道的数据,如图 14、图 15 所示。图 14 深圳市举办 2021 全球开放数据应用创新大赛 023 图 15 深圳市 2021 全球开放数据应用创新大赛利用粤港澳多地开放的数据024 图 16 北京市组织智慧交通开放创新大赛3.4.2 组织引导赋能活动北京市在交通领域组织了开放数据利用专题比赛,促进交通出行数据的社会利用,如图 16 所示。025 图 17 上海市开展数据利用试点项目上海市在交通出行、财税金融、医疗健康等领域,开展公共数据开放利用试点项目,推动公共数据在各行业的利用,如图 17 所示。0263.4.3 优质利用成果上海市平台展示的工商银行政采贷试点项目,通过对各部门
14、数据的整合利用,为银行授信提供依据,如图 18 所示。图 18 上海市平台展示的工商银行政采贷试点项目027青岛市、无锡市、烟台市、杭州市、贵阳市在交通出行领域都产生了比较优质的利用成果。例如,青岛市平台展示的“宜行青岛”是一款提供停车充电查询服务的应用,通过该应用,用户可以在线寻找附近停车场的空闲车位,以解决停车位难找的问题,如图 19 所示。用户还能查找周边的充电桩信息,以及充电桩的剩余车位数、价格等情况。图 19 青岛市平台展示的宜行青岛应用028杭州市的“车来了”应用通过调用市区公交线路和站点分布数据,为用户提供公交位置实时查询服务,如图 20 所示。图 20 杭州市平台展示的车来了应
15、用029数林建言030四、数林建言4.1 制度供给与组织保障在法规政策效力与内容方面,建议各地在制定有关数据开放的地方性法规、地方政府规章或规范性文件时对数据开放要求、数据利用要求、全生命周期安全管理和保障机制作出具体要求。在组织与领导方面,建立数据开放工作的统筹协调机制。建议地方党政领导在公开场合发表明确支持数据开放工作的讲话,加大对政府数据开放的支持力度。制定和公开专门针对政府数据开放的年度工作计划与方案。数林建言4.2 平台优化与持续运营在发现预览方面,建议提供可下载的开放数据目录,提供覆盖数据集和利用成果的高级搜索功能,提供同时支持无条件开放数据和有条件开放数据的预览功能。在数据获取方
16、面,建议扩大无条件开放数据可直接获取的范围,开通有条件开放数据申请功能并列明申请条件,对用户的有条件开放数据申请和未开放数据请求进行及时有效的回复并公开相关信息。031 数林建言在成果提交展示方面,建议为开发者提供多种类型的开放数据利用成果的提交入口,展示多种利用成果和利用成果的多种来源信息,包括数据集名称、数据提供部门和利用者信息等。在互动反馈方面,建议提供数据发布者的联系电话,公开用户对数据集和利用成果的评价,对用户的意见建议和数据纠错进行及时有效的回复并公开相关信息,提供权益申诉功能并对用户的权益申诉进行及时有效的回复。在用户体验方面,建议为用户订阅的数据提供更新推送功能。4.3 数量提
17、升与质量保证在数据数量方面,建议持续开放更多有效数据集,重点提升数据容量,开放更多高容量数据集,提高单个数据集的容量,特别是以 API 接口形式开放的、动态的、高容量的数据。在数据质量方面,建议清理高缺失、碎片化、低容量的数据集,保持开放数据集的不断增长和动态更新。在数据规范方面,建议推进数据的分级分类开放,对数据集标注不同的开放类型和属性,并相应配备差异化的开放授权协议。提高开放数据集可机读格式、非专属格式、RDF 格式的比例,降低申请和调用 API 接口的难度,为开放数据集提供丰富的元数据信息。在开放范围方面,建议提高开放数据集的主题覆盖面和部门覆盖面,开放更多常见数据集和关键数据集。03
18、24.4 数据利用与生态培育在大赛举办参与方面,建议结合自身特色常态化举办开放数据创新利用比赛,或连续参与省级组织的大赛,以提高社会利用开放数据的积极性。在引导赋能方面,建议积极组织多样化、常态化、专业性的引导赋能活动,营造有利于政府数据开放利用的生态体系。在成果数量与质量方面,建议进一步提高有效利用成果的数量和质量,清理与数据开放无关的、由政府自身开发的、无法获取或无法正常使用的成果,为展示的利用成果标明其所利用的开放数据集并提供有效链接。在利用多样性方面,建议推动高校、社会组织、公民等主体参与,以提高开放数据利用者类型的多样性,并通过各行业领域的促进活动提升成果形式与主题覆盖的多样性。数林
19、建言033评估方法034五、评估方法5.1 评估指标体系开放数林指数邀请国内外政界、学术界、产业界七十余位专家共同参与,组成“中国开放数林指数”评估专家委员会,以体现跨界、多学科、第三方的专业视角。专家委员会基于数据开放的基本理念和原则,借鉴国际数据开放评估指标体系的经验,立足我国政府数据开放的政策要求与地方实践,构建起一个系统、科学、可操作的地方政府数据开放评估指标体系,并为每项指标分配了权重,如图 21 所示。图 21 开放数林指数评估指标体系的构建方法035评估指标体系共包括准备度、平台层、数据层、利用层四个维度及下属多级指标,如图 22 所示:准备度是“数根”,是数据开放的基础,包括法
20、规政策效力与内容、标准规范、组织与领导等三个一级指标。平台层是“数干”,是数据开放的枢纽,包括发现预览、数据获取、成果提交展示、互动反馈、用户体验等五个一级指标。数据层是“数叶”,是数据开放的核心,包括数据数量、数据质量、数据规范、开放范围等四个一级指标。利用层是“数果”,是数据开放的成效,包括利用促进、利用多样性、成果数量、成果质量等四个一级指标。036 图 22-1 2021 中国开放数林指数评估指标体系(城市)037利用层数据层平台层准备度 图 22-2 2021 中国开放数林指数评估指标体系(城市)0385.2 评估对象 2021 年起,中国开放数林指数将原来的评估对象“副省级/地级”
21、调整为“城市”。此前报告中的评估对象“副省级/地级”更多将城市作为一个“层级”来进行评测。然而,不论城市处于何种行政级别,它都是一个人口集中居住并进行生产生活的密集“空间”和“聚落”。因此,从本年度开始,中国开放数林指数将直辖市、副省级城市和地级城市都作为一个“空间”和“聚落”来进行评估,并注重省域和城市在数据开放上的协同性和互通性。根据公开报道,以及使用“数据开放”“数据公开”“公共数据”“政务数据”“政府数据”“地名数据”“地名政府数据”“地名开放数据”等关键词进行搜索,发现了截至 2021 年 10 月我国已上线的地方政府数据开放平台,并从中筛选出符合以下条件的平台:1、原则上平台域名中
22、需出现 ,作为确定其为政府官方数据开放平台的依据。2、平台由行政级别为地级以上的地方政府建设和运营(不含港澳台)。3、开放形式为开设专门、统一的地方数据开放平台,或是在政府官网上开设专门栏目进行集中开放,由条线部门建设的开放数据平台不在评估范围内。本次评估中,共发现符合以上条件的城市 173 个,并将上线了这些平台的城市作为评估对象。具体城市、平台名称和平台链接如附录所示。0395.3 数据采集与分析方法准备度评估主要对相关法律法规、政策、年度计划与工作方案、标准规范、新闻报道等资料进行了描述性统计分析和文本分析。搜索方法主要包括以下两种:一是在搜索引擎以关键词检索相关法规与政策文本、标准规范
23、、年度工作计划、地方党政领导讲话的新闻报道以及数据开放主管部门的信息;二是在地方政府门户网站以及政府数据开放平台上通过人工观察和关键词检索采集数据。数据采集截止时间为 2021 年 11 月。平台层评估主要采用人工观察法对各地政府数据开放平台上各项功能进行观测并做描述性统计分析,数据采集截止时间为 2021 年 11 月。同时,还对平台的回复时效和回复质量进行了评估,回复情况采集截止时间为 2021 年 11 月。数据层评估主要通过机器自动抓取和处理各地政府数据开放平台上开放的数据,结合人工观察采集相关信息,然后对数据进行了描述性统计分析、交叉分析、文本分析和空间分析。数据采集截止时间为 20
24、21 年 11 月,对“动态更新”这一指标的评测时段为 2021 年 1 月至 2021 年 11 月。利用层评估主要对各地政府数据开放平台上展示的利用成果进行了人工观察和测试,对 2019 年以来各地开展的开放数据创新利用比赛信息进行了网络检索,并对采集到的数据进行了描述性统计分析。数据采集截止时间为 2021 年 11 月。此外,为确保采集信息准确,避免遗漏,部分指标采取报告制作方自主采集和向各地征集相结合的方式。各地征集结果经过报告制作方验证后纳入数据范围。0405.4 指标计算方法指数制作方基于各地在各项评估指标上的实际表现从低到高按照 0-5分共 6 档分值进行评分,其中 5 分为最
25、高分,相应数据缺失或完全不符合标准则分值为 0。对于连续型统计数值类数据则使用极差归一法将各地统计数据结果换算为 0-5 分之间的数值作为该项得分。各地平台在准备度、平台层、数据层、利用层四个维度上的指数总分等于每个单项指标的分值乘以相应权重所得到的加权总和。最终,各地开放数林指数等于准备度指数、平台层指数、数据层指数、利用层指数乘以相应权重的加权平均分。城市开放数林指数计算公式如下:同时,本次评估发现,部分已上线的地方平台出现下线造成数据供给中断的情况,或虽然平台仍在线,但实际上无法通过平台获取数据的问题。城市开放数林指数附录042 城市平台一览表(按行政层级及拼音首字
26、母排序)043044045指数制作团队报告校对组观察员郑磊、刘新萍、张忻璐、吕文增、华蕊、张宏、侯铖铖纪昌秀、王翔、马李滨、韩笑、李传琪蔡伊南、常媛媛、陈美欣、陈 业、程义婷、董万怡梦、段武鸿、段晓耀、冯会丹、龚小洛、黄河水、黄思雅、蒋 佳 钰、景宇欣、李行行、梁熠扬、廖月妮、刘 予、卢一鸣、莫 涛、钱宇霆、孙萧航、王 芮、王艳梅、王野然、尉 苇、温 顺 月、吴海珍、肖姝阳、辛 悦、徐丹丹、许怡婷、郁春江、于 丹、于锦文、翟 玮、周梦雪、朱钰谦指数制作方046评估专家委员会047联合发布方支持单位优刻得科技股份有限公司浪潮集团有限公司浙大城市学院城市大脑研究院048合作单位冥睿(上海)信息科技有限公司 中山大学数字治理研究中心 晴禾(南京)文化有限公司 汇纳科技股份有限公司 复旦发展研究院