《复旦大学:2023中国地方公共数据开放利用报告(城市)(49页).pdf》由会员分享,可在线阅读,更多相关《复旦大学:2023中国地方公共数据开放利用报告(城市)(49页).pdf(49页珍藏版)》请在三个皮匠报告上搜索。
1、1001001本报告版权为复旦大学数字与移动治理实验室(复旦DMG)所有,如需引用本报告内容,请参照以下规范:复旦大学数字与移动治理实验室.中国地方公共数据开放利用报告城市(2023年度)R/OL.(2023-11-01)引用日期,格式为YYYY-MM-DD.http:/ 数林概貌 数林指数 数林标杆 数林亮叶 评估方法附录 0040031041目录002引言001引言2020201720182019“中国开放数林指数”是我国首个专注于评估公共数据开放利用水平的专业指数,由复旦大学数字与移动治理实验室制作出品。自 2017 年首次发布以来,“中国开放数林指数”定期对我国各
2、地公共数据开放利用水平进行综合评价,精心测量各地的“开放数木”,助推我国公共数据的流通与价值释放。2023 年起,开放数林指数将年度报告的名称从中国地方政府数据开放报告改为中国地方公共数据开放利用报告,以体现从“政府数据开放”迈向“公共数据开放”的方向,以及指数对公共数据从流通、到利用、到价值释放全过程的关注。开放数林指数将直辖市、副省级城市和地级城市,都作为一个“空间”和“聚落”,而不仅仅是一个 层级 来进行评测,并发布中国地方公共数据开放利用报告城市(以下简称报告)。20212022002数林愿景2023开放数据,蔚然成林,“开放数林”意喻我国公共数据开放利用的生态体系,我们期待:开放数林
3、是繁盛多姿的,各种“数木”都能竞相并生、枝杈相连、根系相通;开放数林是生生不息的,无时无刻不在成长变化,充满生机和活力;开放数林更是包容温暖的,既能让林子里的各种“生物”共享数林的美好,又能遮阳挡雨,不让他们被数据“灼伤”或“淋湿”。最终,一棵棵地方开放“数木”能够成长为一片繁盛多样、持续生长、包容宜人的中国“开放数林”。003数林概貌004数林概貌一、数林概貌 图 1 历年地级及以上数据开放平台数量增长情况截至 2023 年 8 月,我国已有 226 个省级和城市的地方政府上线了数据开放平台,其中省级平台 22 个(不含直辖市和港澳台),城市平台 204个(含直辖市、副省级与地级行政区)。与
4、 2022 年下半年相比,新增 18个地方平台,其中包含1个省级平台和17个城市平台,平台总数增长约9%。自 2017 年起全国地级及以上公共数据开放平台数量持续增长,从 2017 年报告首次发布时的 20 个到 2023 下半年的 226 个,如图 1 所示。目前,我国 337 个城市(含直辖市、副省级与地级行政区)中,60.53%已上线了公共数据开放平台。自 2012 年上海市和北京市等地率先上线数据开放平台以来,城市平台数量逐年增长,目前已达到 204 个,如图 2 所示。各城市平台上线时间如表 1 所示。005 数林概貌 图 2 历年城市(含直辖市、副省级与地级行政区)平台上线情况 表
5、 1 城市数据开放平台上线时间一览表(按拼音首字母排序)006 数林概貌 图 3 城市平台上线时间的地理空间分布截至 2023 年 8 月,全国各地上线的城市公共数据开放平台的地区分布如图 3 所示,颜色越深,代表平台上线时间越早。目前,所有直辖市,福建省、广东省、广西壮族自治区、贵州省、湖北省、江苏省、江西省、山东省、四川省与浙江省共 10 个省域所有下辖城市都已上线了公共数据开放平台,形成我国最为密集的城市“开放数林”。同时,安徽省内的绝大多数城市也已上线了开放平台。然而,陕西省、青海省内的所有城市以及海南省、河南省、吉林省、辽宁省和云南省内的绝大多数城市尚未上线公共数据开放平台。007数
6、林概貌 图 4 2017-2023 年城市平台分布自中国开放数林指数 2017 年首次发布以来的七年中,全国各地的公共数据开放平台已蔚然成林。图 4 为 2017 年到 2023 年,地级以上城市(含直辖市)数据开放平台区域分布的变化情况。中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要明确提出“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用。”当前,部分地方已在积极探索授权运营工作,截至 2023 年 9 月,各城市已正式出台的与公共数据授权运营相关的法规政策如表 2 所示,发布的相关征求意见稿如表 3 所示。008数林概貌 表 3 城市公共数据授权
7、运营相关法规政策征求意见稿一览表(截至 2023 年 9 月)表 2 城市公共数据授权运营相关法规政策一览表(截至 2023 年 9 月)009数林概貌目前已公开上线的公共数据授权运营平台或在数据开放平台上开设授权运营专区的城市如表 4 所示。表 4 城市公共数据授权运营平台或专区010数林指数011 数林指数二、数林指数2023 年度全国城市开放数林的指数分值如表 5 所示,报告还基于综合指数分值将各地的公共数据开放利用水平分为五个“开放数级”。杭州市与德州市综合表现最优,进入第一等级“五棵数”,获得“数开繁盛”大奖。日照市、济南市、上海市与青岛市也表现优异,进入第二等级“四棵数”。其次是济
8、宁市、东营市、温州市、深圳市等城市。在四个单项维度上,在全国所有 204 个城市中,上海市在准备度和利用层上表现最优,杭州市在服务层与数据层上表现最优。表 5 中国开放数林指数城市综合排名(前五十名)012 数林指数城市开放数林指数空间分布如图 6 所示,颜色越深代表综合指数分值越高。指数分值较高的城市主要集中在位于东部沿海地区的山东省、浙江省和上海市。同时,华南地区的深圳市、西南地区的成都市和贵阳市也表现优秀,成为所在地区的优质“数木”。013 数林指数 图 6 城市开放数林指数空间分布四个直辖市开放数林指数分值和排名如表6所示,上海市综合表现最优,位列第一,其次是天津市、北京市和重庆市。表
9、 6 直辖市综合排名014 数林指数副省级开放数林指数排名前十的地方如表7所示,杭州市综合表现最优,位列第一,济南市、青岛市、深圳市和成都市也表现优异。地级开放数林指数排名前十的城市如表 8 所示,德州市综合表现最优,位列第一;日照市、济宁市、东营市和温州市等地也表现优异。表 7 副省级城市综合排名(前十名)表 8 地级城市综合排名(前十名)015 数林指数“数林匹克”指数数据开放是一场马拉松,而不是速滑赛,不在于一个地方是否跑得早、跑得急,而在于这个地方能否跑得长、跑得久。报告继续通过“数林匹克”四年累计分值,反映一个地方在过去四年(2020 年-2023 年)开放数据的持续水平。城市“数林
10、匹克”指数由 2020 年到 2023 年这四年该城市的全年开放数林综合指数的分值累加而成。表 9 是为 2020-2023 城市“数林匹克”累计分值排在前二十名的地方,上海市分值最高,其次是杭州市、青岛市、德州市、深圳市、日照市、济南市与温州市。表 9 城市“数林匹克”累计分值(前二十名)016数林标杆017数林标杆三、数林标杆1.杭州市杭州市制定了杭州市公共数据授权运营实施方案(试行),以规范公共数据授权运营管理,加快公共数据有序开发利用。杭州市在公共数据开放平台上设有公共数据授权运营专区,点击后即可进入授权运营平台,还将授权运营数据作为“受限开放类”数据列入开放平台提供的数据目录(如图
11、7 所示),从而在平台入口和数据目录上实现了数据开放和授权运营工作的协同联动,便于用户发现、获取和利用公共数据。杭州市在企业注册登记、交通运输与教育领域都开放了较多的高需求、高容量、高质量数据集,具有较高的利用价值;平台上开放的“停车场空闲状态(杭州)信息”可通过接口调用数据,并按分钟更新,如图 8 所示。图 7 杭州市在开放目录中将授权运营数据作为“受限开放类”数据列入018数林标杆杭州市平台还为授权运营数据提供了详细的元数据信息和数据项说明,并提供了样本数据,帮助用户更清晰地了解数据结构与内容。以授权运营数据集“地铁集团计划时刻信息”为例,图 9 展示了该数据集的元数据信息和数据项说明,图
12、 10 展示了该数据集的样本数据。图 8 杭州市按分钟更新的“停车场空闲状态(杭州)信息”数据接口 图 9 杭州市授权运营数据集“地铁集团计划时刻信息”元数据信息和数据项说明019数林标杆 图 10 杭州市授权运营数据集“地铁集团计划时刻信息”提供的样本数据杭州市通过开放数据,产出了一批优质利用成果。例如杭州市开放了停车场状态信息数据,支撑地图应用开发了停车场状态查询功能。用户可在应用中查询部分停车场的车位空闲状态,如图 11、图 12 所示。020数林标杆 图 11 杭州市平台展示的高德地图应用 图 12 杭州市高德地图应用支持部分停车场状态查询功能021数林标杆2.德州市德州市在其发布的
13、2023 年度公共数据开放清单中提供了数据来源、数据资源目录名称、数据项名称、开放属性、开放条件、开放方式、更新频率、计划开放时间等具体信息(如图 13 所示)。德州市平台重视与用户的互动反馈,对用户提出的有条件开放数据申请、未开放数据请求、意见建议和数据纠错要求均进行了及时有效的回复,并公开了相关信息。如图 14 所示,该平台快速回应了用户提交的未开放数据请求,在与其他部门进行沟通后,将用户需要的数据在平台上进行了开放。此外,德州市平台不仅在开放协议中对无条件和有条件开放数据进行了差异化规范,还对可能带来安全风险的数据集(如实时公交数据集)提供了专门的开放授权许可协议,如图 15 所示。图
14、13 德州市 2023 年公共数据开放清单(部分截图)022数林标杆 图 14 德州市平台对用户未开放数据请求的回复及落实 图 15 德州市实时公交数据集开放授权许可协议023数林标杆为方便残障人群出行,德州市开放了“无障碍设施信息”,包括无障碍厕位、无障碍通道和无障碍停车位等数据项,支撑高德地图开发了无障碍公厕设施导航功能,如图 17 所示。德州市无条件开放数据集的数量在全国处于领先位置,平台无条件开放数据集的平均容量近 300 万,并在交通、卫生与社会民生等关键领域开放了较多的高需求高容量数据。德州市开放的“道路危险货物运输经营许可信息分页查询服务”数据集和“授权开放 _ 德州市公交实时信
15、息(GPS数据服务器与其它数据接收程序的通讯协议)”数据集(如图 16 所示),都具有较高的数据容量与时效性。德州市持续开放高容量数据集,数据容量年度递增幅度在全国领先。图 16 德州市开放的优质数据接口024数林标杆德州市还开放了易积水点信息,支撑高德地图开发相关功能。用户可在地图中通过搜索德州积水、德州暴雨、德州积水地图、德州易积水点等关键词,获得德州市城区道路的易积水点位,从而在暴雨天气中合理规划行程,如图 18 所示。图 17 德州市高德地图应用提供无障碍设施导航功能 图 18 德州市高德地图应用提供易积水信息查询功能025数林亮叶026数林亮叶四、数林亮叶除了以上两个标杆案例,202
16、3 年其他城市在公共数据开放利用和授权运营工作上也出现了不少亮点:济南市注重公共数据的无歧视获取,明确公共数据提供单位不得以不合理条件对企业规模、注册地等进行限制或排斥,不得歧视中小企业、社会组织等利用主体,如图 19 所示。准备度亮叶 图 19 济南市公共数据开放利用管理办法(试行)对无歧视性原则的强调027数林亮叶深圳市平台提供了“字段搜索”服务(如图 20 所示),通过对字段的名称、描述、类型、数据分布特征等信息进行智能分析,使用户能搜索到含有某一字段的所有数据集。服务层亮叶 图 20 深圳市平台的“字段搜索”服务028数林亮叶北京市、上海市、德州市等地通过开放无障碍设施数据集,助力地图
17、应用开发无障碍导航功能,便利残障人士出行。例如,北京市开放了 36 万条无障碍设施数据,数据完整性好,颗粒度较细(如图 21 所示)。东营市与济宁市在社会民生领域开放了较多高需求、高容量数据,涉及水电气缴费、社保参保、低保救助等方面。广州市、深圳市与烟台市对平台上已开放的数据及时进行更新,年度更新比例都达到了 70%以上。数据层亮叶 图 21 北京市开放的残疾人无障碍设施数据029数林亮叶开放数据大赛逐渐“破圈”联动,上海市组织了首届沪港合作开放数据竞赛,吸引上海、香港两地上百支科创团队参赛。公共数据开放还为学术研究工作提供了数据支撑,北京市、深圳市、成都市、上海市开放的公共数据产出的科研论文
18、数量较多,涉及公共服务资源配置、商业经营等研究领域。各地在公共数据授权运营方面的探索也已产生了初步成果,青岛市、成都市、杭州市等城市产出的授权运营产品涵盖交通出行、财税金融和卫生健康等领域。利用层亮叶030评估方法031 评估方法五、评估方法指标体系开放数林指数邀请国内外政界、学术界、产业界七十余位专家共同参与,组成“中国开放数林指数”评估专家委员会,以体现跨界、多学科、第三方的专业视角。专家委员会基于数据开放的基本理念和原则,立足我国公共数据开放的政策要求与地方实践,借鉴国际数据开放评估经验,构建起一个系统、专业、可操作的公共数据开放评估指标体系,并每年根据最新发展态势和重点难点问题进行动态
19、调整。1、从“政府数据开放”迈向“公共数据开放”2023年起,开放数林指数将评估对象从“政府数据”扩展为“公共数据”,即各级党政机关、企事业单位依法履职或提供公共服务过程中产生的公共数据。2021 年,中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要提出要“扩大基础公共信息数据安全有序开放,探索将公共数据服务纳入公共服务体系,构建统一的国家公共数据开放平台和开发利用端口。”2022 年,中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见要求“对各级党政机关、企事业单位依法履职或提供公共服务过程中产生的公共数据,加强汇聚共享和开放开发”,“对不承载个人信息
20、和不影响公共安全的公共数据,推动按用途加大供给使用范围”。2023 开放数林指数在指标体系和评估方法上的调整重点如下:032 评估方法2、将“公共数据授权运营”纳入评测内容2023 年起,开放数林指数将各地在公共授权运营方面的探索和成果也纳入评测内容。2021 年,中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要指出要“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用。”2022 年,中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见指出要“鼓励公共数据在保护个人隐私和确保公共安全的前提下,按照原始数据不出域、数据可用不可见的要求,以模型、核
21、验等产品和服务等形式向社会提供。”开放数林指数认为,公共数据开放和授权运营的目的都是为了畅通公共数据资源的大循环,减低市场和社会主体获取公共数据的门槛,释放公共数据的价值,两者相辅相成,又各有侧重。因此,开放数林指数将一个地方的公共数据开放和授权运营水平做为整体,来评价该地方释放公共数据价值的总体成效。2023 开放数林指数具体从以下几个方面初步开展对公共数据授权运营的评估:准备度评测关注各地制定和出台的与授权运营相关的法规政策,以促进和规范公共数据授权运营工作;服务层评测关注数据开放平台与授权运营平台之间的联通协同以及数据目录的整体展现;数据层评测关注授权运营数据的数量、种类、透明度和可理解
22、性等方面;利用层评测聚焦数据授权运营的成果产出及其价值。3、将评估维度“平台层”更名为“服务层”2023 开放数林指数将平台层更名为服务层,以强调数据开放和授权运营平台的持续运营与有效服务。具体而言,进一步下调了平台功能设置相关指标的权重,提高了数据获取、互动反馈、回应落实等体现平台实际运营服务水平的指标的权重,即不是看“平台对用户说了什么”,而是看“有没有说到做到”。033 评估方法4、强化需求驱动和利用导向2023 开放数林指数进一步强化数据开放和授权运营的需求驱动和利用导向。需求、开放与利用之间具有循环并进的关系,市场和社会对公共数据的需求是开放和运营的起点和依据,而开放和运营又是利用的
23、基础,利用则是开放和运营的目的,反过来,利用又能激发出新的需求,从而进一步促进开放和运营。具体而言,2023 开放数林指数在以下几个方面强化对需求驱动和利用导向的评估:准备度评测重视相关法规政策中对需求征集、需求回应以及开放范围与目录按需动态调整等方面作出的要求;服务层评测重视平台对用户所提需求的实际回应与落实情况;数据层评测增加对高需求高容量数据集开放数量的评测;利用层评测关注数据开放带来的经济和社会价值,以及数据开放利用赛事中形成的创新方案的落地转化情况,并在成果数量指标中新增对基于开放数据发表的科研论文的评测。5、增加对公共治理/公益服务类数据的评测2022 年中共中央、国务院关于构建数
24、据基础制度更好发挥数据要素作用的意见指出要“推动用于公共治理、公益事业的公共数据有条件无偿使用”。因此,开放数林指数在去年重点对企业注册登记、交通、气象、卫生四个领域的关键数据集开展评测的基础上,今年又进一步将“教育”、“社会民生”等领域纳入关键数据集范围进行评测。6、细化对数据质量的评测在数据层评测中,兼顾数据容量增长的总量与质量,加强对数据的完整性、及时性与持续性等方面的检测;增强对实时动态数据接口的评测;对于社会高需求数据集,增加对其关键字段开放情况的评测。7、注重普惠包容评测政策法规中对多种社会主体平等获取数据作出的要求,评测平台在开放协议及在有条件开放数据的申请条件设置中是否贯彻了非
25、歧视性原则,并注重开放数据大赛的参与门槛与社会参与度。034 评估方法2023 开放数林评估指标体系共包括准备度、服务层、数据层、利用层四个维度及下属多级指标(如图 22 所示)。2023中国开放数林指数城市指标体系框架如下:准备度是“数根”,是数据开放的基础,包括法规政策、组织推进等两个一级指标。服务层是“数干”,是数据开放的中枢,包括平台体系、功能运营、权益保障、用户体验等四个一级指标。数据层是“数叶”,是数据开放的核心,包括数据数量、开放范围、数据质量、安全保护等四个一级指标。利用层是“数果”,是数据开放的成效,包括利用促进、利用多样性、成果数量、成果质量、成果价值等五个一级指标。035
26、 评估方法 图 22-1 2023 中国开放数林指数指标体系(城市)036 评估方法 图 22-2 2023 中国开放数林指数指标体系(城市)037 评估方法评估范围开放数林指数将直辖市、副省级城市和地级城市,都作为一个“空间”和“聚落”,而不仅仅是一个“层级”来进行评测。根据公开报道,以及使用“数据开放”“数据公开”“公共数据”“地名数据”“地名公共数据”“地名公共数据开放”等关键词进行搜索,发现了截至 2023 年 8 月我国已上线的地方公共数据开放平台,并从中筛选出符合以下条件的平台:1、原则上平台域名中需出现 ,作为确定其为政府官方数据开放平台的依据。2、平台由行政级别为地级以上的地方
27、政府建设和运营(不含港澳台)。3、开放形式为开设专门、统一的地方公共数据开放平台,或是在政府官网上开设专门栏目进行集中开放,由条线部门建设的开放数据平台不在评估范围内。本次评估中,共发现符合以上条件的城市公共数据开放平台 204 个,报告将上线了这些平台的城市作为评估对象。具体城市、平台名称和平台链接如附录所示。此外,报告还使用“数据开放”“公共数据运营”“公共数据服务”“政务数据运营”“政务数据服务”等关键词进行搜索或通过数据开放平台提供的链接,发现了截至 2023 年 9 月我国已上线的城市公共数据授权营运平台或专区,如表 10 所示。表 10 城市公共数据授权运营平台或专区038 评估方
28、法数据采集与分析方法准备度评估主要对相关法律法规、政策、年度计划与工作方案、新闻报道等资料进行了描述性统计分析和文本分析。搜索方法主要包括以下两种:一是在搜索引擎以关键词检索相关法规与政策文本、年度工作计划、政府工作报告、数字政府方案、以及数据开放和授权运营主管部门的信息;二是在地方政府门户网站以及公共数据开放平台与授权运营平台上通过人工观察和关键词检索采集数据。数据采集截止时间为 2023 年 9 月。服务层评估主要采用人工观察和测试法对各地公共数据开放平台与授权运营平台提供的服务进行观测并做描述性统计分析,并对平台的回复时效和回复质量进行了评估,数据采集截止时间为 2023 年 9 月。此
29、外,服务层还引入了“体验官”对用户在数据发现与数据获取过程中的实际体验进行评测,与人工观察同时进行。数据层评估主要通过机器自动抓取和处理各地公共数据开放平台与授权运营平台上提供的数据,结合人工观察采集相关信息,然后对数据进行了描述性统计分析、交叉分析、文本分析和空间分析。数据采集截止时间为 2023 年 9 月。利用层评估主要对各地公共数据开放平台与授权运营平台上展示的利用成果进行了人工观察和测试,对 2021 年以来各地开展的开放数据创新利用比赛信息进行了网络检索,并对采集到的数据进行了描述性统计分析。数据采集截止时间为 2023 年 9 月。此外,为确保采集信息准确,避免遗漏,部分指标采取
30、报告制作方自主采集和向各地征集相结合的方式。各地征集结果经过报告制作方验证后纳入数据范围。同时,本次评估发现,个别已上线的地方平台出现无法访问造成数据供给中断的情况,或虽然平台仍在线,但实际上无法通过平台获取数据。039 评估方法指数计算方法指数制作方基于各地在各项评估指标上的实际表现从低到高按照 0-5 分共 6 档分值进行评分,其中 5 分为最高分,相应数据缺失或完全不符合标准则分值为 0。对于连续型统计数值类数据则使用极差归一法将各地统计数据结果换算为 0-5 分之间的数值作为该项得分。各地平台在准备度、服务层、数据层、利用层四个维度上的指数总分等于每个单项指标的分值乘以相应权重所得到的
31、加权总和。基于指标本身的重要性、各地在各项指标上的平均达标情况和地区间差距配置权重。最终,各地开放数林指数等于准备度指标分值、服务层指标分值、数据层指标分值、利用层指标分值乘以相应权重的加权平均分。城市开放数林指数计算公式如下:城市开放数林指数15205015服务层指标分值此图由AI生成040附录041 城市平台一览表(按行政层级及拼音首字母排序)042043044指数制作团队报告校对组体验官观察员郑磊、刘新萍、张忻璐、吕文增、张宏、侯铖铖、蒋佳钰、鞠逸飞胡业飞、王翔、袁千里、马李滨、韩笑丁超逸、高梦婷、胡颖、凌丹、潘悦滢、魏澜、吴逸萌、朱丹妮薄佳妍、蔡伊南、曹雁飞、陈宸、陈佳玉、陈曦来、陈祺康、陈业、陈镒丹、陈昱彤、褚晓、崔梦柯、邓佳星、胡珍、姬祥飞、李姗蔓、李霞、李之端、梁嘉桐、梁天佑、刘馨、陆婷婷、罗姝瞳、罗意、欧阳材泓、彭灿、任姝菡、孙孟杰、王晶格、王潇睿、王野然、王怡文、尉苇、项善、辛悦、萧海玥、徐佳迪、徐若茜、徐思佳、徐玉东、于锦文、张梓琦、朱启珠、庄文婷指数制作方045评估专家委员会