上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

复旦智库:2020上半年地方开放数林指数分析报告数据层:浙江(23页).pdf

编号:79070 PDF   DOCX 23页 4.60MB 下载积分:VIP专享
下载报告请您先登录!

复旦智库:2020上半年地方开放数林指数分析报告数据层:浙江(23页).pdf

1、001 评估方法 1.1 评估指标体系 1.2 数据采集分析方法 1.3 指数计算方法 指数分析 2.1 数据数量 2.2 数据质量 2.3 数据规范 2.4 开放范围003003006006008008009012017请参照以下规范:复旦大学数字与移动治理实验室 . 地方开放数林指数分析报告 数据层 _ 浙江(2020 上半年)R/OL. (2020-07-22) 引用日期,格式为YYYY-MM-DD. http:/ 地方开放数林指数分析报告 数据层 _ 浙江(2020 上半年).pdf.0020031.1 评估指标体系评估指标体系共包括准备度、 平台层、 数据层、 利用层四个维度及下属多

2、级指标 (见图1-1、图 1-2):准备度是“数根”,是数据开放的基础,包括法规政策效力与内容、组织与实施、标准规范制定等三个一级指标。平台层是 “数干” , 是数据开放的枢纽, 包括数据发现、 数据获取、 成果提交展示、 互动反馈、用户体验等五个一级指标。数据层是“数叶”,是数据开放的核心,包括数据数量、数据质量、数据规范、开放范围等四个一级指标。利用层是“数果”,是数据开放的成效,包括利用促进、有效成果数量、成果质量、利用多样性等四个一级指标。一、评估方法004 图 1-1 评估指标体系005 图 1-2 数据层评估指标0061.2 数据采集分析方法数据层评估主要通过机器自动抓取浙江省数据

3、开放平台上的数据,结合人工观察采集相关信息,然后对数据进行了描述性统计分析、交叉分析、文本分析和空间分析。数据采集截止时间为 2020 年 4 月,对“动态更新”这一指标的评测时段为 2020 年 1 月 1 日至 2020 年3 月 31 日。1.3 指数计算方法基于浙江省在各项评估指标上的实际表现从低到高按照 0-5 分共 6 档分值进行评分,其中 5 分为最高分,相应数据缺失或完全不符合标准则分值为 0。对于连续型统计数值类数据则使用极差归一法将各地统计数据结果换算为 0-5 分之间的数值作为该项得分。报告对应各项评估指标,以处于全国前 10%、前 25%、前 40%、前 70% 和后

4、30% 五个等级来展示浙江省在该项指标上所处的位置。007008浙江在数据层各项指标上的得分如图 2 所示。二、指数分析 图 2 浙江在数据层各项指标上的得分情况2.1 数据数量数据数量是指平台上开放的有效数据集的数量和容量。009 浙江在该项指标上在全国所处的位置 浙江在该项指标上在全国所处的位置2.1.1 有效数据集总数有效数据集总数是指平台上开放的真实有效的数据集的数量,不包括空白数据集、虚假数据集和重复数据集。浙江目前在该项指标上的排名居于在评地区的前 70%。2.1.2 有效数据容量有效数据容量是指将一个平台上可下载的、结构化的有效数据集的字段数(列数)乘以条数(行数)后得出的数据量

5、。浙江目前在该项指标上的排名居于在评地区的前 10%。2.2 数据质量数据质量是指平台上开放的数据集的完整性、颗粒度、时效性和可获取性。0102.2.1 优质数据集数量优质数据集数量是指平台上数据容量大、社会需求高的数据集的数量。报告对在评地区平台上所有可下载的数据集按照数据容量进行排序,在数据容量相同的情况下再按照下载量排序,最终选出排名居于前 1% 的数据集作为优质数据集。浙江目前在该项指标上的排名居于在评地区的前 10%。浙江省平台有三个优质数据集进入在评地区优质数据集的前十名(如表 1)。 浙江在该项指标上在全国所处的位置 表 1 浙江平台上开放的优质数据集0112.2.2 无质量问题

6、无质量问题是指平台上存在高缺失、碎片化、低容量、生硬格式转化、限制型 API、标题缺失或不清等质量问题的数据集较少或没有。其中,高缺失数据集是指数据集中有 60% 以上的空缺数据 ; 碎片化数据集是指按照时间、行政区划、政府部门等被人为分割的数据集 ; 低容量数据集是指因数据量本身稀少或颗粒度过大等原因造成的数据条数在三行或三行以内的数据集 ; 生硬格式转化是指平台将非结构化的 DOC、PDF 等文件生硬地转化成 XLS、CSV、XML 等可机读格式。浙江目前在该项指标上的排名居于在评地区的前 25%。2.2.3 数据持续性数据持续性是指平台能够持续增加数据集,更新已开放数据集,并留存历史数据

7、集。浙江目前在该项指标上的排名居于在评地区的前 10%。 浙江在该项指标上在全国所处的位置 浙江在该项指标上在全国所处的位置0122.3 数据规范数据规范是指平台上的开放数据集在分级分类、开放协议、格式标准、描述说明等方面的规范和完善程度。2.3.1 分级分类分级分类是指平台根据不同的安全保护要求对数据集标示了不同等级的开放类型,浙江目前在该项指标上的排名居于在评地区的前 10%。 浙江在该项指标上在全国所处的位置013浙江平台为数据集标注了向社会开放的类型,包括无条件开放与受限开放(如图 3)。 图 3 浙江平台开放数据目录中标注的开放类型 浙江在该项指标上在全国所处的位置2.3.2 开放协

8、议开放协议是指平台为数据集提供了有关其开放主体和利用主体的权利和义务的协议,浙江目前在该项指标上的排名居于在评地区的前 10%。014 图 4 浙江平台的数据开放授权许可使用协议浙江平台在用户获取数据时提供了数据开放授权许可使用协议(如图 4)。015 图 5 浙江平台提供的数据集下载格式2.3.3 开放格式开放格式是指平台上开放数据集的格式标准,包括可机读格式、非专属格式、RDF 格式和 API 调用标准。浙江目前在该项指标上的排名居于在评地区的前 10%。浙江为平台上的数据集提供了可机读格式、非专属格式与 RDF 格式(如图 5)。 浙江在该项指标上在全国所处的位置2.3.4 描述说明描述

9、说明是指对数据集的描述与说明,包括元数据提供与 API 说明。浙江目前在该项指标上的排名居于在评地区的前 10%。 浙江在该项指标上在全国所处的位置016 图 6 浙江平台的元数据与 API 接口说明浙江平台为数据集提供了完整的元数据与 API 说明(如图 6)。0172.4 开放范围开放范围是指平台上开放的数据集在数据主题、参与部门、常见数据集及关键数据集方面的覆盖程度。2.4.1 主题覆盖主题覆盖是指平台上开放的数据集在经贸工商、交通出行、卫生健康、教育科技、社保就业、资源环境等 14 个基本主题上的覆盖程度,浙江目前在该项指标上的排名居于在评地区的前10%。浙江平台的数据覆盖了所有基本主

10、题(如表 2)。 浙江在该项指标上在全国所处的位置0182.4.2 部门覆盖部门覆盖是指平台上开放的数据集所覆盖到的政府部门的比例,浙江目前在该项指标上的排名居于在评地区的前 40%。2.4.3 常见数据集覆盖常见数据集覆盖是指平台上开放的数据集在常见数据集上的覆盖程度。报告对在评地区平台上开放的所有数据集的名称进行了文本分析,梳理出十四类各地平台上常见的开放数据集。浙江目前在该项指标上的排名居于在评地区的前 70%。 浙江在该项指标上在全国所处的位置 浙江在该项指标上在全国所处的位置0192.4.4 关键数据集覆盖关键数据集是指平台上开放的数据集在关键数据集上的覆盖程度。报告基于中共中央 国

11、务院关于构建更加完善的要素市场化配置体制机制的意见和地方法规政策要求重点和优先开放的数据领域,结合各地平台上已开放的优质数据集清单,梳理出五项关键数据集。浙江目前在该项指标上的排名居于在评地区的前 10%。 浙江平台提供了除疫情防控类数据以外的关键数据集(如表 3)。 浙江在该项指标上在全国所处的位置定制地方开放数林指数分析报告可在公众号“复旦 DMG”下方留言或者回复关键词“地方报告”,也可发送邮件到 020联合发布方合作单位冥睿(上海)信息科技有限公司汇纳科技股份有限公司DataMate 数据工作室晴禾(南京)文化有限公司浪潮集团复旦发展研究院中山大学数字治理研究中心上海市静安区人力资源和社会保障局

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(复旦智库:2020上半年地方开放数林指数分析报告数据层:浙江(23页).pdf)为本站 (奶茶不加糖) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部