武汉市公共数据开放的问题及对策
2021-11-30肖迎霜
肖迎霜
(武汉市信息中心,湖北 武汉 430012)
公共数据资源开放是党中央国务院部署的重要改革任务,是推进国家治理体系和治理能力现代化建设、促进经济转型升级的重要举措,对于建设数字政府、创新政府、廉洁政府和服务型政府以及发展壮大数字经济、共享经济具有十分重要的意义。以武汉市公共数据开放为对象,研究武汉市公共数据开放的现状及问题,提出建议对策和发展路径,对地方政府数据开放建设具有重要参考意义。
1.武汉市公共数据开放的现状及问题
1.1 武汉市公共数据开放的现状
为加快武汉市政务公开数据开发利用,带动大数据产业发展,促进信息惠民和信息消费,2014年8月11日武汉市政府常务会议审议并同意武汉市信息产业办提交的《武汉市政府公开数据服务平台规划建设方案》,启动武汉市政府公开数据服务平台建设,一期项目于2015年4月上线试运行,二期项目于2016年10月系统上线投入试运行,三期项目于2018年12月正式上线。作为信息惠民的优秀案例,武汉市凭借该项目荣获中国信息协会颁发的“2015中国智慧城市惠民发展优秀城市”证书。2016年11月该项目荣获中国地理信息协会颁发的“2016中国地理信息产业优秀工程铜奖”证书。
截至2019年12月武汉市政府公开数据服务平台整合了政府101个部门日常业务系统产生的各种类型的公开数据,按照政府机构、经济发展、公共服务、能源环境、教育科技、交通服务、文化娱乐、医疗卫生、金融服务、法律服务、公共安全、农业农村等12个大类进行归类,面向各行各业提供包括可在线阅读可下载的PDF、Excel工作簿、数据库文件、CSV数据、地图服务API接口及数据API接口调用服务,开放完整的、原始的、可机读的、非专属的、机构化的、高价值的数据集,并配备实用翔实的元数据条目,帮助用户用好数据、用对数据。平台数据记录共120386条,可下载数据2745项、 地图服务203个、APP应用54个、excel文件699条、图片152张、数据文件5个、PDF文件1179个、csv文件735个。资源下载总次数32311次,资源访问总次数132295次。在一定程度上满足了科研、教育、商业、个人对数据的使用。
1.2 武汉市公共数据开放的问题
参考复旦大学数字与移动治理实验室制定的“中国开放数林指数”评价指标体系,从准备度(25%)、平台层(20%)、数据层(40%)、利用层(15%)[1]四个维度评估,武汉市公共数据开放的主要问题如下:
1.2.1 缺乏数据开放的顶层设计
数据开放的目标是实现政务数据惠民惠企,把数据作为第五生产要素进行管理,发展大数据产业。要实现这个目标, 必须从数据开放的源头抓取,从数据开放单位的责任和义务、数据开放的范围、数据开放的质量、数据开放的组织、数据利用的规定等多个层次开展工作,制定系统的配套机制体制,对工作进行整体谋划和推动。对管理制度、绩效考核、技术架构、日常运维等方面进行顶层设计,实现数据开放全过程的闭环推动。缺乏顶层设计和配套的规章制度,没有形成系统性的工作程序是武汉市数据开放发展缓慢的主要原因。
1.2.2 规章制度和标准滞后
一是规章制度缺失。武汉市2015年出台的《武汉市政务数据资源共享管理暂行办法》中,仅在第十五条中涉及数据开放的规定,要求“统一编制市级《数据目录》,包括数据名称、数据格式、共享类别、共享范围、更新频度、时效要求、提供方式、提供单位、可否向社会开放等内容,并在云端武汉服务平台上公布。”,简单提及了数据开放内容。缺乏专门针对数据开放的规章制度和对数据开放质量、内容等进行强制性规定,对各个部门的数据开放水平也没有硬性规定和严格标准。
二是标准体系建设不足。当前武汉市相关政策主要是针对政务数据资源共享与开放的宏观层面的制度建设。然而开放数据的目标是要实现社会范围内数据的集成与整合性应用,若无相对一致的标准体系,难以在同一管理与技术框架内实现数据的联动与利用,也难以建成政务数据大平台。缺乏统一的数据描述规范、元数据标准、数据分级分类指南等,严重制约了数据开放的能力和水平。
1.2.3 开放应用成效不明显
目前武汉市公共数据开放平台虽然开放的数据领域多,数据集多,而且武汉2020年已开始组织举办开放数据创新应用大赛,并且取得了不错的成绩,但是促进数据利用的力度不够。
2.先进城市做法
对上海、深圳、贵阳等数据开放先进省市的开放平台进行深入分析,分析其特点与优点,各地的特色经验如下:
2.1 重视制度建设
随着信息技术的不断发展,在大数据的背景下,为了政府可以与群众之间进行更好的交流沟通,建设公共数据开放制度是未来的发展趋势,更是实现政府治理能力和治理体系现代化的迫切需求。出台专门针对公共数据开放的地方政府规章,是推进公共数据开放制度建设的法制基础和重要依据。
上海和浙江分别在2019年8月和2020年6月出台了专门针对公共数据开放的地方政府规章,即《上海市公共数据开放暂行办法》和《浙江省公共数据开放与安全管理暂行办法》,文件等级和专门性相对较高。其他一些地方也出台了专门针对数据开放的规范性文件,如《北京市交通出行数据开放管理办法(试行)》和《福州市公共数据开放管理暂行办法》等。以上海为例:
上海在2019年颁布的《上海市公共数据开放暂行办法》[2]中,进一步细化了总体原则、开放机制、平台建设、数据利用、多元开放、监督保障、法律责任等内容。根据《上海市公共数据开放暂行办法》,上海逐步完善了公共数据开放配套制度,一是上海建立专家议事机制。组建数据开放专家委,针对年度重点工作、开放风险防范、应用模式创新等开展专题研讨交流。二是加强评估考核。上海对本市公共数据开放工作情况按月度、季度、年度开展评估,定期通报工作进度。每年11月底启动当年公共数据开放绩效评估和应用成效评估,评估结果纳入市公共数据和一网通办管理考核。三是建立公共数据开放专门服务团队。面向公众提供请求受理、咨询答疑等服务,定期形成运营服务报告,全面提升本市公共数据开放平台软实力。
2.2 重视标准建设
数据的采集、存储、开放、使用等各个环节都需要制定明确的标准作为指导,科学的数据标准是数据资源管理的重要依据。制定开放数据标准规范和操作指南,有利于数据开放工作的标准化和规范化实施。目前山东、江西、浙江、广东、上海等地均已制定了专门针对数据开放的地方标准或技术规范。
《浙江省公共数据开放技术规范》对开放数据标准、开放平台功能和平台管理都作出了明确的规定。山东省《公共数据开放 第1部分:基本要求》《公共数据开放 第2部分:数据脱敏指南》和《公共数据开放 第3部分:开放评价指标体系》对各级政务部门的数据开放、数据脱敏以及数据开放程度评价工作均制定了标准。《江西省政务数据开放平台技术规范》对开放数据集元数据、平台技术架构和平台要求进行了规范。广东省在数据资源开放的技术规范和管理规范上都制定了标准。
上海发布的《政务信息资源共享与交换实施规范第1部分:目录元数据》[3],建立了开放数据元数据标准,明确规定了数据的开放属性、更新频率等。深圳和贵阳两地健全开放数据元数据标准,其元数据包括标识符、开放方式、更新频率、资源状态等近30多种属性,每种属性都有详细说明,是全国所有平台中元数据标准最为丰富的平台。
为保证开放数据的安全性,上海、贵州等地制定了数据开放分级分类指南。
上海2019年出台了《上海市公共数据开放分级分类指南(试行)》[4],将公共数据从三个维度分为24个开放级别,对应不同开放类别、管理流程和利用方式。贵州省2016年在全国率先制定了地方标准《政府数据 数据分类分级指南》[5],采用多维度和线分类法相结合的方法,在主题、行业和服务三个维度对贵州省政府数据进行分类,对于每个维度采用线分类法将其分为大类、中类和小类三级。政府数据的分级由数据的敏感程度划分,分为公开数据、内部数据、涉密数据。
2.3 数据集中统一管理
上海、贵阳都建立了全市统一的政务数据资源平台、开放平台和共享平台。对所有政务数据实行集中统一管理,根据数据的开放和共享属性对外提供开放和共享。
上海市2018年出台的《上海市公共数据和一网通办管理办法》明确规定,市大数据中心负责市级大数据资源平台的建设和运行管理。公共管理和服务机构在履职过程中获取的公共数据,由市大数据中心按照应用需求,实行集中统一管理。行政机关应当依托市大数据资源平台和区大数据资源分平台,实现公共数据整合、共享、开放等环节的统一管理。
贵阳市《贵阳市政府数据共享开放实施办法》规定市人民政府应当组织建设“云上贵州”贵阳分平台、政府数据共享平台、政府数据开放平台,作为政府数据传输、存储、共享、开放的载体。
2.4 制定年度开放计划
制定有针对性的、切实可行的开放数据工作计划并向社会公开是推进政府数据开放工作的重要内容。公开具体的计划既有助于政府自身厘清阶段性的目标与职责,也能给予有数据需求的组织和个人以明确的预期,并接受社会公众的监督,有助于提高开放数据的利用效率,发挥数据的真正价值,是数据开放长期可持续推进的保障。目前仅上海、深圳和福州连续制定和公开了专门针对政府数据开放的年度工作计划,其中上海在该项工作上表现最为出色:
一是制定年度开放计划。上海从2014年起连续6年发布专门针对数据开放的《上海市公共数据资源开放年度工作计划》,明确年度公共数据开放重点领域。
二是组织重点领域公共数据开放应用建设,上海2020年度开放计划中要求各部门、各区根据自身业务重点和区域特色,结合年度开放重点,面向社会主体开展主动服务和共同策划,组织推动建设一批公共数据开放应用项目。开放应用成效将作为本年度绩效评估重点内容。
三是推进行业数据价值挖掘。以行业痛点难点为切入,对接社会需求打造重点领域创新应用示范标杆。上海2019年度开放计划中要求重点开展普惠金融、交通出行、医疗健康、文化旅游四个方面的公共数据开放。如普惠金融向试点银行开放市场监管类数据、企业税务数据、企业社保公积金数据、企业技术认定数据等,为银行中小企业信贷服务提供数据支撑,降低信贷服务门槛和信贷风险。
2.5 举办开放大赛
举办开放数据应用创新大赛是推动开放数据的社会化利用常见活动之一。上海、山东、北京、海南、深圳、绍兴、潍坊等地连续多年举办开放数据比赛。2015年上海率先试点以赛促用,截至2020年已连续举办六届上海开放数据应用创新大赛(SODA),成为数据开放领域的品牌赛事,累计吸引了世界各地近万人,1800支团队参加比赛。
在比赛类型上,既有综合性大赛,如2020浙江数据开放创新应用大赛和深圳开放数据应用创新大赛;也有更具行业性和专业性的比赛,如上海市已连续四年举办了图书馆开放数据专项竞赛。
在比赛的组织形式上,浙江和四川等省的数据利用大赛设置了多个地市分赛区。2020首届数字四川创新大赛在德阳、宜宾、达州、雅安等地市都设置分会场。
除举办开放数据应用创新大赛以外,开展各种常态化、条线性、专业性的引导赋能活动,也有助于促进开放数据的利用和落地。上海市举办了公共数据开放应用试点项目申报政策宣讲会、应用试点项目征集宣贯会等引导活动,深圳市也举办了2020开放数据应用创新大赛才企交流活动。上海市推出普惠金融应用,整合8个部门的数据,开放了300多个数据项,为银行信贷赋能;浙江省金华市搭建信义贷金融服务平台,为银行发放贷款提供数据支持。
3.武汉市公共数据开放对策研究
3.1 优化公共数据开放顶层设计
顶层设计是系统工程学的概念,指统筹考虑项目各层次和各要素,追根溯源,统揽全局,在最高层次寻求问题的解决之道。顶层设计是公共数据开放成功的核心逻辑和基本原则。一是全局关照。国迈研究院副院长田景熙在“2020智慧中国年会”上指表示“2020十四五期间,电子政务将向G2G2B2P2C(政务间+政企间+政府与公众间+政府对公民个体间服务)的一种多业务系统融合模式发展。这需要形成6种能力:第一个就是全局资产汇集和管理;第二个是全局资产观测能力;第三个是电子政务全领域能力;第四个是全社会资产生态能力;第五个是社会、经济、教育、文化这些资产的增值能力;第六个是全方位产业支撑。”[6],具体到数据开放领域,这种全局能力是认知数据资源、数据开放和数据共享三者之间关系的能力。是否将所有政府部门的数据资产统一汇聚管理?是否统筹考虑数据开放和数据共享平台的建设?是否考虑这些问题决定了在数据开放过程中是否具有了全局眼光。二是洞悉关联性。在数据开放过程中,关注组织架构、平台设计、数据治理、开放应用、标准规范、法规制度、安全保障等七个方面之间的关联性,整体推进,不是只在一个方面孤立发展。
3.2 出台公共数据开放领域法规
研究出台武汉市公共数据开放的法规。出台公共数据开放法规的主要目的是促进和规范武汉市公共数据开放和利用,提升政府治理能力和公共服务水平,使数据成为第五生产要素,促进数字经济发展,并从立法层面化解公共数据开放领域的阻碍。在这种立法目的的指引下,法规中的每一个条款必须经得起衡量,是否有利于实现这个目标?是否有利于解决公共数据开放建设中面临的问题?是否借鉴了外地省市的经验和做法?是否符合武汉市发展的水平?是否具有武汉本地特色?是否具有操作性?是否有适当的超前?是否具有创新性?为此,梳理公共数据开放以往建设中的问题是立法的前提和基础,对外地省市先进做法和经验的取舍是立法的保障和精髓,保持适当的超前和创新是武汉本地对数据开放领域的总结和贡献。基于以上立法逻辑和立法路径,确保法规中的每一个条款承担着实现立法目的某种责任。
3.3 出台公共数据开放领域技术标准
公共数据开放领域技术标准是对该领域中需要统一协调的技术事项所制定的标准。目前亟需出台的是两个标准:公共数据开放元数据标准和公共数据开放分级分类指南。前者已比较成熟,后者仍处于探索阶段。
研究出台武汉市公共数据开放元数据标准。元数据即“关于数据的数据”,是为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具。离开元数据的公共数据将是一盘散沙,将无法提供有效的检索和处理。元数据标准着重解决公共数据开放中的以下问题:一是数据资源确认和检索,帮助用户检索和确认所需要的资源 ,如数据的名称、摘要、标签、提供单位、各种分类方式等;二是数据资源描述,描述数据的格式、开放类型、更新时间、发布时间、地域范围、时间范围信息字段项等;三是数据资源管理,如资源状态、提供单位、联系电话、更新频率、开放条件、来源系统等;四是统计数据资源利用情况,如文件数量、浏览量、下载量等。
研究出台武汉市公共数据开放分级分类指南。数据开放领域最大的困难之一是数据安全问题,在实际建设中,很多部门要么对数据过于保护不敢开放数据,要么对数据保护意识不足而开放不该开放的数据。在数据分散、数据提供部门多,数据利用主体不明确的情况下,如何将合适的数据开放给合适的对象,又不影响个人、企业或国家的秘密和权益,建立公共数据开放分级分类指南是解决这类问题的途径之一,分级分类指南本质上是统一所有数据提供部门分类分级的方法和标准。但数据分级分类是一个尚未成形的概念,在不同的领域数据分级分类的定义和方法不同。如《上海市公共数据开放分级分类指南(试行)》中的分类定义为无条件开放、有条件开放、非开放三种开放类别,分级指根据个人、组织、客体三个维度分为10个开放级别,对应不同开放类别、管理流程和利用方式。贵州省《政府数据 数据分类分级指南》中分类指将政府数据按主题、行业和服务三个维度分类,分级由数据的敏感程度划分,分为公开数据、内部数据、涉密数据。工信部《工业数据分类分级指南(试行)》将工业数据分为一级、二级、三级等3个级别,根据级别确定数据开放共享属性和范围。中国证监会《证券期货行业数据分类分级指引》根据将金融行业业务细分进行数据归类,再根据数据被破坏后的影响对象、影响范围和影响程度将数据分为4级。
如何对开放数据进行分类?如何对开放数据进行分级?开放数据分类和分级之间的对应关系是什么?开放数据分类分级标准是否与其他行业的分类分级标准相适应?作为网络安全一部分的数据安全,开放数据分类分级标准是否适应网络安全分级标准?这是制定数据开放分类分级指南必须权衡考虑的问题。
3.4 促进开放数据开发利用
数据开放作为一种政府活动,其主要目的是释放数据要素价值。这一目的是围绕数据开放——数据利用——数据产业化的主线开展的。
在开放数据开放环节,主要是提升数据开放质量和数据数量。主要手段是组织重点领域公共数据开放应用建设,面向社会主体开展主动服务和共同策划,组织推动建设一批公共数据开放应用项目。聚焦数据需求侧,开展供需精准对接,以应用导向、效果导向,全面提升数据开放的质量和精准度。另一个手段是制定年度工作计划,要求数据提供部门制定年度数据开放清单,推进公共数据开放量持续增长。
在数据利用环节,以赛促用,每年定期举办“武汉市开放数据应用创新大赛”,邀请全国数据企业的大数据从业者和高校的大数据研究者参加,鼓励和引导各类社会主体参与公共数据深度利用和价值挖掘,促进公共数据与社会数据融合,对优秀参赛团队、典型应用案例等进行宣传激励和落地孵化。
在数据产业化环节,开展公共数据开放应用试点项目征集活动,推动公共数据资源供需对接,加强公共数据深度开放;引导社会主体对公共数据的价值挖掘和创新应用,发挥政企数据融合对各行业的赋能作用;打造一批示范案例,引导各类社会主体参与公共数据开放应用,形成融合创新生态体系。