内蒙古自治区环境信息资源目录体系建设研究
2022-10-01张巍金鹏李瑞强何燕飞
张巍,金鹏,李瑞强,何燕飞
(1.内蒙古生态环境大数据有限公司,内蒙古 呼和浩特 010011;2.内蒙古自治区生态环境综合行政执法总队,内蒙古 呼和浩特 010011;3.内蒙古自治区环境在线监控中心,内蒙古 呼和浩特010011;4.北京思路创新科技有限公司,北京 100000)
引言
环境信息资源是指生态环境部门在履行职责过程中制作或获取的,以一定形式记录、保存的文件、资料、图表和数据等各类数据资源。党中央、国务院高度重视信息资源整合共享工作,习近平总书记强调要强化信息资源深度整合,构建全国信息资源共享体系,打通经济社会发展的信息“大动脉”,以信息化推进国家治理体系和治理能力现代化。2017年,国家发改委下发《政务信息资源目录编制指南(试行)》(发改高技〔2017〕1272 号)[1],明确了政务信息资源的分类、元数据、编制要求等内容,为信息资源目录建设提供了更为具体的方法和依据。2017 年底,由生态环境部牵头编制了《生态环境保护信息化工程数据分类与编码标准》《生态环境信息共享服务注册规范》《生态环境信息共享资源发布和使用规范》。内蒙古自治区生态环境保护工作起步较早、发展较快,积累了大量的数据。在数据整合工作中,我们发现,由于业务系统建设没有统一的标准,数据质量参差不齐,“数据孤岛”“数据烟囱”现象普遍存在。为推动全区生态环境数据的整合共享,强化数据资源的高效统一管理,研究制定环境信息资源目录体系势在必行。
1 数据来源与研究方法
1.1 研究区域概况
选取内蒙古自治区为研究区域。内蒙古自治区从2016 年起实施生态环境大数据建设项目,具有良好的环境信息资源目录编制基础:一是通过数据资源规划,初步摸清了生态环境大数据资源“家底”,使分散的、标准不一的数据实现由数据到信息的转化,规范数据库及业务系统建设,为环境资源共享夯实基础;二是针对不同粒度和层次的信息资源建立数据库体系,以满足生态环境数据分类存储及分析需求,数据库体系主要由关系型数据库、时序数据库、半结构化数据库、非结构化数据库组成;三是建立了数据资源数据库,从数据库设计方法、数据库体系总体结构、元数据库设计、业务数据库设计等方面,形成基础数据库、主数据库、元数据库、主题数据库、指标库和公共代码库。
1.2 数据来源
本研究数据来源于内蒙古自治区生态环境大数据资源中心,该中心收录生态环境数据约36.7 亿条,数据容量约30.1T。本研究依托内蒙古自治区现有生态环境数据基础,围绕生态环境领域数据,通过对环境质量、生态环境、污染源等信息的分类以及对应业务数据、环境质量数据、环境要素等数据信息梳理,确定资源目录规范结构,建立数据资源体系,规范资源目录内容,实现对环境质量信息相关源数据及元数据的有效分类、管理。
1.3 研究方法
采用实地调研、文献调研、专家调研等方法研究不同来源的内蒙古自治区生态环境数据的现状,摸清数据家底。建立“一横一纵”生态环境数据梳理机制,纵向贯穿部、省、市县、排污单位等生态环境管理节点内部数据,横向整合其他委办厅局及互联网数据。纵向依据生态环境各业务部门现有的职能职责,梳理出各部门涉及数据,依据数据所涉及的环境管理要素再进行二次分类,最终形成数据资源基本情况调查表,见表1。横向梳理出其他委办厅局及互联网上涉及的数据,将对应数据类型按照环境管理要素添加至表1中。
表1 数据资源基本情况调查表
1.4 分类方法
环境信息特别是内蒙古自治区内各级生态环境管理部门使用的环境管理及相关信息,具有层次分明、隶属关系明确等特点,宜采用线方法进行分类。对于一些特殊类别的环境信息,宜采用面分类方法。本分类采用以线分类法为主、面分类法为补充的混合分类法。
一、二级分类采用线分类方法按照生态环境管理要素分类,一级类目包含目前环境管理业务涉及要素,包括环境质量信息、自然生态、污染源等大类;二级类目对管理要素进行再分类,如环境质量信息下再分大气环境质量、水环境质量、声环境质量等;三级至五级类目采用面分类方法,按照每类要素包含的数据属性进行分类。类目层次目前暂时分到五级,将来可根据数据类别扩展需要增加。
1.5 代码规则
类目的分类编码规则沿用《环境信息分类与代码》中的分类代码,分类代码用阿拉伯数字表示,每层代码均采用2位阿拉伯数字表示,即01-99。一级类目代码由第一层代码组成,二级以上类目代码由上级类目代码加本层代码组成。
代码结构组成如图所示:
图1 代码结构组成图
2 结果与分析
表2 环境信息资源代码表(节选)
表3 环境信息资源核心元数据说明(节选)
2.1 环境信息资源代码
通过本项目研究,最终形成环境信息资源一级目录9 项,包括环境质量信息、自然生态、污染源、核与辐射、环境风险与应急、环境政策法规标准、环保科技与产业、政务信息、环境保护相关信息等;二级目录32 项,包括大气、水、土壤、自然生态环境质量等;三级目录80项,包括空气质量监测、降尘、降水、沙尘等;四级目录82 项,包括空气自动常规监测、空气超级站监测等;五级目录54 项,包括国控空气自动常规监测、区控空气自动常规监测等。
2.2 元数据
环境信息元数据是描述环境数据资源特征的数据。其中核心元数据是描述数据基本属性与特征的最小集合,一般包括环境信息资源的名称、内容摘要、提供方、发布日期等。利用元数据来描述信息资源后,可以快速发现和确认信息资源、为信息检索提供关键词,可以在不同系统之间进行数据交换。环境信息资源核心元数据包括环境信息资源分类、环境信息资源名称、代码、提供方、提供方代码、摘要、格式、信息项信息、共享属性、开放属性、更新周期、发布日期、关联资源代码等13项。
2.3 编制意义
内蒙古自治区生态环境保护工作起步较早、发展较快,积累了大量的数据。近年来,通过环境信息系统的配套建设,大部分数据实现了纸质化向电子化的转变。2016年,内蒙古自治区生态环境厅启动大数据建设项目,推动涉及环境监测、环境执法、环境统计、污染源普查等环保业务数据的整合共享。经过多年的项目建设与实施,我们发现数据资源整合中存在以下几方面问题:一是信息系统建设缺乏顶层规划、统一标准,造成大量“数据孤岛”;二是业务数据标准不一,数据质量层次不齐,难以交换和共享;三是数据资源开发利用程度不高,为环境形势预警预测、环境管理宏观决策等方面发挥作用有限[2]。
本研究编制的环境信息资源目录,通过建立各类环境信息资源的分类方法,规范资源排序和编码,推进数据整合和共享,促进数据标准的统一,实现对各业务数据资源特征的准确描述。环境信息资源目录建立起数据使用者和业务部门的桥梁纽带,方便人们对环境数据资源的检索、定位和获取,推动了数据共享应用,提升了数据的环境管理决策支撑能力。
2.4 应用前景
本研究基于内蒙古自治区生态环境大数据项目的建设经验,环境信息资源目录体系已成功应用于内蒙古自治区生态环境大数据五期工程。研究成果适用于内蒙古自治区各级生态环境信息化项目实施过程中,环境信息资源目录的建设和管理,为生态环境数据治理、数据管理、数据共享等工作提供标准统一的编码规则,推进全区生态环境数据的交换共享。
3 结论
本研究基本建立起内蒙古自治区生态环境五级信息资源目录体系,形成了内蒙古自治区环境信息资源分类原则与代码规则、环境信息资源核心元数据。该目录体系具有可扩展性,后续可根据生态环境管理业务需求,不断完善和更新,通过目录使用过程中的意见反馈,不断优化分类和元数据。环境信息资源目录体系的建立有利于推动生态环境信息资源的整合和共享,强化数据资源的高效统一管理,推进数据应用,挖掘数据潜在价值,为生态环境质量改善提供强有力的数据支持服务。