生态环境数据资源中心建设方向探索与研究
2022-11-15谭文津
谭文津,江 驰
(1.江西省生态环境科学研究与规划院,江西 南昌 330077;2.江西省生态环境监测中心,江西 南昌 330077)
1 引 言
生态环境数据资源中心[1]是生态环境数据共享、交换、治理的重要载体,是环境大数据发展的核心[2]。现阶段我国尚未形成生态环境数据资源中心的建设方案或者指南,各省也正处在生态环境数据资源中心规范化建设的摸索阶段[2]。本文结合江西省生态环境数据资源中心建设及实际应用情况,研究、探讨了生态环境数据资源中心发展方向,为进一步推进生态环境数据共享、应用提供参考。
2 架构设计现状
江西省生态环境数据资源中心采用数据集成交换层、数据管理层、数据应用层三层架构进行设计(图1),依托省电子政务外网实现与国家、市生态环境部门、省发改委、水利厅、自然资源厅、林业厅、市场监督管理局、交通厅等部门连接,满足海量结构化、半结构化、非结构化数据归集共享、管理、应用能力。
2.1 数据集成交换层
数据集成交换层是数据资源中心的基础层,通过对业务系统数据集成、抽取、电子文件手工导入以及页面数据爬虫爬取[3]等方式,打通厅内污染源在线、移动执法、环境监测、“三线一单”等20 余个自建业务系统数据孤岛,与生态环境部,省发改委、水利厅、交通厅等委办厅局实现数据共享,日增数据2000 万条。同时向外提供各类定制化数据接口,满足不同数据共享的需要。
2.2 数据管理层
数据管理层是数据资源中心的核心层,江西省从业务系统(非业务系统数据作为一级目录单列)、机构职能两个维度梳理编制生态环境数据资源目录354 项,保证了数据资源目录的可维护性、实用性及可扩展性。通过建立数据共享中间库、基础业务库和公共基础库,避免了不同来源数据之间交叉影响,保证了入库数据在共享、数据治理过程中的完整性、真实性和可靠性。
2.3 数据应用层
数据应用是数据共享的关键引擎及核心价值。在数据应用层面,数据资源中心向各类业务系统提供数据共享接口的同时,还面向管理人员、技术运维支撑人员,提供数据查询功能,进一步开拓了数据应用深度。
3 存在的问题
在实际使用过程中,江西省生态环境数据资源中心解决了系统间、部门间数据共享问题,但也存在一些不足。
(1)适配终端不足,没有移动端应用,办公人员在会议、出差、执法等工作场景下无法进行使用。
(2)使用人群覆盖面不足,为保障数据安全,数据资源中心仅向厅内各业务处室(单位)数据管理员、系统管理员、运维技术人员共40余人开放了权限,日活量约20 人/次, 按全厅724 人计算,权限开通率不足6%。
(3)数据开放量不足,在354 项数据资源目录中有250项为有条件共享类型,不予共享类型2 项,约占总数据项的71%;无条件共享类型为102 项,约占总数据项的29%,无条件共享类型不足总数据项的1/3,一定程度制约了数据共享与应用深度。
4 下一步应用探索
针对江西省生态环境数据资源中心存在的不足,可以从扩大用户群体、建设移动应用终端、扩展数据开放范围、加强数据安全四方面提升数据资源中心的能力。
4.1 扩大用户群体
使用数据的对象越多,数据的价值则越大。因此,在保障数据安全条件下,生态环境数据资源中心应扩大到政府内部全员使用,甚至逐步向高校、科研院所、企业、社会公众开放,使越来越多的人可以直接利用数据资源中心海量数据,挖掘数据价值为生态环境管理、社会管理服务。
4.2 扩展移动终端
数据的使用应该最大限度突破时间、空间限制,满足于各类应用场景。因此,可依托生态环境数据资源中心,结合基础地理信息建设掌上智能搜索移动APP应用等数据资源中心衍生产品,让生态环境工作人员通过移动终端随时随地查询数据,掌握各类生态环境信息动态,为现场决策分析、应急指挥、调查执法等提供支撑。
4.3 推进数据开放
数据是可无限复制的宝贵资源,应进一步推进无条件共享数据类型比例,可按单位内部、政府部门间、社会公众3个层面扩大范围。一是在单位内部除涉密数据外,争取100%无条件共享;二是在政府部门间通过脱敏处理,取消数据订阅、审核流程,采取数据共享登记制,除涉密数据外均无条件共享;三是按政务公开目录要求,对要求向社会公开、开放的数据100%进行公开。
4.4 加强数据安全
安全是数据共享的保障[4],数据查询是最直接的数据使用方式,在数据查询过程中为避免数据滥用及外泄,应对数据查询、使用权限进行分类管理。无条件共享数据应主动对外单位开放,有条件共享数据应采用申请订阅、授权方式或备案方式获取,保障数据资源的安全及应用。
5 结论
现有数据资源中心解决了数据孤岛、数据共享问题,但数据资源由于安全、技术、管理水平等原因仍然没有达到100%共享应用,数据价值仍然有待于进一步开发。在今后生态环境数据资源中心功能优化上,应该扩大数据使用人群范围,通过备案等简易方式,实现除涉密数据外均无条件共享,同时加强数据安全管理,保障数据的完整性、真实性、可靠性等价值属性,才能最大限度地开发、挖掘生态环境数据价值。