环境影响评价大数据分析与创新服务
2016-03-03诸云强赵晓宏冯卓潘鹏李时蓓孙凯
诸云强,赵晓宏,冯卓,潘鹏,李时蓓,孙凯,4
(1.中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京 100101; 2.江苏省地理信息
资源开发与利用协同创新中心,南京 210023; 3.环境保护部环境工程评估中心,北京 100012;
4.中国科学院大学,北京 100049)
环境影响评价大数据分析与创新服务
诸云强1,2,赵晓宏3,冯卓1,潘鹏3,李时蓓3,孙凯1,4
(1.中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京100101; 2.江苏省地理信息
资源开发与利用协同创新中心,南京210023; 3.环境保护部环境工程评估中心,北京100012;
4.中国科学院大学,北京100049)
摘要:环境影响评价是一项数据密集型工作,不仅需要跨部门、多类型的大数据支撑,而且会产生相互关联的整体价值非常高的成果数据。如何共享和利用环评大数据,是充分发挥环评作用的基础和前提。通过分析环评业务流程,提出了环评数据的概念模型和组成内容,重点探讨了利用大数据、云计算、“互联网+”等新一代信息技术和思维模式,以期未来能够实现环评大数据的开放共享、关联发现、在线计算和创新应用。
关键词:环境影响评价;大数据;云计算;互联网+;共享服务
环境影响评价是一项覆盖范围广、多主体参与的数据密集型工作,既需要基础地理、水文、地质、气象、海洋和环境监测等大量数据资源的支撑,又会在环评、技术评估、审批、监督后评价、公众参与等过程中产生大量的数据资源。在经历引入确定、规范建设、强化完善、提高拓展四大阶段的发展后[1],我国的环境影响评价已经积累了海量的环境影响报告书、报告表、登记表以及技术评估报告、竣工验收报告、审批报告等数据资源。
然而,环评大数据的共享和利用并不理想。2008年,全国人大在《环评法》执法检查中指出,“水文、地质、气象、海洋和环境监测等相关数据没有实现共享,要加快整合现有基础数据,逐步建立统一的环评基础数据库、环评审批数据库和污染源跟踪数据库,形成环评信息共享机制和交流平台”。全国1 000多家环评单位各自以不同的方式和渠道获取有关数据,这些数据质量参差不齐,标准不统一,收集耗时长、成本高[2]。从2010年开始,环保部环境工程评估中心主持开展了环评基础数据库建设工作。到目前为止,已经制定了较为完善的标准规范体系[3],建设形成了环评法律法规库、专家库、地理信息库、环境敏感区等基础支撑数据库,以及建设项目环评报告书、重点行业环评指标库、环评资质库等环评核心业务数据库。尽管环评基础数据库取得了丰硕的成果,但还需要继续推进数据共享机制、数据资源整合以及环评技术支持系统的建设[4]。
随着物联网、云计算等信息技术和电子商务、社交网络等互联网应用的发展,大数据时代已经悄然来临。大数据的出现,迅速引起政府部门、产业界、科技界的广泛关注,已成为国家战略、产业投资和科学研究的热点,渗透到各个领域。大数据应用的层出不穷和巨大的潜力,让人们开始重新审视和关注数据的价值[5]。在此背景下,本文在系统分析环评数据资源的基础上,研究探讨符合大数据思维的环评数据创新服务模式。
1环境影响评价数据分析
1.1 业务分析
环评的本质在于预防或减轻规划或建设项目的决策对环境的不良影响[6],其核心业务流程是环评单位依据法规政策和技术标准对实施单位的建设项目(或规划)可能对环境造成的影响进行评价(过程中要对公众意见进行调查),评估机构(专家参与)对环评报告(表)进行技术评估后,再由环境保护主管部门对环境影响评价进行审批,最终决定是否通过环评,如图1所示。
图1 环评核心业务流程Fig.1 The core business workflow of environmentalimpact assessment
环评一般包括:评价区域自然和社会环境调查、建设项目工程分析、环境质量监测、环境影响分析、环境保护措施分析与建设等步骤。从环评全生命周期来看,环评完成后,还要进行环境保护的竣工验收和后评价,以便对其中的环境保护措施落实情况及环保效果进行评估。环评全生命周期流程如图2所示。
图2 环评全生命周期流程Fig.2 The full lifecycle of environmental impactassessment
1.2 数据组成
根据前述环评业务流程的分析,可得到环评数据概念模型,如图3所示,即承受客体(环境)承载或支撑着实施主体(建设项目或规划等),而实施主体作用于承受客体可能产生环境影响;参与主体(环评机构、评估机构、专家、审批机构、社会公众等)按照各自职责收集或生产基础数据(基础地理、水文地质、生态环境、气候气象等),参与环评不同环节的工作中,并最终形成环境影响评价成果(报告书、报告表或登记表等)。
基于概念模型,环评数据涉及的主要数据实体及其关系如图4所示,主要包括:实施主体、环境客体、参与主体、环评依据和环评成果5个一级实体。实施主体主要包括:可能对环境造成影响的建设项目、政府政策、规划、计划等;环境客体包括:自然地理环境、人文社会环境、大气环境、水环境、声环境、土壤环境等,其中自然地理环境和人文社会环境中又会包含环评最为关注的环境影响敏感点(区),包括:需特殊保护地区(饮用水水源保护区、自然保护区、生态功能保护区、基本农田保护区、世界遗产地、国家重点文物保护地等),生态敏感与脆弱区(沙尘暴源区、荒漠绿洲、湿地、热带雨林、红树林等),社会关注区(人口密集区、文教区、医院等);参与主体包括:建设单位、环评单位、评估单位、审批机构、专家和社会公众等;环评依据包括:法律法规、部门规章、地方政策、区划/规划、评估导则、环境标准等;环评成果包括:环评报告书(报告表/登记表)及其衍生的重点行业环评指标数据、技术评估报告、审批意见,建设项目竣工环境保护验收报告、后评价报告等。
图3 环评数据概念模型Fig.3 The concept model of environmental impactassessment data
注:N表示数据实体之间是多对多的关系。图4 环评核心数据实体关系模型Fig.4 The E-R model of core data of environmental impact assessment
因此,环评数据库组成主要包括:环评依据库、基础支撑库、核心成果库以及成果描述库,其中成果描述库主要用于数据的交换与共享服务,通过元数据和数据服务的形式对外提供服务。环评数据库组成如图5所示。
图5 环评数据库组成Fig.5 The components of environmental impact assessment database
2环评大数据创新服务
2.1 大数据特征分析
大数据是指无法在可容忍的时间内用传统信息技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合[7]。通常,人们认为大数据具有“4V”特征(体量大——Volume、类型多——Variety、快速化——Velocity、价值化——Value)。大数据还体现出个体或部分数据呈现低价值而数据整体呈现高价值的特点[8]。大数据直接带来三个思维模式的转变[9]:(1)数据分析不是依靠少量的随机样本,而是全体数据;(2)允许数据不精确性和混杂性;(3)关注数据间的相关关系而不是因果关系。从科研的角度,大数据的本质在于从模型驱动到数据驱动范式的转变以及数据密集型科学方法的确立[10]。
对比大数据,环评数据资源尽管已经具备资源体量大、类型多、数据整体呈现高价值等特点,但其开放共享、关联分析与挖掘利用还需要进一步提高。
2.2 环评大数据创新应用模式
环评数据资源必须实现向大数据的转变,加强管理与应用服务的创新,才能进一步提高环评的科学性和效率,更加有效地支撑“科学、智能、阳光”的环评,进一步提升环评在参与国家宏观调控、优化产业结构、转变经济增长方式、推进节能减排、遏制环境违法行为等方面的作用。环评大数据需要解决跨部门开放共享、全生命周期关联、智能发现与推荐以及高效的在线计算分析与便捷的公众服务等问题。
(1)创新共享机制,促进大数据开放共享
大数据的开放共享是发挥其价值的基础和前提。2015年9月国务院发布的《促进大数据发展行动纲要》中将政府数据的开放共享列为首要任务。早在2009年,美国就启动了政府开放数据计划,通过网站Data.gov共享政府数据,以CSV、HTML、XLS、PDF、WMS、WFS等格式向社会公众开放,并逐渐向政府关联数据转换[11]。英国也建立了政府开放数据网站。2011年,美国、英国、挪威、巴西、南非、墨西哥、印度尼西亚、菲律宾8个国家联合签署了《开放数据声明》,成立开放政府联盟(OGP);2013年又签署了《开放数据宪章》,规定了政府开放数据的五大原则[12],其中最重要的一条就是“开放为默认,不开放为特例”。通过该原则可以使政府部门尽最大可能地公开所有数据。截至2014年底,全球有63个国家加入了开放政府联盟。
因此,作为政府投资的环评基础支撑数据,如基础地理、地质、水文、气象数据,以及作为环境保护基本制度的环评成果数据等,应在充分尊重数据生产者知识产权(数据使用的知情权、被引用权等)的基础上,进一步推动数据开放共享,并且应使用元数据、数据目录等形式,方便数据的查询和使用。
(2)实现数据关联,促进全生命周期追溯
关联数据(Linked Data)被认为是语义网的一种实现,通过明确的语义表达,使不同领域、来源和结构的数据可以相互链接,从而促进数据的查找、集成与利用,为构建一个富含语义、人机都可理解的、互联互通的全球数据网络奠定基础[13- 14]。
如前文所述,环评数据横向上包括同一个区域内的战略环评、规划环评、建设项目环评等的数据;纵向上包括环境影响评价、技术评估、审批、验收、后评价等数据。这些数据资源应参照关联数据技术,实现纵向、横向以及特定维度的关联,如建设项目环评与所在区域战略环评、规划环评的关联,建设项目环评报告书、技术评估报告、审批意见以及项目竣工环保验收报告、后评价报告的关联,建设项目环评与环评单位、人员资质的关联,同类同规模建设项目的关联等。通过数据关联,构建形成互连互通的环评数据语义网络,可以方便地进行各类信息的智能查找和全生命周期的追溯分析等。
(3)构建一体化平台,提升预测分析效率
环评的核心是对实施主体可能对环境客体造成的影响进行预测分析,包括大气、地表水、地下水、噪声等。这些预测分析需要利用不同的环境预测模型以及相应的输入参数数据。安装调试环境预测模型、准备模型输入数据往往非常费时费力,而且如果进行大范围的预测分析,往往还需要高性能计算能力的支持。
因此,应利用云计算技术,发展“模型-数据”一体化共享平台。在高性能或分布式计算环境下,实现大气、水、声等常用的环境影响预测分析模型的共享与在线计算。同时,基于已经整合集成的环评大数据,实现环境影响预测分析模型输入数据的自动匹配与推荐,进而提升环境影响预测分析的效率与水平。
(4)利用“互联网+”,实现大数据创新应用
“互联网+”是把互联网和传统行业应用结合起来,形成一种新的生产和服务模式,推动传统产业换代升级。如传统银行+互联网产生了支付宝,传统集市+互联网产生了淘宝,传统百货卖场+互联网产生了京东,传统打车+移动互联网产生了滴滴快的等。2015年7月,国务院印发了《关于积极推进“互联网+”行动的指导意见》,提出“到2018年,互联网与经济社会各领域的融合发展进一步深化,互联网成为提供公共服务的重要手段。到2025年,‘互联网+’成为我国经济社会创新发展的重要驱动力量”。
因此,环评大数据的应用必须利用“互联网+”思维,把互联网应用到环评数据资源的收集(如基于网络的公众意见调查、环评报告书等资料报送,基于移动终端的环境敏感点调查、流域生物多样性调查等)、处理(如在线环境影响预测分析)、开放共享(如网络环评数据交换共享、环评信息公开与推送)、利用(如建设项目时空分布、产业结构分析、产业结构调整与环境质量关联分析)等各个环节中。
3结语
环评作为环境保护的一项基本制度,在控制污染物排放、提高清洁生产水平、减小生态破坏、节约自然资源、调整产业结构和布局优化经济增长、推动决策的科学化和民主化等方面发挥了重要作用。但近年来,环评执行率和措施落实率不到位[4]也致使环评制度饱受争议。环评是一项数据密集型的工作,一方面需要跨部门、多类型的大数据支撑,另一方面又会产生大量的、相互关联的数据。要让环评回归本质,必须“依靠数据、拿数据说话、用数据决策”。尽管环评数据已经具备大数据资源体量大、类型多、数据整体呈现高价值等特点,但还需进一步利用大数据、云计算、“互联网+”的思维和技术,加强环评数据的开放共享、语义关联、在线计算和创新应用。
参考文献(References):
[1]张云怀, 姚建玉, 董西哲. 我国环境影响评价的回顾与发展[J]. 北方环境, 2011, 23(4): 82- 83.
[2]赵晓宏, 李时蓓, 诸云强. 加强基础库建设提高环评科学性[J]. 环境保护, 2012(22): 59- 62.
[3]王卷乐, 赵晓宏, 马胜男, 等. 环境影响评价基础数据库标准规范体系研究[J]. 环境科学与管理, 2011, 36(8): 168- 173.
[4]赵晓宏, 丁峰, 李时蓓, 等. 环评基础数据库建设与展望[J]. 环境影响评价, 2014(4): 33- 35.
[5]诸云强, 孙九林, 王卷乐, 等. 论地球数据科学与共享[J]. 国土资源信息化, 2015(1): 3- 9.
[6]包存宽. 环境影响评价制度改革应着力回归环评本质[J]. 中国环境管理, 2015, 7(3): 33- 39.
[7]李国杰, 程学旗. 大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J]. 中国科学院院刊, 2012, 27(6): 647- 657.
[8]徐宗本. 大数据研究的若干科学问题[J]. 科技促进发展, 2014, 10(1): 66- 69.
[9]维克托·迈尔-舍恩伯格, 肯尼思·库克耶. 大数据时代[M]. 盛杨燕, 周涛,译. 杭州: 浙江人民出版社, 2013.
[10]郭华东, 王力哲, 陈方, 等. 科学大数据与数字地球[J]. 科学通报, 2014, 59(12): 1047- 1054.
[11]Ding L., Lebo T., Erickson J.S.,etal. TWC LOGD: A portal for linked open government data ecosystems[J]. Web Semantics: Science, Services and Agents on the World Wide Web, 2011, 9(3):325- 333.
[12]Castro D. , Korte T.. Open Data in the G8: A Review of Progress on the G8 Open Data Charter[EB/OA]. [2015-10-20]. http://www2.datainnovation.org/2015-open-data-g8.pdf.
[13]Bernhard Haslhofer, Bernhard Schandl. Interweaving OAI-PMH data sourceswith the linked data cloud[J]. International Journal of Metadata, Semantics and Ontologies,2010, 5(1): 17- 31.
[14]Christian Bizer, Tom Heath, Tim Berners-Lee. Linked Data - The Story So Far[J]. International Journal on Semantic Web and Information Systems, 2009, 5(3): 1- 22.
Big Data Analysis and Innovative Service on Environmental Impact Assessment
ZHU Yun-qiang1,2, ZHAO Xiao-hong3, FENG Zhuo1, PAN Peng3, LI Shi-bei3,SUN Kai1,4
(1.State Key Lab of Resources and Environmental Information System, Institute of Geographic Sciences and Natural
Resources Research, Chinese Academy of Sciences, Beijing 100101, China; 2.Jiangsu Center for Collaborative
Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China;
3.Appraisal Center for Environmental & Engineering, Ministry of Environmental Protection,
Beijing 100012, China; 4.University of Chinese Academy of Sciences, Beijing 100049, China)
Abstract:Environmental impact assessment (EIA) is a data-intensive research work that not only requires support of cross-department and multi-type big data, but also produces lots of linked and high value data achievements. How to share and exploit these data is the fundamental and precondition of fully playing the role of EIA. After analyzing the core business workflow of EIA, this paper puts forward the conceptual model and content of EIA data. And then it focuses on discussion about the usage of new generation of information technologies such as big data, cloud computing, “Internet Plus”, etc., and the thinking mode. Thereof it will achieve the open sharing, association discovery, online calculation and innovative applications of big data of environmental impact assessment in the future.
Key words:environmental impact assessment; big data; cloud computing; Internet Plus; sharing service
中图分类号:X820.3
文献标识码:A
文章编号:2095-6444(2016)01-0005-05
DOI:10.14068/j.ceia.2016.01.002