APP下载

生态环境大数据发展现状与趋势

2018-03-30赵海凤李仁强赵芬刘丽香赵苗苗徐明

生态科学 2018年1期
关键词:观测监测

赵海凤, 李仁强,赵芬,刘丽香,赵苗苗,徐明



生态环境大数据发展现状与趋势

赵海凤, 李仁强,赵芬,刘丽香,赵苗苗,徐明*

中国科学院地理科学与资源研究所 生态系统网络观测与模拟重点实验室, 北京 100101

随着大数据时代的到来生态环境大数据给生态环境领域研究带来了新的机遇与发展。本文回顾了生态环境大数据在收集、监测、分析与应用方面的发展现状。虽然生态环境大数据研究相对于其他领域起步较晚,但是目前正处于蓄势待发的状态。生态环境大数据研究未来的发展趋势为: 一、建立数据共享机制;二、需要跨区域的不同监测站点甚至不同观测网络进行联合观测与研究, 建立从样地到区域甚至到全球多尺度的、系统的观测与研究, 并且应该推进观测的标准化和规范化, 进一步统一不同生态环境观测网络的观测标准, 建立国际统一的观测标准和规范;三、需要开发针生态环境对大数据的统计分析软件, 尤其应该重视地理信息技术与统计分析技术的结合,特别是过程模型与大数据的结合。最后, 虽然生态环境大数据的应用研究相对薄弱但未来的发展空间是巨大的, 未来生态环境大数据的应用主要应该体现在生态环境资源管理、生态环境动态监测、生态环境评价等方面。

生态环境大数据; 发展现状; 趋势

1 前言

20世纪后半叶以来, 伴随着社会经济的高速发展全球生态环境问题日趋严重。目前全球生态环境问题突出表现在环境污染、土地退化、森林锐减、生物多样性丧失、水资源枯竭以及气候变化等方面。而这些问题往往是时间跨度长、涉及部门广、过程复杂、驱动因素众多, 因此解决起来难度很大。现代社会面临的生态环境问题首先源于生态系统的内在复杂性, 它不仅与地球科学 (如地理学、水文学、海洋学、气象科学等)有密切的联系, 还涉及数学、经济学、信息科学等学科。生态环境问题正跨越局域尺度扩展至全球尺度, 这些都促使生态学家们在更大的时空尺度、更多的领域收集数据, 进而完成更为复杂的分析[2,3,5]。随着大数据时代的到来, 生态环境大数据将带给生态环境研究领域带来新的机遇与发展。

2 生态环境大数据的定义及特点

2.1 大数据与生态环境大数据的定义

维基百科 ( http: //en.wikipedia.org/wiki/Big data) 对大数据的定义为: 大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。国际前沿学术期刊《Nature》于2008年出版有关大数据的专刊并将大数据定义为: 大数据是指数据集的规模是无法在可容忍的时间内用目前的技术、方法和理论去获取、管理、处理的数据[5]。作为第一家信息技术研究和分析的Gartner Group公司在2012年提出大数据的定义为: 大数据是高容量、高生成速率、种类繁多的信息价值, 同时需要新的处理形式去确保判断的作出、洞察力的发现和处理的优化[9]。目前关于大数据, 人们更多从商业、社会经济、信息技术和数据特征等角度来描述, 综合当前国内外各类关于大数据的定义, 可以这样理解, 大数据是指通过传统技术手段难以有效收集、处理和应用的大而复杂的数据集。根据以上大数据的概念可见, 大数据之“大”是相对的, 是以传统数据为参考的, 因此各个领域在界定大数据时没有绝对的标准。此外, 大数据之“大”不仅体现在数据量的大, 也包括数据的高度复杂性, 这包括数据来源与构成的多样性、数据流动的快速性(如实时更新)和数据质量的不确定性。

随着大数据时代的到来, 生态环境大数据的概念在学术领域和政府部门开始流行, 但和大数据一样, 目前还没有统一的定义和界定标准。生态环境大数据是大数据的一部分, 是指生态环境领域所涉及的各类大数据, 其具备大数据的一般特征。因此按照大数据的定义, 生态环境大数据是指通过传统技术手段难以有效收集、处理和应用的大而复杂的生态环境数据集。

2.2 生态环境大数据的特点

生态环境大数据作为大数据的一个类别同样具有五大特征: 数量大(Volume)、种类多(Variety)、价值大(Value)、快时效(Velocity)、准确性(Veracity)。具体体现为以下几点:

首先从数据规模和类型来看, 生态环境大数据体量大、类型多、结构复杂。从内容上包括水、土、气层等方面的生态数据; 从地域上来讲, 包括全球各个尺度, 如大气、海洋、土壤、植被、森林、湿地等各类生态系统的生态数据; 从数据构成上关联物理过程和化学过程, 空间变异性强, 多样复杂, 这都导致生态环境大数据来源的多样性。也由于生态环境大数据来源复杂多样直接导致其体量大的另一显著特点; 其次从数据价值来看, 生态环境大数据无疑具有巨大的潜在应用价值, 如何从海量数据中挖掘出最有用的信息是生态环境大数据面临的最大挑战;再次从数据动态变化方面来看, 由于生态系统结构与功能的动态变化生态环境数据多表现为流式数据特征, 实时连续观测尤为重要。例如, 我国已经开发了一些污染物扩散预测模型, 可由于缺乏大量实时数据的支持而不能进行精确地预测;最后从数据真实性来看, 由于受野外监测条件的限制, 生态环境大数据往往存在一定误差甚至存在错误数据。如何从海量数据中去伪存真获取真实数据是生态环境大数据面临的又一挑战。

除了上述基本特征,生态环境大数据较其他领域大数据更加具有数据源多样又复杂、所在部门分散、监测体系不统一、跨历史事件长的独特特点。

3 生态环境大数据的发展现状

早在20世纪中叶, “大数据”的思想已在生态环境领域得到体现, 宏观生态学研究早已认识到了大数据的重要性。大数据在生态系统研究方面的应用, 最早可以追溯到国际地球物理年(1957—1958)和国际生物学计划(IBP)(1964—1974), 当时被称为大科学研究, 其目的是通过收集大量的数据研究大尺度生态环境问题, 后来这种研究演变成了现在的国际长期生态研究计划(ILTER)。直至目前随着科技的发展, 生态环境大数据在收集、监测、分析与应用方面都相继取得了初步发展。

3.1 生态环境大数据的收集与监测

目前国际上已经建立了多套覆盖全球的生态环境监测网络, 总体来说可分为全球卫星遥感监测网络和地面监测网络这两大类。全球尺度的主要观测网络包括全球环境监测系统( GEMS)、全球陆地观测系统( CTOS) 、国际长期生态研究网络( ILTER) 、全球通量观测网络( FLUXNET) 以及国际生物多样性观测网络(GEO· BON) 等。有代表性的国家尺度生态环境观测研究网络包括美国的US—LTER生态环境观测研究网络、英国的ECN生态环境观测研究网络、中国的CERN生态环境观测研究网络和日本长期生态研究网络(JALTER)。

随着全球生态环境问题日益突出, 卫星遥感技术在生态环境监测与管理中的应用也越来越广泛,美国、日本及欧洲的一些国家近年来都在大力发展生态环境遥感监测技术。目前在轨运行的和计划发展的国内外卫星传感器提供数据的空间分辨率已从公里级发展到亚米级, 重复观测频率从月周期发展到几小时, 光谱波段跨越了可见光、红外到微波, 光谱分辨率从多波段发展到超光谱, 遥感数据获取技术正走向实时化和精确化, 卫星遥感应用也正在向定量化和业务化快速发展[34]。在陆地生态环境遥感监测方面, 通常采用空间分辨率较高的陆地卫星和传感器, 如美国的Landsat/TM系列、法国SPOT/HRV系列、印度IRS-1系列以及高光谱卫星如美国的EO-1/ALI及Hyperion等。在海洋卫星遥感方面也开展了全球范围的业务化运行, 代表性的卫星平台和传感器有美国的Seastar/SeaWiFS、EOS/MODIS-TERRA&AQUA及欧空局的ENVISAT/ MERIS、日本的ADEOS/GLI、印度的IRS/OCM等。另外, 覆盖全球的大气监测卫星传感器主要有美国的NOAA/AVHRR、EOS/MODIS-TERRA&AQUA& AURA和欧空局的ENVISAT/SCIAMACHY、ERS-2/ GOME、METOP-1/GOME-2及日本的ADEOS-Ⅱ/ TOMS&TOVS等[37]。

全球地面监测网络中, 其中比较典型的是地面气象站监测网络和全球环境监测网络等。全球地面气象站监测网络集成了不同国家不同地区的实时天气观测数据, 共包含100多种数据来源和35000个气象站点。该监测网络涉及的气象站点数据可追溯到1901年, 站点数量在二十世纪四十年代和七十年代出现了两次大幅度的增加, 目前已经拥有了14000个每日更新的固定站点。全球地面气象站监测网络获取的气象参数主要包括风速风向、温度、云量、气压、可见度、降水以及积雪深度等其它要素(https: //www.ncdc.noaa.gov)。全球环境监测系统是联合国环境规划署下属的全球和地区环境监测的协调中心, 它系统地收集和分析了各种环境状况变化因素的数据和环境在时间和空间上的变化情况, 并在此基础上对环境状况进行定期评价, 从而提高对环境的管理、监测与评价水平。该监测网络主要涉及陆地生态系统监测和环境污染监测, 如大气组成和气候系统、淡水和海岸污染、空气污染、森林砍伐、臭氧层耗减、温室气体增加、酸雨、全球冰盖范围变化以及生物多样性问题等。

我国生态环境大数据的研究起步较晚, 环境保护部最近刚刚发布了《生态环境大数据建设总体方案》, 但是该方案仅涉及到环保系统大数据的建设规划, 而分布在其它部门的大量生态环境数据并没有在该方案中得以体现。在生态系统监测方面, 我国已于1988年开始组建中国陆地生态系统监测网络, 覆盖农田、森林、草原、荒漠、湖泊、海湾、沼泽、喀斯特及城市9类生态系统, 观测指标达280多个。其中包括中科院所属45个站;国家林业局所属森林站105个、湿地站35个、荒漠站26个;农业部所属68个野外农业试验站和185个国家级草原固定监测站;此外水利部、教育部以及地方政府也拥有上百个生态监测站。同时, 我国已初步建成包括岸基海洋观测系统、离岸海洋观测系统、大洋和极地观测的海洋生态系统观测网络, 其中包括海洋站180多个、浮/潜标50多个、调查断面约120个、极地科考站4个。此外, 我国也初步建立了生态系统通量观测网, 包括200余个通量站。

在环境污染监测方面, 我国已经初步建立了一套网络监测系统, 涵盖大气、水和土壤等领域。其中, 大气监测网包括1436个空气质量监测站点、82个沙尘暴监测站点、1011个酸雨监测站点、956个地表水水质监测断面、20401个地下水监测站点、301个近海水质监测站点、35000多个土壤污染监测站点。此外, 在气象观测方面, 近年来国家气象局已管理高达2000多个常规气象站, 3万多个自动气象站和39个沙尘暴监测站点。在水利方面, 已拥有259个水文站及1435个水位站, 其中水利卫星通信站达610个; 国家水土流失监测网络目前由7大流域监测中心站、31个省级监测总站和175个重点地区监测站构成。在冰冻监测方面, 已有冰川监测站4个, 冻土监测站160余个。另外, 我国目前已初步建成了综合资源环境遥感监测平台, 包括陆地卫星9颗、气象卫星3颗、海洋卫星3颗。

至今为止, 一套天地立体监测系统已初步建立, 但由于我国幅员辽阔, 生态环境复杂, 这些监测系统还无法完全满足生态环境建设的需要, 很多监测网络有待进一步补充完善。首先这些网络系统分散于多个部门, 存在着数据收集标准不一、质量参差不齐和数据共享极其困难等问题。另外,上述各类网络现阶段主要侧重于数据收集, 在数据分析、挖掘、存储和利用等方面还非常薄弱甚至某些领域还是空白。例如在大数据的硬件支撑方面(超算和云计算), 我国目前虽然拥有世界上最快的天河2号计算机, 但由于应用软件开发滞后, 数据分析与挖掘能力不足, 导致机器利用率很低, 从而无法充分发挥大数据在生态环境领域的优势。

3.2 生态环境大数据的集成和分析

虽然大数据本身蕴含了大量信息但更多有用的信息并不在于原数据本身, 而在于对数据进行深度分析, 剖析数据间的统计关系挖掘其中的潜在价值。统计分析是数据处理最常用的技术, 通常包括数据描述性分析、相关分析、回归分析、聚类分析以及主成分分析等。除具备数据的一般特性外生态环境数据通常还具有地理空间特征, 因此空间分析技术是生态环境大数据的常用分析技术。传统的统计分析技术与大数据相结合对推动生态环境领域的发展起到了举足轻重的作用, 各类统计分析软件、地理信息软件等的开发利用对于解决复杂多变的生态环境问题提供了有力的技术支撑。

美国环保局联合美国航空航天局利用卫星技术收集空气质量数据, 以便更好地确定污染源及污染物排放与变化规律。同时利用商业传感器开发个人空气质量监测系统和能够安装在各种交通工具上的空气污染监测传感器系统。美国环保局联合企业研发力量, 通过产学研联合创新推动了大数据的发展。在生态环境大数据的建设方面, IBM、惠普、谷歌、微软等美国IT企业为政府和公众提供了全球最先进的数据库、服务器、搜索服务和存储设备等, 帮助政府和研究机构对环境现状及未来趋势做出准确判断。但是国际上跨部门跨行业的大数据平台目前还比较少见, 尤其是在生态环境领域。

近年来, 随着计算机和通信技术的飞速发展, 大数据在生物多样性保护领域也得到了广泛应用, 很多国家和地区已经或正在建设生物多样性信息管理系统。例如, 惠普公司联合非盈利环保组织“保护国际”(Conservation International)于2012年共同启动惠普地球观察(HP Earth Insights)项目。通过开发Vertica分析平台, 该项目对全球高达3兆兆字节的生物多样性和气候数据进行了系统分析。同时, 为了提高生物多样性信息的可视化程度, 研发了野生动物图片索引分析系统(Wildlife Picture Index Analytics System), 用户可以通过网络随时随地对该系统进行访问。

通用的统计分析技术给大数据平台的信息挖掘提供了有力的手段, 但是这些用于数据加工的通用分析软件(如R、SAS、SPASS等)对于解决复杂多变的生态环境问题还远远不够, 正是诸多技术瓶颈使生态环境大数据的集成和分析方面相对薄弱。

3.3 生态环境大数据的应用

目前大数据在生态环境领域已得到初步应用, 主要体现在全球气候变化预测与区域大气污染治理等方面。

大数据技术有助于整合海量庞杂的观测数据及模式数据提高的数据存储速度和管理效率。随着新的气象观测设备的普及与应用, 气象观测己经由过去相对少量的常规观测发展到如今海量的非常规观测, 观测精度也日益提高。目前气象监测站点已经遍布全球, 观测范围从地面到几千米的高空, 观测手段从最原始的人工观测到高科技的雷达卫星[13]。与此同时为了真实地模拟全球大气走向大量的模式数据也随之产生,模式系统一般每天计算2—4次, 通常在整点开始利用整点前采集到的实况数据进行计算, 每次计算要生成大概几百个物理量, 包括从开始计算的时刻至未来240 h或更长时效的一系列二进制网格数据, 预报时效通常间隔3 h。目前气象网格经纬度间距一般在0.25度数量级, 一个网格文件大小通常在1—2兆, 包含几十万个浮点数值[15]。谭清海等(2013)针对气候模式在超大规模数值模拟中产生的Tb至Pb量级的四维体数据的可视化和分析诊断方法, 提出了基于Server-Client方式的远程数据抽取和并行可视化解决方案[32]。2015年6月, 美国宇航局结合了最新超级计算技术、地球系统模型、工作流管理以及遥感数据的协作及分析平台, 发布了从1950年到2100年全球气候变化预测数据, 该数据库可以在15 km的空间分辨率上测算未来全球各地气温与降水情况的变化。国内方面黄刚等(2010)分析了大气科学数据的特点, 同时结合e-Science的大气科学数据再分析平台构建了一套新的大气科学数据的分析和可视化系统, 并提出数据处理算法与数据分析系统结合的可行方案[26]。贾韶辉(2013)基于大数据角度研发了集成大数据的信息与专业服务平台, 开展了针对中国石油气象与地质灾害的预报预警工作[28]。2015年5月,中国气象局与阿里云合作, 旨在挖掘全球尺度历史观测及预报数据等气象大数据的深层价值。2015年9月,中国科学院大气物理研究所等发布了“地球数值模拟装置”原型系统, 该系统是基于中科院地球系统模式1.0版本的高性能计算机系统, 填补了中国地球系统模式大数据实践平台的空白。另外, 气候变化观测数据包含的信息十分丰富可以发挥出跨行业的服务价值, 有可能挖掘出新的信息从而拓展新的业务领域和服务范围。例如美国硅谷一家公司利用多年来的降雨、气温、土壤状况等气象数据与历年农作物产量进行关联分析, 预测各地农场来年产量和适宜种植品种, 这些结果以个性化保险服务的形式向农户出售, 从而减少了气象灾害给当地农户带来的风险及损失。气象大数据应用还可在林业、海洋、气象灾害等方面拓展新的业务领域[25]。

大数据技术为区域大气污染联防联控工作的开展带来了巨大的潜力。传统的区域大气质量模式对监测、气象、地理等数据分析可以起到一定的作用, 但传统的数据分析方法处理大气污染的时空数据却面临较多的困难和局限。与之相比, 大数据技术在处理视频、语音、文档、图片等非结构化数据的数据挖掘、专题分析和模拟预测方面更加具有优势[37]。大数据技术通过对海量数据的有效整合、抽取、数据分析以及数据解释和挖掘为区域大气污染联防联控监管工作的开展带来了新的机遇。武装和覃爱明(2015)提出了利用空气污染观测资料和先进的大数据Hadoop平台对空气监测数据进行数据挖掘和分析[35]。该方法依据逐年逐日的天气现象数据, 针对地区空气污染状况以及时间分布特征的影响进行研究, 并以可视化方法对空气污染物的时空分布特征进行预测。曹骝和吴修文(2015)开发了基于大数据平台的PM2.5监测预警系统, 该系统由前端的PM2.5云监测仪和后端的大数据处理平台组成突破了传统的监测方法, 运用创新的设计理念, 使环保与大数据技术有机结合, 架构海量数据处理平台[22]。

3.4 目前生态环境大数据研究存在的不足之处

虽然生态环境大数据的相关研究已经有了很大进展但仍存在以下几点不足:

1) 缺乏数据共享。我国的生态环境建设经过多年努力在快速发展的同时产生了大量的数据, 可由于数据标准格式和技术路线不统一导致严重的数据割据, 形成了“数据孤岛”。数据共享一直是制约大数据发展的突出问题, 没有数据共享, 就无法形成“大数据”, 因此数据共享是开展生态环境大数据建设的前提和基础。2)技术问题。从基础架构讲, 传统信息技术架构存在扩展性弱、容错性差、资源利用率低等问题。云计算是解决这些问题的关键, 但目前在生态环境领域中云计算技术普遍仅在IaaS层实现硬件资源调配, 在市场上少见PaaS和SaaS层的成熟产品和解决方案。在数据采集方面, 生态环境大数据除传统的业务数据外还来源于物联网传感器、网络定位、视频影像, 以及互联网上的文本、图片等信息。如何将这些多源异构数据转换成合适的格式和类型, 并将这些数据应用于环境决策和监管还在探讨之中。在数据存储方面, SQL 数据库已不适合用于大规模非结构化数据的存储和处理, 大数据所需要配套的分布式数据库与混合型数据库相关技术还有待进一步完善, 也需要对相关技术人员进行专业培训。建模分析是大数据的核心技术, 如何使用新一代的机器学习和人工智能等模型实现技术应用创新, 为不同客户提供个性化服务, 是我国生态环境建设面临的重要挑战, 同时也正是生态环境大数据的发展机遇。3)应用不足。迄今为止, 我国生态环境大数据的创新应用还很有限, 大数据的威力远远未能发挥出来, 政府综合运用生态环境大数据的能力较低, 没有形成成熟的生态环境大数据产业链和有影响力的数据企业。生态环境大数据在气象、水利、国土、农业、林业、交通、社会经济等各部门的应用才刚刚起步, 跨领域的应用寥寥无几。如何促进大数据在生态环境领域中的应用创新, 使大数据真正成为提高生态环境监管能力现代化的有力手段, 是目前世界各国正在探索的课题。

4 生态环境大数据的发展趋势

4.1 在数据的搜集与整理方面应建立数据共享机制

生态环境问题的解决需要长期的数据积累, 对这些长期积累数据进行收集和整理是大数据科学中非常关键的一部分。与生态环境相关的数据众多, 大致包括地面监测数据、遥感影像数据、社会经济数据、专项调查数据以及科学研究数据等。由于生态环境的多样性和复杂性, 这些数据的来源、监测对象及收集管理均不统一, 而是分布在环保、国土、水利、农业、林业、卫生、气象、海洋等多个领域。例如, 各类生态环境及污染监测数据, 包括污染物排放数据、空气环境质量数据、水环境质量数据及土壤环境质量数据等; 各类农业资源、农业生产及农业市场等数据; 森林资源清查数据、林业生态工程数据、自然保护区及生物多样性数据等林业数据; 土地资源、土地利用、矿产资源开发等数据; 水文水资源、水土流失、水利设施等数据; 各类地面气象站、气象卫星、气象雷达以及探空等气象数据; 海洋生态环境、渔业资源、近海资源开发、滨海湿地保护等海洋数据以及各种环境灾害数据以及与环境相关的人体健康等数据等等。

但目前人们对这些数据的开发利用不足远没有发挥数据本身以及隐藏数据背后的价值。造成这种现象的最主要原因是数据的来源、格式及标准等不统一, 缺乏有效的集成共享。没有数据共享, 不能实现数据“在一起”, 就不能形成大数据[24]。因此, 对历史数据进行收集整理并实现有效共享是开展生态环境大数据建设的前提和基础。通过不同国家间的协议交换来实现生态环境大数据在国际间共享与服务, 推动实现国际生态环境大数据平台的对接, 为解决全球性生态环境问题提供科学依据和有力支撑成为必然趋势。

4.2 未来生态环境观测研究网络的发展趋势

生态环境监测是一项宏观与微观相结合的复杂的系统工程, 其涉及的空间和时间范围都非常广。生态环境监测的对象包括农田、森林、草地、荒漠、湿地、湖泊、海洋、气象、物候、动植物等。针对生态环境数据特定优化的数据采集、存储、分析、发布等多个模块, 实现对气象、环境、地质、农业、林业、海洋等多类型生态环境数据的实时监测和关键环境变量的预报预测以及使观测数据标准化、规范化和共享是未来的发展趋势。

在当今生态系统研究的时空尺度不断拓展的状况下, 需要跨区域的不同监测站点甚至不同观测网络进行联合观测与研究, 建立从样地到区域甚至到全球多尺度的、系统的观测与研究。其次, 应该推进观测的标准化和规范化, 进一步统一不同生态环境观测网络的观测标准, 建立国际统一的观测标准和规范。

4.3 未来生态环境大数据的处理与分析发展趋势

数据处理与分析主要体现在统计分析、人工智能分析和数据的深度挖掘等方面。首先, 基于生态环境大数据的统计分析主要是从生态环境集成数据库中抽取需要的数据资源建立数据仓库, 并通过特定的数据挖掘技术对数据进行深度分析和挖掘以获取新的认知, 但是传统的统计分析软件无法对大数据库进行有效的处理需要开发针对大数据的统计分析软件, 尤其是生态环境大数据更应该重视地理信息技术与统计分析技术的结合, 是未来生态环境大数据在数据的统计分析方面的发展趋势。

其次, 在生态环境大数据平台的基础上利用计算机学习生态环境领域的相关理论及专家知识, 建立各类计算模型或认识模型, 结合具体应用建立面向任务的学习系统, 实现生态环境大数据平台的智能化应用, 以有效提高生态环境监管水平。

同时, 统计分析技术给大数据平台的信息挖掘提供了有力的手段, 但是这些用于数据加工的通用分析软件(如R、SAS、SPASS等)对于解决复杂多变的生态环境问题还远远不够。相比其它社会领域, 生态环境领域的用户需要更加专业的服务, 因此需要结合生态环境领域的相关理论来提高数据挖掘能力。目前生态环境面临诸多问题, 仅靠大量数据还不足以揭示这些问题的驱动机制和潜在影响, 因此过程模型与大数据的结合显得尤为重要。数据与模型融合不仅可以利用丰富的数据资源作为模型的输入, 同时又可以通过模型模拟产生新的、更有价值的数据来丰富大数据平台。例如, 利用各类数据与模型同化技术对气象站点及气象卫星数据进行同化模拟获取新的气象数据产品; 通过生态过程模型与大量监测数据的融合, 提高对生态系统各类功能的模拟精度, 从而揭示生态系统过程的内在作用机制及其变化规律。

4.4 未来生态环境大数据的应用发展趋势

生态环境大数据的应用是生态环境大数据研究的最终目的。生态环境大数据应该利用不同的应用方式将有价值的信息提供给用户, 实现生态环境信息的传播、交流和增值, 全面展现生态环境资源和状况变化, 综合揭示各种因素的关系和内在变化规律, 为生态环境建设以及社会公众提供全面、及时、准确的信息。

生态环境大数据的应用主要体现在生态环境资源管理、生态环境动态监测、生态环境评价等方面。生态环境资源除了土地资源、水资源、大气资源、生物资源等自然资源之外, 还包括开发和改造生态环境过程中产生的各类资料等。由于生态环境资源涉及的内容多而杂, 传统的数据管理方法无法对生态环境资源进行有效的管理。随着云计算、物联网、分布式数据库等先进技术的发展, 利用生态环境大数据对各类资源数据进行集成整合, 从而实现生态环境资源的优化配置及合理开发, 解决目前存在的资源开发过度、配置不合理等问题; 运用大数据在数据分析方面的优势, 结合模型模拟、人工智能等先进技术, 评价各类生态系统的现状和可能存在的不利于其稳定的各种问题, 例如进行环境质量评价、生态安全评价、生态风险评价、生态退化评价、生态环境的脆弱性评价、生物多样性评价、工程影响评价和生态健康评价等, 从而为生态环境的决策管理提供科学依据, 成为是大数据应用的未来发展趋势。

5 总结

本文结合生态环境大数据目前的研究现状, 提出了生态环境大数据未来的发展趋势, 而生态环境大数据的发展还需要以下几点保障: 完善大数据发展法律法规, 制定统一的规范标准体系等体制保障; 加强大数据新技术的研发, 成立相关科研机构等技术保障; 培养一批复合型人才等人才保障; 加大生态环境监测设备、计算机等数据处理基础设施投入, 设立生态环境大数据建设专项基金, 设立生态环境大数据人才培养专项基金等资金保障。目前, 生态环境大数据的发展尚在起步阶段, 需要人们不断开拓的空间很大, 如何高效地处理大数据、合理地利用大数据促进生态环境领域的研究仍需要不断地探索与发现。

[1] ARONOVA E. Big Science and Big Data in Biology: From the International Geophysical Year through the International Biological Program to the Long Term Ecological Research (LTER) Network, 1957–Present[J]. Historical Studies in the Natural Sciences, 2010, 40(2): 183–224.

[2] BIGANG F, DEAN J, GHEMAWAT S, et al. Bigtable: A distributed storage system for structured data[J]. ACM Transactions on Computer Systems (TOCS), 2008, 26(2): 4.

[3] CASSANDRALAKSHMAN A, MALIK P. Cassandra: a decentra­lized structured storage system[J]. ACM SIGOPS Operating Systems Review, 2010, 44(2): 35–40.

[4] DYNAMODCANDIAE G, HASTORUN D, JAMPANI M, et al. Dynamo: amazon's highly available key-value store[C]// ACM SIGOPS Operating Systems Review. ACM, 2007, 41(6): 205–220.

[5] GRAHAM-ROWE D, GOLDSTON D, DOCTROW C, et al. Big data: science in the petabyte era[J]. Nature, 2008, 455(7209): 8–9.

[6] HALLGREN W, BEAUMONT L, BOWNESS A, et al. The Biodi­versity and Climate Change Virtual Laboratory: Where ecology meets big data[J]. Environmental Modelling & Software, 2015, 76: 182–186.

[7] HAMPTON S E, STRASSER C A, TEWKSBURY J J, et al. Big Data and the future of ecology[J]. Frontiers in Ecology & the Environment, 2013, 11(3): 156–162.

[8] HUANG C, KIM S, SONG K, et al. Assessment of Paraguay’s forest cover change using Landsat observations[J]. Global and Planetary Change, 2009, 67: 1–12.

[9] YU J I and QIU W M. Big data proccessing in cloud computing environments[C]//Proc of the 12th International Symposium on Pervasive Systems, Algori­thms and Networks. 2012: 17–23.

[10] KAMPE T U, JOHNSON B R, KUESTER M, et al. NEON: the first continental-scale ecological observatory with airborne remote sensing of vegetation canopy biochemistry and structure[J]. Journal of Applied Remote Sensing, 2010, 4: 510–524.

[11] LEVIN S A . The problem of pattern and scale in ecology [J]. Ecology, 1992, 73(6): 1943-1967.

[12] MELBOURNE B A, CORNELL H V, DAVIES K F, et al. Invasion in a heterogeneous world: resistance, coexistence or hostile takeover? [J]. Ecology Letters, 2007, 10, 77–94.

[13] MICHAELL S, PANGNING T, VIPIN K, et al. Discovery of climate indices using clustering[A]. KDD-2003 Proceedings of the ninth ACM SIGKDD international conference on Knowledge discovery and datamining[C], 2003: 446–455.

[14] NEOWEBBER J. A programmatic introduction to neo4j[C]//Proceedings of the 3rd annual conference on Systems, programming, and applications: software for humanity. ACM, 2012: 217–218.

[15] OOUCHI K, YOSHIMURA J, YOSHIMURA H, et al. Tropical cyclone climatology in a global-warming climate as simulated in a 20 km-mesh global atmospheric model: Frequency and wind intensity analyses[J]. J. Meteor. Soc. Jpn. , 2006, 84 : 259–276.

[16] ShIN D H and MIN J C. Ecological views of big data: Perspectives and issues[J]. Telematics & Informatics, 2014, 32(2): 311–320

[17] VOLDEMORTSUMBALY R, KREPS J, GAO L, et al. Serving large-scale batch computed data with project voldemort[C]//Proceedings of the 10th USENIX conference on File and Storage Technologies. USENIX Association, 2012: 18–18.

[18] WALER, S J, VIKTOR M S, KENNETH C. Big Data: A Revolution That Will Transform How We Live, Work, and Think[J]. OrganizacijaZnanja, 2013, 18(1-4): 47–49.

[19] WIKLE C K, HOLAN S H, HOOTEN M B. Guest Editor’s Intro­duction to the Special Issue on “Modern Dimension Reduction Methods for Big Data Problems in Ecology” [J]. Journal of Agricultural Biological & Environmental Statistics, 2013, 18(3): 271–273.

[20] ZhANGK M and WEN Z G. Review and challenges of policies of environmental protection and sustainable­development in China[J]. Journal of Environmental Management, 2008, 88(4): 1249–1261.

[21] ZULUETA R C, OCHELE W C, LOESCHER H W, et al. Aircraft- derived regional scale CO2 fluxes from vegetated drained thaw-lake basins and interstitial tundra on the Arctic coastal plain of Alaska[J]. Global Change Biology, 2011, 17:2781–2802.

[22] 曹骝, 吴修文. 基于大数据平台的PM2. 5监测预警系统研究[J]. 互联网天地, 2015, 4: 74–79.

[23] 陈宝学, 俞经善, 关宏伟. 数据挖掘技术应用于天气预报的可行性研究[J]. 应用科技, 2004, 31(3): 48–50.

[24] 程春明, 李蔚, 宋旭. 生态环境大数据建设的思考[J]. 中国环境管理, 2015, (06): 9–13.

[25] 程春明, 李蔚, 宋旭. 生态环境大数据建设的思考[J]. 中国环境管理, 2015, 6: 9–13.

[26] 方巍, 郑玉, 徐江. 大数据: 概念、技术及应用研究综述[J]. 南京信息工程大学学报(自然科学版), 2014, (05): 405–419.

[27] 黄刚, 屈侠, 王鹏飞. 气象数据分析和诊断可视化平台的设计和构想及其在互联网络上的实现[J]. 大气科学学报, 2010, 33(2): 153–159.

[28] 黄哲学, 曹付元, 李俊杰, 等. 面向大数据的海云数据系统关键技术研究[J]. 网络新媒体技术, 2012, (06): 20–26.

[29] 贾韶辉. 企业级气象与地质灾害预警技术研究应用[D]. 北京:中国地质大学,2013, 32–36.

[30] 李克让, 全球气候变化及其影响研究进展和未来展望[J]. 地理学报, 1996, (51) : 1–14.

[31] 彭昱忠, 王谦, 元昌安, 等. 数据挖掘技术在气象预报研究中的应用[J]. 干旱气象, 2015, 33 (1): 19–27

[32] 秦大河, 丁一汇, 王邵武, 等. 中国西部生态环境变化与对策建议[J]. 地球科学进展, 2002, (03): 314–319.

[33] 谭清海, 邓春林, 刘俊. 全球气候变化模拟结果数据的远程抽取及其可视化[J]. 地震, 2013, 33: 153–161.

[34] 王桥, 杨一鹏, 黄家柱. 环境遥感[M]. 北京: 科学出版社, 2005.

[35] 吴国雄, 林海, 邹晓蕾, 等. 全球气候变化研究与科学数据[J]. 地球科学进展, 2014, 29 (1): 15–22.

[36] 武装, 覃爱明. 基于大数据的空气质量数据可视化[J]. CHINESE& FOREIGNENTRE- PRENEURS. 2015, 485: 249–251.

[37] 杨一鹏, 韩福丽, 王桥, 等. 卫星遥感技术在环境保护中的应用: 进展, 问题及对策[J]. 地理与地理信息科学, 2011, 27(6): 5–89.

[38] 杨毅, 大数据时代下探索区域大气污染联防联控的新模式[J]. 科技传播, 2014(11): 107–108

[39] 杨宗喜, 唐金荣, 周平, 等. 大数据时代下美国地质调查局的科学新观[J]. 地质通报, 2013(09): 1337–1343.

[40] 张志强, 徐忠民, 程国栋, 等. 中国西部12省(区市)的生态足迹[J]. 地理学报, 2001(05): 598–609.

[41] 赵国栋, 易欢欢, 糜万军, 等. 大数据时代的历史机遇—产业变革与数据科学[M]. 北京:清华大学出版社, 2013: 10–39.

[42] 赵士洞. 美国国家生态观测站网络(NEON)——概念、设计和进展[J]. 地球科学进展, 2005, 20: 578–583.

[43] 朱强, 俞孔坚, 李迪华. 景观规划中的生态廊道宽度[J]. 生态学报, 2005, (09): 2406–2412.

Current status and development trend of eco-environmental big data

ZHAO Haifeng, LI Renqiang, ZHAO Fen, LIU Lixiang, ZHAO Miaomiao, XU Ming*

Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101

With the coming of the big data age , the eco-environmental big data brought new opportunities and development in ecological research. This paper reviewed the current status of eco-environmental big data including data collection, onsite monitoring, data analysis and applications. Although the research on eco-environmental big data started later than in other fields it has a great potential in the future. The development trend of eco-environmental data in the future includes: 1). Establishment of data sharing mechanisms; 2). standardizing and normalizing observation methods and techniques to promote collaborative research at regional and global scales; 3).Developing new software for the analysis of big data by combining geographic information technologies with statistical analysis tools, especially the combination of process models with various data sources. Finally, although the application of eco-environmental data is relatively limited, the development in the future is tremendous. The application of eco-environmental data would be mainly reflected in the eco-environmental resources management and the evaluation of ecological and environmental assets.

eco-environmental big data, current status, trend

S157.2

A

1008-8873(2018)01-211-08

2016-05-00;

2017-12-22

973计划项目“土地利用方式转变控制试验研究” (项目编号2012CB417103);国家社会科学基金年度一般项目“青海省藏区神山文化对生物多样性保护和生态服务价值提升的贡献研究”(项目编号17BM045);国家民委项目“藏族神山文化研究”(项目编号2017-GMC-029)。

赵海凤(1987—), 女, 辽宁沈阳人, 博士后, 主要从事生态系统服务管理与评估、民族地区生态保护、生态经济研究; Email: maryzhaonew@163.com

徐明, 男, 河南平顶山人, 研究员, 博士生导师, 中国科学院“百人计划”入选者, 主要从事全球变化生态学、生态系统服务功能等研究; Email: mingxu@igsnrr.ac.cn

10.14108/j.cnki.1008-8873.2018.01.028

赵海凤, 李仁强,赵芬,等. 生态环境大数据发展现状与趋势[J]. 生态科学, 2018, 37(1): 211-218.

ZHAO Haifeng, LI Renqiang, ZHAO Fen, et al. Current status and development trend of eco-environmental big data [J]. Ecological Science, 2018, 37(1): 211-218.

猜你喜欢

观测监测
特色“三四五六”返贫监测帮扶做实做细
水土保持监测
磁暴恢复相后期超低频波观测分析
交通运输部对ETC运行情况进行监测
天文动手做——观测活动(21) 软件模拟观测星空
2018年18个值得观测的营销趋势
日食观测指南
可观测宇宙
网络安全监测数据分析——2015年12月
网络安全监测数据分析——2015年11月