数据融合技术在环境监测中的运用探究
2017-03-28唐龙彪唐友姣
唐龙彪 唐友姣
摘 要:随着信息技术的不断发展,人们将越来越多新颖的技术运用到日常环境监测工作中。针对环境指标的不同,在信息描述上有着不同的差别,所收集到的数据也不同。因此,阐述了日常环境监测中数据融合技术的具体运用状况。
关键词:数据融合技术;环境监测;信息技术;信息技术
中图分类号:TP79 文献标识码:A DOI:10.15913/j.cnki.kjycx.2017.05.144
1 关于数据融合技术概述
1.1 定义
作为新型的数据处理技术中的一种,数据融合最早在20世纪70年代初期出现,最开始这种技术主要是在军事领域得以应用,所谓“数据融合”,事实上是指人脑进行信息处理的方式,在中枢神经的运用下传送信息至大脑中随后对信息进行综合处理,从而控制和判断外部环境的过程。数据融合依托于特定的算法,能将多传感器在时间或空间上的数据互补或有效组合,其目的是为了获得被测对象一致性的描述或解释,从而获取可信度更高、更加准确的监测结论的过程。
1.2 关键技术
由于在数据融合中有着不同的数据源信息描述方式以及数据格式,如图1所示,因此,数据融合会在合适工具的利用下统一转换数据格式,转换完成后的数据能够在MAPREDUCE的帮助下将不同信息源之间的信息相关性找出来,分析相关结果,并将其作为融合数据输入到计算中;在DS证据论的帮助下将不同数据源重组,从分析相关性结果,将得出的数据作为融合计算输入,针对不同来源的数据因素采取DS证据论证的办法将各个因素之间的关系和信息进行融合;将得出的融合结果输入,并储存到相应的数据库中。
2 设计环境监测系统
2.1 关于省级环境监测系统
水环境监测站点存在于环境监测系统中,能够分成2个部分,一个是手工监测站点,另一个是手工监测站点。其中,有24个是自动监测站点,297个是手工监测站点。该环节主要内容是对水环境数据进行采集,比如石油类排放量、pH值以及氨氮排放量等。设置有24个大气监测站点是对颗粒物、CO2以及NOX等进行监测,其中,还涉及到众多的污染源信息以及针对不同污染问题所进行的应急交通处理信息,比如应急物资状况、应急车辆等,面对这些庞大的数据,需要将这些信息存储到本地系统中,并做好安全管理工作,避免网络中断的情况出现,以防有数据丢失问题发生。如果有网络中断问题出现,则需要在下一次恢复网络时将补送数据发送到数据中心网络中,并储存到本地数据系统之后在网络作用下向远程数据中心传送。
2.2 设计数据融合环境监测系统
从系统的整体架构出发,其通常被分成3层,按照从上到下的秩序,分别是应用层、核心功能层、平台层,如图2所示。其中,按照数据来源可以将应用层分成是大气环境数据融合与水环境数据融合,依托于MAPREDUCE框架這一大数据技术的作用,平台层在SPOOP以及HIVE的利用下能够对NOSQL中的关系型数据库进行传输和转换,随后将其储存在HDFS文件系统中。当所有的机器都在集群中分布,并经过ZOOkeeper的审核后,才能对该集群进行有效管理。
3 设计模块
3.1 关于数据采集模块
存在于环境监测系统之中的数据采集模块能被分成2大部分,其中一个是利用数据采集仪器对监测站点某一时间点中所涉及到的COD、水环境pH值和盐度等数据的监测,并在Oracle这一关系型数据库的利用下将相关数据存储到本地数据库中。不同的站点还需要在网络编程的帮助下将收集到的数据向远程数据中心传送,远程数据中心即NoSQL数据存储方式。
3.2 关于规则构建模块
在相关准则的依托下所进行的数据预处理有关的抽取、清洗和转换等工作。一般情况下,清洗准则都是在国家出台的相关业务准则下制订的,比如COD含量、pH值的范围等。为了保证数据再处理过程中的安全性,对于那些不符合准则要求的数据,需要重新进行过滤处理。对于转换规则的操作则是需要统一处理数据,比如TXT、XML等文件统一转换成TXT格式的文件。在处理某些污染物(命名有差异)或对污染物含量单位进行统一时,均需要在相关标准下进行。在抽取规则环节,需要在污染物类型、监测站点编号以及监测时间段维度等内容的标准下进行。
3.3 关于数据预处理模块
就数据预处理模块而言,其提取于关系型数据库中,是相关性分析前所进行的操作,因此,这一环节的数据预处理模块不仅能使相关模块数据的合理性、有效性得到保证,还能够使整个处理过程的安全性提高,如图3所示。这一操作需要在MapReduce框架的帮助下进行,通过Task Tracker与Job Tracker将主从结构组成。其中,Task Tracke的作用在于任务执行,而Job Tracker的作用则在于任务分配和启动。
4 结果展示
从环境监测系统中有关于风速、温度以及湿度对于大气监测值融合的最终结果来看,大气监测值每隔5 s便需要更新一次。此时,需要每隔2 h计算一次平均概率分配值,随后在风速、温度以及湿度等监测值的参考下将基本的一个概率分配值得出来,最后再通过DS进行验证计算。
5 结束语
综上所述,本文主要是在数据融合技术的有效应用下,对存储于环境监测中庞大的数据进行处理,并将存在于其中的问题进行有效解决,在各个传感器间的性能以及协调性帮助下,逐步提升整个监测系统的准确性和效率。
参考文献
[1]李恒灿,李权才.数据融合技术在环境监测中的应用[J].中国农机化,2011(04).
[2]刘卫萍,王宁,周晓磊.数据融合技术在环境监测领域的应用[J].计算机系统应用,2016(06).
[3]陆猛.数据融合技术在环境监测中的应用[J].科技风,2014(08).
〔编辑:张思楠〕