基于JN5139的农田无线传感器网内数据融合研究
2016-03-23高红菊刘艳哲
陈 莎 ,高红菊,刘艳哲,梁 栋,伍 丹
(1.中国农业大学 信息与电气工程学院,北京 100083;2. 农业部信息中心 数据资源处,北京 100125;3.农业部干部管理学院,北京 102208)
基于JN5139的农田无线传感器网内数据融合研究
陈莎1,高红菊1,刘艳哲1,梁栋2,伍丹3
(1.中国农业大学 信息与电气工程学院,北京100083;2. 农业部信息中心 数据资源处,北京100125;3.农业部干部管理学院,北京102208)
摘要:在无线传感器网络中,各个节点的存储能力、通信能力、计算能力及能源的供给都十分有限,因而运用网内数据融合算法消除冗余数据,减小数据传输量,从而达到节省功耗、延长节点生命周期、提高数据采集效率和准确度的目的。介绍了系统结构及主要模块JN5139,采用简单滑动平均法、指数平滑法及自回归滑动平均模型(ARMA),在分析大量WSN数据的基础上,利用时间序列对数据进行建模预测,提出了适合WSN的数据处理模型并用MatLab进行仿真,之后将程序烧写到节点中进行试验。试验表明:该方法在保证采集数据可靠性的前提下有效地减少了网络的耗能,延长了网络的生命周期。
关键词:无线传感器网络;数据融合;时间序列预测模型;能量消耗
0引言
随着无线传感器网络WSN(Wireless Sensor Network)的发展,无线传感器网络[1]成为了当前国际研究热点。无线传感器网络节点数目庞大,其节点一般携带有限的、不可替代的能源,在没有长期可供能源的情况下,工作寿命十分有限[2],其能源的有限性成为其发展的瓶颈。感知节点主要在数据传输、信号处理及硬件操作上消耗能量,其中数据传输消耗能量最多,因此,需要首先解决的是如何实现传感器网络在能量有限的情况下实现复杂的数据监测和信息报告。
数据融合(Data Fusion)是WSN中一项十分重要的技术,将传感器采集到的原始数据通过该技术进行模型融合运算处理,从而减少冗余数据[3],只将有价值的、变化的数据传送到网关节点,不仅提高了数据收集的效率,同时还节省了传输数据所消耗的能量,有效地减少了能源的开销,达到延长了网络节点的使用寿命的目的。
1无线传感器网络系统架构机构
具有代表性的无线传感器网络的系统由分布式无线传感器节点、 汇聚节点、通信卫星或互联网以及任务管理节点[4]组成,如图1所示。其中,A-E代表随机部署在感知区域内部的分布式无线传感器节点群,这些节点群对本地信息进行采集与处理。节点之间可通过自组织方式构成网络,并由无线方式采用多跳路由将采集的数据传输至汇聚节点。汇聚节点直接与传感器网络、Internet等外部网络相连,通过GPRS网络将收集的数据转发至外部网络。用户即可访问农田信息监测平台,查询相关信息进行分析处理,从而指导农业生产。
图1 无线传感器网络系统架构
本文节点系统的主体选用Jennic公司生产的JN5139模块,节点及模块如图2所示。JN5139系列模块是基于Jennic第二代无线微控制器的低功耗无线通讯模块,其存储能力、运算能力有限[5],使得很多计算复杂的模型都不适用。若采用的融合算法复杂度过高,不但不能节省能量,可能会加大能量的开销,故采用算法较简单的模型,在确保预测结果准确性的情况下,尽可能减小算法的复杂度。传感器采集的数据以平稳性、周期性数据为主,时间序列模型能有效地描述其特征。运用基于时间序列的数据融合算法进行网内数据融合可减少数据冗余,提高其采集效率,延长整个网络的使用寿命。
图2 节点电路板图
2网内数据融合算法设计
时间序列数据一般都为季节型、水平型、周期型、线性趋势型和非线性趋势型其中之一[6],可根据数据类型的不同,合理灵活选择预测分析模型。在无线传感器网络感知节点进行网内数据融合,系统首先设定一个容忍阈值,在一个采样周期内,在获取充分的历史数据之后,根据预测模型对即将要采集的数据进行初步预测,计算采集的真实数据与预测数据之间的差值。当预测值与真实值的差值小于容忍阈值时,表明预测合理,系统不传输数据,远端平台直接进行同样的预测模型,将该预测值显示在服务器中;当预测值与真实值的差值大于容忍阈值时,表明预测不合理,系统将进一步发送该数据。系统的主要思想即为根据历史数据预测未来数据,若预测合理,该数据不传输,减少了无线传感器网络节点数据的传输量,从而可减少感知节点能量的消耗,延长整个网络的使用寿命。
在一个采样周期的节点的工作流程如图3所示。这种融合方法在满足观测者对于数据准确性要求的前提下,尽可能地减少感知节点与网关节点之间的数据发送量,同时具有实时监测数据变化并自适应调节的能力,使得该系统不会漏检突发事件。
图3 感知节点数据融合流程图
2.1简单滑动平均法
简单滑动平均法基本原理为把大量历史时期所统计的数据作为观察值,求出算术平均数作为预测值。该方法适用于数据变化范围小、方差小变化趋势不大的数据类型,该模型假设“过去这样,今后也将这样”。预测值为
(1)
式中Ft+1—对下一周期数据的预测值;
n—滑动平均个体样本;
xt—t时刻感知节点采集的真实值;
xt-1、xt-n+1—分别表示t-1时刻采集的真实值和前t-n+1时刻采集的真实值。
随着样本n的增加,平滑作用将加强。若数据出现大的波动性,预测数据将出现大的误差。
2.2指数平滑法
指数平滑法基于历史实际采集值和预测值,要求的数据量小,只要求上一周期的实际采集值以及上期的预测值,便可预测下一周期的估计值,同时该模型不舍弃往日的历史数据;历史数据赋予逐步减小的影响因子,给予不同时期的数据不同的权重,减少了较远时期数据对模型的影响程度。模型通过2个数据的计算进行预测,减少了数据的处理时间、能量消耗及存储量,十分适合短期预测。指数平滑公式为
Ft+1=αxt(1-α)Ft
(2)
式中Ft+1—t+1时刻指数平滑值;
α—平滑系数,0<α<1;
Ft—t时刻指数平滑值。
运用该模型可预测t+1时刻的预测值Ft+1,指数平滑法的关键在于平滑系数α的选取,其选取的大小直接影响预测值的准确度。在实际应用中,一般α的选取依靠预测研究人员反复测试及研究人员对数据属性变化特性来确定。根据目前研究现状来看,若序列比较平稳,无大的波动,α的取值一般较小,如0.1~0.3之间;若时间序列数据有明显的变动倾向,α一般取0.6~0.9之间[7]。
2.3自回归移动平均模型
在实际的时间序列分析系统中,ARMA时间序列分析模型被广泛应用,它将随时间变化的预测对象时间序列看作一串随机数字序列,用相应的模型对这一串随时间变化又相互关联的数字进行近似描述。在实际应用中,首先利用感知节点采集的历史数据进行建模,建模完毕之后即可进行未来数据的预测。该模型利用节点采集数据之间的相关性进行设计,其更容易识别异常数据,并将之剔除[8]。公式为
xt=α0+α1xt-1+…+αpxt-p+εt-
φ1εt-1-…-φqεt-q
(3)
E(εt)=0
E(εsεt)=0
s≠t
E(Xsεt)=0
∀s 式中p—自回归部分的阶数; q—滑动部分的阶数; αt—自回归系数; φj—滑动平均系数。 其中,xt和xt-1,xt-2,…,xt-p为具有一定相关性的时间序列变量。 ARMA(p,q)模型含有p+q+1个未知参数,在实际应用中,一般考虑到实时检测,如果阶数p取值太大,将会产生很大的计算量。若要采用ARMA模型进行预测,则在建模之前需判定时间序列{xt}是否具有正态、平稳和零均值的特性。在时间序列中,要检验{xt}是否满足正态曲线,一般只需检验{xt}的三阶矩和四阶矩是否满足正态随机变量的特性;之后用最小信息准则对ARMA模型进行定阶。对原始数据进行预处理后再对{yt}进行建模,有 (4) 本仿真数据基于2012年11月-2013年4月为期6个月在涿州实验地采集的土壤湿度值,以下介绍ARMA(p,q)土壤湿度拟合模型建模过程。 1)图4(a)为传感器感知节点采集的原始数据。首先利用公式(4)对原始数据进行零化处理得到图4(b),可看到数据在零附件上下波动,满足了ARMA模型建立的数据零均值特性。 (a) 原始数据 (b) 零化处理后 2)图5(a)为原始数据的自相关和偏相关仿真结果图,图5(b)为零化处理之后的自相关和偏相关仿真结果图。从自相关图中可知:MA(q)有截尾特性,从偏相关函数图中可看出在滞后期p之后也有截尾特征;根据自相关图可进一步估算MA过程的阶数q,根据偏相关图可特征识别AR(p)过程的阶数。 (a) 原始数据 (b) 零化处理后 3)进行残差分析,主要分析检验过程是否为白噪声,图6为该数据的拟合残差分析图。 图6 拟合残差分析图 由图6可知:除了个别数据外,所拟合的模型满足有关假设。图7的全部数据都在置信水平0.95内,表明建立了合适的回归方程。进一步找到合理的阶数使得AIC值最小,对于土壤湿度数据,当p=2,q=1时,AIC=-2.610 3为最小值,故建立预测土壤湿度的ARMA(2,1)模型。 图7 残差自相关和偏相关函数图 3网内数据融合算法实现 3.1仿真实现 3.1.1土壤湿度仿真实现 本研究采用3 975个土壤湿度数据中的3 825个数据预测150个数据,进行模型的建立,对以上介绍的3种算法分别进行模型的建立与验证。 运用简单滑动平均算法时,考虑到结果的准确性以及计算量的大小,本研究采用n=10,进行滑动预测。根据涿州采集土壤湿度进行仿真验证,其效果如图8所示。从图8可看出:预测结果与真实结果较接近,但不能很好预测数据突变情况。 图8 简单滑动平均法预测土壤湿度效果图 运用指数平滑法对土壤湿度进行预测,本研究中,数据的波动起伏较大,经过MatLab仿真及推导最终采用α=0.6的参数进行模型构造,预测值与真实值如图9所示。该预测模型运用少量的数据,预测效果较好,与真实值较接近,可较大程度上预测土壤湿度值。 图9 指数平滑法预测土壤湿度效果图 图10 ARMA土壤湿度预测效果图 3.1.2空气温度仿真实现 本研究采用在涿州试验采集的3 482个数据进行模型的建立。由于空气温度成周期性实时变化,数据变化较快,下午2:00左右温度最低,凌晨4时左右温度最高,数据实时变化较快,因此采用n=2的简单滑动平均模型,预测效果较好,如图11所示。 图11 简单滑动平法预测空气温度效果图 由于温度变化较快,故指数预测模型中选用α=0.8的参数进行数据预测,预测效果如图12所示。 图12 指数滑动平法预测空气温度效果图 3.1.3空气湿度仿真实现 本研究采用在涿州试验田感知节点采集的3 482个数据进行模型的建立。由于空气湿度成周期性实时变化,数据变化较快,与温度差不多相反,下午2:00左右湿度最低,凌晨4时左右湿度最高,数据实时变化较快。因此,采用n=2的简单滑动平均模型,预测效果较好,如图14所示。 图13 指数ARMA预测空气温度效果图 图14 简单滑动平法预测空气湿度度效果图 由于湿度变化较快,故指数预测模型中选用α=0.8的参数进行数据预测,预测效果如图15所示。 图15 指数滑动平法预测空气湿度度效果图 图16 ARMA预测空气湿度度效果图 3.1.4CO2浓度仿真实现 本实验根据自己在实验室进行长达3个月采集的3 486个数据,根据其中3 336个数据进行建模,对剩下150个数据进行模拟。简单滑动平均法采用n=3,预测效果如图17所示。 图17 简单滑动平法预测CO2浓度效果图 在CO2浓度数据中,CO2浓度每天都有规律的变化,在夏季,下午2时左右CO2浓度最低,晚上3:30左右CO2浓度最高,其数据波动性大。通过分析计算,在指数滑动平均算法中采用α=0.8进行数据的预测,其预测效果图如图18所示。 图18 指数滑动平法预测CO2效果图 图19 ARMA预测CO2浓度效果图 3.2实地实验 为验证仿真预测模型理论预测效果、预测模型是否能运用于实地环境,以及是否节省了感知节点能量的消耗、延长了整个网络的使用寿命,基于JN5139主要模块的硬件平台,将模型在Jennic平台CodeBlocks环境下运用C语言进行编写,完成之后运行生成bin文件,再运用Flash Programmer1.8.9将bin文件烧写至JN5139,从而进行实地实验。 本研究对土壤湿度、空气温湿度及CO2浓度进行模型编写与试验,采用以上介绍的3种模型,同时进行实地验证。本实验采用4个感知节点传感器,其中1号感知节点烧写没有数据融合的示例程序,30min发送1次数据的程序;2号烧写简单滑动平均算法程序;3号烧写指数滑动平均算法程序;4号烧写ARMA模型算法程序。 为避免外界环境因素的干扰,保证数据融合预测模型的有效性与正确性,本实验将土壤湿度传感器放置同一环境中,感知节点放置同一地理位置,保证其所处外界环境一致,土壤湿度、空气温湿度实验地点为中国农业大学信息与电气工程学院楼顶,CO2浓度实验地点为实验室内(另一个置于支架背后),实地效果如图20所示。 图20 实地实验图 节点持续运行3个月,选取1个星期的实验数据结果进行分析对比得出结果,如表1所示。从表1可知:有数据融合的2、3、4号节点明显比没有融合的1号节点发送次数少;4号节点烧写ARMA模型融合效果最好。为了验证融合模型的可靠性,本实验结束后,在接收平台用对应的模型对未发送的数据进行恢复,恢复的数据再与1号节点的数据进行比较,得出90%以上恢复的数据与1号节点采集的真实数据相差小于等于设定的相应阈值,从而验证了上述3种模型的可靠性。因此,运用数据融合可有效减少数据的发送,从而减少了发送数据所需能量,增加了无线传感器网络的使用寿命。 表1 数据融合实地结果分析 4节点使用寿命的估计 在整个无线传感器网络中,数据传输消耗的能量最多;但增加算法的复杂度及能量的消耗。因此,需要找到一个平衡点在一个周期内使系统自身算法消耗的能量小于数据传输所消耗的能量。本研究中在JN5139模块中采用了3组融合算法,对比1个周期(30min)内有传输与无传输能量的消耗情况。感知节点中能量主要的消耗为 E=EWake+ERead+ECCA+ETransmte+Esteep(5) 其中,EWake+代表从睡眠中唤醒所消耗的能量,ERead代表从传感器读取数据所消耗的能量,ECCA代表对空闲信道评估所消耗的能量,ETransmte代表传输含64字节的数据帧至网关节点所消耗的能量,Esteep为1周期内所消耗的能量。 在应用程序与PAN Coordinator相关联的情况下,应用程序代码还需要16字节的存储空间,系统运行的所消耗的电量可通过每个模块的电流与每个模块循环周期所需要的时间的乘积进行计算。在1个周期内发送数据,并且没有数据融合算法系统所消耗的总能量为2 403.72μC,其计算详细过程如表2所示。 从表2中可以看出:传输数据消耗的能量远远大于其它阶段。如果在系统中增加算法,那么从休眠中唤醒所消耗的能量将会增加,但数据传输所消耗的能量会减少。用ARMA预测模型为例来计算能量的消耗情况,从睡眠中唤醒所需的时间增加到14.75ms,从而增加78.902 5μC电量消耗,同时减少数据传输所消耗的96.064μC。因此,总体看来ARMA预测模型的运用1个周期内能量大约减少了17.159μC。由此计算,若传感器部署于大田6个月,运用预测模型之后所传输的数据少于原来数据的50%。因此,运用本文研究的简单滑动平均算法、指数滑动平均算法、ARMA在很大程度上节省了感知节点能量的消耗,为整个无线传感器网络延长了使用寿命。 表2 能量消耗详细分析表 5结论 本研究基于JN5139的网内数据融合算法,通过减少冗余信息的发送,传输有价值的信息,减少了能量的消耗,从而延长其生命周期。通过模型的选取、MatLab仿真和算法程序进行C语言编写,最后烧写到节点进行实地实验。结果表明:简单滑动平均算法、指数滑动算法和ARMA算法模型在保证采集数据可靠性前提下减少了节点能量的消耗,延长了整个网络的寿命。 无线传感器网络在精细农业以及农业现代化中运用十分广泛,感知节点对农田环境信息实时、长期地采集有助于农户长期掌握农田环境信息,对农业的生产实施提供参考依据,对实施精细耕作有着重要意义。 参考文献: [1]孔鹏,余镇危.无线传感器执行器网络关键技术综述[J].传感器与微系统,2014,33(2):4-8. [2]张永梅,杨冲,马礼,等.一种低功耗的无线传感器网络节点设计方法[J].计算机工程, 2012, 38(3):71-73. [3]何受倩.现代优化技术在无线传感器网络中的应用[J].计算机科学,2014, 41(6A):329-330. [4]Akyildiz L F, W Su Y Sankarasubramaniam, E Cayirci. Wireless Sensor Networks: A Survey[J]. Computer Networks,2002,38(4):393-422. [5]梁栋,高红菊,李偲钰,等.无线传感器网络终端节点设计与实现[J].农业网络信息,2012(4):91-98. [6]史浩山,杨俊刚,李田.无线传感器网络时间序列流量预估算法[J].中国电子科学研究院学报,2010,5(2):120-125. [7]齐驰,侯忠生.自适应单指数平滑法在短期交通流预测中的应用[J].控制理论与应用,2012,29(4):465-469. [8]文轩,蒋文贤.无线传感器网络中一种ARMA流量预测的拥塞控制算法[J].小型微型计算机系统,2012,33(5): 1098-1103. In Network Data Fusion for Agricultural Information on Wireless Sensor Nodes Based on JN5139 Chen Sha1, Gao Hongju1, Liu Yanzhe1, Liang Dong2, Wu Dan3 (1.College of Information and Electrical Engineering, China Agricultural University, Beijing 100083,China; 2.Ministry of Agriculture Information Center,Beijing 100125,China; 3.Agricultural Management Institute of Ministry of Agriculture, Beijing 102208,China) Abstract:In wireless sensor networks, the storage capacity of each node, communication capabilities, computing power and the supply of energy are very limited.By in network data fusion algorithm to eliminate redundant data, reduce the amount of data transferred,so as to achieve the purpose of saving power,prolong the life cycle of the nodes and improving the efficiency of data collection and accuracy. This paper describes the system structure and the main module JN5139, using a simple moving average,exponential smoothing and autoregressive moving average model (ARMA).On the basis of analyzing large data of WSN, proposed data processing model which fit for WSN and to simulate with Matlab.Field experiments conducted after verifying the simulation model.Experiments show that under the premise of ensuring the correctness of the data,the method is effective in reducing the energy consumption of the network, thus extending the network lifetime. Key words:wireless sensor networks; data Fusion; time series forecasting model; energy consumption 文章编号:1003-188X(2016)05-0006-09 中图分类号:S159-3;S126 文献标识码:A 作者简介:陈莎(1991-),女,湖北当阳人,硕士研究生,(E-mail)chenshacau@126.com。通讯作者:高红菊(1972-),女,河南鹿邑人,副教授,博士生导师,(E-mail)hjgao@cau.edu.cn。 基金项目:国家自然科学基金项目(31371531) 收稿日期:2015-04-27