基于农业物联网的农作物生长监测数据融合研究
2017-12-13黄海松秦志远张慧
黄海松 秦志远 张慧
摘要:针对农业无线传感器网络数据融合精度低、传感器节点能量有限的问题,结合农作物生长环境监测的特点,提出了一种适用于农作物生长监测数据融合的架构和算法。将无线传感器网络划分成多个固定层级,减少数据传输量并逐层降低误差。仿真试验结果表明,该算法融合结果比算术平均法和单一自适应加权算法更接近真实值。该算法能够减少数据传输量,且具有很好的可拓展性。
关键词:农業物联网;格拉布斯准则;分层数据融合;自适应加权;数据融合
中图分类号: TP39302;S126文献标志码: A
文章编号:1002-1302(2017)21-0241-03
收稿日期:2016-05-23
基金项目:贵州省自然科学基金(编号:黔科合J字2015]2043号);贵州省重大基础研究项目(编号:黔科合JZ字2014]2001)。
作者简介:黄海松(1977—),女,贵州大方人,教授,博士生导师,主要从事制造业信息化、物联网技术相关研究。E-mail:huang_h_s@126com。
通信作者:秦志远,硕士研究生,主要从事物联网技术、数据融合相关研究。E-mail:Zhiyuan_Qin1992@163com。
农业物联网有力地推动了信息化和农业现代化的融合,对精细农业的应用和发展起到了重要作用1]。农作物生长环境变化缓慢、实时性要求低,应用环境更为恶劣,因而农业物联网的应用特点和环境与工业物联网有本质区别2],应根据农业生产环境特点应用物联网技术。农业物联网中信息传输是一个至关重要的环节,农业信息传输广泛采用无线传感器技术3]。农业物联网具有监测面积大、数据传输距离远等特点,因此信息传输要充分考虑农业物联网的特殊性。
相比工业物联网,农业物联网要求传感器节点拥有更长的使用寿命,但是无线传感器网络中传感器节点大都用电池供电且连续工作寿命有限。减少数据传输量和数据处理量是延长无线传感器节点寿命的有效途径。如果将不经处理的数据直接发送给上位机处理,不仅浪费能量,缩短传感网络整体寿命,而且不利于数据利用,甚至会造成网络拥塞和瘫痪。
1无线传感器网络数据融合技术
数据融合技术可以有效去除冗余信息,提高数据准确度和精度,节省传感器节点能量,达到延长网络寿命的目的4],因此能够有效地解决以上问题。无线传感器网络数据融合技术是众多科技工作者的研究热点5-7]。刘凯等为提高多传感器检测系统预警精度,提出了在数据层、特征层、决策层分别进行数据融合的多传感器分层数据融合模型5]。王华东等提出单个传感器数据融合,再进行传感器间数据加权自适应融合的方法,但在去除粗大误差时计算方法较为复杂,且传感器间数据融合全部在同一节点完成,使该节点负担较重6]。Chen等提出了一种基于簇的数据自适应融合方法,实现数据在空间和时间上的自适应融合7]。无线传感器节点和路由器的能量有限且处理能力较弱,因而数据融合算法应当尽量简洁,易于实现8]。自适应加权数据融合算法无需传感器系统先验知识,依靠传感器采集的测量数据即可实现较高精度的融合估计9],且计算方法简便。
结合上述研究及农作物生长监测的特点,本研究借鉴分簇路由协议的思想及其周期性采集数据的特点,提出一种适用于农作物生长监测的农业物联网数据融合的架构及算法。该算法虽然增加了数据融合次数,但是减少了数据传输量,在Berkeley Mote中,1 bit数据传输的能源消耗可以执行800条指令10]。
2农作物生长监测数据融合研究
农作物生长监测具有环境变化缓慢、实时性要求不高的特点。根据经验,北方温室温度每10 min变化1 ℃,且温室植物对温湿度变化敏感度不高11],其他温室或农田环境也存在类似情况。据此本研究提出的分层自适应加权数据融合架构如图1所示,其中基站下设p个子层节点,每个子层节点下设m个普通成员节点,每个普通节点单位时间内采集k个数据。图2为本研究提出的算法流程示意图,首先对单位时间内单个传感器节点采集的数据进行最优估计,然后子层节点对该层内传感器节点估计值进行自适应加权融合,最后基站将子层节点融合值再次进行自适应加权融合,获得单位时间内的测量数据最优融合值。
21初始测量数据预处理
估计算法是建立在可靠的测量初值基础上的,在单个节点的多次测量中,不能保证每次测量值都是正确的,因而首先需要去除粗大误差。粗大误差(又称疏失误差)是指在测量过程中,偶尔产生的某些不应有的反常因素造成的测量数值超出正常测量误差范围的小概率误差。无线传感器网络进行数据采集时,受外界干扰不可避免地出现粗大误差。含有粗大误差的数据会干扰试验结果,甚至歪曲试验结论。
剔除测量数据中的粗大误差,可以提高数据融合的自适应速度和精确度。常用剔除粗大误差的方法有分布图法、拉伊达法则、格拉布斯准则等。分布图法借助中位数、四分位数等剔除粗大误差,但过程较为繁琐。测量次数趋于无穷大时才可使用拉依达准则12],测量次数有限时拉依达准则就不很可靠。实践证明,在检验数量较少的数据时,格拉布斯准则剔除疏失误差的准确性较高,为保证实时性,单位时间采集数据次数不能过多,因此本研究选用格拉布斯准则剔除粗大误差。
设某节点单位时间内的测量数据分别为x1,x2,x3,…,xi,…,xk则此节点测量数据算术平均值:
xTX-5]=SX(]1kSX)]∑DD(]ki=1DD)]xi。
第i个测量值的残余误差为:
Vi=xi-xTX-5]。
对应的该组数据标准差为:
σ=KF(]SX(]1k-1SX)]∑DD(]ki=1DD)]V2iKF)]。
在表1中可查出格拉布斯统计量的临界值g0(n,α),即pg≥g0(n,α)]=α(显著水平α一般取005或001,即置信度为95%或99%),为提高测量精度,取置信度为95%。endprint
若第i个测量数据xi满足如下条件,即
|Vi|≥g0(n,α)σ,
则将xi剔除。
将剩余数据重复以上过程,直到所有数据满足要求为止。
22单个节点数据分批估计
对单个传感器节点单位时间内采集的多个数据进行分批估计,减少数据发送次数,节省节点能量,提高数据精确度。对于单个节点数据去除疏失误差后,将测量数据分为n组。第j组数据可分别表示为xj1,xj2,xj3,xj4,…,xjnj,4≤nj≤7,即每组至少有4个数据,至多有7个,此处考虑计算量与精准性的平衡。
第j组平均值为:
xjTX-5]=SX(]1njSX)]∑DD(]nji=1DD)]xji。
对应的方差为:
σ2j=SX(]1nj-1SX)]∑DD(]nji=1DD)](xji-xjTX-5])2。
单一节点数据同属于一批测量数据,可认为近似服从正态分布,由分批估计理论可得到第i个节点的最优融合方差13]为:
σ2i=JB((]∑DD(]nj=1DD)]SX(]1σ2jSX)]JB))],i=1,2,…,m。
其中σ2i越小表明该节点测量数据融合之后的精度越高14]。
由各组方差和平均值能够计算得知第i个节点融合值为
xi=JB((]∑DD(]nj=1DD)]SX(]1σ2jSX)]JB))]-1∑DD(]nj=1DD)]SX(]1σ2jSX)]xjTX-5],i=1,2,…,m。
假设将测量数据分为2组,则该节点的方差可估计为
σ2=SX(]σ21σ22σ21+σ22SX)]。
该节点数据的估计值为
x=SX(]σ21x2+σ22x1σ21+σ22SX)]。
23子层节点数据加权自适应融合
经过上述步骤,得到单个节点的测量数据的估计值。成员节点将数据估计值发送给相应的子层节点,由子层节点融合后转发给基站,减少了数据传输距离,同时进一步提高了数据准确度。设每个子层有m个节点,单个节点数据融合值记为xi、方差为σ2i,对每个子层内节点数据进行层内自适应加权融合。根据权值最优分配原则计算各节点估计值在组内的最优权值Wi,然后对xi自适应加权融合处理,计算得到子层节点数据融合最优值和对应的方差。
设某子层内第i个节点的权值为
Wi=JB((]σ2i∑DD(]mi=1DD)]SX(]1σ2iSX)]JB))]-1且∑DD(]mi=1DD)]Wi=1。
第q个子层节点融合值和方差分别为
Yq=∑DD(]mi=1DD)]Wixi,q=1,2,…,p;
σq=∑DD(]mi=1DD)]Wiσi,q=1,2,…,p。
依据上述计算过程,可以得到各个子层节点的融合值和方差,为下一步在基站位置数据融合提供数据支持。
24基站级数据加权自适应融合
基站接收各个子层节点数据的融合值和方差,再次融合数据,降低误差。设每个基站下设p个子层,基站级数据融合过程与子层融合过程基本相同。由上个步骤得到的子层数据方差σq,可计算获知各个子层的自适应加权因子Wq,结合子层数据融合值Yq,最终可求得该时段内测量数据最优值Z。
第q个子层自适应加权因子为
Wq=JB((]σ2q∑DD(]pq=1DD)]SX(]1σ2qSX)]JB))]且∑DD(]pq=1DD)]Wq=1。
可得基站层级最终融合值为
Z=∑DD(]pq=1DD)]WqYq。
3改进算法测试分析
为验证本研究算法的有效性,在实验室内选定1个监测区域,由15个温度传感器节点和3个子层路由节点构成无线传感网络,温度传感器节点编号1~15,每个节点单次试验采集10次数据,在不同温度下进行5次试验,基准真值分别为135 ℃、172 ℃、208 ℃、237 ℃、250 ℃。3个子层节点标号为1~3,每个子层节点连接5个普通节点,分别对应1~5号、6~10号、11~15号传感器节点。
31试验数据处理
以第5次试验数据为例展示试验数据处理过程,表2~表4分别为1~5号、6~10号、11~15号温度传感器节点融合值、方差和权值,表5为1~3号子层测量数据融合值、方差和权值。依据上面公式进行计算,得出第5次试验的最终数据融合值为2524 ℃。
32对比与分析
分别使用本研究算法、算术平均法和自适应加权数据融合方法对试验数据进行处理,结果见表6。为直观展示3种计算方法融合值与真值近似程度,将真值标准化为零,3种计算方法得到的融合值以相对差值的形式在图3中表示。在第5次试验中,算术平均值比自适应加权融合值更接近基准真值,但此种“接近”有较大不确定性,其余试验中自适应加权融合结果比算术平均法结果更接近真实值。总体来看,自适应加权融合方法优于算术平均法,本研究方法优于分层自适应加权融合方法且更稳定,主要原因是分层自适应加权融合方法最初没有剔除粗大误差,导致计算偏差较大。
4结束语
本研究結合农作物生长监测环境特点提出的改进分层自适应加权融合架构与算法,将无线传感器网络划分成多个固定层级,周期性采集数据并融合,得到被测数据单位时间内的最优融合值。首先对单个传感器节点数据进行估计,然后对每一层分别进行自适应加权融合。该算法相比以往算法融合精度高,稳定性好,简单易行,在满足数据融合实时性要求的同时,提高了测量数据精准度,虽然增加了计算量,但是减少了数据传输量,理论上可以节省无线传感器节点的能量,延长无线传感器网络的寿命。endprint
该方法具有较好的可拓展性,可根据无线传感网络规模大小调节网络分层,适当增加或减少网络层数。将该算法用于其他类型数据融合时,如湿度、CO2含量、光照度等,可根据被测量的实时性要求和精确度要求,设定传感器采集数据周期以及周期时间内的数据采集量。下一步的研究重点是在融合多类型数据,为研究基于农业物联网的农作物生长情景建模奠定基础。
参考文献:
1]ZK(#]秦怀斌,李道亮,郭理 农业物联网的发展及关键技术应用进展J] 农机化研究,2014(4):246-248
2]ZK(#]常超 精准农业中WSN渐进融合算法研究D] 重庆:重庆大学,2012
3]同诗扬,祁广云,衣淑娟 基于农业物联网的改进型双门限频譜检测算法研究J] 农机化研究,2016(1):53-56
4]陈正宇,杨庚,陈蕾,等 无线传感器网络数据融合研究综述J] 计算机应用研究,2011,28(5):1601-1604
5]刘凯,郭勇义,吴世跃 煤矿安全监测多传感器分层数据融合模型研究J] 工矿自动化,2014,40(6):45-50
6]王华东,王大羽 一种改进的多无线传感器数据分批估计自适应加权融合算法J] 传感技术学报,2015,28(8):1239-1243
7]Chen H,Mineno H,Mizuno T Adaptive data aggregation scheme in clustered wireless sensor networksJ] Computer Communications,2008,31(15):3579-3585
8]熊迎军,沈明霞,陆明洲,等 温室无线传感器网络系统实时数据融合算法J] HJ185mm]农业工程学报,2012,28(23):160-166
9]高峰,俞立,王涌,等 无线传感器网络作物水分状况监测系统的上位机软件开发J] 农业工程学报,2010,26(5):175-181
10]ZK(#]邱爽,吴巍 无线传感器网络数据融合算法研究J] 武汉理工大学学报,2008,30(7):119-122
11]陈春玲,崔琳,许童羽,等 日光温室无线传感器多数据融合技术研究J] 沈阳农业大学学报,2016,47(1):86-91
12]樊雷松,强彦,赵涓涓,等 无线传感网中基于BP神经网络的数据融合方法J] 计算机工程与设计,2014,35(1):62-66
13]张立勇,张利,李丹 基于最优分组原则的多传感器分组加权融合算法J] 仪器仪表学报,2008,29(1):200-205
14]蒋婷,滕召胜,顾红艳,等 基于EMD与分批估计的动态称量快速融合方法J] 仪器仪表学报,2015,36(6):1406-1414endprint