多传感器数据融合技术在机房监控系统中的应用
2017-01-19赵玲云
赵玲云
摘 要: 基于ZigBee技术设计机房环境监控系统,根据无线传感器网络自身的局限性和监控网络多种传感器协同工作的特点,重点研究多传感器数据融合知识,并将模糊数学的D?S数据融合技术应用到该系统网络中,为了确保无线传感器的稳定性以及采集到的数据的准确性,系统加入智能判别过程。实践表明,该研究达到了预定目标。
关键词: 机房监控系统; 多传感器; 数据融合; ZigBee技术
中图分类号: TN948.64?34 文献标识码: A 文章编号: 1004?373X(2016)24?0116?04
Application of multi ?sensor data fusion technology in computer room monitoring system
ZHAO Lingyun
(Nantong Shipping College, Nantong 226010, China)
Abstract: The design of computer room environment monitoring system based on ZigBee technology is introduced in this paper. According to the limitation of wireless sensor network itself and characteristics of multi?sensor cooperative work in monitoring network, the knowledge of multi?sensor data fusion is researched emphatically, and the D?S data fusion technology in fuzzy mathematics is used in the monitoring system. In order to ensure the stability of wireless sensor and veracity of the collected the data, an intelligent decision process is added in the system.
Keywords: computer room monitoring system; multi?sensor; data fusion; ZigBee technology
1 机房监控系统的多传感器与信息融合技术概述
机房环境监控系统是指对机房环境的湿度、温度、烟雾以及供电电源的电压、电流进行实时数据采集并进行调控的综合系统。本文研究的机房监控系统采用的是基于ZigBee技术的无线监控网络,对机房内的环境进行实时监控并将传感器收集到的信息上传给核心处理模块做进一步处理。无线网络的基本框架如图1所示,系统中无线监控的终端节点主要由传感器、控制器、射频通信模块和供电系统组成。根据机房环境的特点,传感器又分为温湿度传感器、水浸检测传感器、烟雾传感器、电源电压检测传感器等。系统中的传感器种类复杂多样、采集到的信息量大、每种传感器采集的信息耦合性强。多传感器信息融合[1] (Multisensor Information Fusion)是指多级别、多方面、多层次地对来自多个传感器的数据进行处理,从而产生这些传感器无法产生的有意义的信息,实现对目标更准确、更可靠的识别。
当今,随着科学技术的发展,对信息融合要求也是越来越大,融合的主要技术手段是利用计算机技术对按时序获得的多传感器的观察信息在一定条件下自动优化分析、综合利用以做出所需的决策和相关任务而进行的信息处理的过程。可见,信息融合的硬件基础是各种传感器,加工对象是多源信息,核心是对数据进行协调优化综合处理。数据融合目前有许多种分类方法[2]。按融合方法分类,可以分为统计方法、人工智能方法等;按信号处理的域进行分类,分为时域、空域和频域等;按融合的层次以及融合过程顺序分为低级、中级和高级,并根据融合的层次和相关信息推导出融合的级别,又可以分为数据级、特征级和决策级。其中,最后一种分类的三种方法目前使用的较广泛,三种融合方法的性能对照[3],如表1所示。
表1 按融合级别划分的三种融合方法性能对照表
无线传感器网络大多是由部署在监控区域大量微型传感器组成,这些传感器具有感知、计算和通信能力,它们通过无线的方式组成一个网络系统,其目的是采集、感知目标区域的信息,并将获取的信息传递给获取者。无线传感器网络因其具有很强的灵活性、低功耗等特点,在军事领域、灾难预警与救助、空间监测、医疗健康检测等方面应用十分广泛。但是,无线传感器网络也有自身的不足,首先通信能力有限,传感器的通信能力一般在几十至几百米,由于节点的工作环境一般比较恶劣,所以通信过程中往往受到地形、气温、磁场等因素的干扰;其次,计算能力有限,节点内核往往嵌入低端的处理器和存储器,如8/16位单片机等,这些设备只具有较低速率的处理能力;能量供给有限,节点往往是由电池供电的,而每个节点的运行周期长,因此节点在被按放到目标环境中时其供给的能量是十分有限的;最后就是传输数据方向性强,在网络中节点一般会遵循传输协议中规定的方向进行传输,一旦某个中间级节点发生故障而无法接收下级节点的数据,可能导致终端节点数据的丢失。数据融合技术在传感器网络中的作用是十分巨大的,主要表现在节省网络能量、提高信息的准确性、提高收集的效率等方面。
2 数据融合算法
信息时代,传感器网络的数据融合技术已经应用的十分广泛,而多数数据融合的算法是对传感器测量的一些数据提出了一些假设,如将一个统计独立的高斯噪声加入到传感器的测量模型中或者将传感器的测量误差假定为统计独立。根据不同的应用领域,数据融合算法可以归纳为以下几种[4]:
(1) 加权平均值算法。加权平均值算法是一种简单有效的融合算法,如式(1)所示,它对不同传感器收集到的信息加权后取平均值,该方法计算过程简单,实时性强,但必须根据专家知识设定权重值,主观性强。
[m=j=1Nwjmjj=1Nwj] (1)
式中,[wj]为每种传感器收集到的信息的加权值。
(2) 贝叶斯估计算法。贝叶斯估计实际就是用概率的形式表示各种不确定的信息,并用贝叶斯条件概率公式进行处理,每个相互独立的决策都是一个样本空间的划分,最后由某种规则做出系统的决策,但是贝叶斯估计需要先验概率作为计算的基础并且计算量较大。
(3) 卡尔曼滤波算法。卡尔曼滤波算法利用高斯白噪声对线性系统的系统噪声和传感器的噪声建模,并可以将动态的低级冗余数据实时融合,提供了惟一一个统计意义上的最优融合值,其实时性好且不需要大量的存储空间。
(4) 人工神经网络。人工神经网络是在现代心理学家和数理逻辑学家模拟人脑工作机制基础上提出的。它由大量广泛互联的处理单元连接而成并与传统的数字计算机的计算过程有本质的区别。它具有大规模并行模拟处理,连续时间动力学和网络全局作用等特点,存储体和操作合而为一。利用神经网络进行数据的融合可以实时实现最优处理算法、分布式存储、并行处理并可以避开模式识别中建模和特征提取,消除了模型不符与特征选择不当所产生的影响,并实现实时识别,以提高识别系统的性能。
(5) D?S(Dempster?Shafer)证据推理方法[5]。D?S是当今数据融合中比较流行的一种方法,它是通过证据集的累积来缩小假设,首先将证据集合划分为两个以上不相关的小集合,并利用它们分别对目标区域进行独立判断,然后用特有的Dempster组合进行规划,最终将它们组合起来做出最终的判断。其特点就是利用多角度多方面的证据来产生一个综合信任度来判断问题,这样使人们判断问题更理性、可靠。在传感器网络中,每个传感器就被假设为一个证据体。多个传感器数据融合,实质上就是在同一判断条件下,利用Dempster组合规则将各个证据体合并成一个全新的证据体,而这个证据体产生的过程就是D?S数据融合过程。但是D?S数据融合也有着自身的缺点,主要是数据融合建立在逻辑推理的前提下进行的。同时,多路传感器所收集到的证据集也会随着传感器受到外界工作的影响而非定向漂移,产生信息误差。
3 D?S在监控系统中的应用
3.1 D?S证据理论
D?S理论中最基本的概念是建立证据框架(Frame of Discernment),并记为[θ],与贝叶斯公式对[θ]内的元素采用事件?概率的计算过程不同,它引入了命题?信任度的概念,并认为一个事件与其对立事件的信任度之和可以小于1。在证据理论中,[θ]内元素互不相容,对于框架内的基本命题X满足如下公式:
[m?=0X?2θm(X)=1] (2)
式中,[m(X)]称为命题X的基本概率赋值或质量函数,它是[θ]的集合[2θ]到[0,1]上的映射,即[m:2θ→[0,1]],同时X也成为[θ]内的一个焦元。[m(X)]表示对命题X的支持程度,显然对于空集[?]的支持程度为0,对于[θ]的全部子集的支持程度为1,从这点可看出,对命题X的赋值与计算X出现的概率方法相同。证据理论中第二个公式为:
[Bel?=0Bel(θ)=1Bel(X)=Y?Xm(Y)] (3)
式(3)中,同样[?X?θ],称Bel(X)为命题X的总信任度,由此基本概率赋值函数又可以推导为:
[m(X)=Y?X(-1)X-YBel(Y)] (4)
证据理论中的第三个公式:
[Pl(X)=1-Bel(X)Pl(X)=X?Y≠?m(Y)] (5)
式中,[Pl(X)]为命题X的似真度,似真度函数与信任度函数表示的是同样的意义,即当发送命题命题X时,[Pl(X)]为0,接收命题X时,[Pl(X)]为1,同时由式(5)还可以得到[Bel(X)≤Pl(X)],这样信任度函数与似真度函数可以用图2表示。
区间[[0,Bel(X)]]定义为支持命题X的证据区间,[Bel(X)]为证据区间的上限;区间[[0,Pl(X)]]定义为命题X的似真区间,同样,[Pl(X)]为似真区间的上限,同时它也是拒绝区间[[Pl(X),1]]的下限;区间[[Bel(X),Pl(X)]]为信任度区间或者中性证据区间,此区间表示对命题X的态度为既不支持也不反对。信任度区间是证据理论中讨论性最强的一个区间:
(1) [[Bel(X),Pl(X)]]=1时,表示在[[0,1]]整个区间上均为信任度区间,命题X中包含的信息没有任何利用价值;
(2) [[Bel(X),Pl(X)]]=0时,表示D?S证据理论与贝叶斯估计算法相一致,即[Bel(X)=Pl(X)=P(X)],其中[P(X)]表示命题X的概率;
(3) [Bel(X)=Pl(X)=0]时,表示对命题X全然不支持;
(4) [Bel(X)=Pl(X)=1]时,表示这个区间为命题X的支持区间,此时的支持程度最大。
由证据理论式(2)、式(3)、式(5)可以推导得:
[Bel(X)+Bel(X)≤1] (6)
[Pl(X)+Pl(X)≥1] (7)
式(6)、式(7)说明接收与拒绝命题X的信任度之和可以小于1,似真度之和可以大于1。
3.2 Dempster组合规则
D?S证据理论定义了组合来自多个信息源信息的相关规则,其中组合来自两个信息源的组合规则可以表示为:假设[Bel1]和[Bel2]是来自同一个证据框架[θ]上的两个信任度函数,基本概率赋值分别为[m1]和[m2],相应的命题组(焦元)为[X1,X2,…,Xk]和[Y1,Y2,…,Yk],则两个命题组合成后的信任度函数[Bel],如式(8)所示。
[m(Z)=Xi?Yj=Zm1(Xi)m2(Yj)1-K, ?Z?θ, Z≠?0, Z=? ] (8)
式中,假设[K=Xi?Yjm1(Xi)m2(Yj)],[K<1],[i=1,2,…,k]且[j=1,2,…,k]。式(8)中,[0≤K<1]时m(Z)可以确定一个基本概率分配,这时[Bel]是[Bel1]和[Bel2]的正交和,记作[Bel1⊕Bel2],称为命题组的信任函数组合;[K=1]时则认为[m1]和[m2]发生冲突无法进行组合,那么式(8)称为Dempster经典组合规则。
进一步,命题[Xi]和[Yj]的信任度区间记为[El(Xi)=[Bel(Xi),Pl(Xi)]]和[El(Yj)=[Bel(Yj),Pl(Yj)]],那么[X1]和[Y1]组合后的证据区间为:
[El(Z1)=El(X1)⊕El(Y1)=[1-ξ(1-Bel(X1))(1-Bel(Y1),ξPl(Y1))]] (9)
式中,[ξ={1-[Bel(X1)Bel(Y1)Bel(X1)]Bel(Y1)}-1]。对于多个信任度的融合,融合后的基本概率分配为[m(Z)=m1⊕m2⊕…⊕mN],如下:
[m(Z)=?Xi=Zi=1Nmi(Xi)?Xi≠?i=1Nmi(Xi)] (10)
最后,需要一个决策性的准则来判断假设命题的真伪,或者说信任度或拟真值在哪一个范围是可以接受的、哪些需要拒绝等,从而给命题下定论。
3.3 监控系统的数据融合
机房监控系统需要对机房内的设备进行全天候不间断的监控,传感器工作过程中会受到各种噪声的干扰,这些噪声大多以高斯分布形式出现,虽然系统可以判别噪声并加以滤除,但还是会给数据融合的准确性带来一定误差。为了防止上述现象的发生,系统首先对传感器采集到的数据进行预处理,定义式(11)和式(12)两个式子作为环境变量归一化公式:
[cj′=cj-LvaljLvalj-min1≤j≤n cj] (11)
[cj″=cj-Hvaljmax1≤j≤n cj-Hvalj] (12)
式中:[cj′∈(-1,0)]为低于机房环境某一项正常值的归一化结果,如:机房内的环境温度;用[Lvalj]表示第j项环境参数正常范围的下限值;[min1≤j≤n cj]为第j类检测项最小值,有时可以根据实际情况对此项进行专家人为拟定;同理,[cj″∈(0,1)]为高于机房环境某一项正常值的归一化结果;[Hvalj]为表示第j项环境参数正常范围的上限值,[max1≤j≤n cj]为第j类检测项取最大值,同样可以根据实际情况对此项进行专家人为拟定。这样就可以将机房环境的各个因素划分在(-1,1)的范围内,当机房环境满足正常值时,归一化的结果为0,而当某一项环境参数低于或高于正常值时,结果就会在(-1,0)或(0,1)两个区间内。显然,当结果出现在这两个区间时都是非正常的情况,数据融合过程中总体的结果也会偏离正常值,最终产生监控系统报警并且采取使之向正常值变化的调控。但是,如果因噪声或其他因素的影响使传感器节点非正常发送数据而落在这两个区间时,调控就会失败。因此,系统在得到归一化的结果后,首先利用模糊数学的隶属度函数对归一化的结果与专家设定值进行比对,如下:
[ri=j=1nexp-cj-nj, j=1,2,…,n] (13)
式中:[ri]为机房环境第[i]项的相似度总和;[cj]为同类传感器中的一个得到的归一化结果;[nj]为专家设定的同类传感器中的一个比对数值。其次,在核心控制板设定数据融合阈值,进而判断模糊数学处理后的结果是否进一步采取数据融合的判断,这样不但提高了数据融合的准确性,加强了系统的可信度,同时也减少了核心板的运算量,控制系统的实时性更强。
4 智能判别
无线传感网中的每一个节点都承担获取传感信息、数据存储并发送、与其他节点通信的任务。每一个节点在传输过程中易受到高斯噪声的影响而产生漂移。实际上,每一个传感终节点都会被布置在环境相对较差的地方,如:将温湿度传感器节点安置在工作中的交换机、路由器周围,那里温度较高且电磁干扰强,噪声大。因此,传感器节点易受到软、硬件的损失而导致系统产生错误甚至崩溃,其中产生错误传感信息(较传感获取值严重偏大或偏低)并发送给核心控制板是最为隐蔽,同时也是损失较大的一种错误,它会扰乱后续的调节处理步骤,给机房监控带来严重后果。为了解决这一问题,系统在加入模糊数学的同时也设置了轮回方式的网络自询问,实现网络节点的智能判别过程。
在轮回方式网络自询问的过程中,每一个在无线网络中coordinator节点附近的若干个终端节点将组成一个虚拟小网络,coordinator节点和终端节点是ZigBee无线网络中的典型节点。在这个小网络中,共由9个节点组成,如图3所示。
由图3可知,一个节点向周围节点发送一致性检测的信息,通过周围节点的反馈结果来确定周围节点的健康情况。在这个网络中的节点不论coordinator节点还是终端节点其通信地位都是平等的,因此第一个发送检测信息的节点从其ID号最低的开始,依次轮回到小网络中ID号最高的节点。发送的检测信息包括检测软件与硬件的相关内容,这些内容可以根据用户的要求进行定义。当其他节点完成一致性检测后它将发送一个回答信息,最初发送的节点将收集这些信息以确定周围节点的健康情况。在整个智能判别的网络中,每一个节点都有一个健康阈值[wk],它是指小网络检测一轮后各个节点健康信息总和。当这个节点的健康信息不小于健康阈值时,它将被判定为正常节点,否则定义为错误节点,整个网络将舍弃该节点的任何信息。图3中,各个节点的健康阈值定义为2,当健康信息总和为1时,将被定义为错误节点。经过无线通信网络自主智能判别后,网络会自动滤除错误节点,使网络信息的可信度大大提高。
5 结 语
综上所述,机房监控系统选用D?S融合算法作为数据融合的主要手段,为了克服D?S数据融合应用在本监控系统中的不足,首先根据机房环境的实际情况确定最准确的隶属度函数,对收集到的数据进行模糊数学处理,然后将处理后的数据集作为多方面证据融合出机房环境监控的最佳监控结果,实现机房高效监控、科学调控的目的。
参考文献
[1] 刘晓宁.ZigBee无线传感器网络在监控系统中的研究与应用[D].济南:山东大学,2007.
[2] 宁永生.智能控制技术在中央空调监控系统中的应用研究[D].重庆:重庆大学,2004.
[3] 王蕴红,谭铁牛,朱勇.基于奇异值分解和数据融合的脸像鉴别[J].计算机学报,2000,23(6):649?653.
[4] 张弘强,邓振生,苏心雨.基于Linux和Qt4便携式医疗仪器的开发方法[J].北京生物医学工程,2011,30(2):191?194.
[5] JOHNSTON M S, ROSENTHAL K L, SHOFER F S. Assessment of a point?of?care biochemical analyzer and comparison with a commercial laboratory for the measurement of total protein and albumin concentrations in psittacines [J]. American journal of veterinary research, 2007, 68(12): 15?27.
[6] 刘小杰,杜永清,张鹤平,等.基于LabVIEW与PLC的烧嘴试验台测控系统设计[J].火箭推进,2015(3):108?112.
[7] 朱舒扬.全尺寸超燃冲压发动机推力测量台架研制[J].火箭推进,2015(5):106?110.