APP下载

面向智慧小区的环境监测与控制研究

2022-06-28豪,张

软件导刊 2022年6期
关键词:冲突证据决策

王 豪,张 珣

(杭州电子科技大学电子信息学院,浙江杭州 310018)

0 引言

人与自然环境相互依存,相互影响。在不断追寻更加舒适的生存环境的道路上,人类付出了极大努力。从原始的观察自然、记录环境变化等方式,到如今利用科技手段进行环境指标监测,都是在采集与分析环境数据,以求掌握自然环境变化规律,由此建立预防、预警措施并提出环境治理相关对策,最终达到人与自然和谐共融的目的。

近年来,数据融合技术被广泛应用于军事和民事工程等领域[1-2]。随着我国信息化建设的不断推进,多数据融合技术也开始被运用于环境数据融合中。改善小区环境作为智慧社区建设的重要组成部分,是智慧社区发展的必然要求,也是智慧社区的重要基础。基于多数据融合技术对小区环境状况进行研究,不仅有助于对小区环境的精准掌控,而且能够为小区环境的改善提供科学指导。

以往对智慧社区环境监测系统的研究往往忽略了复杂环境因子对决策控制的影响,仅使用单一传感器采集的环境数据判断某一环境状况,可能导致对整个环境状况的误判,最终使决策结果差强人意。如陆珂琳[3]侧重于运用物联网技术采集和展示环境数据,并没有将单个环境数据充分利用起来,也没有通过这些数据指导小区建设,因此无法适应未来智慧社区的建设要求。对于多源数据的融合办法,任倩等[4]侧重于多源数据采集以及系统架构模型建立,没有为数据融合提供具体的可行方法,也没有结合多种测量数据;向朝兴等[5]则使用模糊理论的方法处理多源数据,由于该方法的特点是将人的主观判断用数量形式进行表达与处理,所以具有一定的主观局限性。

综合上述研究,本文以经典的非概率融合算法为基础,将传统的D-S 证据理论引入到小区环境状况决策中,通过对冲突因子的优化与改进,有效解决了证据间的高冲突问题,在提高决策准确性的同时,也使得系统具有更强的适应能力。另外,针对会造成监测数据偏差的一些非可控干扰因素,谢苗苗等[6]提出箱线图的方法处理原始数据,但这种方法仅针对室内环境数据的处理效果显著,而对于小区的大面积环境,则需要依靠更多组数据作为参照。因此,本文使用群体支持度的方式对数据进行预处理操作,通过对多组实验数据支持度的计算,选取符合实际环境状况的有效数据。该方法充分利用了小区的环境特点,增强了数据可靠性。

1 小区环境监测与控制总体设计

1.1 系统总体架构

本系统软件部分总体架构采用B/S(浏览器/服务器)模式,相较于传统的C/S(客户端、服务器)模式,既节省了客户端资源,又方便了用户,不需要下载专用的客户端程序。系统软件浏览器端使用HTML 和基于JavaScript 的easyUI 前端技术框架进行页面设计与开发。后端服务器使用基于Java 的springboot 微服务框架进行开发,并使用MyBatis 技术操作数据库,以及使用Ajax 技术局部响应前端请求,实现数据管理与后台控制。

系统硬件部分共包含5 类传感器,分别用来采集小区的温度、湿度、PM2.5、风速和噪声等环境数据,然后利用这些数据,结合改进的D-S 证据理论算法,构建出小区环境的智能决策模型,从而可利用模型判断得出不同实时环境参数状况下的决策结果,最后通过无线网络将控制指令发送到相关设备,实现对设备的智能控制。其中,控制指令先由服务器通过因特网发送到路由器,再由路由器转发到对应的智能网关,最后由网关下达指令到设备。小区居民可通过智能手机或电脑端浏览器登录服务器,实时查询环境参数和决策结果,小区管理者也可根据实时环境信息手动调控相应的环境控制设备[4]。系统总体架构如图1所示。

Fig.1 System overall architecture图1 系统总体架构

1.2 通信方式选择

传感器及控制设备与智能网关之间的通信可分为两大类:一类是无线通信方式,例如蓝牙、ZigBee、NB-IOT等;另一类是有线通信方式,例如485 总线等。本文选用电力线载波通信(PLC -Internet of Things),其是一种以电力输电线为传输介质的通信方式[7]。与传统的无线通信方式相比,PLC 更加稳定。一方面由于蓝牙和ZigBee 的传输距离有限,并不适合小区环境数据的传输;另一方面NB-IOT 作为远距离的无线通信方式,依赖于通信运营商的基站,且实时性较差,因此也难以适应智慧小区的实际要求。相比于485总线,PLC 仅由一组零火线便完成了485总线两组线才能完成的功能,即设备供电和数据传输。另外,相比PLC 直接使用的通用电力输电线,485 总线需要采用变压器对家用电进行转换后才能为设备供电,因此PLC布线更加简单、便捷。

PLC 技术包含多种编解码方式,其中常见的有扩频、OFDM(Orthogonal Frequency Division Multiplexing)正交频分复用和多维网格编码等[8]。其基本工作原理是在电力输电线中加入高频载波信号,由输电线作为载体运输信息,并在接收端进行解析。PLC 的缺点是当连接设备较多时,设备之间的干扰很大,尤其是在近距离使用时。但对于小区环境监测数据传输和设备控制指令下发,PLC 仍是比较可靠的,原因是各设备间的距离不会太近。另外使用OFDM 技术可有效避免交流电力线上较多的低频干扰,使得PLC 能够适应较远距离的信息传输。

2 小区环境数据融合算法分析

2.1 D-S证据理论

D-S 证据理论(Dempster-Shafer Envidence Theory)是一种处理不确定性问题的完整理论,在强调事物客观性的同时,也强调了人类对事物估计的主观性[9]。与传统的概率论方法相比,其优势在于利用“区间估计”代替“点估计”来表示事物之间的关系。因此,D-S 证据理论在对不明确事物的处理决策上比传统概率统计更有说服力。

D-S 证据理论通常包含4 个概念,分别为识别框架、基本概率分配函数、信任度函数和似然函数。其中,识别框架是D-S 证据理论的基础,通常定义集合Θ={δ1,δ2,δ3,...δn}作为识别框架,其是一个包含事件所有可能性的集合,而识别框架中的每一个元素代表着一个事件的最终结果。基本概率分配函数m(δi)表示证据对命题δi的信任程度,信任度函数表示证据对命题δi为真命题的信任程度,似然函数表示证据对命题δi的可疑程度。

其中,每个事件结果都与任何一个子集对应,也即是说幂集中必定存在某一事件的答案。幂集中的元共有2n个,对应识别框架中的n元素。

(2)基本概率分配函数。定义基本概率分配函数为m(δi),其表示证据对命题δi的信任程度,满足m(ϕ)=0 和。即对于空集ϕ,其信任度为0。则表示在识别框架中,n个证据的基本概率分配值之和为1。

(3)似然函数。定义似然函数为Pl(δi),代表命题δi为真命题的信任程度,其需要满足的条件是:Pl(δi)=(1 -Bel(δi))。其中,对于Pl(δi)>Bel(δi),一般把Bel(δi)称为对命题δi信任程度的上限,把Pl(δi)称为对命题δi信任程度的下限。[Bel(δi),Pl(δi)]代表对命题δi的不确定区间。

(4)信任度函数。若识别框架Θ 中的元素是集合,则必定存在δj<δi<Θ 在幂集中,其中δj是δi的子集,对δj的信任度等于δj集合里全部命题的信任度总和。

定义信任度函数为Bel(δi),且δi上的所有子集δj存在,同时符合δj<δi<Θ,则信任度函数满足:Bel(δi)=。对于识别框架内的元素,若m(δi)>0,则称δi为信任度函数的焦元。

(5)合成规则。由于多种环境因子都可能对环境质量造成不同的影响,所以在实际情况中要使用多种类型的传感器测量出多种环境数据,然后利用这些不同种类的信息合成不同的基本概率分配函数,最终得到新的决策输出。假设在识别框架Θ 下有两个不同的基本概率分配函数m1、m2,其对应的信任度函数分别为Bel1、Bel2,对应的焦元分别为A、B。如果A∩B=X,则利用合成规则可得式(2):

其中,k为冲突因子,并且满足k-1=。冲突因子k反映两个证据之间的冲突程度,k值越大,证据间的冲突越强烈。

2.2 D-S证据理论的不足

传统D-S 证据理论主要依靠信任度函数计算,相较于传统的概率论方法,其对于应对复杂情况下的融合更具优势。但是,一般的D-S证据理论算法仍然存在缺陷:

(1)证据的高度冲突问题。D-S 证据理论无法解决证据冲突严重和完全冲突的情况,冲突因子k越大,越容易造成证据高度冲突的问题,最终导致融合结果与实际情况不符。

(2)基本概率分配值偏差问题。基本概率分配值是融合处理的关键要素,直接影响到最终的融合结果,因此基本概率分配值的选取十分重要。基本概率分配值的选取方法也有多种,通常会根据不同应用背景选择适合的基本概率分配值。以文献[10]为例,基本概率分配值依靠主观经验获取,这样很容易导致结果产生偏差。

(3)鲁棒性差。由于基本概率分配值对后续合成结果有很大影响,对基本概率分配函数的些许变动,都可能造成融合结果出现较大偏差,因此传统的D-S 证据理论算法不具有普适性。

2.3 D-S证据理论改进

传统的D-S 证据理论在进行证据合成时,冲突因子k仅代表存在冲突的焦元之间的冲突程度,而忽略了证据间距离与冲突的关系。所以当k值较大时,证据之间的冲突也较大。此时,若使用传统D-S 证据理论算法对数据进行融合操作,很可能会产生有悖于实际情况的融合结果,进而导致决策出错。

证据间距离作为衡量证据之间信息相似度的指标,能够较准确地描述各证据间的支持程度[11]。因此,为解决证据之间由于高冲突所带来的合成结果错误问题,考虑利用可改进证据间距离的计算方式对传统D-S 证据理论进行改进[12-13]。

具体改进措施主要包括两个方面:一是使用巴氏距离计算方式作为证据间距离的计算方法。在统计学中,巴氏距离通常被用于测量两个样本的相似性,其具备对称性。证据ai与aj之间的巴氏距离可表示为式(3):

其中,BC(ai,aj)=为巴氏系数,当巴氏系数趋近于0 时,两证据间距离dBPA(ai,aj)趋近于正无穷大,此时证据ai与其他证据之间的距离总和趋近于无穷大。

二是利用新的证据距离改进原始的冲突因子k,通过其之间的互补,形成新的冲突因子k’,如式(4)所示:

新的冲突系数k’充分结合了原始冲突因子k和证据距离。只有在两者都为0 的情况下,才表示两证据间没有冲突;只有在两者都较大的情况下,才能说明证据间的冲突较大。该方法有效解决了在传统D-S 证据理论合成规则中因证据间冲突引起较大误差的问题。

3 小区环境数据融合模型构建与实现

3.1 模型构建流程

为使小区的环境监测结果更加准确,在收集到传感器直接检测到的数据后,首先需要对这些原始数据进行预处理操作。这里采用群体支持度方法对采集到的原始数据作有效性判断,从而剔除无效的异常数据,仅保留有效数据作进一步融合操作;然后对同类型的传感器数据使用自适应加权平均算法进行一级融合,得到一级融合值,再对一级融合结果作归一化处理;最后利用改进的D-S 证据理论进行决策级融合,得到对小区环境状况的整体判断。小区环境控制决策模型构建流程如图2所示。

Fig.2 Flow of building a community environment control decision model图2 小区环境控制决策模型构建流程

3.2 模型实现

3.2.1 数据预处理

在传感器测量环境参数的过程中,不仅会受到传感器自身灵敏度或准确性的影响,而且会受到特殊位置或特定环境的影响,这些客观条件都可能使测量结果出现偏差[14],甚至在后面的融合计算中不断放大误差,最终导致完全相反的错误决策出现。因此,为避免无效的异常数据对实验结果造成影响,对原始的采集数据进行预处理操作是十分必要的[15]。

本文利用群体支持度思想判断采集的数据是否为有效数据,群体支持度的核心是通过数据间的联系得出其对彼此的支持度。具体而言,利用多个同类分别对其中某一个传感器节点计算支持度,当总支持度越大,则证明其与大多数传感器节点测量值越接近,此时该节点的测量数据为有效数据的可能性越大;反之,说明该节点的测量数据为无效数据的可能性越大,应予以剔除。

为更加直观地体现不同采集数据之间的支持度,使用支持度函数来量化这一概念。设支持度函数为sup(x,y),用来表示数据y对数据x的支持程度。通常选用指数衰减型函数作为支持度函数,如式(5)所示:

其中,β为衰减因子,该值越大,支持度函数衰减速度越快,所以可通过调节衰减因子的方式改变支持度函数的衰减幅度。两个相同类型传感器的测量数据越接近,其支持度函数值则越大。因此,该支持度函数可较好地反映传感器测量数据的准确性。

假设在监测区域内采集温度的传感器节点有n个,在一定时间段内共采集到m个环境数据,得到支持度矩阵。则其他传感器节点对传感器节点ai的综合支持度为si=。

其中,si表示节点ai与同类型传感器节点测量值的接近程度,即si值越大,ai值为有效数据的可能性越大。因此,某时间段内该监测区域采集的温度数据经过预处理后的值为xi(t)(i=1,2,...,n)。同理,可得到某个时间段内该监测区域采集的湿度、PM2.5、风速和噪声数据经过预处理后的值分别为yi(t)(i=1,2,...,n)、zi(t)(i=1,2,...,n)、wi(t)(i=1,2,...,n)、vi(t)(i=1,2,...,n)。

3.2.2 数据一级融合

原始测量数据经过预处理操作后,按照不同的传感器类型进行划分,并采用自适应加权平均算法对有效数据进行一级融合[16-20]。自适应加权平均算法依靠自适应寻找方法找到不同类型传感器所对应的最优加权值,并在满足总均方误差最小的情况下,获得最优融合结果[21]。自适应加权平均算法模型如图3所示。

Fig.3 Adaptive weighted average algorithm model图3 自适应加权平均算法模型

由于不同位置的同类型传感器测量的环境数据也会存在差异,为了缩小差距,得到更加均衡的环境数据,首先使用最小均方误差理论找到不同位置传感器对应的权值,再将预处理后的数据与相应权值的乘积相加,得到一级融合结果。

其中,由于同类型传感器在小区的安装位置不同,且距离较远,可近似认为其之间相互独立,因此有E[(x-xi)(x-xj)]=0(i≠j)。均方误差可简化为式(7):

3.2.3 全局融合决策

经过一级融合后,可得出对小区各种环境状况的局部判断。为了使小区环境监测结果更加准确,还需要利用改进后的D-S证据理论进行决策级融合。

假设有识别框架Θ={δ1,δ2,δ3,δ4},经过一级融合后,得到各证据在识别框架下的基本概率分别为m1、m2、m3、m4、m5。首先利用式(8)计算原始的冲突因子k:

然后计算出该证据与其他证据之间的巴氏距离dBPA,并求出平均距离u1,如式(9)所示:

最后,将原始冲突因子k与证据距离dBPA相结合,取二者均值作为新的冲突因子,再利用D-S 证据理论合成规则计算出最终融合结果,如式(10)所示:

同理,可求出m(δ2)、m(δ3)、m(δ4)、m(δ5)的值。

3.2.4 实验结果分析

为了得到更加均衡的环境数据,实验选择在3 个不同区域安置5 类传感器,分别在小区的建筑附近、道路附近和绿植附近。实验每隔5min 采集一次传感器数据,在当天下午的6~7 点共采集1h 数据。表1 为经过预处理剔除无效数据后的测试环境数据。

Table 1 Test environment data表1 测试环境数据

假设识别框架Θ={δ1,δ2,δ3,δ4},其中,δ1代表无动作,δ2代表开启灌溉设备,δ3代表开启净化设备,δ4代表给居民发送环境情况提醒。经过融合计算后的结果对比如表2所示。

实验结果表明,两种融合结果的最终决策对应同一控制指令,结合实际环境数据和决策指令,可判断该决策结果是正确的。但是从融合结果来看,传统D-S 理论对δ1和δ4的融合结果十分相近,说明对该决策结论的支持度并不高,而改进D-S 理论的融合结果明显指向了δ1。因此,在冲突相对较高的情况下,改进的D-S 理论能更好地适应需求。

Table 2 Test environment fusion results表2 测试环境融合结果

4 结语

本文从智慧小区环境研究入手,提出适用于未来小区环境监测的方案和智能决策模型。系统整体利用物联网技术,结合计算机软件和云服务,实现了对环境状况的可视化操作和对设备的精准控制。其中,针对小区环境监测目标,重点分析了传统D-S 证据理论算法存在的缺陷,利用改进冲突因子的计算方法,实现了更精准的控制决策。经过分析比较,将群体支持度思想运用到初始测量数据预处理中,从而有效避免了无效值对决策结果的影响,进而利用加权自适应算法对同类型测量值进行一级融合,最后采用改进的D-S 证据理论算法得到决策级融合结果。经过实验验证,该模型可实现对小区环境的智慧决策和智能控制。然而,本文利用数据融合生成的控制决策,仅在传感器种类较少的情况下效果显著,而对更多类型测量证据的支持度有限。因此,未来智慧小区建设还有很长的路要走。

猜你喜欢

冲突证据决策
耶路撒冷爆发大规模冲突
为可持续决策提供依据
“三宜”“三不宜”化解师生冲突
决策为什么失误了
对于家庭暴力应当如何搜集证据
手上的证据
“大禹治水”有了新证据
手上的证据
“邻避冲突”的破解路径
一次冲突引发的思考和实践