浅谈传感器网络中的数据聚合技术

2020-09-04程文静

科学与信息化 2020年21期

关键词：节能

摘要由于传感器网络的能量受限，因此数据聚合问题是一个研究的重点，其主要目标是以节能的方式收集和聚合数据，从而提高网络的生存期。本文综述了无线传感器网络中的两种数据聚合算法，并讨论了它们的优势和局限性。

关键词传感器网络;数据聚合;节能

引言

无线传感器网络被广泛应用于军事监控、设施监控和环境监测等领域。通常，无线传感器网络具有大量的传感器节点，这些节点之间能够相互协调，相互通信，也能够与外部汇聚节点或基站通信。传感器周期性地感知数据，对其进行处理并将其发送到基站。报告数据的频率和报告数据的传感器的数量通常取决于具体的应用。

数据采集被定义为从多个传感器中系统地收集感测数据，并最终发送到基站进行处理。由于传感器节点的能量受限，而且在相邻传感器生成的数据通常是冗余和高度相关的，因此把所有传感器数据直接传输到基站的效率很低。因此，我们需要在传感器本地或中间节点处将数据进行聚合，从而形成高质量的信息，这样可以减少发送到基站的数据包数量，从而节省能量和带宽。这可以通过数据聚合来实现。数据聚合尝试将来自多个传感器的数据融合起来，以消除冗余传输，并将融合后的信息传递给基站，同时尽量将数据延迟降到最低。数据延迟问题在许多应用程序中非常重要，例如在环境监测应用中，数据的新鲜度也是一个重要因素。开发高效节能的数据聚合算法以提高网络生存期是至关重要的。

网络生存期、数据准确性和延迟程度是数据聚合算法的一些重要性能度量。网络生存期定义为直到网络中α%的传感器死亡时，数据聚合的轮次数，其中α由系统设计者指定。例如，在一个应用中，所有节点需要一起工作，生存期就被定义为第一个传感器耗尽其能量之前查询执行的轮次数。针对这样的应用，其设计的主要思想是通过执行数据聚合使得网络中各个节点有统一的能量消耗。网络数据精度的定义取决于传感器网络针对的具体应用。例如，在目标定位问题中，接收端对目标位置的估计决定了数据的准确性。延迟程度被定义为数据传输、路由和数据聚合所导致的延迟。它可以通过在源节点生成数据和在汇聚节点端接收到数据包之间的时间间隔来衡量。

近年来，人们对无线传感器网络中的数据聚合进行了大量的研究。本文对其中几种数据聚合算法进行了综述，介绍了其基本功能和不同的特点，讨论了它们的性能，并与其他类似方法进行了比较。在此根据数据聚合所涉及的网络体系结构对不同的数据聚合协议进行了分类。

1平面网络

在平面网络中，每个传感器节点扮演相同的角色，并配备大致相同功率的电池。在这种网络中，数据聚合是通过以数据为中心的路由来实现的，其中汇聚节点通常通过泛洪向所有传感器发送查询消息，并且具有与查询匹配的数据的传感器将响应消息发送回汇聚节点。接下来描述两种协议，并介绍它们各自的优点和局限性。

1.1 推送-扩散方案

在推送-扩散方案中，源节点是活跃的参与者，当汇聚节点对源做出响应时启动扩散。当源节点检测到一个事件时，会将数据进行泛洪式扩散，最终被汇聚节点获得。通过协商获得信息的传感器协议（SPIN）[1]就是一种基于推送的扩散协议。SPIN的两个主要特征是协商和资源自适应。为了成功地进行数据协商，传感器节点需要一个描述符来简洁地描述其观测数据。这些描述符在SPIN中定义为元数据。元数据的格式是根据应用程序特定的。例如，在区域覆盖问题中，覆盖不相交区域的传感器可以使用其唯一ID作为元数据。

当一个节点采集了新数据，其作为发起节点使用元数据向网络中的相邻节点播发数据。对这种数据感兴趣的相邻节点向发起节点发送数据请求。发起方节点响应并将数据发送到汇聚节点。每个节点都有一个资源管理器，用于监测其能源使用情况。每个节点在数据传输前要了解其电池电量。这使得传感器在能量不足时可以减少某些任务。模拟结果表明，在一段时间内，使用SPIN传输的数据量与泛洪方式几乎相同。然而，SPIN带来的能量消耗减少了3.5倍，并且与泛洪相比，SPIN能够利用每单位能量多传输60%的数据量。SPIN的一个主要优点是拓扑变化是局部的，因为每个节点只需要知道它的单跳邻居。SPIN的主要缺点是无法保证数据的传输。例如，在入侵检测应用中，如果对数据感兴趣的节点离源节点较远，而中间节点对数据不感兴趣，则数据不会传递到汇聚节点。

1.2 两阶段拉扩散

定向扩散是两阶段拉扩散的一种典型方法，它也是一种以数据为中心的路由方案。汇聚节点最初在网络中通过发送兴趣消息发出查询任务。如果源节点生成的数据的属性与查询兴趣匹配，则设置一个梯度来标识传感器节点生成的数据。梯度指定数据扩散速率和发送数据的方向。中间节点能够缓存和转换数据。每个节点维护一个数据缓存，该缓存记录了最近被看到的数据项。当汇聚节点接收到低数据速率事件后，它加强一个特定的临节点以获得较大的数据率。因此，定向扩散是通过利用数据驱动的局部规则来实现的。

每个节点的平均能耗和延迟率被用作性能度量指标。仿真结果表明，定向扩散比全知多播方案具有更高的能量效率。在全知多播方案中，每個节点沿着最短路径多播树向所有汇聚节点发送数据。定向扩散的平均能耗仅为全知多播方案的60%，而二者的平均延迟率相差无几。定向扩散适用于源节点较多而汇聚节点较少的网络。在定向扩散中，不必像SPIN那样维护全局网络拓扑。然而，定向扩散并不适用于需要连续数据传输到汇聚节点的应用。

2层次网络

平面网络会导致汇聚节点的通信和计算负担过重，从而导致其电池电量的更快耗尽。汇聚节点的死亡会破坏网络的功能。因此，从可扩展性和能源效率的角度出发，提出了几种层次化的数据聚合方法。分层数据聚合涉及在特定节点上的数据融合，这减少了发送到汇聚节点的消息数量，提高了网络的能源效率。接下来介绍一种基于簇的分层数据聚合协议，并说明它们的主要优点和局限性。

在大规模且能量受限的传感器网络中，传感器直接将数据传输到汇聚节点的效率很低。在这种情况下，传感器可以将数据传输到本地聚合器或簇头，后者会将集群中所有传感器的数据聚合后并将结果传输到汇聚节点，这就节省了大量的能量。簇头可以通过远程传输或通过其他簇头的多跳直接与汇聚节点通信。接下来介绍两种基于簇的网络组织和数据聚合协议，即低功耗自适应集簇分层型协议LEACH和使用固定簇半径的分簇协议HEED[2]。

LEACH协议是分布式的，传感器节点将自组成簇进行数据聚合。每个簇中的指定节点（簇头）将簇中多个传感器的聚合数据传输到汇聚节点。这会减少传输到汇聚节点的信息量。LEACH适用于涉及持续监控和定期数据报告的应用。它的两个主要阶段包括建立簇阶段和稳态阶段。在建立簇阶段将整个网络组织成簇并选择簇头。在稳态阶段会在簇头周期性地进行数据聚合并将数据传输到汇聚节点。簇头的确定方式是以循环的方式随机选择的，这样能将整个网络的能量负载平均分配到每个传感器节点中，从而达到降低网络能源消耗和提高网络整体生存期的目的。

HEED的主要目标是形成有效的集群以最大限度地延长网络寿命。HEED假设在传感器节点上有多个功率级。簇头选择基于主次两个参数，其中主参数为每个节点的剩余能量，具有较多剩余能量的节点具有较高的概率成为临时簇头;次参数依赖于节点邻近度或节点密度。对于处于多个簇覆盖范围内的成员节点则根据次参数AMRP来选择最终的簇加入。AMRP是集群范围内所有节点到达簇头所需的最小功率水平的平均值，其提供了通信成本的估计值。

HEED没有考虑簇间通信，将HEED的性能与广义LEACH（gen-LEACH）进行了比较。仿真结果表明，HEED协议比gen-LEACH协议提高了网络生存时间。在gen-LEACH中，簇头的选择是随机的，这可能导致某些节点的快速死亡。然而，在HEED中，簇头的选择使得它们以最小的通信开销均匀分布。此外，与gen-LEACH相比，HEED在簇内部消耗的能量更少。这是由于gen-LEACH需要在簇内部广播各节点的剩余能量。总之，HEED延长了网络生命周期，从地理位置上较好地实现了簇头的均匀分布。

参考文献

[1] Kulik J，Heinzelman W，Balakrishnan H . Negotiation-Based Protocols for Disseminating Information in Wireless Sensor Networks[J]. Wirel. Netw，2002，8（3）：169-185.

[2] Heinzelman Application-specific protocol architectures for wireless networks[J].PhD Thesis，Massachusetts Institute of Technology，2010（6）：109.

作者簡介

程文静（1983-），女，河南新乡人;职称：讲师，现就职单位：郑州航空工业管理学院，研究方向：数据知识工程。