APP下载

移动物资中的RFID数据清洗技术

2019-07-29占晖

无线互联科技 2019年9期

占晖

摘   要:RFID设备采集原始数据直接应用于上层系统,会造成系统业务逻辑设计困难,也会对系统资源造成浪费。针对此问题,文章对RFID数据传输于上层应用时的流数据进行清洗,处理其中存在的数据冗余问题,为上层应用提供高效、可靠的源数据。

关键词:RFID;数据冗余;数据清洗

射频识别(Radio Frequency IDentification,RFID)技术作为物联网的关键技术之一,被广泛用于物资识别、物资监控、物资追踪等领域[1]。RFID技术通过阅读器识别黏附于物体表面的标签感知物体,将其行为转换为数据支持各类服务及应用程序。当数据转化为服务时,由于数据处于复杂、动态、易变的环境中,若直接将采集的流数据应用会产生系统业务逻辑设计困难,也会对系统资源造成浪费。

1    RFID原理

RFID系统一般包含阅读器、标签及后台服务系统。RFID系统工作时,阅读器周期性发出载波信号,标签在阅读器的载波信号覆盖区内域,RFID0标签通过耦合元件被激活,从中获取能量后通过自身天线将标签的编码等信息发送。阅读器通过解码电子标签传输的信号,识别标签数据传输到后台服务系统,后台监控系统对传输的信息进行处理并应用于各种服务[2]。

2    冗余数据清洗技术

RFID数据是具有顺序性、连续性的大量有序流数据,语义丰富,但在阅读器读取并传输数据中,既包含黏附于物体表面的有用数据,也包含大量因数据重复、标签失效、标签多读等带来的冗余数据[3]。清理无效数据,压缩冗余数据,对RFID系统减小数据传输误差、节约通信能源具有非常重大的意义。

阅读器对范围内的标签进行周期性扫描,在一个阅读周期内,标签会被阅读器识别一次。以主动式RFID系统为例,标签在进行识别时,首先需要根据其标签传输的信息格式判断是否会被阅读器识别。以有源标签为例,标签未被激活时,标签数据格式为“00X…X”,激活后传输数据格式将为“0EX…X”。如果阅读器多次处于同一位置,状态并未发生改变,将一直传输相同的数据,这样将产生大量的冗余数据。对于此类冗余数据,一般采取的措施是在一段时间内统计若干次数据,但只传输一次有效数据,同時,比对标签本次传输媒介状态与上次传输状态差异性,如果存在状态不一致,就将不一致状态进行传输。

本文讨论了对冗余数据的处理算法。对于数据流中的数据,首先,根据标签编码格式确认标签是否为可识别标签,不符合要求的标签直接剔除。其次,根据历史读数判断标签状态是否发生变化,以判断标签是否冗余。对其中状态不变的数据只更新标签存在时间,不更新标签状态。对于状态发生变化的标签,更新其标签状态,并为前一状态更新状态结束时间,为新状态增加状态开始时间。RFID冗余数据清洗算法伪代码算法如表1所示。

3    实验

3.1  实验模型及实验定义

阅读器在读取标签时,按照距离读取概率不同,一般在主检测区域标签读取概率高达90%以上,次检测区域随着距离变化而使标签读取概率逐渐下降,标签读取概率如图1所示。

根据数据清洗的内容,定义以下数据清洗指标。

数据压缩率:一段时间原始数据与有效数据的比值,公式如下:

原始数据(RawData):在一个阅读周期直接捕获的标签数据。

有效数据(EffectiveData):当标签的感应状态发生改变时,获取的数据才为有效数据。如图2所示,标签在一段时间窗口内确认一次数据,其余数据均为冗余数据。

3.2实验结果

在阅读器周围0~20 m内随机均匀放置10个已经激活的RFID标签,沿着阅读器的中轴移动,随机速度进行运动,每100个阅读周期由运动状态切换到静止状态,标签由运动到静止再由静止到运动的速度均为2 m/s,并同时改变主要检测区域的百分比,即主区百分比数值从0变化到1。采用冗余数据清洗算法清洗数据,选取时间窗口为3 s,5 s,7 s,比较不同窗口内的标签经过清洗后平均错误率,实验参数设置如表2所示。

冗余数据清洗实验结果如图2所示。随着时间窗口的增加,压缩率较小增长,基本保持不变。时间窗口的个数与压缩率无关,总时间窗口越大,压缩率越高,清洗后的数据更加高效。

4    结语

在RFID应用系统中应用冗余数据清洗算法,通过判断标签格式、去除媒介状态重复的标签数据,可有效降低数据的冗余性,提高数据的利用率。

[参考文献]

[1]蒋皓石,张成,林嘉宇.无线射频识别技术及其应用和发展趋势[J].电子技术应用,2005(5):1-4.

[2]谷峪,李晓静,吕雁飞,等.基于RFID应用的综合性数据清洗策略[J].东北大学学报(自然科学版),2009(1):34-37.

[3]柴文超,汤洪涛,吴光华.面向仓储的RFID数据清洗技术研究[J].机电工程,2017(12):1474-1479.

Abstract:The RFID device collects the original data and directly applies it to the upper layer system, which will cause difficulty in designing the system business logic and waste the system resources. To solve this problem, this paper cleans the stream data when the RFID data is transmitted to the upper layer, processes the data redundancy problem, and provides efficient and reliable source data for the upper layer application.

Key words:RFID; data redundancy; data cleaning