APP下载

基于RFID 技术的图书编目自动查重系统设计

2021-01-16

现代电子技术 2021年2期
关键词:查重电子标签编目

彭 薇

(桂林电子科技大学 信息科技学院,广西 桂林 541004)

0 引 言

图书编目是图书馆管理图书的重要工作环节之一,在大多数图书馆中,图书馆的业务管理工作是从文献搜集开始的,以图书被采购到图书馆的时间节点为起点,相关的工作人员对采购的图书信息进行一一核对,并将采购的图书信息录入到图书馆的管理系统当中,并标注图书的基本信息[1]。然而图书馆的日常运行与管理存在流通管理繁杂、效率低下、图书储藏量大、盘点工作量繁重等问题,因此需要对图书馆中的所有图书进行编目处理,方便进行图书的管理与统计。

图书编目就是对图书馆中的所有图书以及文献资料进行分类,并编制成目录,建立馆藏目录体系的过程。然而由于图书馆中的图书数量较多,分类类型也较多,因此经常会出现重复编目的情况,导致图书的管理出现故障问题。因此在图书编目完成后需要对其进行查重处理。查重就是重复率的查询,将当前的图书编目结果与已有图书编目资源库中的数据比对,得出两者之间的相似比和重复率。图书编目的查重关系到分编工作的质量,可以避免出现同书异号的现象,从而保持图书信息的一致性。查重功能能够及时纠正编目过程中产生的错误,以免产生遗留问题。此外通过查重系统可以为新书的分类起到参考和辅助的作用。

现阶段图书编目的查重系统包括基于检索的查重系统、基于索引批量的查重系统等。然而上述传统的查重系统存在查重时间长、多次查重结果不相同等问题,对于过于简单的图书名称,查重检索时会出现多条重复数据,为图书编目的查重工作带来巨大的工作量[2]。为了解决上述传统图书编目自动查重系统存在的一系列问题,引入RFID 技术。RFID 技术也就是射频识别技术,通过阅读器与标签之间的非接触式数据通信,从而达到识别的目的。通过该技术的应用提升了图书馆的科学化管理程度,实现了图书自动分拣、排序的功能,同时也提升了图书编目的自动查重的精度和速度,进而有效地提升图书的流通与管理效率。

1 图书编目自动查重硬件系统设计

为了保证设计的图书编目自动查重系统功能的实现以及应用性能的提升,需要分别从硬件、数据库以及软件功能三个部分进行优化设计。其中,硬件部分就是在原硬件设备的基础上,为RFID 技术的运行提供硬件支持,同时也作为自动查重系统软件功能实现的硬件支持。在此次图书编目自动查重的硬件系统中需要安装的硬件设备包括RFID 读写标签、书籍阅读器以及网络通信设备,将网络通信设备安装在图书馆内,形成图书馆内部的局域网络,并将书架、传感器、RFID 读写标签以及书籍阅读器等设备接入到网络环境当中,实现图书编目数据信息的实时调取与传输。

1.1 RFID 读写标签

RFID 技术是以射频信号为载体进行双向通信并最终达到识别目标对象的一种识别技术,该技术在实现与运行的过程中不需要对目标对象产生接触,灯光实现对目标对象识别的自动化[3]。RFID 硬件设备按照不同的应用频率可以分为低频、高频、超高频以及微波等多种类型,其中,低频表示RFID 硬件设备的频率在135 kHz以下,射频波段高于13.56 MHz 的设备为高频设备,另外超高频RFID 设备和微波RFID 设备的频率分别为860~960 MHz 和2.4~5.8 GHz。除 了 上 述 分 类 方 式 之外,按照RFID 的能源供给方式可以将一个键设备分为无源RFID、有源RFID 和半有源RFID 三种类型,三种不同的能源供给方式对读/写的距离要求不同。然而无论哪种RFID 设备,其基本组成结构均包括电子标签、阅读器、天线、读/写应答设备等,在此次图书编目自动查重系统中选择的RFID 设备的组成结构如图1 所示。

图1 RFID 硬件组成结构图

其中,RFID 的电子标签模块也就是射频标签模块包括电子标签天线和射频芯片两个部分,具有唯一的电子标号,在射频芯片中可以存储大量的相关信息。电子标签天线是RFID 电子标签的应答器天线,属于一种通信感应天线。阅读器的作用是读取/写入标签信息,此次设计的查重系统中选择的阅读器为书籍阅读器,主要用来读取图书馆中的图书基本信息[4]。将RFID 硬件设备中的各个组成部分按照一定的规律连接在一起,保证该设备的正常运行,当电子标签进入到磁场范围后,书籍阅读器发出相应频段的射频信号,电子标签通过读写应答设备所发出信号造成的感应电流获得所需能量,并将获取结果发送并存储到电子芯片当中。当书籍阅读器获得电子标签内的信息后,进行解码,并以接收到的信息为基础进行解码应用。

1.2 网络通信设备

网络通信模块由服务器、RFID 设备以及无线传感器等设备组成。其中,系统网络的核心服务器是两台型号为IBMX3850M2 的服务器作为双机设备,通过配套的IBM SAN16B-2 存储交换机采用4 GB 光纤通道连接IBM DS4700 阵列组成全冗余网络结构[5]。另外还需要添加两台型号为IBM X3250M2 的服务器作为局域范围内的中间服务器,具体网络服务器的安装数量、型号以及参数的设置情况如表1 所示。

通过服务器的连接形成基础局域网络,分别将图书馆环境中的书架、RFID 等设备接入到该网络当中,规定网络传输协议和规则,得到可以正常运行的无线网络环境[6]。

2 图书编目自动查重系统数据库设计

针对图书编目自动查重系统的设计目的,选择的数据库主要倾向于实用性强、数据库与检测系统交互速度快且易于实现的数据库,因此选择的数据库平台为MySQL。图书编目自动查重系统的数据库管理整个图书编目的相关数据,并以数据库中的信息为基础作为判断当前编目是否重复的依据[7]。在此次设计的数据库中除了图书编目数据之外,还存储了不同图书编目数据对应的电子标签信息以及系统用户的基本信息等,因此系统数据库的逻辑结构如图2 所示。

表1 系统网络服务器安装设置数据表

图2 查重系统数据库逻辑关系图

以图书馆中的图书标签主句为例,设置图书编目标签的数据库存储列表,如表2 所示。同理可以根据数据库的类型将相应的数据信息按照对应的规则编写存储格式,并存储到数据库空间当中。

3 图书编目自动查重系统软件功能设计

以连接完成的硬件设备和数据库的基础上,通过编写相应的查重逻辑和程序代码,实现系统的图书编目自动查重软件功能。软件系统的自动查重功能应具有一次输入、多次使用的能力,应具备自动校验ISBN 号的能力,应具有先查主库、后查源库的能力,另外图书编目自动查重系统得出的查询结果需要具有自动排序和显示的处理能力[8]。结合软件功能的需求分析结果,确定软件系统的逻辑层次架构如图3 所示。

表2 图书编目标签存储列表

图3 图书编目自动查重软件模块架构

3.1 确定图书编目查重的工作内容

图书编目的自动查重工作需要以图书的编目工作为基础,具体的图书编目工作流程如图4 所示。

图4 图书编目流程图

按照图4 中的编目流程,使用书名或ISBN 号检索图书积累,使用硬件设备激活系统的RFID 电子标签,并形成图书的RFID 电子标号作为识别码[9]。系统自动产生对应的数据存储编号,再编制分类号,最终得出完整的图书编目信息。

3.2 RFID 标识的加工处理

在控制书籍阅读器向电子标签中写入数据时,必须要先对电子标签内的数据存储空间进行初始化,放置存储空间中原有数据对写入图书编目数据的干扰。向RFID 电子标签发送一个初始化数据帧,电子标签接收后对其中的存储空间做清空处理[10]。这些将RFID 电子标签中的存储空间划分为保留区、TID 分区和EPC 分区。根据RFID 模块中的读/写器接收信号强度,通过式(1)计算出电子标签和读写器之间的距离。

式中:d 和d0分别为RFID 读写天线的距离和参考距离;n 为环境参数,该参数的取值与图书馆的实际情况以及内部的布局因素有关;Xσ为标准偏差为σ 的高斯随机噪声变量;PL( d )以及PL( d0)表示距离读写器d 和d0位置上的信号强度。通过式(1)的计算可以实现图书的远距离定位和识别,接着利用阅读器、天线和无线网络将图书编目的有关信息传输到电子标签中,并写入到对应的存储分区空间中。在向电子标签写入数据后,可以使用阅读器读取电子标签内的数据信息,实现对图书编目信息的收集。

3.3 检测图书编目相似度

对收集的图书编目信息进行同义词转换处理,并提取图书编目数据信息的特征。利用相关系数算法通过计算提取的编目数据信息特征向量和数据库中存储信息特征向量的相关程度,来度量两个特征向量之间的相似度[11]。图书编目数据相关系数的相似度计算公式为:

式中:x 和y 分别为提取的和数据库中原有的图书编目数据特征向量;而xˉ和yˉ分别为两个程序各自特征向量中元素的平均值[12]。设置图书编目相似度的阈值为η,若式(2)的计算结果大于η,表示在当前的图书编目数据库中存在至少一个与提取编目相似的数据,则判定该图书编目数据重复,否则认定为不重复。

3.4 输出图书编目查重结果

设计系统的人机交互功能,通过上述RFID 技术的应用以及图书编目自动相似度的计算[13],得出最终的查重结果,并通过人工交互界面输出,输出界面如图5所示。

图5 图书编目自动查重结果输出界面

4 系统测试

以测试设计的基于RFID 技术的图书编目自动查重系统的查重功能为目的,设计系统测试实验。选择Python 语言作为系统的开发语言[8],该语言的版本主要有Python 2.X 和Python 3.X,两者之间不能完全兼容。为了保证基于RFID 技术的图书编目自动查重系统的设计能够调用Python 语言的第三方数据库,选用Python 2.7 版本作为开发语言。在此次的系统测试实验中构建的实验环境结果如图6 所示。

图6 系统测试环境

为了避免单一实验对实验结果造成的误差,在测试过程中选择多次实验取平均值的方式来提升实验结果数据的可信度。另外为形成实验对比,除了设计的基于RFID 技术的图书编目自动查重系统之外,还需要以相同的语言开发环境和方式得出传统图书编目查重系统,并作为系统测试实验的对比系统。经过6 次实验分别统计两个系统得出的查重结果以及在查重运算过程中消耗的时间,统计与对比结果如表3 所示。

从表中的测试结果对比中可以看出,传统查重系统的平均消耗时长为30.5 s,而基于RFID 技术的图书编目自动查重系统的平均查重时长为22.5 s,相比之下查重速度提高了8 s 左右。而在查重精度方面,传统查重结果的精度为小数点后一位,而本文设计系统的精确度保留到了小数点后两位,由此可以证明本文设计的基于RFID 技术的图书编目自动查重系统的查重精度更高。

表3 系统测试结果对比数据表

5 结 语

为了解决传统图书编目查重系统中存在的查重时间长、查重精度低的问题,基于RFID 的技术特点,研究图书编目自动查重系统彻底摒弃了传统的人工查重方法。通过确定图书编目查重的工作内容、RFID 标识的加工处理和检测图书编目相似度等步骤,得出图书编目自动查重结果,并通过人工交互界面输出。通过系统测试实验得出结论:设计的自动查重系统比传统系统的查重精度更高,且查重速度约提高8 s,实现了图书查重的自动化和高效化。

猜你喜欢

查重电子标签编目
学位论文查重乱象引关注
国家图书馆藏四种古籍编目志疑
学术论文该“查”什么?
论文查重别大意
学术论文该“查”什么?
粤剧编目整理之回顾与展望
适用于高衰减汽车玻璃的电子标签方案与应用
一种新型结构电子标签天线
CALIS联机合作编目中的授权影印书规范著录
探寻“千万”的背后——写在金溢科技电子标签销量超1000万之际