智能图书盘点机器人技术的实践与应用研究*
——以上海交通大学图书馆为例
2023-02-15陆亚红马灵杨婉茹施晓华
陆亚红 马灵 杨婉茹 施晓华
1 引言
随着人工智能技术的进步,智能机器人产业迎来了蓬勃发展。智能机器人是一个在感知、思维及效应方面全面模拟人的机器系统,在智慧社会建设领域大展身手[1]。面对人工智能技术带来的时代机遇和发展理念,国内外一些图书馆乘势而行,积极探索机器人在智慧业务管理、智慧空间建设及智慧服务创新等方面的运用[2],为建设智慧图书馆[3]提供技术支撑。其中包括:自动存取机器人系统[4],能够实现图书高密度存储、高效率流通分拣、自动出库入库等功能;自动导引车(Automated Guided Vehicle)移动机器人[5],实现图书归还收纳、高速分拣和精准配送;智能咨询机器人[6],可有效分担图书馆参考咨询工作,提升参考咨询服务效益;智能导引交互机器人[7],帮助读者快速轻松地获得所需资源。
图书盘点作为图书馆馆藏管理的一项基础性工作,也因智能机器人技术带来了新的发展。在运用机器人进行图书盘点之前,图书盘点主要为人工盘点模式[8-9],这种方式需要工作人员全程参与,读取准确率和扫描效率受操作人员经验和书架环境影响。目前,国内外已有研究者进行了机器人在图书盘点中的应用实践。其中,南京大学图书馆在阅览室试验点取得了较好的实验效果,能够通过自动盘点及时更新图书位置信息,识别图书RFID(Radio Frequency Identification)标签位置顺序,最终生成丢失或错架图书的报告清单,以便馆员进行图书整理[10]。武汉大学图书馆实现了大规模盘点,通过数据对接,定时同步RFID应用平台数据库与图书馆管理系统馆藏数据库;生成各类异常状态的馆藏数据报表,并在定制的联机公共目录检索系统(Online Public Access Catalog,OPAC)页面,显示图书位置和查找路径[11]。在国外,MetraLabs推出的RFID库存机器人在卢森堡马克斯普朗克大学图书馆进行了测试应用,具备全自动盘点、自动充电和触发续盘的能力,读取RFID标签的准确率可达99.1%,并能够将盘点到的丢失图书在地图上以红点的形式显示;此外,该款机器人将在未来应用人工智能和深度学习技术,用于路径规划、障碍物检测及更准确的图书位置估计[12]。随着计算机视觉技术的发展,不少学者基于该技术对书脊印刷信息或者编目信息进行提取和识别[13]。马丁内斯·马丁(Martinez-Martin E)等研究出一款空中图书馆员机器人,除能够对图书进行视觉识别外,还能够利用视觉标记来进行飞行位置定位和路径导航,从而达到图书定位和自动盘点的目的[14]。贾姆布尔(Jampour M)等介绍了一款名为 Pars 的新型人形机器人来实现自动化图书馆的书架阅读,并研究出基于区域卷积神经网络(Region-CNN)条码检测算法,有效地对机器人在运动中捕捉的条码进行图像处理和解析[15]。
上海交通大学图书馆(以下简称交大馆)自2017年以来,经历从盘点机械臂、双天线盘点机器人、四天线盘点机器人,再到现在的最新版高性能盘点机器人四个版本的迭代升级。根据阅览室实际情况及工作需求,一方面,不断总结提升机器人运行稳定性、盘点读取率和准确率的技术方法和实践经验;另一方面,研究如何充分利用机器人进行盘点,对于不同的馆藏管理需求制定相应的应用方式,从而最大化机器人的盘点效能,使其在提高馆藏管理和读者服务水平方面发挥应有的优势。本文从技术实现结合实际应用的角度,介绍最新版盘点机器人的软硬件组成,以及盘点工作流程中的关键技术和实践经验;探讨机器人盘点在图书馆的服务内容和工作模式,以及在实际应用中的实施要点和成效,希望能对同行带来一定的借鉴。
2 盘点机器人系统及盘点关键技术介绍
2.1 盘点机器人系统组成及功能介绍
如图1所示,盘点机器人由硬件系统和软件系统两部分组成[16]。其中,硬件系统的控制与驱动部分,用于控制机器人行进速度和方向,采用两轮差速驱动,应对地面打滑、阅览室回环多等情况;传感部分以激光雷达导航为主,多传感器融合,最大程度地实现高精度定位;机械部分的天线升降由静音滚珠丝杠驱动和小车框架稳定固定,晃动幅度较小;配套模块包括RFID读写模块、用于视觉盘点的图像识别装置、支持WiFi和5G的数据通信模块、电源模块(有线及无线充电)、触摸屏及I/O模块等。
图1 盘点机器人系统组成
软件系统主要由系统软件和应用程序组成。机器人软件部分底层为Linux操作系统。应用程序的人机交互,包括屏幕交互选定盘点区域、查看盘点进度,结果显示、查看历史记录,以及远程遥控等;图书定位模块根据读取标签信号强度和相位、读取时间、误读筛除规则等信息,定位图书实际所在的书架;盘点功能模块将图书实际所在位置与系统数据进行比对,得出盘点结果;数据同步与交互模块用于盘点前从服务器加载选定盘点区域的图书书目信息和架位信息,盘点过程中查询盘点范围外的图书信息,盘点后将盘点相关数据上传至后端服务器;监控模块用于收集机器人盘点状态、进度,以及机器人电量等信息,并上报给监控平台;用户终端通过Web访问方式,连接监控平台,查看盘点结果、机器人状态,进行远程查看和操控。
2.2 机器人盘点关键技术
在盘点的整个工作流程中,从盘点前的高效地图构建,到盘点时的安全稳定运行,再到盘点后的数据高速传送,每个流程都有相应的关键技术作为支撑;结合实际应用,机器人盘点也需具备应对各类异常、特殊情况的处理能力。
2.2.1 高效构建地图
一个高效的构图机制是开展大规模盘点的前提。考虑到阅览室是一个面积大、回环多、视野狭窄复杂的环境,建立地图所需要的传感器性能以及CPU性能都较高。此外,对于弧形书架和直型书架,均有相应的地图绘制机制。对此,采用如下建图机制。
(1)地图坐标采集。基于激光雷达的同时定位与地图构建技术,自动构建阅览室地图,作为机器人移动和定位的依据。其流程如图2所示。
图2 地图坐标采集流程
(2)层架标与地图坐标标定。使用可视化标定程序精确标识每个书架在地图上的位置,一个书架一般用一个线段表示,盘点时机器人行至一个线段附近,即可知道当前正朝向的书架编号。
(3)地图测试。地图构建之后,机器人在地图范围内进行行进测试,以确认机器人在自主导航模式下能够顺畅、安全进出书架。
(4)地图上传。上传地图至后端服务器,其他机器人也可自行下载进行图书盘点;上传后的地图也供监控平台调用,用于机器人盘点时,显示机器人在地图上的所处位置和运动轨迹。
2.2.2 稳定安全运行
在盘点过程中,机器人的定位导航、自动避障和自主充电功能,是确保机器人的稳定行进的关键因素。
(1)定位导航系统完成完整的长距离导航、路径规划、路径重规划等功能。采用多传感器融合的导航方式,定位精度可达±1.5cm;当沿书架盘点时,辅以书架本身为参考系,可以达到±0.25cm的书架距离保持精度,从而保证盘点机器人沿书架稳定安全运行。
(2)避障功能能够实时避开读者和障碍物。在机器人四周0.75m高度处配备四个广角声呐探测器,用于规避激光雷达看不到的障碍物,安全性较高;在阅览室有读者来回走动的情况下,可设置机器人禁止运行区域,防止机器人跌落或干扰重要区域。
(3)自主充电功能。机器人具有电量预警功能,若电量较低(如低于20%时)无法完成剩余盘点任务时,可自行回到充电位置,补充完电量后自动回到上一次盘点停止的位置继续盘点,避免因电量原因无法顺利完成剩余预设盘点流程的情况。
(4)远程实时监控。机器人在自动盘点时,能够将运行轨迹图、启停状态、故障报警等实时运行数据信息上传至监控平台,馆员访问监控平台进行远程登录、远程监控及操作机器人,包括启动停止设备、读取设备状态、查看任务进度、修改运行参数等,实现远程操控和紧急故障处理功能。
2.2.3 数据高速传送
机器人在盘点过程中,需要即时将运行状态数据上传到盘点服务器,再由服务器进行分析,从而在网页界面显示及交互。此外,每当机器人完成盘点,需要将盘点数据上传到盘点服务器,服务器负责收集历次盘点数据,并作永久性保存,为后续盘点数据挖掘分析及对外开放盘点数据访问接口提供数据保障。如何能够保证各类数据安全、稳定及快速上传,是盘点相关数据在传送过程中的关键。众所周知,阅览室书架的集中摆放,对无线AP信号产生一定程度的屏蔽,对数据即时快速传输带来影响。
得益于5G通信技术的发展,上海交通大学利用运营商5G切片技术+校园核心网技术构建网络即服务的新一代高速校园网平台,形成了5G融合校园网网络环境。盘点机器人接入该网络环境,可以拥有特定校内IP地址,保证了盘点数据传输的安全性;在数据传输方面具备5G高带宽、低时延等优点,为远程操控机器人提供稳定的网络条件。
2.2.4 异常情况处理
图书馆环境及藏书情况复杂,机器人为实现正常无差别盘点,考虑到以下几种情况:
(1)铁质书架读取。阅览室的书架分为铁质书架和木质书架,铁质书架对信号有一定的干扰,机器人盘点能够应对铁质书架环境。
(2)夜间盘点。夜间闭馆后,阅览室没有读者走动,更适合机器人进行整库盘点,以避免对读者造成干扰。夜间盘点需要机器人能够应对光线较暗的环境,并且在无人值守的情况下出现异常能够采取紧急措施,如防火防撞处理,必要时以短信等形式及时通知馆员。
(3)特殊地面行进处理。由于木质地面走线有金属突起槽,对机器人的全局导航产生了一定的干扰。对此,机器人系统也支持断点续盘方式和流程,在盘点过程中由人工辅助机器人移动至书架入口附近,再继续盘点,解决地面金属突起而无法自动续盘的问题。
(4)书架层高不同。图书馆每个区域的书架风格有所不同,每层的高度也可能稍有差别。对此,在升降天线机械臂的基础上,自适应调整各个天线之间的距离,以适配每层书架高度,从而提升读取率。
3 机器人盘点的工作模式及服务内容研究
鉴于机器人的自动盘点功能已通过各项技术实现,接下来研究机器人盘点如何满足实际应用需求。根据图书馆馆藏管理及服务需求,初步整理出机器人的三种工作模式,以及在不同模式下提供的服务内容。
机器人所能盘点出图书定位状态的类别,决定了图书盘点在馆藏管理工作中能够提供的服务内容。因此,交大馆设计出一套高效完备、能够得出图书各类定位状态的盘点结果计算算法,用于实时快速分析。
3.1 盘点结果计算算法设计
在盘点之前,盘点系统需先从图书馆已有的图书馆管理系统同步图书的书目信息及流通信息,再根据每本图书的馆藏地信息和索书号分配其应在架位。文中盘点系统采用首书定位方式分配图书架位,而首书定位的核心是索书号排序算法,为了使得该盘点系统具有通用性,交大馆设计并开发了一套灵活配置的通用型分类索书号排序系统。由于不同的图书馆分类索书号排序模式均有所不同,因此提供灵活可控的配置文件,用户可自行定制排序的规则。通过导入图书信息及首书信息、加载配置文件、切分索书号、排序处理及输出排序结果,计算出图书架位并保存在盘点系统中用于后续比对。
盘点时,机器人采集图书实际在架信息,与系统中图书应在的架位信息进行比对,从而得出图书实际摆放位置与系统信息是否一致。对此,采用以下算法策略进行计算,盘点结果包括了正常、不在架、馆藏地错误、异常在架、错架、借出、未定位状态(见图3)。
图3 机器人盘点结果计算算法
3.2 机器人盘点的工作模式介绍
针对目前加装有RFID标签图书的错架盘点、图书清查、馆藏迁移、图书弱标签检测、读者阅后图书信息收集[17]等服务类别,交大馆制定了以下三种机器人盘点的工作模式:
(1)常规模式
常规模式是指对开架流通图书的日常盘点,主要目的是及时掌握图书的架位错误、馆藏地错误、图书流通状态错误等信息,保证图书状态和架位的准确性;同时,及时核对公共服务空间被阅览过的图书数量、图书类别等数据,及时掌握读者阅览行为,为图书采访、读者阅读推荐、动态馆藏调整等提供参考。
(2)清查模式
清查模式是指根据一定的周期和模式重复盘点,主要目的是定期清查各阅览室图书藏量,掌握图书丢失比率、馆藏状态等,为新书购买、架位测算、馆藏迁移和调整等提供参考。
(3)其他模式
其他模式主要针对馆藏迁移、统架、书展等特殊或临时工作,目的是及时掌握馆藏迁移后架位、馆藏地信息有无相应更改,为馆藏调整相关的信息维护和阅览室图书有序摆放工作提供有力支撑。此外,随着RFID标签信号逐年衰减,当RFID标签密集放置时,较弱的RFID信号容易被较好的RFID信号所掩盖,由此,设计一种辅助排查弱标签的自定义模式。
机器人盘点各工作模式下的服务内容介绍详见表1。
表1 机器人盘点各工作模式下的服务内容详情
4 上海交通大学图书馆机器人盘点实践经验与成效
交大馆自2019年正式采用四天线机器人进行图书盘点,之后不断从硬件和软件方面改进机器人的盘点性能,使其在日常盘点、图书清查、馆藏迁移等工作中发挥重要作用。以下介绍在应用过程中探究出的提高盘点读取率和准确率的方法,并介绍机器人盘点在2021年全馆图书清查工作中的应用实践。
4.1 提高盘点读取率的实践经验
读取率是机器人盘点应用的首要考量,有效读取图书标签,为后续盘点结果判断提供数据基础。书架环境、图书状况等客观因素都将影响盘点读取率,如图书标签信号弱、真实不在架、金属封面、薄书紧密排放、图书不规则摆放等。除客观因素之外,机器人读取的参数特性也在很大程度上影响读取率,主要有盘点速度、离架距离和天线功率。
4.1.1 盘点速度
为准确得出盘点速度对读取率的影响,盘点前剔除实际书架中弱标签、真实不在架和外借的图书。对12列书架、1895本图书,分别以2.5cm/s、5cm/s、7.5cm/s、10cm/s的速度,每个速度下独立盘点6次,对6次盘点的读取率取平均值。不同速度下的盘点读取率如表2所示,速度与读取率的关系图如图4所示。
表2 不同速度下的测试结果对比
图4 机器人行进速度与图书读取率关系图
从图4可以看出,机器人行进速度越慢,读取率越高。这是由于超高频RFID天线能够同时大量读取的特性,读写器可以达到每秒1000个信号的采集频率。但读写器和标签之间进行高速化数据交换处理存在拥塞控制问题,迫使机器人的四根天线轮流工作。而机器人扫描过程中一直在匀速行进,当机器人行进到一个点位时,上下四根天线中存在天线还未工作,机器人即已驶离,导致该天线未能在最佳角度读取对应层的图书。因此,降低一定的机器人行进速度,延长读取时间,能够有效提高读取率。
4.1.2 离架距离
为验证机器人离架距离对读取率的影响,我们挑选一个没有图书突出的书架,RFID读写器射频功率和天线增益保持不变,分别进行距离书架1cm、7cm、10cm、15cm、20cm的读取率测试。测试结果显示,当天线紧贴书架1cm时读取率最高,10cm距离读取率略微下降,20cm距离时读取率断崖式下降。
在实际书架环境中,对于尺寸较大非正常摆放的图书,这类图书大多突出书架5至10厘米。为顺利进行盘点,需根据实际情况适当调节天线与书架的距离,并通过提高导航定位精度的方式,使机器人尽可能贴合图书进行盘点,以保证读取率。
4.1.3 天线功率
鉴于无源RFID读取原理,提高天线的功率,更容易读取标签。然而,这也将导致读取的范围更大,从而误读率越高,即读取率与准确率之间存在矛盾。在实际应用过程中,可根据服务内容的不同,以不同的标准平衡这两者之间的矛盾。例如,在图书清查工作中,由于盘点的目的是掌握馆藏的在架率和丢失率情况,优先保证读取率,可提高天线功率;相反,在常规盘点中,若要掌握图书的错乱架情况,则不能一味追求读取率,否则盘点的结果将无意义。
4.2 提高盘点准确率的实践方法
交大馆应用超高频RFID技术。与高频相比,超高频射频识别距离比较远,一般大于1米;天线一般为定向天线,只有在天线定向波束范围内的射频标签才可被读写。鉴于以上超高频的特性,其读写范围较难控制,容易造成误读,尤其容易误读到背面书架的图书,并且难以有效获取图书排放的实际次序。针对以上问题,我们提出两个提高准确率的实践方法,即盘点时过滤书架背面标签信号和基于视觉图书盘点。
4.2.1 过滤书架背面标签信号
盘点机器人在进行图书定位时,采用多天线多次读取的方式,根据每次读取的信号强度、读取时间、信号相位等变量,基于概率模型计算出每本书所在层架。然而,由于超高频标签本身的技术特征,机器人盘点时容易读到背面书架的图书标签信号,对盘点结果的准确判断造成干扰。根据实践经验,除非大规模错架,对于盘点结果错架在背面书架的情况,基本属于误判。因此,在实际应用中,除优化机器人硬件参数及软件算法外,还可以通过过滤背面书架图书信号的方式提高盘点准确率。
鉴于此,我们在盘点结果计算策略上加以改进,增加“对穿错架”这一状态,并且设置盘点时过滤背面书架图书信号的开关。若打开开关,则没有此类错架信息;若关闭,则存在“对穿错架”状态。在常规模式下盘点,一般打开此开关,追求准确率;在清查模式下关闭,追求读取率。
4.2.2 机器人基于视觉分析的图书盘点实践
随着基于图像处理的文本识别技术的发展,书籍背脊的自动化识别成为智能盘点的前沿核心研发内容。交大馆也在积极探索与实践,研究基于图像与文本的图书盘点识别方法、装置及系统,形成视觉盘点机器人系统(见图5)。
我们针对基于视觉分析的图书盘点进行了实践。通过盘点机器人实时采集书架图像,将书架图像切割为多个含有书脊的图像;利用光学字符识别(Optical Character Recognition,OCR)技术对书脊图像进行识别,获取书脊对应的关键字;判断关键字与图书数据库中图书信息的相似度是否到一定的相似度阈值,从而达到获取书架上图书实际位置的目的。
图5 配置摄像头的盘点机器人
4.3 机器人盘点在图书清查工作中的成效与分析
为了加强图书馆馆藏资产管理,2021年交大馆实施了全馆馆藏图书清查工作。对于主馆6个阅览室的一线馆藏,应用机器人盘点实现了自动清查,总量达45万册。为更加准确掌握图书在架情况,尽可能减小因漏读带来的影响,每个阅览室机器人自动盘点三次,一本书有一次盘点到即可视为“清查到”,将“清查到”的书与图书馆管理系统中所有图书进行比对得出清查率;提供三次均未盘点到的图书清单及应在架信息,用于后续人工核对。
在盘点过程中,为保证清查工作按期完成,并保证盘点读取率,将本馆购置的两台盘点机器人,首先同时以5cm/s的速度错开位置盘点,大概需要8小时完成第一次和第二次盘点。第三次盘点,两台机器人分工,均以2.5cm/s的速度同时盘点,大概需要6小时完成。由此,一个阅览室在两个工作日完成三次盘点。
盘点后,根据盘点结果分析报表中每个书架的盘点率情况,筛选出盘点率低的书架。针对因大量特薄书紧密排放、图书突出书架距离过大等客观因素导致盘点率低,以及因柱子阻挡无法使用机器人盘点的书架,使用机器人配套小车进行人工补充盘点,小车盘点数据与机器人盘点均上传至同一盘点数据库中,便于提供统一的数据报表及数据访问接口。各个阅览室盘点机器人清查量与盘点小车清查量对比如图6所示。
图6 盘点机器人与盘点小车清查量对比图
图6所示的阅览室中,存在书架行道中段有柱子阻挡导致机器人无法盘点此排剩余书架的情况,如B300阅览室正因此有80列书架需要人工补充盘点,盘点小车清查量占比大。为减少因柱子阻挡而导致机器人无法盘点的书架数量占比,对机器人路径规划进行优化,当机器人被挡住后,切换该排书架的另一端作为入口继续盘点(仅书架两端均被阻挡或书架紧靠柱子的情况暂无法完成自动盘点)。优化后,B300阅览室仅剩20列书架需要人工补充盘点,大大减少了人工盘点量,提高了机器人的盘点效力。
5 总结与思考
智能机器人用于图书盘点,能够提高图书馆的纸质馆藏管理水平,使图书日常理架、顺架工作更加快速、准确;更加重要的是,利用日常盘点数据,可提高读者服务水平,避免因图书在馆不在架、错架乱架导致读者找不到书的问题。此外,根据图书实际所在位置,推出图书导航应用,引导读者快速找到所需图书,实现读者用户体验的进一步提升。保持盘点系统中图书的系统架位与实际架位一致,满足图书馆阅览室“数字孪生”[18]化的基本要求,保证图书架位虚实同步,结合AR/VR技术,实现虚拟书架和虚拟阅览室。
随着机器人盘点的常态化,将历次盘点数据科学永久保存,分析挖掘盘点信息,为开发智慧化服务提供数据基础和技术支撑。这将是下一步研究机器人盘点应用的方向,也是构建未来图书馆智能馆藏管理体系的重要组成部分。