图书采分编智能作业系统的研究与应用
2021-04-09王惠君吴昊潘咏怡钱海钢陈润好
王惠君,吴昊,潘咏怡,钱海钢,陈润好
0 引言
图书的采购验收、分类编目、典藏管理(以下简称“采分编”)一直以来都是图书馆的基础业务,而且作为图书馆的核心业务之一,采分编业务也是图书馆众多业务中最早实现标准化、规范化和网络化的。比如,《文献著录总则》[1]《中国文献编目规则》[2]等标准的发布,实现了采分编业务的标准化、规范化;《中国机读目录格式》的普及应用和联机编目的实用化[3]也让各馆在网络环境下实现数据资源共享成为现实。得益于图书采分编的标准化和规范化,相关业务外包逐渐盛行,带来了文献编目加工周期缩短、效率提高的便利,而由此造成的编目数据质量下降[4]、编目馆员需耗费大量时间进行数据校对和修正[5]等问题较为突出。可以看到,尽管这些标准规范和技术手段在一定程度上提升了图书采分编效率,但客观上图书馆仍需投入大量的人力和时间。仅以广东省立中山图书馆(以下简称“广东省馆”)为例,作为广东省文献编目中心,该馆采编部每年新增编目数据便有10余万条,还需向广东省内成员馆提供分编图书、回溯建库等服务,任务繁重[6]。以2019年为例,广东省馆新书采购量约10万种30万册,采分编流程包含拆包验收、系统收单、馆藏分配等10多道工序,仅就图书搬运一项来计算,完成30万册图书的所有采分编工作至少需要搬运300万册次,其工作量之繁重可见一斑。如何进一步降低编目员的工作压力、提高图书采分编工作效率这一实际问题摆在眼前,亟待解决。
近年随着信息技术高速发展,图书馆业务管理、资源建设和读者服务等相关环节均已充分应用新技术手段进行革新,实现了图书馆服务的网络化、智能化。伴随着物联网技术(RFID、NFC、红外感应器、激光扫描器)、物流技术、工业机器人、人工智能[7]等相关技术日渐成熟,其在图书馆领域的应用探索方兴未艾,这些探索集中在读者服务的前端应用,如自助借还[8-10]、送书上门[11]、智能图书盘点机器人[12]、图书自动存储系统[13]。而在图书馆业务管理的后端,尽管已有学者对自动标引展开讨论[14-15],但鲜见相关理论探讨的落地和实用化案例,更未见到将新技术手段整合运用到图书馆采分编业务流程的实践案例。事实上,此前已有的图书采分编工作标准化、规范化、网络化基础,理论上已经为进一步利用物联网、工业机器人等新技术实现智能采分编作业奠定了良好的基础条件,对相关技术的整合研发和系统探索时机已然成熟。
本文以广东省馆研发中的图书采分编智能作业系统为例,对如何构建一种应用于图书馆图书采分编基础业务全流程的自动化作业系统进行研究和说明。该系统能够利用自动机械化操作替代重复的人工操作,通过精准的图书识别实现自动采购验收、智能化分类编目等信息化数据处理,以极大地减轻人员劳动强度,提高图书采分编效率。
1 研发内容和系统构建
图书采分编智能作业系统拟通过综合采用物联网技术、图像识别、工业自动化处理、自动分拣等技术,研究和设计图书馆图书采分编稳定高效的全流程智能化作业,以极大地提高图书馆,尤其是大中型图书馆图书采分编效率,减少重复的人力劳动,打造“智能化编目”新业态,为未来图书馆业务优化提供创新方案。
1.1 传统作业与智能作业的匹配
为实现图书馆采分编的全流程自动化作业,一方面需要对整体的传统业务流程进行拆分和逻辑归类,确认各个作业环节的可行性,并根据拆分出来的各环节业务特点匹配相关的自动化方案;另一方面需要重点对现有图书采分编加工流程进行再造,从能否实现原有加工要求、能否满足效率以及能否适应各类型图书的通用性等方面进行调整,以适应未来全智能化作业的模式。
传统的图书采分编加工流程繁多,以广东省馆为例,通常包括拆包验收、系统收单、馆藏分配、图书封边、盖馆藏印章及贴条形码、编目及校验、索书号分配、书标打印、出书登记、贴书标、覆保护膜、加装RFID标签、RFID标签数据写入、图书分拣及配送等。为此,系统根据现有工业自动化技术、机器视觉技术、数据处理技术等的特点和功能,在保证满足现有图书采分编工作规范的情况下,设计了整个智能作业流程的总体框架(见图1),有重点、分阶段地实现图书采分编全流程智能化作业的目标。
图1 图书采分编智能作业系统流程
图书采分编智能作业系统总体上分为图书验收及编目前加工模块、图书分类编目模块、图书典藏加工及分拣模块3个部分。其中,图书验收及编目前加工模块重点实现图书编目前的采购验收和规范化的物理加工;图书分类编目模块初期的重点是以人机协同的方式实现线上“无纸化编目”,后期将逐步采用人工智能技术探索实现文献自动标引;图书典藏加工及分拣模块负责处理图书编目后图书的典藏标识加工、入库分拣等操作。上述3个模块将搭建在同一流水线工序上,拟实现图书的一次流转便完成图书采分编的全流程作业。
1.2 图书验收和加工
到馆图书在进入编目环节之前,需要完成验收、盖章、贴标加工等繁琐工序,系统利用工业机器人自动控制技术对图书进行规范化的物理加工,替代人工操作,同时完成进馆图书信息数据的核验校对和补充修正,以提高图书加工的效率和准确率。这一环节又可拆分为3个主要部分。
(1)图书自动分离,这是后续图书加工的关键步骤。当前系统将图书自动分离设计为图书堆叠和分离两个环节。首先是图书堆叠部分,该步骤采用工作人员批处理的方式,将书商运输到馆图书按批次叠放到供件台的图书提升机处,作为待处理图书等待进入工作流程。其次是图书分离部分,该部分采用提升机加负压机械手抓取方式,负压机械手的抓取位置为图书的书脊位置,保证被抓取图书不会损坏。图书提升机的顶端与负压机械手交接的部分设置有光电感应系统,可以自动检测当前图书堆的高度,确保每次图书被抓取后,下一本图书可以被提升至准确的高度以备再次抓取导入。通过依次将待处理图书单本分离并投入后续的自动化流程,保证分离后的图书无重叠、无堆积,实现系统可以进行后续处理的单本分离状态。此外,在图书自动分离系统预设人机交互设备,实现基础数据的实时显示,便于馆员了解和回溯系统历史处理效率、处理量等信息,同时,系统预留软件接口,供调取各种统计数据做大数据分析使用。
(2)图书自动验收,该环节用于新购图书的核验处理。在图书馆以往采购的新书验收过程中,无论是手工验收还是计算机验收,或是两者结合的方式,通常都需要馆员用条码机扫描每本书信息,再一一与书单的字段进行匹配,不仅耗费大量馆员精力,还可能因为手工验收而出现验收疏漏。而在智能作业系统中,系统会对流转过来的已分离单本图书进行自动采样识别,通过对封面、书脊等位置的图像扫描,获取识别包括题名、作者、出版社等基本信息,并将其与书商提供的送货单进行一一比对,完成图书的自动验收工作,并将其流转到下一步骤。在研发后期,还拟加入了人工智能识别图书一环,通过对图书封面、书脊等位置图像信息的扫描和识别,推进机器学习和训练,保证对图书的自动识别和处理,完成部分图书数据的校验,补充完整图书信息。
(3)图书自动贴标,这一环节的实现能够极大减少图书采分编环节中的重复繁琐工作。传统图书采分编工作流程中包含大量的机械式劳动操作,如图书ISBN 号码扫描及信息识别(包含书名、价格、出版社、作者等信息)、图书标签的打印粘贴、RFID电子标签的粘贴、图书翻页及盖章、图书RFID标签数据读写、图书分拣。系统研发的重点是利用机器视觉和工业机器人技术对图书的特征码、特征标识进行精准的识别。系统通过对图书进行位置调整,使每一册书达到符合系统处理标准的状态,然后采用图像识别技术,通过算法滤波,实现图像检测,根据“采样-识别-判断-再采样”的模式,辅以机械手进行图书翻页,按照图书物理加工规范,精准定位图书的封面、题名页、特定内页、封底页等位置,进行条码打印、粘贴、盖馆藏章、贴RFID标签、覆保护膜等一系列全自动化操作。
1.3 智能化分类编目
图书分类编目是图书采分编流程中复杂度最高的一个环节,其本质是要针对每一种文献信息进行客观著录和内容主题分类标引,生成书目数据,以实现文献信息化的检索利用。初创智能化图书分类编目新模式,实现图书馆图书采分编全流程作业自动化和智能化是本系统的最终目的。前期,系统设计研发专门的机械装置和软件,通过对每一种图书进行特征码识别、图书关键内容扫描存档、文本OCR识别等一系列的图像处理,并与图书馆业务自动化系统(Library Automatic System,LAS)对接,实现“无纸化编目”,一是对已有联机编目数据的图书实现编目数据自动下载、自动添加馆藏信息、分配索书号等编目操作;二是对无联机编目数据图书进行无纸化线上编目,通过对图书的题名页、版权页等信息进行OCR识别,由软件自动完成文献客观信息的著录,然后将已扫描的图书关键内容页文档在线推送至编目员前端,由编目员完成主题标引著录等数据操作。在自动套用数据或智能识别图书内容完成图书编目后,分配索书号,进而完成打印贴书标等工序。后期,系统拟采用人工智能技术探索实现文献自动标引,以真正达到全智能化编目的目的。
1.4 图书典藏与分拣
图书典藏加工及分拣用于处理图书编目后图书的典藏标识加工、入库分拣等操作。作为智能作业流程的最后步骤,系统需要完成书标打印、书标粘贴、覆保护膜、RFID标签数据写入、出书登记、图书入库分拣及配送等系列工作。其中,书标打印、书标粘贴、覆保护膜、RFID标签数据写入、出书登记等环节在技术实现上,与图书验收和加工模块比较相近,而图书入库分拣及配送部分,系统拟采用AGV分拣和自动搬运方式完成,目前此类工业自动化技术在物流行业已经比较成熟并广泛应用。另外,为进一步提高整套设备的使用效率,系统拟增加分拣分时复用策略,一方面可以在采分编作业完成后对图书进行入库分拣处理;另一方面也可以在系统无采分编加工任务的“闲时”,复用系统分拣模块,对所有读者归还的图书进行分拣操作,以方便工作人员进行图书分类上架。
2 技术路线和关键问题
本系统将采用机器视觉、工业机器人等技术,辅以人工智能图像识别及相应定制软件的开发实现,涉及到工业自动化、大数据、人工智能、图像识别、云计算、物联网等前沿科技的整合集成及应用。现结合系统实际需求对各个技术节点的实现方式进行探讨和考察,进一步确认各技术节点落地可行性并进行风险评估,其中的技术路线和关键问题包括:
(1)基于机器视觉的图书外部特征识别。系统中对图书外部物理特征的识别是机器视觉技术基于人工智能图像识别在细分行业的开发应用,以便让智能作业系统“看到”图书,包括图书的大小、位置、方向、正反面等都是后续一系列自动化操作的先决条件,几乎是直接影响图书采分编智能作业的全流程。
(2)基于工业机器人自动控制的图书姿态整位。系统采用直角坐标型数控工业机器人技术来完成作业过程中图书的姿态整位,即让智能作业系统“拿起和翻动”图书,包括单本图书分离、调整图书的左右和前后位置、翻转图书的前后方向、翻转图书的正反面、图书翻页等多种姿态处理动作,需根据图书的不同类型及各个动作的复杂程度采用不同形态的机械手设计和非标开发。对图书姿态的标准化调整,是自动贴标加工等步骤的关键过程之一。
(3)实现图书无纸化自动编目。该过程需要利用人工智能图像采集和识别技术完成对图书的精准识别、主要内容的文本扫描、OCR识别等,并与图书馆联机编目系统、业务自动化系统做全面整合以实现智能化编目,此为本系统复杂度最高的部分。通过图像采集和识别所形成的数据资料库,一方面可以作为系统自动学习和更新的原料库;另一方面也是匹配现有编目系统和集成管理系统的重要匹配库。
(4)图书馆开放式环境下图书的分拣和搬运。系统需解决在图书馆开放式环境中,馆员甚至读者与自动分拣搬运设备的运行空间交互问题,系统拟采用激光SLAM智能避障导航技术及3D地图自学习技术,实现图书自动分拣,并规避障碍物转运到对应书库。
(5)全流程智能作业系统框架设计和调试。作为全新的行业应用,该流程构想涉及技术种类多、设备装置多,需保证软硬件结合,要充分考虑系统运行复杂度、运行效率、系统拓展等因素。
3 预期效益和风险评估
在实践应用方面,广东省馆图书采分编智能作业系统的图书验收和加工模块目前已经完成一期设备的安装并进入调试运行阶段,系统实施的最初目的就是解决图书馆编目工作人员的劳动力释放问题,提高图书采分编工作效率。系统的落地和实施将在很大程度上改变图书馆采编运转方式和行业链生态。对大中型图书馆而言,传统图书采分编过程中存在大量的重复劳动,但通过图书采分编全智能作业,基本上是实现了图书采分编“一条龙作业”,理论上每册图书只需在作业系统上流转一次,便可完成所有采分编加工工序。因此,无论是从减少简单的重复搬运和人工操作,还是从提升图书采分编综合工作效率而言,图书采分编全智能作业对图书馆而言都有着良好的经济效益和社会效益,其将解放大量的馆员的劳动力,极大地减轻人员劳动强度,降低图书编目成本,同时也能提高图书采分编工作的效率和准确率。对行业链条中的其他参与角色,如书商或馆配商而言,其编目的流程将大大优化,未来馆配商或可依托图书采分编智能作业系统建设区域性的采分编系统中心,理论上各图书馆可将图书“投喂”到该作业系统,经智能作业系统分编后,再进馆上架流通,由此保证了编目质量,又提高了工作效率。与此同时,该系统的实践落地也引领了工业机器人、机器视觉等技术在图书馆行业的应用,将智慧图书馆的建设从注重前端服务改革,引申到聚焦后端业务的重构,首创实现图书馆图书采分编作业的自动化和智能化,推动智慧图书馆理念的纵深发展。
在理论价值方面,尽管系统着眼于图书采分编全流程系统的设计和实现,但其中的关键和核心目的是希望从图书采分编智能作业的研发,推进自动标引的理论和可行性探索,智能化分类编目无疑是系统设计最为关注的环节。在当前智慧图书馆建设的背景下,读者前端服务的智慧化已经逐步成熟,而后端管理的智慧化仍在探索阶段,自动标引无疑是图书馆智慧化的最佳体现之一。如前文所述,围绕图书自动标引的相关研究已有不少积累,关于《中国图书馆分类法》等工具书的自动标引探讨也不在少数,其相关改造和网络版工具的提供,也为系统设计的智能作业充分预留了整合接口。图书采分编智能作业系统的设计和研发正是基于前期的理论积累,系统的实施落地也将反哺自动标引等相关理论探索的进一步深化。
与此同时,本系统各项功能的实现涉及物联网技术、图像识别、工业自动化处理、自动分拣等多种技术的综合应用,多重技术的组合本身便有可能增加系统整体实施的难点和风险点。在此之中,除RFID技术、自动分拣技术的图书馆应用相对成熟外,其他相关技术在图书馆行业中应用的可借鉴案例和经验并不多,因此该系统设计在实现上具有相当的复杂度,在实际实施上可能会有一定不确定性,这都是应当考虑在内的。