地震图书馆查收查引自动化系统建设介绍与展望*
2023-11-22张晋辉马秀丹
张晋辉 马秀丹
1) 中国地震台网中心, 北京 100045
2) 中国地震局发展研究中心,北京 100036
0 引言
查收查引又叫收引查证、文献查证、代查代检等,是图书馆、情报机构或信息服务机构提供的一项日常服务项目。通过对用户发表或指定的论文或著作在SCI(Science Citation Index)、EI(The Engineering Index)、CSCD(中国科学引文数据库)和CNKI(中国知网) 等国内外著名检索工具中的收录及引用情况进行检索并出具检索报告,为用户项目申请、奖励申报、职称评聘等工作提供客观、准确的依据[1]。
随着大学和科研机构职称评审、基金申请、学位申请、工作量核定、奖学金评定、科研奖励等科学评价定量化,用户根据人事、科研或教务等部门关于科研成果评定的相关规定,要准备论文收录或引用的检索证明材料时,查收查引服务通过文献检索出具论文收录或引用的检索证明材料,查收查引系统为图书馆和信息服务机构开展查收查引服务提供在线申请和受理的解决方案。
地震系统图书馆有没有自己的查收查引服务?目前地震图书馆查收查引服务开展的情况如何?存在哪些问题?查收查引服务有没有实现自动化?系统如何开发和建设的?有什么优势?如何提供服务的?等等这些问题都是本文重点关注和阐述的。笔者作为中国地震局图书馆科技查新工作负责人亲身经历了地震系统查收查引服务的发展历程及查收查引自动化系统的开发和建设过程,希望通过对该工作的介绍,帮助广大用户深入了解地震系统查收查引工作的开展情况和自动化系统的建设情况,并以此推动地震图书馆科技查新工作的开展。
1 地震图书馆查收查引服务开展情况及存在的问题
1.1 地震图书馆查收查引服务开展情况
中国地震局图书馆于1998 年建立,是由中国地震台网中心(原地震信息中心)主办,中国地震局系统各单位协办的专业图书馆。查收查引服务是中国地震局图书馆最早开展的服务项目之一,自1999 年经中国地震局科技发展司批复建设地震系统唯一的科技查新室以来,几代地震图书馆人不断摸索、开展服务,至今已有20 余年的历史。中国地震局科技查新站是中国地震局批准建立的地震系统唯一一个地震科技查新咨询机构,依托丰富的地学馆藏资源及电子文献资源,为中国地震局系统内外用户提供地学及相关专业的科技查新和查收查引服务,为地震监测预报、震害防御、应急救援等领域的地震科研人员及相关管理部门提供重要的信息支撑[2]。
中国地震局图书馆原有查收查引申请方式主要为到馆申请、邮件申请,查收查引工作大部分环节都由手工完成,即科技查新员通过接收查新检索申请单,根据用户需求,手工查询数据库,获取文献的收录和引用情况,复制到检索报告中,再经过手工编辑、排版,最后产出检索报告,这一过程大约需要5~7 个工作日。随着查收查引工作的开展,原有查收查引服务存在问题日益突显。
1.2 地震图书馆查收查引服务存在的问题
1.2.1 用户查收查引知识缺乏
由于缺乏科技查新和查收查引相关必备知识,很多用户普遍对查收查引的概念认识不够,对服务内容和服务流程了解不够,认为查收查引服务只是一项立等可取的服务。查收查引申请单出现各种各样的低层次错误,例如有的订单缺少待检索论文清单,有的订单没有勾选待检索的数据库,有的订单没有正确勾选数据库检索时段,有的订单甚至提供错误的检索人姓名信息等,这些问题需要工作人员花费时间来修改和完善已提交订单。
1.2.2 自动化程度低,查收查引效率低
查收查引流程一般包括服务受理、数据库查询、数据下载、开具并核对证明、收费并开具发票等,都需要馆员人工处理,尤其在项目申请、成果鉴定、奖励申报、职称岗位评聘等工作重叠时,工作量非常大。查收查引缴费需要与财务部门反复沟通,需要用户来图书馆缴费,或者银行汇款,或者内部转账(本单位职工),存在耗时、支付困难、服务流程繁琐等问题。查新员人工修改报告模板,计算收录和引用记录费用、开发票税费等容易出错。
1.2.3 处理流程不透明、工作量统计困难
图书馆原有查收查引服务与用户之间没有建立统一的服务平台,缺乏协同办公,导致查新员和用户无法及时了解服务进度,无法快速查询工作的历史记录;检索申请文档以纸质形式存档,难以查询历史委托单的情况,年末人工统计工作量,只能根据保留下来的纸质申请单,人工计算工作量。
1.2.4 重复劳动非常大
由于缺乏经验传承机制,前期工作不能得到有效积累和重复利用,导致新申请订单都要从零开始、重新检索,从而造成了大量的重复劳动以及时间和人力的浪费。
若干年来,科技查新室一直饱受上述问题的长期困扰,随着计算机技术和信息技术的发展,原有的工作模式已不适应信息时代用户获取信息和科技查新工作的需要。为适应时代发展,提高工作效率和工作质量,迫切要求建设自动化的查收查引系统。因此,地震图书馆于2018 年勇于创新、大胆尝试、积极探索,结合地震行业实际情况,将人工智能、大数据等现代信息技术有机融合到传统科技查新和查收查引工作中,自建自动化查收查引系统,努力提升查收查引服务的自动化、标准化程度和工作效率,提升图书馆的信息化水平和深度知识服务水平[3]。
2 地震图书馆查收查引系统建设
查收查引自动化系统自2018 年建设完成并投入使用,经过几年的不断迭代完善,实现了前台申请和后台受理,并通过系统、邮件和微信号提醒进度。由于相关的评价工作经常有处理高峰,需要将查收查引服务用系统管理起来,优化服务流程,并实现对收录和引用的文献进行自动处理,以及报告的自动形成。
2.1 系统架构
地震图书馆查收查引系统的总体架构如图1。地震图书馆查收查引系统由数据预处理、收录检索、引用检索和报告生成4 个功能模块组成。为了提升系统的精准性、便捷性、实用性和高效性,系统专门设置数据预处理功能和算法,增加了检索数据源、人机交互模块及自引排除等功能模块[4]。同时,开发适用于SCI、CDCD、EI 和CNKI 等国内外主流引文数据库的接口程序,实现以文献标题(收录)或作者&刊物(引用)中关键词自动提取收录或引文数据。
图1 地震图书馆查收查引系统架构Fig.1 The cited reference retrieve service system framework of earthquake library
2.2 系统软硬件、系统配置和服务界面
查收查引自动化系统搭建的服务器为Windows Server 2012 及以上,4 核CPU,16 G 以上内存、200 G以上硬盘。系统基于Apache+PHP+MySQL 的服务器架构,使用逻辑、数据、界面显示分离的MVC 方法组织代码,采用模块化的开发设计模式,保证了系统的二次开发和可扩展性。查收查引报告兼容Office 各版本的Word 软件[5]。
系统界面(图2)采用左右布局,左侧为导航栏,分为科技查新、查收查引等服务,以及与这些服务相关的人力资源、系统功能、个人设置等模块;右侧为导航栏中各模块对应的工作界面,默认页面为各常用模块的最新数据统计情况、代办事宜,以及进入各模块的快捷链接。在打开多个模块的工作界面后,可以通过工作界面上方的选项卡对已经打开的模块的不同子页面进行切换。
图2 地震图书馆查收查引系统后台服务界面Fig.2 Background service interface of cited reference retrieve service system in earthquake library
2.3 系统主要功能
系统针对传统查收查引服务存在的问题,实现如下10 项功能:
(1)实现在线申请和进度查询:用户前台在线填写《查收查引申请单》,通过系统查询和邮件提醒功能得知查收查引的进度;
(2)实现对前台用户申请的后台处理功能:工作人员在后台受理查收查引,修改查收查引报告的相关信息,包括用户的基本信息和每种类型索引的信息,工作人员可查看与自己相关的任务信息;
(3)具有统合检索入口的功能:系统可快速切换至各个数据库进行检索;
(4)具有文献处理功能:系统能够对SCI、EI 等数据库的纯文本题录数据进行自动处理,进行格式简化、查重、排重、快速获得入藏号、期刊统计等操作;
(5)具有格式简化功能:系统对中科院期刊分区导出的Excel 进行简化打印;
(6)具有相关文档和单据的打印功能:工作人员在线打印查收查引的相关单据,自动导出Word 版的查收查引报告;
(7)具有费用计算功能:系统根据表单填写的相关属性自动计算查收查引费用;
(8)提供统计功能:系统可以导出历史查收查引数据,也可实时统计工作人员的工作量,根据查收查引的目的、类型等维度进行统计;
(9)用户可对工作人员的服务进行评价,填写意见反馈表单,促进服务质量的不断提升;
(10)记录系统后台与前台的日志:采集用户对前台的访问和使用日志,包括访问页面、检索、登录等,及时发现恶意访问的IP 地址并禁用,采集系统管理员对系统的使用日志,包括系统登录和相关模块的增删查改等。
3 系统建设总结
地震图书馆查收查引自动化系统解决了制约原有查收查引服务开展的若干瓶颈,改进了查收查引工作模式,提升了工作效率和报告质量。查收查引自动化系统投入运行后,图书馆查收查引量大幅提高,2018—2020 年查收查引量为263 份,较系统投入运行前年均数量增加155%。自动化系统具有以下显著优势:
(1)平台建设的科学化和标准化提高了报告数据的可靠性和定制化,提升了用户体验。系统对查收查引报告中的清单、收录、引用、指标等数据均进行了标准化细分管理,数据可以通过自动检索数据库的标准接口获得,也可以通过导入国际通用的文献题录数据格式获得,符合科技查新站的全国业务标准和数据库商的国际通用标准。根据教育部科技查新工作指导,平台对查收查引报告的产生制定出网页和Word 版本的统一模板,从顶层设计适应各科技查新的业务标准和需求,同时也根据地震图书馆的个性化需求进行了定制开发,比如报告水印、模板风格和新增个别字段的显示需求等。
(2)收录引用的检索范围、检索效率和数据完整性提高了报告生成的时效性和准确性,提高了工作效率。系统既对接Web of Science 引用的标准接口检索(检索SCI 引用数据在10 s 以内),又提供非标准引用检索(通过标题或作者、期刊、年份模拟浏览器操作进行引用检索),可通过标准接口快速高效获得引用数据,也可通过非标准接口查全引用数据。平台实现对查收查引所需的Web of Science、Scopus、EI、CSCD、CSSCI、CNKI 等若干主流数据库都能进行自动检索,国内其他供应商只做到了部分数据库[6]。此外,系统还能根据文献所发表期刊和年份高效关联JCR 影响因子、JCR 期刊分区、中科院期刊分区、CNKI 影响因子数据,在一定程度上反映文献品质,突出数据完整性和定期更新速度。
(3)论文清单、收录数据、引用数据的智能匹配提高了查收查引工作的自动化程度,避免了重复劳动。系统对论文清单、收录数据和引用数据的获得进行逻辑设计与智能算法匹配。支持用户在线提交查收查引的论文清单,通过人工智能算法自动解析用户提交的论文清单的若干种格式,同时也支持用户直接提交数据库的标准格式或Excel 模板,让用户将论文清单的查询需求格式化地反馈给查新人员;在获取收录数据时,系统可以根据用户的作者姓名和地址自动查询出可能属于作者的潜在收录数据,再通过论文清单中的标题通过人工智能算法匹配出用户所需的论文;在获取引用数据时,系统通过自引判断标准(施引文献作者包含被引论文全部作者、委托人自己、第一作者、通讯作者或作者团队),可以根据作者简称和全称的匹配机制自动区分论文的被引频次、他引频次、自引频次。在收录和引用数据都获得之后,系统可以将收录和被引文献与作者的论文清单进行匹配,准确地给出作者提供的论文清单中被收录和引用的论文,以及未被收录或引用的论文。
4 下一步工作展望
地震图书馆经过前期建设和近几年的不断完善,虽然已经初具雏形,并以此为基础为地震系统内外用户提供了多年的信息检索服务,累计出具查收查引报告460 余份,但仍然存在着若干需要进一步改进的地方,例如查收查引申请单填写有些繁琐,有些数据如期刊引证报告、北大核心刊源等更新时间较慢等,需要在日后实践过程中加以改进。为建设功能完备的地震行业自己的科技查新和查收查收系统,我们还需要在以下几个方向努力:
(1)加强与用户之间的互动。用户是信息系统的服务需求方和最终使用方。建设一个易用性强、体验友好的信息系统,必须要加强与用户的沟通和联系,通过设计调查问卷、抽样访谈、用户培训等方式充分掌握用户的使用体验和改进建议,加强系统的迭代升级和优化完善,将是一项持之以恒、久久为功的工作。
(2)加强与其他信息系统尤其是单位业务管理系统之间的融合。数据管理和信息服务效能的提升依赖充分的数据共享和数据融合。除了图书馆和情报机构,单位人事、科研等管理部门对单位员工科技成果产出都具有比较强的信息获取和跟踪需求。图书馆查收查引系统需要与单位自身人事、科研等信息管理系统进行无缝衔接,实现数据共享,最大限度提升单位内部信息化程度和业务管理水平。
(3)对接图书馆微信公众号和小程序。充分利用大数据和融媒体技术手段,开发服务接口,与微信等社交软件整合[7],可以通过微信公众号和企业号来对系统中的服务进行申请、受理和查询,在微信平台上提供移动端便捷式查新服务。