图书馆智慧管理平台书目数据融合若干问题分析
2024-03-27高冕,高培培,王鹏
高冕,高培培,王鹏
摘要:文章通过分析河海大学图书馆智慧管理平台下的书目数据融合项目的实践,总结了数据库中书目数据存在的问题及原因,从编目人员、编目外包公司、图书馆自身3个维度提出优化策略,以提升图书馆的编目业务的质量,促进图书馆编目事业稳定健康的发展。
关键词:书目数据;数据融合;编目外包;质量控制;高校图书馆
中图分类号:G254文献标志码:A
0引言
编目工作是图书馆传统业务的核心,我国图书馆事业已进入一个快速发展的阶段,各大高等院校办学规模逐渐扩大,学校的学生人数呈上升趋势,为了达到教育部颁布的《普通高等学校本科教学工作水平评估方案(试行)》每生均进书量4册的评估标准,高校图书馆大量购买新书,图书采购和编目工作激增[1]。书目数据是数字图书馆信息资源的基础,书目数据的好坏一方面直接影响纸质书刊的借阅,另一方面反映图书馆开展数字信息资源建设的能力。新环境下,图书馆管理服务水平也向智慧化方向演变。国内外技术商陆续推出了适用于智慧环境的服务管理平台,如图星系统和汇文系统等。随着全国教育保障系统书目数据联编中心的建立,编目不断社会化,需要原始编目的机会越来越少。
1研究现状
河海大学图书馆下一代智慧管理平台于2019年成立,受校区设置因素的影响,南京、常州2地校区各上线了一套平台系统,在学校一体化建设大背景下,需将2套系统平台的书目数据融合到1个平台中,产生了数据融合项目。此项目共涉及73万余条书目数据的清洗,问题数据的分析。笔者基于下一代智慧管理平台建设的数据融合项目背景,分析和总结了河海大学图书馆数据库书目数据的相关问题,开展了编目数据资源的保障研究,提出了相关优化策略。
2数据分析
2.1数据收集
馆藏marc数据收集时间截至2020年,经过一系列的清洗,总结出河海大学图书馆的书目数据一共分为2个类型:采访marc数据,包括征订数据以及订购数据;馆藏书刊marc数据,包含中西文图书、期刊等数据。南京校区marc总种数732 054 种,复本总数为2 378 318个;常州校区marc总种数370 508种,复本总数为927 120个,具体数据如表1和表2所示。
2.2书目数据问题类型总结
2.2.1空白中西文书刊marc
狭义上指的是基本上没有字段信息的空白marc。主要由升级系统版本bug产生或者在数据回溯过程中编目人员技术操作失误造成。
2.2.2无馆藏无订购的不存在关联引用关系的书刊marc
此类指技术人员在编目过程中导入大量的编目数据进入系统,其中有些书目数据并没有进行相关图书的关联marc套录,后期也没有集中用SQL语句或者其他方法定位找出并删除。
2.2.3无必备字段或必备字段相关信息错误
主要指缺少题名或相关关键信息,书刊marc不规范或相关关键信息错误等问题。为了分析书目数据不同错误字段之间的关系,将编目数据错误分为普通错误和关联错误,而普通错误主要分为缺失错误、多余错误和错著错误3大类。[2]
(1)缺失字段错误。
主要是marc数据中相关字段和子字段的缺失。例如:中文图书书目数据方面:200题名与责任者说明字段漏著子字段(著者),缺少300一般性附注字段的著录,缺少400丛编字段的著录,缺少205版本说明字段的著录,甚至有的数据做了510并列正题名著录,缺少了312相关题名附注字段的著录。
(2)错误或重复字段。
中文图书书目数据方面的问题主要有以下几类:102字段中子字段制作国别的错误;330字段摘要、文摘附注中出现大量的错别字;690中图法字段存在错误分类的情况;200题名与责任者说明字段中的子字段与701人名等同责任字段中责任说明不一致;701人名等同责任字段中拼音字段重复;200题名与责任者说明字段拼音字段重复,还有一些书目数据出现记录头标区第5位字符或第8位字符错误等。
(3)关联字段错误。
关联字段错误有以下几种:200题名与责任者说明字段子字段与510并列正题名字段、690中图法分类号字段与606学科名称主题字段、090和093分类号字段与650主题附加字段的等关联错误。
3存在问题编目数据的原因分析
3.1编目技术人员缺失
编目工作枯燥,工作显现度低,无法吸引年轻的图书馆馆员主动从事编目工作。图书馆发展规划及人事制度的安排,缺乏相应的鼓励机制,导致从事编目工作的馆员没有新鲜血液注入,年龄结构层偏大,同时缺乏相关元数据专业背景的技术人员,人才梯度建设相对畸形。河海大学图书馆从事编目工作的馆员近几年从原先的5名减少至3名,目前仅剩2名人员从事图书编目工作。图书馆经费有限,难以引进技术型馆员或者激励年轻馆员开展相关业务。目前,图书馆现有工作人员因其技术水平低甚至完全不懂相关技术,面对网络技术的迅猛发展以及实际工作中对相关技术的运用要求,一时之间无法适应编目工作的转变,也不能满足编目的新要求[3]。
3.2编目外包质量不稳定
河海大学图书馆从2018年开始实行图书编目业务外包业务,经过几年的业务开展,发现图书编目外包存在以下几个问题:
第一,编目外包公司人员流动性比较大,从事专业技术方面的人员不够稳定,每个人的业务能力不同,频繁换人,对图书馆编目加工要求不熟悉,导致编目数据质量的不确定性。
第二,大多数的编目外包人员没有经过系統的业务技能培训,只经过短期的编目知识培训,对专业的知识了解不够深入,只知道一般的计算机操作,从各大数据库套录原始编目数据。自身的文化教育水平相对偏低,有的图书馆的编目外包人员只有高中教育水平。
第三,编目外包公司管理不科学。部分外包公司追求经济利益最大化,以计件制来衡量员工的薪酬。编目人员为了追求更高的收入,盲目疯狂计件,有些员工拿到需要编目的图书,直接从外部数据库进行编目数据套录,也不核对相应的著录信息,直接将编好的元数据存盘。有个别编目外包人员缺乏责任心,未对不熟悉的图书主题进行分类法工具书的查阅,直接使用错误的在版编目的分类号,导致分类的错误,影响了图书的借阅率。
3.3图书馆文献分类编目工作细则缺失
图书馆文献编目细则是确保编目工作顺利开展和保证编目质量的基础[4]。当前,各高校图书馆根据自身实际情况,各自对分类编目编制了工作细则,缺乏统一性、规范性。甚至有的图书馆到现在还没有一个完整的编目质量控制细则。河海大学图书馆2018年才制定真正完整地从验收、编目、加工和典藏的各个环节的细则。不同的编目老师对图书主题有不同理解,在著录分类时会给出不同的答案。有的编目老师会对非必备字段进行选择著录,以达到简洁、快速编目。在对编目外包书目数据审校过程中,缺少科学的编目数据质量流程及合理的数据审校的规范。以上诸多情况都会导致书目数据的差异化,编目数据质量参差不齐,从而影响读者对图书的查全率和查准率,削弱了图书馆文献信息服务能力。
4编目工作优化策略
4.1优化编目工作模式及流程
各馆的编目工作模式大都是统一采购、分散编目或者统一编目。工作相对封闭、单一、分散,日常工作任务较重。未来分类编目工作模式可向联合编目方向优化,各馆合作编目,将原始编目数据上传至网络数据库共享或在智慧化图书馆服务平台合作编目,扩大编目数据覆盖面,提升书目数据的质量和编目工作的效率。图书馆文献编目工作的流程大致分为新书验收—文献分类编目—数据审校—图书加工—图书典藏—图书上架。编目工作人员在分编套录数据过程中应做好数据查重工作,可按isbn或者题名+isbn或题名+作者多途径精准查重。再将新进的文献放置在相应的位置进行管理[5]。
4.2引进技术人才,助力梯队建设
图书馆文献编目工作要求馆员不仅要有图书情报专业知识、分类编目基础,还要有复合型学科的背景,熟悉并了解新兴学科、冷门学科和交叉学科。首先,图书馆应鼓励现有的编目工作人员继续深造,同时根据自身发展需要制订培养计划,确定培养对象,安排相关培训等,为编目工作人员提供学习平台,提高编目工作人员的业务能力,及时了解编目工作的最新发展动态[6]。智慧型图书馆的建设对编目型馆员提出了更高的要求,不仅需要编目人员平时加强政治理论、文献编目理论、元数据标准规范的学习,还要求编目人员熟练掌握计算机技术,强化专业继续教育的学习,使编目业务能力与信息技术能力有机结合在一起,学以致用,完善编目人员的专业知识,提升专业素质。其次,图书馆还应出台相应的激励措施,多给编目老师一些职业发展的机会,更好的薪资待遇、生活补贴等。领导层应根据各馆的实际情况,制定元数据馆员的培养计划,为他们提供继续教育的学习平台,提高编目人员的专业技术能力,进一步提升图书馆数据库书目源数据的质量。最后,图书馆还可以引进图书编目外包公司优秀的编目人员,将校外先进的文献编目工作的理念和技术带到相对封闭的高校图书馆,助力图书馆编目人才队伍的建设。
4.3加强对编目外包公司的风险控制
4.3.1谨慎选择编目外包公司
供应商作为图书馆的合作伙伴对今后图书馆的服务质量水平有着决定的作用,是外包成败的关键,图书馆一定要慎重选择供应商[7]。这要求在图书编目外包招标过程中,要从公司的规模、人员配备、业务能力、编目资质、公司信誉、售后服务等诸多方面打分,选择适合自身的编目外包公司进行合作。河海大学图书馆编目外包业务经过5年的开展,也跟3~4家公司进行了合作。目前,河海大学图书馆优先考虑与具有中国高等教育文献保障系统认证的中西文书刊三级编目员认证的公司进行合作,此外还会考察对方的合作对象,过去的服务案例等。
4.3.2提升外包编目人员的专业素养
编目外包商工作人员的编目水平参差不齐,缺少相关理论指导,往往仅根据个人工作经验对文献进行编目,影响了编目质量[8]。外包编目人员业务能力的好坏直接影响着图书marc数据质量,图书馆书目数据审校老师特别要注意。编目外包公司应对编目人员开展岗前培训,不仅要求编目人员要有工作责任心、职业道德,还要熟练掌握现有的编目业务知识。例如:《CALIS联机合作编目手册(中西文)》《中国分类主题词表》《中国图书馆分类法(第五版)》《资源描述与检索(RDA)》《中国季度规范格式》等编目行业标准规范。编目外包公司应对完成岗前培训的编目人员进行业务技能测试,成绩合格者方能上岗。图书馆编目老师也要加强对外包编目业务的业务指导,与其多沟通,在外包公司和外包编目人員之间充当桥梁纽带,互相反馈情况。如在数据审校过程中发现原则性错误,应面对面沟通解决,并通过邮件或微信、QQ等方式将错误反馈给外包公司编目技术负责人,让他们及时知晓、记录并修改错误数据,总结错误经验,提高编目工作的质量。
4.3.3加强对编目外包质量控制
首先,编目外包业务招标完都应与图书馆签订详细的合同,合同上要明确编目外包的工作流程、业务环节的报价、合同双方的权利义务、出现外包事故的赔偿责任及出现编目数据质量问题的惩罚措施等。图书编目外包公司应按照图书馆的编目细则加工图书,提供具有编目员资格认证的业务员到馆加工。河海大学图书馆为了保证编目数据质量,在合同中明确规定了要求具有CALIS联机合作编目中心认证的中文书刊或西文图书三级编目员到馆加工。还制定了图书验收、分编、典藏和加工的细则及图书编目工作流程图,要求编目外包公司应在文献编目部的监督控制下,按照每道工序的细则,保质保量地开展编目外包业务。其次,要加强对编目外包公司的考核。每年编目外包业务结束后,图书馆应成立编目外包服务评价小组,对其服务质量、水平、效率、态度等进行打分,对编目数据定期或不定期进行抽检,如发现问题及时反馈给编目外包公司令其整改。
4.4加强图书馆自身编目业务质量控制
4.4.1以人为本,提升文献服务保障能力
图书馆应以读者为中心主动收集读者对图书编目加工的反馈意见,充分调动读者的参与度,让其监督图书馆编目业务的工作。图书在上架流通过程中,也需积极听取读者服务部老师的意见,第一时间了解图书在借阅过程中是否遇到了编目相关的问题,如有问题及时修改,控制编目质量,提高读者对图书馆服务满意度。
4.4.2充分利用智慧管理平台
图书验收、分编一直是图书馆最传统、最基础的业务。首先,在云计算环境下,图书馆可以利用智慧化管理平台加强联机、联合编目,编目工作要顺应时代发展的趋势。充分利用高等教育文献保障系统,套录和复制系统数据库中的相关书目记录,还可以下载其他外部放入數据,最终实现资源共享[9]。河海大学图书馆在编目业务开展过程中,优先套录CALIS联合编目中心的书目数据,积极向其数据库上传原始编目新数据,若发现其数据库中的错误数据及时修改再将数据反馈至数据库中。其次,图书馆在物联网、计算机环境下也可以引进先进的采分编智能作业系统,解放编目人员的部分劳动力,提高编目质量,丰富图书馆馆藏资源。
5结语
总之,编目工作一直是图书馆的最传统的业务,目前各大图书馆编目业务都存在着普遍的数据质量问题。在编目人员短缺的情况下,如何提升工作效率与编目数据质量是亟待解决的问题。一切从实际出发,以读者为中心,找出一条适合本馆的编目业务发展路径,加大对编目外包业务的质量控制,才能使图书馆采编业务健康可持续的发展。
参考文献
[1]刘春鸿.高校图书馆业务外包生存机制探源[J].大学图书馆学报,2014(4):55-58.
[2]徐新邦.图书馆中文图书编目外包数据质量控制分析[J].江苏科技信息,2022(16):19-22.
[3]宋琳琳,蔡沅欣.我国高校元数据课程调查与对比:以《编目和元数据专业馆员核心能力》为视角[J].图书馆论坛,2020(12):169-180.
[4]杨青.图书馆文献编目工作优化措施研究[J].河南图书馆学刊,2021(12):101-102.
[5]刘菡.略论信息组织中的文献保证原则[J].国家图书馆学刊,2019(1):59-67.
[6]左斯敏,朱嘉麒,梁益铭.开放科学数据驱动下的高校图书馆馆员角色转变[J].图书馆建设,2018(11):25-29,37.
[7]赵桂梅,陈亚梅.图书馆采编业务外包的质量控制研究[J].内蒙古科技与经济.2023(12):137-140.
[8]蒋婵华.基于维护台账数据分析的索书号编制改善:以上海图书馆为例[J].图书馆理论与实践,2020(2):100-103.
[9]王颖洁.基于calis的外语院校文献资源联合采编平台构建研究[J].图书馆工作与研究,2019(1):90-95.
(编辑何琳)
Analysis of the issues in the integration of bibliographic data on the smart management platform of the library——taking Hohai University library as an example
Gao Mian, Gao Peipei, Wang Peng
(Library,Hohai University, Nanjing 210098,China)
Abstract: This article analyzes the practice of the bibliographic data fusion project under the smart management platform of Hohai University library, summarizes the problems and reasons of bibliographic data in the database, and proposes optimization strategies from three dimensions: cataloging personnel, cataloging outsourcing companies, and the library itself, in order to improve the quality of the librarys cataloging business and promote the stable and healthy development of the librarys cataloging industry.
Key words: bibliographic data; data fusion; cataloging outsourcing; quality control; university libraries