大数据环境下中文图书编目数据质量控制分析
2020-01-10
(延边图书馆,吉林 延边 133002)
随着大数据技术的不断创新,大数据为读者的浏览和编目人员的工作提供了便利。由于中文图书编目是一项涉及大量数据的烦琐任务,因此,在数据编目中出现问题的可能性很高,这些问题都会影响学术权威和图书馆的服务质量。图书馆应通过分析编目数据中存在的主要问题并提出有针对性的解决方案以改善编目工作中的质量漏洞,为读者提供更多权威和准确的编目数据。
一、什么是中文图书编目数据质量
中文图书编目数据是图书编目人员首先根据`《中国图书馆分类法》将编目数据分配给每本书,然后将书内容分析进行组合,然后根据CNMARC格式、书名、分类号、作者等信息进行分配手段。通过输入相应的书目数据库来组织结构化数据。图书编目数据主要包括由编目人员编辑和复制的数据。复制数据的主要来源是:国家图书馆编目数据、CALIS编目数据和书籍出版机构和目录数据等。编目数据的质量与图书馆阅读器服务的质量和水平密切相关。通常,可以根据准确性、标准化、一致性、中文图书编目效率和兼容性来衡量编目数据的质量。在对中文图书数据进行分类时,编目人员必须在书中准确地描述信息。如果在输入数据时发生错误,则此编录数据将影响读者的图书搜索和使用。规范化数据规范是规范化数据项必须符合CNMARC的相关要求,并且相关内容必须输入相应的字段。中文图书编目数据的一致性意味着,CNMARC格式的同类中文书籍的编目数据必须一致,以避免不必要的数据重复。中文图书编目数据有效性表示编码数据的准确性和合理性。整个图书馆目录系统的数据应相互协调,并且不得与其他数据集冲突,是中文图书编目数据的兼容性。
二、中文图书编目数据中存在的主要质量问题
1.中文图书编目数据准确度不高
图书馆目录协调员通常使用一种交换检查的工作方法来检查当天的工作质量。但实际上,图书馆有多本同样的书,但是书的序列号是不同的。图书馆编目人员将有关中文书籍的信息收集到计算机系统中。在这一过程中,计算机数据库中的书目类型与实际的书目类型不匹配会导致图书编目数据错误。当前,图书馆对中文书籍的描述一般采用CNMARC格式,但是每个图书馆对CNMARC格式的理解不同,主要表现为机器可读目录格式中的字段与字段指示符之间的差异。在描述标准中,各种系统之间也存在显著差异。使用分布式描述时,可以使用通用标题作为文档的适当标题,也可以使用通用标题作为系列标题。在注释中,一些集中注释创建了一条记录,而一些分布式注释创建了多条记录。这些问题通常是由列表创建者对列表规则的不同理解引起的,并且还很常见。
2.中文图书编目数据工作缺乏规范性
近年来,图书馆管理中逐渐使用了许多新技术,图书技术的发展也呈现出较高的发展水平。基本上,管理员每年都会重新定义技术标准。简单编目是20世纪末许多图书馆采用的标准。管理员只需要显示需要的信息,就可以找到相对应的书目。随着图书馆的社会地位的提高和管理者的增加,这些问题正在逐步得到适当解决,总的来说,编目人员对大多数书目信息进行了完整描述,并根据读者的需求做出检索。由于图书馆规模的不断扩大和发展以及不同时代的描述要求的差异,随着当今网络的增加,对图书馆编目数据的要求越来越高。图书馆编目在不同时间的原则并不统一,工作缺乏规范性。
3.中文图书编目人员素质水平存在局限性
图书馆藏书很多,编目员要在有限的时间内完成大量的编目工作,因此一些工作人员会为了跟上工作进度而不注重工作质量。一些图书馆还使用学生或社会工作者来完成编目工作,但是这些人员不在相关的专业领域,不了解自己的专业知识,并且责任感薄弱。
三、大数据环境下对中文图书编目数据进行质量控制的有效方法
1.注重反馈情况,对编目数据进行定期维护
图书馆管理人员应认识到,保证编目质量的最有效方法是分析读者反馈和图书馆提供的服务质量。因此,管理者需要注意图书编目数据的实际情况。通过对实际情况的调查了解,可以发现系统输入的信息是否真实有效,而图书馆在比较信息后才能保证资料和信息的质量。为此,图书馆可以在图书馆中设置一个单独的窗口,此功能为读者提供了一个反馈平台,读者可以访问该窗口,以便在书籍编目出现问题时读者可以就相关情况提供反馈。同时,图书馆要找到相应的编目人员来处理这些问题。这样,每个管理人员的职责都可以落实到位,从而有效地减少工作中出现编目数据错误的可能性。通过读者访问权限和图书馆各种服务的反馈来测试编目的质量。为提高图书馆编目数据的质量,应在配送服务部门安装记录手册,当读者和工作人员发现问题时,会随时记录质量问题,并及时向编目部门提供反馈,并由编目部门报告。错误和问题被公开,这样就可以有效地提醒图书编目工作者,以避免在以后的工作中出现这些错误,并可以增加目录作者的责任感和专业知识。此外,可以举行定期交流会。召集一些读者、编目制作者和配送服务部门的人员进行交流,并通过沟通和对话查找库存问题,从而实现及时发现,及时纠正。
例如,可以在图书馆的借阅柜台设置一个读者借阅意见箱。读者在借阅图书的同时可以向图书馆反馈自己的借阅感受,对图书馆的中文图书编目数据指出不足或者提出建议。管理人员要定期查看反馈箱,通过有关目录数据质量的信息反馈来确保目录数据质量的优化。也可以在图书书目里面不定期加入一份调查表,读者在借阅到图书后会对图书馆的相应数据质量进行评价。图书编目数据管理人员可以一周进行以此交流会,总结在编目工作中的问题并分享研究改进方法。
2.建立规范、完善的编目机制
中文图书编目数据工作中的一些问题是由应用程序软件不当引起的。因此,图书馆必须选择适合编目分类的作业应用程序软件。应用软件必须能够满足行业的发展需求和图书编目的实际情况。因此图书馆管理者必须实时更新应用软件,以提高图书编目数据工作的质量。国家有关部门制定了专门的图书馆数据编目标准,图书馆必须根据这些标准要求和自身实际情况,建立一套完整并且规范的编目机制。不同图书馆的管理员为图书馆的书目分类要求建立特定的规则,以规范图片编目操作。
例如,由于某些书籍的书名过长,因此目录作者在选择本书的学科时应遵循其规范标准。因此,不应基于主观性来选择图书学科。如果某些标题是作者姓名而不是标题,则目录作者应严格检查作者姓名,以免在查找参考文献时造成混淆。同时,在设计数据分类要求时,该库必须分解所有参考文献,并且由于不可能采用近似分类方法,因此有必要确保具有大量参考文献,以使读者不会为搜索参考文献带来不便。因此,建立严格的审核制度,完善数据质量管理体系中心,还必须选择一个安全高效率的目录管理器。该管理器应尽可能地安装校准柱,以便严格检查和控制目录管理器提供的数据,对编目数据进行随机检查。同时,对工作中的每个环节进行严格的质量检查、验证、分析和判断,然后记录并纠正检查错误,总结检查中发现的问题,吸取教训,并制定相应的预防措施。
3.提升工作人员的素质水平
图书馆必须确保编目人员具有专业技能和良好的专业知识。图书编目数据任务是一项强调细节的任务,只有具有强烈责任心的人才能完成。管理人员需要分析书的内容,确定与书的内容相关的主题,并建立尽可能多的搜索方法。为此,图书馆应组成目录小组,定期进行交流培训,以获取最新知识和新技能,并根据规范要求完成工作任务。同时,编目人员需要操作计算机系统,因此图书馆必须确保编目团队熟悉计算机的操作规范。此外,编目小组应定期召开工作会议,为编目人员进行学术讨论提供平台。建立一支能够满足时代需求的高素质的图书编目队伍是确保图书质量最优化的基础。如今,所有图书清单都已联网,对于编目员来说,使用计算机系统是一项非常专业的任务。
例如,有必要加强对编目数据管理人员的职业道德培训,以增加员工的责任感和工作态度,形成耐心、审慎、积极、严肃的工作作风。同时,加强和提高编目人员的专业水平。当今的计算机编目需要主题专业知识、图书馆业务流程相关知识,以及计算机应用程序和一定水平的外语技能。可以提供及时和适当的业务培训,可以通过参加各种编目课程,学术研讨会或在部门中进行定期讨论,来继续提高编目人员的知识结构,文化素养和问题处理能力。只有通过提高编目人员的素养和知识水平,才能从根本上避免由编目人员的编目数据水平和工作态度引起的错误,并确保更好的编目数据质量。
结语
简而言之,当前中文图书编目数据存在的主要质量问题是编目数据的准确性低,编目工作缺乏标准化以及编目人员的水平有限。图书馆管理人员要注重定期维护编目数据,重视校对的重要性并选择合适的工作软件来完善编目数据的必须设置。编目是图书馆的一项基本而重要的任务。只有有效地提高图书编目数据的质量,才能提高图书馆的服务质量,才能使资料质量和服务质量相辅相成。做好图书编目数据质量的优化,不仅是保证书目分类质量和效率的有效途径,而且是从宏观和长期的角度实现书目资源的共享的唯一途径。