APP下载

我国数字图书馆标准研究综述

2019-09-10张文亮郭婧

电子商务 2019年3期
关键词:数字图书馆综述标准化

张文亮 郭婧

摘要:梳理国内数字图书馆标准化研究领域的相关文献,利用文献计量和知识图谱分析的方法,总结目前该领域的研究热点主要集中在元数据标准、数字图书馆标准体系、特色数据库标准以及版权研究几个方面,分析目前研究中存在标准规范体系研究不足、内容研究尚未完善、缺乏标准应用指南研究等不足之处。

关键词:数字图书馆;标准化;综述

引言

我国数字图书馆的建设开始于20世纪90年代,为了更好地促进其发展,标准规范工作紧随其后展开。CALIS从2002年开始进行相关研究,2003年底组织人员正式编制“CALIS子项目建设技术标准与规范”;国家数字图书馆工程从2005年开始建设数字图书馆标准规范,迄今已有30余項。实践表明,标准规范的建设是数字图书馆发展的重要保障。

截止到目前,尽管国内已经有关于数字图书馆标准化研究的综述,但是大都发表于2010年以前,距离当前时间较长。此外,研究内容多是对数字图书馆项目标准的概述。本文利用文献计量统计以及知识图谱分析的方法,在分析相关文献的基础上,揭示目前该领域的研究主题,总结其不足,以期为数字图书馆标准化领域研究提供借鉴。

1、研究设计

1.1文献来源

为了对数字图书馆标准化研究的发展脉络有系统性的掌握,本文对截止到2017年12月30日的CNKI中国知网数据库的期刊文献进行了全面检索。在CNKI期刊全文数据库的“图书情报与数字图书馆”子库中,将主题设置为“数字图书馆”或含“电子图书馆”或含“虚拟图书馆”或含“复合图书馆”,作为第一组检索词,并以“标准”“规范”“协议”“规则”“指南”为第二组检索词进行检索,共获得632篇核心期刊文献,对这些文献进行查重,并剔除无效征文通知等不相关文献后,获取有效文献441篇。

1.2方法选择

利用Bibexcel和Ucinet软件对所获取到的有效文献进行文献计量统计与知识图谱分析。文献计量统计包括年代分布、作者发文量分布,而知识图谱则是利用从文献中提取到的关键词绘制知识图谱。

2、文献计量统计

2.1年代分布

数字图书馆标准化研究领域的发文量很大程度上可以表现出学者对该领域的关注度以及此领域的发展情况。对1990年至2017的441篇文献进行年代统计,分析每年发文量以及出现的原因,见图1。

由图1可知,该领域的研究呈阶段性发展。1996年,国家图书馆申请立项“数字式图书馆实验项目”,主要对各类相关标准进行研究;1997年出台的《文化事业发展“九五”计划和2010年远景目标纲要》提出要使文献资源数字化的进程加快以及对数字化图书馆进行研究;2001年立项的数字图书馆工程中,一项重要的内容就是标准规范建设,同年,CSDL项目正式启动;2002年,CALIS开始对相关的国际标准进行研究。在这些政策以及项目的带动下,我国数字图书馆标准化研究开始起步,至2005年发文量总体呈上升趋势,并达到高峰期。2005至2013年研究进入慢速发展阶段,发文数量逐渐减少,但总量依旧多于2005年之前的发文数量。2013至现在,标准化研究再次引起该领域学者的关注,发文量呈上升趋势。2016年6月,《全国图书馆标准化工作“十三五”规划纲要》中指出要研究建立一个图书馆标准规范体系以适应数字图书馆事业的建设需求。在这些政策的带动下,对数字图书馆标准化的研究探索得到更加广泛的关注。

2.2作者发文量统计

对上述文献的作者进行统计分析,441篇文献的共同作者共计500位,并统计了作者分布情况:88.2%的作者只有一篇相关领域的研究成果,有两篇以上研究成果的作者只占到了11.8%,这表明对数字图书馆标准化研究的核心作者相对不集中,见表1。

3、词频分析与可视化

词频分析是指利用Bibexcel软件对有效文献中的关键词进行提取,在人工优化的基础上合并同类关键词,并利用Excel软件进行词频统计分析。可视化分析则是在此基础上利用可视化软件将关键词之间的联系以知识图谱的形式展示出来,并通过节点的大小、节点之间连线的粗细区别各研究主题的重要程度。

3.1词频分析

对441篇有效文献进行关键词的统计,经过去重、合并后共得到494个有效关键词。通过Excel统计频次≥6的高频关键词,见表2。

从表2中可以看出,除“数字图书馆”、“图书馆”、“标准”这样没有分析意义的词外,排名前十的高频关键词包括:元数据、互操作、合理使用、XML、元数据标准、数字资源、都柏林核心元数据、数字化、信息资源、著作权。由此可见,元数据、合理使用以及互操作等是数字图书馆标准化领域的研究重点。

3.2可视化分析

在对关键词统计的基础上,利用Ucinet和Netdraw构建了关键词共现网络图谱,见图2。

图2中围绕在数字图书馆周围节点较大、连线较粗的关键词有元数据、合理使用、互操作。表明我国学者在这三个方面研究最多。从“元数据”节点出发,辐射出较多的连线,包括都柏林核心元数据、元数据标准、XML、MARC等,这些研究主题之间的联系较为紧密。此外,技术标准、评价标准、分布式检索、信息安全管理等主题虽然与数字图书馆相关,但是彼此之间并没有联系,呈分散式分布,表明这些主题已经引起国内学者的关注,但是到目前为止并没有形成研究热点。

4、主题热点研究

通过对有效文献的词频与可视化分析,将目前数字图书馆标准化领域的研究主题归结为以下几个方面:

4.1元数据标准

元数据是一种结构化的编码数据,用来对数据进行描述。随着资源的开放共享,不同的元数据格式以及标准体系大量涌现,元数据的标准化直接影响数字图书馆的建设发展。国内学者很早就开始对元数据标准规范进行研究,包括古籍元数据、音乐元数据、拓片元数据、电子论文元数据等,一致认为元数据的标准化是数字化建设的需要,是基础性工程,也是促进元数据在跨学科资源描述过程中使用的重要保障。基于元数据标准独特性、多元化的特点,数字化的发展要求不同的元数据之间建立一种机制,实现互操作性。而语义一致性、语法一致性等是元数据互操作性的关键。

4.2数字图书馆标准体系

数字图书馆标准体系是标准的集合,它按照一定的逻辑体系囊括了该领域所有相关的标准。标准体系的建立可增强现有标准的可操作性、统一不同系统之间的标准规范,对数字图书馆建设的发展举足轻重。数字图书馆标准规范建设主要包括资源的加工、组织、服务、互操作、长期保存与体系化建设。关于数字图书馆标准体系的探讨,赵悦提出了从标准层级体系和标准内容体系两方面构建数字图书馆标准规范体系框架。标准层级体系包括:国家、行业、地方、机构层级;标准内容体系方面包括:资源、服务、管理和技术,并指出数字图书馆标准规范在未来5-10年内的建设重点就是服务和管理。

4.3特色数据库标准

特色数据库是指各单位根据其需求建立的数据库,主要用于其特色资源的保存和推广。但是在推广过程中,因建设标准的不同,造成资源难以共享。对此,王爱华等人提出特色数据库在建设时,其标准可以借鉴并采用《我国数字图书馆标准规范研究》项目中介绍的系列相关标准、元数据标引格式规范、文献著录的有关国际标准和国家标准等。

4.4版权研究

版权问题一直困扰着数字图书馆的发展,也是数字图书馆研究的重点。2004年,谷歌数字图书馆诞生,随后接踵而来的就是版權问题。肖东梅认为在现行的版权框架下,先授权后使用的版权规则是谷歌在数字图书馆项目中难以逾越的壁垒,而谷歌在版权问题中积极的探索促使数字图书馆版权问题受到重视。针对如何解决数字图书馆建设中出现的版权问题,秦珂学者提到了补偿金制度。当然,在对馆藏文献数字化以及网络资源馆藏化的过程中,版权问题也是不容忽视。

5、结语

总体而言,通过文献计量与可视化分析可以知道目前我国数字图书馆标准化领域的研究主要集中在元数据、互操作、特色数据库标准、版权以及数字图书馆标准体系等方面。在信息检索、存储、服务、安全等方面也有涉及,但是研究较少。本文在梳理该领域研究主题的过程中,也发现其存在的不足,主要表现在以下几个方面:其一是标准规范体系研究不足。现有的对标准规范体系的研究多数在数字资源生命周期的基础上展开,而随着数字图书馆建设的深入发展,标准规范体系需要不断的完善,才能更好地指导数字图书馆的建设发展。其二是内容研究尚未完善。数字图书馆标准化的研究应该符合一个完整的数字资源生命周期。目前关于资源建设的研究较多,对资源的长期保存、管理、服务等方面的研究还有所欠缺。其三是缺乏标准应用指南研究。数字图书馆建设项目的发展推动了数字图书馆标准规范的建设。在重大项目标准规范建设成果中,只有国家数字图书馆工程制定了标准规范的应用指南。应用指南的缺失会使得标准规范建设成果难以运用到实践中。

猜你喜欢

数字图书馆综述标准化
SAPHO综合征1例报道并文献综述
院前急救标准化管理在急性心肌梗死患者中的应用
基于迁移学习模型的小样本学习综述
国家标准委与非洲标准化组织签署合作谅解备忘录
知识追踪综述
共指消解技术综述
“一带一路”离不开标准化人才
学生评教的标准化处理
基于云计算的数字图书馆建设与服务模式研究
刍议数字图书馆计算机网络的安全技术及其防护策略