数字资源与传统文献元数据整合
2019-02-14耿文红
耿文红,陈 晨,张 莉,郭 淼
(北方科技信息研究所,北京 100089)
随着互联网的飞速发展,全球信息量在以井喷的速度冲击我们的视线,一方面是图书馆数据库,无论是纸质还是电子化记载的数据,需要收集和存储的信息资源日益增长,另一方面,用户想要得到最全面的数据,则需在海量的数据中层层筛选,无疑增加了工作成本和时间成本。为缩短检索时间,需要更快捷更专业更现代化的图书资料数据库,提供最直接最全面的信息资源。为适应时代需求,我们不能只限于数字化一些当前信息,丢弃传统文献,使它们成为“睡美人”,这是一种资源的浪费,我们有责任把传统文献与数字资源进行元数据整合,给读者和用户提供系统化、专业化,网络化的文献服务。
1 数字资源与传统文献元数据整合中存在的问题
1.1 数字化传统文献信息资源加大了工作成本
传统运行模式的图书馆里,会对图书馆内部所拥有的书籍资料名称和存放地点进行记录,也就是创建目录。[1]这样的管理模式,使用者能够根据目录对信息资源进行统计,快速找到想要的书籍,为使用者提供了不少的便利。但为了数字化这些传统文献,尤其是纸质文献,需要投入大量的人力物力,对传统文献进行扫描、复印、数据加工、校对入库。以兵器情报中心文献馆为例,从2004年开始建设数字化图书馆,每年复制扫描人员不仅要完成当年采购资料的数字化工作,还要对文献馆成立以来,所有的纸质文献逐一扫描,几十万份资料无疑是个漫长而庞大的工程,费时费力,但作为数据库的基础工作,这项工作又是必需的。
1.2 传统文献元数据加工质量影响数字资源检索
科研人员对信息资源进行检索时,可能输入同样的关键词,通常情况下数据库会为读者推送批量元数据,科研人员要根据需求进行仔细筛选。这个检索的过程中,数据库元数据的加工质量,直接影响检索结果和信息质量。元数据加工过程不仅要求扫描复制人员保证资料的清晰完整,最重要的是数据加工人员对科研论文及学术资料的理解和把握,要以最精确最专业的国防叙词主题词,标引资料主题,并将文献资料做准确分类,避免出现泛泛之词,造成检索结果大量重复和没有明确指向的擦边内容,每一条文献资源所要表达的内容都是不同的信息,要确保检索结果与文献资源的高度一致性。
2 数字资源与传统文献元数据整合方法的选择
2.1 从系统设计方面开展工作
从上世纪90年代开始,国际上已经有相当多的图书馆意识到了数字元数据整合的重要意义,开始进行数字资源与传统文献元数据整合的工作。有一部分图书馆从系统层入手,花费资金铺设了一个系统。数字资源作为新的资源形式放到这个特定的系统里面,与传统文献资源分隔开来,等到实际使用的时候,图书馆管理人员可以通过事先搭建的相关链接,为使用者搜索到相要的信息资源。这样的做法既有存在的价值,也有一定的弊端:使用这样的方法对元数据进行整合,确实可以方便图书馆工作人员的操作,因为该方法实现的过程中对工作人员的各项能力并没有很多的要求。这种方法的坏处就是,只创建了这样一个系统,将数字资源和传统文献资源分隔开来,并没有从数据层面对整个资源库进行整合。[2]虽然这样的方法可以加快元数据整合的速度,但是整合出来的质量很差,这样的措施对图书馆未来的长远发展没有什么实质性的帮助。还有一点问题在于,系统只单单设置在数字资源方面,传统文献资源方面不能通过系统来进行规范。读者检索资源的时候,只有资源处于系统内时才能享受到系统所带来的快捷便利服务,当资源没有处于系统内时还是只能选用较为麻烦的方式搜索查找资源,这不是很符合元数据整合工作的初衷。
2.2 从数据库建设方面开展工作
除了从系统层面入手外,部分图书馆还从数据层面开展工作,实现元数据整合。简单一点的方法就是将传统文献资源进行标引,并将标引的相关内容上传,将传统文献资源与数字资源相结合,读者在搜索关键词的时候,能够通过上传的数字链接,找到想要的资源的出处,从而找到想要的信息。[3]复杂一点的办法就是对元数据进行分类,根据类别整合。这样的方法相较于简单的方法来说更加方便了读者的使用,而且数据也更加的有条理性。而数据标引与分类相结合,则形成了数字图书馆数据库建设最基础的数据加工流程,需要专业、耐心、认真的工作态度,才能完成此项工作。
随着科研一线对文献资源的需求增大,文献资源要开展专题数据库服务,利用数图的数字化资源,根据特定用户的需求,制成网络版、单机版或光盘版的专题全文数据库,为特定用户提供专题数据库服务,定期更新,依托强大的数字文献资源,把数字图书馆建成主动型服务型数字图书馆。
3 结束语
数字资源与传统文献元数据整合的理念是符合信息化时代的发展需求的,相关人员要努力做好这个工作。在整合的过程中,要秉持着读者即上帝的原则,为读者提供更好的服务,同时还要根据实际情况,努力将整合之后的信息资源有效的利用起来,更好的服务于大众、服务于科研,使传统文献与数字文献创造更大的社会效益和经济效益。