APP下载

元数据在数字图书馆应用中的可行性建议

2022-09-15

智能城市 2022年8期
关键词:编目检索图书馆

冯 爽

(中铁十六局集团有限公司,北京 100018)

1 元数据方案设计

1.1 元数据概述

现阶段,国内大部分元数据设计方案将都柏林核心(Dublin Core,DC)元数据作为核心集,定义特定化的拓展机制并适当拓展,可以使用多个不同的元数据设计方案混合模式。

沃里克框架(Warwick Framework)在早期的数字化图书馆设计以及元数据设计方案中使用较为频繁,兼容性非常强大,可以包容多种不同的数据表现形式,为元数据的封装提供集成化的表现形式。但沃里克框架在当时并未发展成熟,还属于简单化的概念模型,可以通过多种方法或工具实现,元数据操作问题并未得到妥善解决。1999年万维网联盟(Word Wide Wed Consortium,W3C)正式将XML(Extensible Markup Language)/RDF(Resource Description Framework)作为网络资源元数据的描述标准,结合实际情况,XML虽然在当时并未完全覆盖整个领域,但大部分研究学者均看好XML的发展潜力,RDF是发展数字化图书馆兼容的元数据表达形式。

1.2 元数据体系的映射

元数据体系的映射大致可以细分为两个层面,分别为语义映射与结构映射。其中,语义映射通常针对描述性的元数据体系,如机器可读目录(Machine Readable Catalog,MARC)、端点准入防御(Endpoint Admission Defense,EAD)、DX(Direct Extension)等,可以提供一个元素对照依据,从而精准描述元数据资源的跨库。结构映射主要用来处理不同元数据包间的关联性问题,与“格式转换”类似。

元数据体系映射细分为动态化映射与静态化映射。其中,动态化映射借助中间件将对应的指令信息转化为资源站兼容的数据格式,信号返回时,将信号内容转化为本系统可以识别的元数据形式,确保本系统高效完成结果查询;静态化映射与当前使用的搜索引擎差距不大,直接将资源站内的数据对象提取至本地数据库,结合本地元数据的结构搭建索引,为用户提供相应的功能服务。

1.3 元数据模型的实现

数字图书馆应妥善处理数字资源的检索与组织问题。现阶段,大部分设计方案选择使用构建好的模型体系,通过单独存在的元数据功能实现系统对元数据资源的需求。元数据服务应具备检索、保存、内容描述、交互操作等功能[1]。

2 元数据方案可行性建议

2.1 实现数字资源的有效管理

元数据自带识别、传播、资源定位等相关内容,操作人员可以直接利用元数据完成对数字资源的管理。数字资源属性出现波动时,操作人员通过维护元数据更新部分重要信息,数字资源在系统内的属性会自动调整,保证用户获取正确的数据信息。数字资源自身需要进行更正时,操作人员可以利用元数据对数字资源的初始化位置进行定位,更正处理数字化资源。操作人员可以借助元数据分类管理数字资源,构建非真实的资源管理组,形成崭新的内容体系,可以有效提高数字资源服务的效率。

社会网络环境下用户参与的图书馆数字资源组织与整合的模式如图1所示。

图1 社会网络环境下用户参与的图书馆数字资源组织与整合的模式

2.2 实现数字资源的互通

元数据在数字资源中具备较为显著的优势,被广泛运用在各种类型的系统开发活动中。随着元数据在数字资源中的适用范围不断拓宽,为数字资源在系统内的交互提供良好的基础。元数据运用在其他系统时,可以直接与系统预留的接口进行连接,或将元数据转换格式直接导入系统,直接发挥元数据的功能。相同类型的数字资源,只进行一次元数据制作就能在多种资源系统内使用,具备较强的灵活性。

元数据含有数字资源的定位信息与识别信息,可以帮助系统内的资源可以借助无线网实现互通,达到数据共享的目的。数字图书馆将数字资源下的元数据全部存储在仓储平台内,用户直接通过检索获取需要的内容,检索活动不受时间与空间因素的限制。通过资源定位功能精准识别全国图书馆的资源,在理论层面实现统一,形成结构完整、内容丰富的数字资源集群[2]。

2.3 实现数字资源的高效服务

搭建元数据仓储可以整合全国图书馆中的数字资源,为用户提供完整的检索功能。用户直接通过检索关键字获取需要的信息资源,系统会根据用户输入的检索关键字在全国数据库中检索,将收集到的信息资源呈现给用户,由用户进行选择,用户需要注意数字资源的存储问题。

3 元数据在数字图书馆中的应用

3.1 元数据在图书馆管理方面的应用

结合国内各图书馆对元数据的应用研究现状,国家图书馆主要针对法律、娱乐、历史方面的元数据展开研究分析;北大图书馆主要针对拓片元数据展开研究;上海图书馆在1997年开展首个数字化图书馆建设项目,随后结合自身丰富的经验多次开展数字化图书馆建设项目。

馆藏资源的智慧数据上传如图2所示。

图2 馆藏资源的智慧数据上传

3.2 元数据在编目工作中的应用

(1)利用DC编制图书馆信息。

图书馆应最大限度发挥地方局域网的效能,将计算机应用技术与宽带技术作为信息传播的平台,将部分关键的馆藏资源进行数字化处理,适当引进外部特色,满足图书馆需要的内容建立自身的数据库。

(2)开发搜索引擎,整合互联网相关信息。图书馆无法满足每一位用户的差异性需求,使用DC编著图书馆信息时,还应对互联网中的信息进行整合编目,通过搭建搜索引擎为用户提供更丰富的海量资源。

(3)图书馆内的管理人员可以直接按照编目标准对元数据进行审查,删除不符合标准的元数据,保证编目的所有元数据全部满足标准要求,能够为用户检索提供精准、有效的信息,提高网上资源的利用率。

(4)实现DC与MARC的映射。结合图书馆的编目工作内容,MARC格式属于较复杂、经过结构化处理的设计方案内容,数据加工的效率较低,需要对相关操作人员进行专业化培训。DC属于相对简单且便于控制的编目方案,可以对已有内容进行详细描述。图书馆可以将DC视为“中介”,实现对元数据的格式编目工作,可以满足用户的个性化需求。

元数据在编目工作中的应用如图3所示。

图3 元数据在编目工作中的应用

3.3 元数据作为用户使用数字图书馆的向导

数字图书馆的网站首页应提供馆内资源介绍信息,帮助用户快速了解图书馆的特点与具体的藏书范围;公示数据库内的全部元数据,高效引导用户进一步了解图书馆的检索内容。数字化图书馆应收集检索历史内容以及存在价值的检索测量,将元数据提供给用户,帮助用户制定自身的检索策略,会在很大限度上提升数字图书馆与用户间的黏度。

3.4 元数据在文件和档案管理方面的应用

我国已经进入知识经济时代,文件、档案的效能越来越显著,信息资源成为行政单位、企业内部的无形资产,管理这部分无形资产的方法会对企业及行政单位日常运转的效率造成巨大影响。电商产业、互联网产业深入发展,使文件管理的要求不断提升。目前,已经出现文件、档案专用数据格式,如EAD。

3.5 元数据在网络信息检索方面的作用

(1)网络宽带数据管理规模非常大。元数据主要标引不同形式的大规模数据,获取具备代表性的数据,并非信息本身。

(2)实现信息资源的检索与发掘。将元数据与数据结构运用在数据深入分析过程中,可以大幅度提高信息检索的速度。

(3)可以共享或集成不同结构的信息资源。标准的元数据描述完全可以在庞大网络环境中进行对比、集成、共享。

(4)控制限定检索的信息。元数据可以提升异化结构信息资源的检索速度,管理用户的检索范围,为用户提供增值服务,保证信息资源的安全性与保密性。

4 结语

元数据在数字图书馆中的运用至关重要。数字图书馆是信息时代的产物,处于蓬勃发展阶段,元数据是数字图书馆建设的关键技术,使数字图书馆的信息管理更加合理和科学,提高资源利用率。

猜你喜欢

编目检索图书馆
试析图书馆编目的边缘化与编目馆员的转型
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
图书馆
网络环境下图书馆编目工作问题探讨
新形势下高校图书馆编目工作面临的挑战和发展契机探讨
去图书馆
高校图书馆编目业务外包下的数据质量控制