APP下载

非物质文化遗产数字资源元数据标准应用的研究和思考*

2016-05-17李月明湖南图书馆长沙410011

图书馆 2016年2期
关键词:语义文化遗产数据库

张 勇 蔡 璐 李月明(湖南图书馆 长沙 410011)



非物质文化遗产数字资源元数据标准应用的研究和思考*

张勇蔡璐李月明
(湖南图书馆长沙410011)

〔摘要〕文章在分析非物质文化遗产数字资源元数据标准的基础上,通过元数据试著录、平台模拟实现等方式,阐述了元数据标准与本地资源、应用平台、用户的对接中存在的问题,为完善和推广应用非遗元数据标准提供思路。

〔关键词〕非物质文化遗产数字资源元数据标准

〔分类号〕G254

〔引用文本格式〕张勇, 蔡璐, 李月明.非物质文化遗产数字资源元数据标准应用的研究和思考[J].图书馆,2016(2):38-42

*本文系湖南省科技厅科技计划项目“数字化传承视域下非物质文化遗产分类和元数据标准研制与推广研究”(项目编号:2014GK2018)的研究成果之一。

前言

非物质文化遗产资源(以下简称非遗)是一类具有重要价值的、珍贵的文化信息资源。在非物质文化遗产领域开展数字资源建设与服务,需要研究制定元数据标准规范和分类体系,并进行实际应用和推广。文章在研究已有非遗元数据标准的基础上,通过对标准的试著录检验及在全文检索数据库管理平台上的模拟实现,分析其在具体项目应用中对接非遗资源、应用平台、用户等模块时可能出现的问题及注意事项,为非遗元数据标准的制定、完善和推广应用提供指导。

1 非遗元数据标准化应用的意义

实现非遗资源元数据标准化的应用可以为非遗信息的发现、获取、管理、利用、整合提供理论依据、方法和技术手段;同时,利用元数据标准框架的著录系统还可以实现非遗信息的计算机统一著录,方便建立非遗信息资源库。

1.1有助于优化非遗信息的管理,实现不同信息源的非遗信息融合

非遗数据标准化能有效促进非遗的产业化运作,提高非遗数据库效能和经济产出。产业化、市场化是非遗保护和发展的最佳手段和途径,非遗元数据标准与实际应用对接能消除非遗市场化、产业化进程中标准不统一的障碍,从而提高非遗数据库的利用效率。

1.2有助于不同信息源、不同格式、不同语言非遗信息的交换,提高非遗信息的利用率

非遗数据标准化能有效解决非遗资源分布分散、重复建设和利益冲突等问题,提高非遗产品的生产能力和效率,提高非遗资源产品的供给服务能力,节约社会成本。

1.3有助于丰富非遗资源及其相关领域研究

非遗数据标准化能方便用户对非遗信息的发现、获取和信息共享,使大量有价值的非遗信息为各级用户所用,非遗领域及其相关领域的研究得以不断丰富,形成了可观的社会效益。

2 非遗元数据标准

在非物质文化遗产资源库建设的具体项目中,元数据标准作为信息组织工作的重要一环,其制定过程是以“非遗元数据标准框架”为基础,结合实际应用需求,并按照一定的工作流程设计本地元数据应用方案。

2.1非遗元数据标准基本框架

非遗元数据标准是对非遗相关信息资源一般属性和特殊属性进行描述所形成的数据元素集合。然而这些元素又具有一定的层次性,由抽象到具体,其基本框架如图1所示。

图1 非遗元数据标准框架结构

(1)非遗核心元数据标准,也称非遗通用元数据标准。它是非遗元数据标准的核心部分,也是制定非遗专门元数据标准和本地元数据标准的基础,这个元素集适合非遗所有资源类型,包括名称、主要责任者、主题、描述、出版者、其他责任者、日期、类型、格式、标识符、来源、语种、关联、时空范围和权限等15个核心元素。

(2)非遗专门元数据标准。由于非遗资源的特殊性,有些类型的非遗资源并没有相应的国际标准或行业标准可采用。非遗专门元数据标准是根据非遗资源特点,以核心元数据标准为基础进行扩展,而制定的针对非遗专门数字对象的元数据标准,且在非遗资源领域内具有通用性。非遗专门数字对象元数据包括的类型有:非遗项目、人物、机构、实物和电子资源,其中电子资源包括古籍、舆图、家谱、拓片和地方志、期刊论文、会议论文、学位论文、电子图书、网络资源、音频资源、视频资源和图像资源等。

(3)非遗本地元数据标准,也称非遗应用元数据标准。课题组针对《湖南图书馆非物质文化遗产数据库》具体的应用需求,基于核心元数据标准和专门元数据标准而设计的、适合于《湖南图书馆非物质文化遗产数据库》应用系统的元数据规范。

非遗元数据标准框架三个层次的划分,目的是为了保证在元数据标准一致性和整体性的基础上,最大限度地体现不同系统和资源的特征,给予标准的使用者和制定者更大的自由度,有利于标准的推广应用。

2.2非遗资源的体系构建

非遗保护是一项系统工程,非遗保护涉及的对象、内容广泛,从系统论的角度来看,非遗保护涉及主体、客体、过程、成果、环境等五大基本因素,这些基本因素相互作用形成一个有机整体。

(1)主体是指参与非遗保护的机构或人物。非遗保护机构根据其性质可分为生产机构(如歌舞、戏曲、书画等艺术创意或表演机构和组织)、管理机构(如非遗保护涉及的教育、科技、文化等国家和地方行政管理部门)、保护机构(如非遗保护的专门机构或组织)、传播机构(如博物馆、档案馆、图书馆、文化馆、广播电视台、出版发行机构、艺术学校、高校艺术院系等)、研究机构(如非遗保护的专门研究机构、高校艺术院系等)和其他机构(无法列入以上部分的机构和组织),且参与非遗保护的很多机构具有多重属性;根据非遗保护的机构类型和性质,人物有创造者、表演者、生产者、传播者、管理者、研究者、公众等,参与非遗保护的很多个人也具有多重属性。

(2)客体是指非遗保护的对象,即非遗资源。非遗资源包括显性非遗资源和隐性非遗资源两大类。显性资源以实物、文字、图片、符号、声频、视频等形式存在于各类物理载体中,如工具、道具、原材料、制成品、手稿、照片、图片等事物,表现为物质形态。隐性资源无形存在于组织机构(如艺术机构或团体等)或依附于个人(如创造者、传承者、表演者、生产者、传播者、研究者等)的技能、技艺、技巧中,具有活态性,需要实时呈现,以事件(活动、表演等)的形式来表达,表现为非物质性,有些可复制,有些不可复制。

(3)过程是指非遗保护主体作用于非遗客体的方式和手段,如非遗保护机构或个人通过各类项目或活动保护、修复、传承、传播、保存、研究非遗资源,形成非遗保护成果。

(4)成果是指经过非遗保护过程而产生的各类成果。主要包括记录非遗的载体和非遗的内容两方面,经过保护的非遗资源又以显性和隐性方式呈现,成果又成为新的非遗资源。记录非遗的载体有非遗实物、与非遗有关的文献(纸质文献、声像文献、缩微文献、数字文献,如数据库、网页、网站等)、非遗艺术人才(大脑、口耳相传)等。记录非遗的内容包括非遗内容的生产、表演、创意、创造、再现、展示、展现、呈现等。

(5)环境是指完成非遗保护所需要的运行机制和保障条件,主要包括非遗保护的政策、法律、法规、制度、经费、技术、设备、人员(教育)等。

2.3非遗元数据标准应用

非遗元数据标准本地化是应用多个元数据标准形成元数据方案的规范形式,具体应用于非遗领域具体项目的元数据方案设计,其基本流程如图2所示。

图2 非遗元数据标准本地化应用流程图

(1)首先是非遗资源分析。针对非遗数据库建设的应用需求,分析本地非遗资源类型、特征及文献的利用方式。根据对资源的分析结果,明确非遗资源对象,详细列出相关对象实体以及对象之间的相互关系,定义各资源对象所要描述的所有属性,为本地化元数据标准方案的制定提供信息基础。

(2)根据基本元数据规范和资源分析结果,确定核心元素。确立非遗元数据标准中元素与资源对象属性之间的对应关系,精炼应用领域元数据元素集。元素的语义根据所引用的标准规范进行限定,若对象属性在语义上与现有标准中的元素不一致,则根据扩展原则来扩展元素或元素修饰词。

(3)规定元素属性的限定原则,确定元素修饰词和编码体系修饰词。考察需要进行规范控制的属性,包括对所有元素和子元素的必备性、可重复性、取值范围、数据类型等进行规范控制。

(4)制定著录规则。分析元数据标准中的每个元素,制定详细的著录规则,包括详细规则、实例等,用来指导数据的标引。

(5)规定上述元数据的编码规则。也就是元数据的形式化表述,推荐采用描述功能较强的XML/RDF。

(6)最终是系统的实现。包括系统需求的分析、数据结构的设计、检索需求等,将元数据方案形式化表达的元数据应用到具体数据库系统中,在语义上和功能上保持等价。

3 非遗元数据标准与本地化应用的对接

本地化应用对接模块主要包括本地非遗资源(资源分析、对象建模)、用户需求(元素的选择、限定、扩展、规范与著录规则)和应用平台(编码规则、试著录系统)三个部分。因此,在具体应用非遗元数据标准时,需要根据所涉及的资源、平台和用户实际情况,与现有非遗元数据标准进行对接,设计或规范出本地元数据应用方案。

3.1非遗元数据标准与本地资源的对接

非遗元数据标准应该适用于不同地域、各种载体类型的非物质文化遗产数字资源的元素集合。非遗元数据标准与非遗本地资源间的对接主要涉及三个方面的问题:一是标准对非遗资源分类是否清晰全面;二是标准及其子集与各类型对象资源的映对是否准确且具有专指性;三是标准元素集是否完整揭示对象资源的基本信息。

3.1.1非遗资源分类

制定元数据标准首先要对该领域资源进行调查分析,包括对资源本身的调查,以及对资源管理者、使用者的需求进行分析等,再以此为基础构建一个清晰全面的对象资源概念模型,最后依据概念模型对资源进行分类。确定的概念模型应包括以非遗项目为组织核心的六个概念,即项目、人物、机构、事物、事件和文献,且定义了各概念之间的关系及属性。以项目为核心的概念模型几乎囊括了所有已知的非物质文化遗产资源类别,并将非遗资源划分成界限清晰、内容全面的六大类对象数据。

由于非物质文化遗产的普查、申报、保护、研究和传播都是围绕具体项目开展的,因此,在此过程中所建立起来的各类信息都是非遗信息组织的对象。

3.1.2专门元数据标准与各类型对象资源的映对

非遗元数据标准应包括三个层次:核心元数据层、专门元数据层和本地元数据层。核心元数据层是一个可映对到所有非遗对象资源的通用基础元素集。在非遗领域,具有特殊属性的非遗资源类型形成了非遗专门元数据,非遗元数据标准中各种专门类资源对象都有相应的专门元数据标准与其映对。对于事物、事件和文献类对象,它们都和项目、人物、机构类对象存在关联,并在元数据标准中通过“关联(relation)”的元素修饰词来建立联系。

3.1.3元素集对资源的描述和揭示程度

元数据标准是领域内多个元素及修饰词的集合,该集合内收录的元素及修饰词组成了描述对象资源的基本单位。对象资源基本属性的描述与揭示是否全面,取决于该标准中最小元素集内元素的个数、属性以及标准是否支持灵活的拓展。

非遗元数据标准可以采取复用DC(都柏林核心元素集)全部的15个基本元素及部分修饰词作为其核心元素集合的方法。由这些元素及修饰词组成标准的最小元素集,用以满足所有数字资源基本信息的描述。以非遗核心集为基础制定的专门元素集和本地元素集,可以在与已有元素无语义重复的前提下灵活扩展元素、元素修饰词或属性值,且能根据不同层级的需要,加深对资源信息的描述和揭示。

3.2非遗元数据标准与应用平台的对接

元数据功能的实现必须依靠应用平台来进行信息组织和管理。作为一种结构化的数据,元数据可应用的范围与平台有很多,如不同的操作系统、数据库管理系统、网站内容管理系统以及语义Web等。要与这些不同应用平台实现对接,元数据标准必须具备支持多种系统平台通用的编码语言、存储方式和语义定义。

3.2.1编码语言

编码语言,即元数据的置标语言(标记语言),是一种将文本及文本相关的其它信息结合起来,展现出关于文档结构和数据处理细节的电脑文字编码,便于软件平台的理解和识别。常用的元数据编码语言有XML和RDF,这两种编码语言具有较强的描述能力。XML是一种元置标语言,是一种用于标记电子文件使其具有结构性的标记语言。它将数据的显示样式与数据本身相分离, 具有良好的可扩展性。RDF是一种用于描述Web资源的标记语言, 是描述网络中资源的W3C标准。

国际上有一定影响力的元数据标准( 如Dublin Core、EML 和FGDC等)几乎都是采用XML作为其源语言。以XML作为源语言的非遗元数据将会变得简单易用,方便拓展,可在大多数应用软件中被读写,能与不同类型的操作系统、应用平台实现良好对接。

3.2.2元数据存储

非遗元数据标准中定义的元素不但包括语义,也包括了对象之间的关联。采用XML、HTML或RDF编码语言来描述,能很好地表达语义和关联。按照数据的存储形式,数据库类型可以分为结构化数据库、非结构化数据库和语义数据库三种,相应地,以上三种数据库存储的数据类型分别为结构化数据、非结构化数据和语义数据。三种类型的数据库存储元数据语义和关系的比较,如表1所示。

表1 元数据存储方式比较

由表1可以看出,元数据存储在非结构化数据库或语义数据库中最为合适。然而,实践中的应用平台多以关系型数据库为主。采用关系型数据库时,元数据的语义和关系存储在数据库结构中,对于元素为多值的,一般可采用关系表来存储;对于元素具有“属性”修饰的,可通过增加字段来存储元素的“属性”。在元数据信息交互时,再将关系型数据转换为XML数据格式。在实践中,应用平台多以关系型数据库为主,采用关系型数据库时,元数据的语义和关系存储在库结构中,对于元素为多值的,一般采用关系表来存储;对于元素具有“属性”修饰的,可采用增加字段来存储元素的“属性”。在元数据信息交互时,再将关系型数据转换为XML数据格式。

3.2.3语义定义

非遗元数据标准可以采用与DC一致的方法,即采用ISO/IEC11179标准来定义元素,从名称、元素、标识、定义、必备性等方面来准确定义元素。为防止语义畸变并确保兼容性,非遗元数据标准核心元素可完全复用DC元素的中英文名称,但对各元素应该赋予非遗数据资源特定的注释描述,并可以设定一些必需的子元素。子元素(元素修饰词以及编码体系修饰词)可同样参照此方法定义,并在注释项说明其母元素。为便于广泛使用,元数据标准定义应尽量宽泛些。

3.3非遗元数据标准与用户的对接

非遗元数据标准的使用者主要是非物质文化遗产的研究、管理、制作机构(公共图书馆、文化局)或者工作人员(编目员、研究员)。如何对接好这些用户,主要涉及到用户需求、宣传推广与应用等几个方面。

3.3.1用户需求

用户需求分析是通过对非遗用户的调查分析,确定即将制定的元数据应用方案需要具备的功能和要达到的效果,来实现用户与标准之间的完好对接。非遗元数据标准中元数据的7大功能(描述、定位、管理、评估、检索、交互、选择)和5个基本原则(一致性、通用性、专指性、互操作性、可拓展性),都需要与用户的应用需求相一致。

3.3.2宣传推广

非遗元数据标准是非物质文化遗产保护、管理与传承的有利工具,但由于非遗元数据标准层次复杂、描述的对象种类繁多,为方便用户利用,可以配套提供非遗元数据标准应用指南,以帮助用户制定本地非遗元数据的应用方案。由于按规范标准应用的用户并不多,因此可以选取公共图书馆用户作为试点,并通过应用加大宣传和推广范围。

3.3.3标准的应用

标准制定的最终目的是得到用户的认可并进行广泛应用,用户应用的效果是衡量标准与用户对接的一项重要指标。非遗元数据标准中的核心元数据层和专门元数据层的标准需考虑用户的著录元素的复用,非遗元数据的拓展等需求。在实际应用环境中,还应支持用户在不违反基本语义规则的前提下,可通过简单复用实现对非遗资源的著录描述,或采用增加本地元素集的方式,实现对元素集进行纵向与横向拓展。

4 非遗元数据标准对接问题分析

非遗元数据标准化框架的层次性和可扩展性,以及规范的本地应用方案,可为本地非遗元数据规范的制定以及与各应用模块的对接提供理论和技术支撑,但实际应用中也存在一些不可避免的问题。

(1)随着非遗保护工作的深入开展,新的非遗对象资源将不断涌现。只有一个或少数几个元数据标准将不能完全满足非遗信息资源建设的发展需求,如何不断完善非遗信息元数据标准体系建设,使非遗元数据标准一直处于一种活态,以方便对接不断发展的非物质文化遗产资源是需要不断思考的问题。

(2)针对语义环境中信息资源的复杂多样性,为保证信息资源的可理解性,非遗元数据标准应提供面向语义的信息资源描述能力。如何将本体论方法完全应用到非遗领域,对元数据起到补充和高层互操作的作用需要进行不断的实践。

(3)面对数据库应用平台的多样性,非遗元数据标准在与各平台对接过程中,采用XML或RDF编码语言描述的非遗元数据,转化为结构化数据库应用平台的数据结构时,元数据语义和关系越丰富会使得数据结构越复杂,系统实现难度以及维护和更新成本加大。如何保证在核心元数据的语义和关系不损失的情况下来设计数据存储结构需要不断思考。

(4)随着信息资源管理向知识资源管理的转变,信息组织也转变为知识组织,现有非遗元数据标准中对各类信息资源的组织是以知识载体文献为单位,而不是非遗知识本身,只能保证检索出文献含有所需知识的外型特征,而不能揭示文献中的内容特征和知识之间的联系。在非遗元数据标准设计中加入以知识为单位的知识标引将变得越来越重要。

(5)非物质文化遗产数字化保护过程中收集了大量的音频和视频资源,非遗音视频专门元数据标准在实际对接应用模块时只对其外部特征进行了标引,而其中语音、视频的信息更为重要,这种实时的、线性的信息存在与获取方式对于信息使用者而言具有局限性,如何进行可视化标引,从而提高音视频资源的组织、检索和获取效率需要不断探索和实践。

5 结语

随着非遗保护工作的开展和深入,非物质文化遗产数字资源库元数据标准与应用也会出现一些新的现象或问题。如何使非遗元数据标准与应用一直处于一种活态,方便对接不断发展的非物质文化遗产资源,是个值得研究和深思的问题。

(来稿时间:2015年9月)

参考文献:

1.肖珑,陈凌,冯项云等.中文元数据标准框架及其应用[J] .大学图书馆学报, 2001(5):29-35

2.张鼐.基于元数据标准基础用RDF和XML构建语义Web[J].现代情报, 2007(10):220-223

3.于忠庆,张东,王惠临. DC元数据标准中文化探讨[J].情报杂志, 2008(11):111-113

4.赵华,王健国.内外科学数据元数据标准及内容分析[J].情报探索, 2015(2):21-24

5.刘嘉. 元数据导论[M]. 北京:华艺出版社,2002

6.陈彩红. 国内外元数据标准宏观比较研究[J]. 河北科技图苑, 2011(1):65-67

7.张茜.电子文件管理元数据需求分析理论研究[J]. 浙江档案, 2008(3)

·学术论坛·

Study and Thinking on Metadata Standard Application for Intangible Cultural Heritage

Zhang YongCai Lu Li Yueming
( Hunan Library )

Abstract〔〕Based on analysis of the metadata standards of digital resources of intangible cultural heritage this paper discusses some problems about the metadata standards docking with the local resources, application platform and users order provide ideas to improve and promote the metadata standards of intangible cultural heritage by the metadata test description and simulation platform.

Keywords〔〕Intangible cultural heritageDigital resourcesMetadata standard

〔作者简介〕张勇(1962-),男,湖南图书馆研究馆员,研究方向:图书馆管理和文献信息资源建设;蔡璐(1976-),女,湖南图书馆副研究馆员,研究方向:数字图书馆技术;李月明(1975-),女,湖南图书馆副研究馆员,研究方向:信息资源管理。

猜你喜欢

语义文化遗产数据库
与文化遗产相遇
酌古参今——颐和园文化遗产之美
语言与语义
活态文化
数据库
《文化遗产》2016总目录
批评话语分析中态度意向的邻近化语义构建
“社会”一词的语义流动与新陈代谢
数据库
“吃+NP”的语义生成机制研究