艺术品数字化元数据模型构建
2019-07-22翁子扬李卓然
翁子扬 李卓然
(武汉大学信息管理学院,武汉 430072)
文化遗产数字化是指将信息技术应用于文化遗产的保护、开发与利用全生命周期过程中,从而达到提高保护效率与质量、减少对原件的使用与损坏、挖掘艺术魅力与文化内涵等目的的一系列活动总称[1]。对于我国文博机构而言,艺术品是物质文化遗产的重要组成部分,作为馆藏藏品的主要内容,面临最迫切的数字化需求。而目前我国艺术品数字化的进程面临的核心问题之一,就是建立规范化、可精确描述和互操作的元数据标准。因此,基于艺术品信息特征和信息需求,本文划分元数据模块,对艺术品特征信息进行横向和纵向扩展,构建便于互操作、适应管理与研究需求的艺术品元数据层次模型,以及相应的参考元素项,旨在为艺术品数字化进程提供可能的解决方案,使信息资源维护更加具有可行性,从而有利于艺术品数据的标准化管理,并服务于艺术品的研究、鉴赏与传播。
1 艺术品元数据标准及研究现状
视觉艺术中的艺术品可以理解为以鉴赏为目的或目的之一创作,能够实现独立美学功能的二维或三维物品。2016年文化部公布的《艺术品经营管理办法》将艺术品概括为“绘画作品、书法篆刻作品、雕塑雕刻作品、艺术摄影作品、装置艺术作品、工艺美术作品等及上述作品的有限复制品”[2]。这是国内对艺术品类型最为权威的概括。艺术品的特征包括:①具有依赖于主观衡量的艺术价值;②具有反映时代特征的历史性;③其艺术价值和历史性可以通过物理特征进行表达。艺术品的艺术价值迎合了人民的精神文化需求,使其相比于缺乏审美价值的历史文物获得了更多的公众关注度,从而诞生了庞大的艺术品展览与交易市场,并展开了诸多艺术品研究。因此,艺术品元数据标准的建立需求十分迫切,并且需要应对不同的应用场景。然而,艺术品的艺术价值难以客观衡量,它的物理特征及历史性更具有记录和研究的可行性与必要性,因此艺术品元数据标准更关注于对艺术品的客观描述。
元数据标准是指如何描述某些特定类型资料的规则集合,一般会包括语义层次上的著录规则和语法层次上的规定[3]。本文对国内外艺术品元数据标准及其研究和实践进行梳理与分析,并进一步阐述现有工作的不足。
1.1 国内外相关元数据标准
最早诞生的艺术品元数据标准是艺术作品描述目录(Categories for the Description of Works of Art,CDWA),它最早由艺术信息工作组(Art Information Task Force)在1990年制定,经过数次更新,现在包含约540个元素项[4],对艺术品信息的描述完整全面。1995年,联机计算机图书馆中心(OCLC)和美国国家超级计算应用中心(NCSA)制定了都柏林核心元素集(Dublin Core Element Set,DC),它包含15项核心元数据,其应用的对象包括各类网络信息资源,具有很强的复用性。美国视觉资源协会在1996年推出了VRA Core(Visual Resources Association Core)的1.0版本,用于描述视觉文化作品以及记录它们图像的视觉资源核心类目[5],VRA Core 4.0定义了19个核心类目,旨在对艺术品元数据进行基本的描述。1999年,国际文献工作委员会(International Committee for Documentation,CIDOC)开发了面向对象的概念参考模型,即CIDOC概念参考模型(CIDOC Conceptual Reference Model,CIDOC CRM),这是第一个国际文化遗产领域的本体,最新版本由98个类和174个连接类的属性组成[6],CIDOC CRM在2006年成为国际标准,标准号为ISO 21127:2014。1997年,盖蒂信息研究所发起用于描述文物的国际标准Object ID,便于在文物丢失或失窃的情况下,根据信息回收文物[7],是艺术品元数据在特定应用上的探索。
我国并没有在全国范围内建立权威的艺术品元数据标准,主要依靠由中华人民共和国国家文物局发布的中华人民共和国文物保护行业标准《馆藏文物登录规范》(WW/T 0017—2013)[8]进行馆藏信息的数字化记录。在地方层面,北京市质量技术监督局在2015年发布北京市地方标准《文物艺术品元数据规范》(DB11/T 1219—2015)[9],划分了标识、名称、分类等12个类目,下设不同级别的子元素对艺术品元数据进行详尽的描述。
1.2 国内外艺术品元数据相关研究
国内外学者对艺术品元数据的研究主要涉及元数据框架设计、核心元数据设计,以及对元数据扩展规则和语法规则的建议,从不同角度对政府部门制定艺术品元数据标准提供了参考。Baca[10]概述了ObjectID和VRA Core等艺术和建筑领域的描述性元数据架构,并填充了这些元数据架构所需的受控词表和分类系统,旨在处理元数据映射问题,以加强用户的访问。Graten等[11]以Bob Ross创作的“绘画的喜悦”为案例,分析了一组描述该艺术作品的3 324个标签,强调研究人员应用艺术作品元数据的需求,通过定量数据及其可视化来评估视觉文化。
国内在艺术品元数据方面的探索处于起步阶段,但已经有一些学者在数字博物馆馆藏信息管理与元数据建设方面提出了见解。针对数字文化资源,兰绪柳等[12]选择VRA Core作为核心格式,CDWA中部分元素作为扩展元素,提出了包含18个核心元素的元数据格式,并以亚伯拉罕·林肯雕塑为例解释所提出的元数据格式的使用方法及效果,该方案通过整合VRA Core与CDWA提出了核心元素,并没有对元素项进行扩展。易军凯等[13]提出了由核心元数据规范、专门元数据规范、元数据扩展规则组成的三级数字博物馆元数据规范体系,不仅提供了通用元数据规范,还提供了核心元数据的扩展规则,从而支持针对专门领域的馆藏文物元数据规范,对如何复用通用元数据规范提供了借鉴意义。龚花萍等[14]对文物信息资源元数据建设的原则、模型和方法进行探讨,并设计出以基本信息、局部信息、历史文化脉络信息、相关视觉文献、展览信息、记录管理信息为基本框架的元数据规范,对文物数据信息进行较详尽描述。
1.3 艺术品元数据实践现状
CIDOC CRM模型目前已被相关领域多个有影响力的项目采用为信息架构,如德国数字图书馆的基础信息资源架构和英国国家美术馆馆藏的RDF描述[15]。CDWA的应用实践更为广泛,许多主流博物馆馆藏管理系统的数据字典都以CDWA为基础或建立了与CDWA的映射,如艺术博物馆图像联盟(AMICO)数据字典以及智利的国家文献系统SUR都直接以CDWA为基础[10]。CDWA的范式也被国内借鉴,如杨西宁等在对敦煌壁画的描述中,参考CDWA、DC等元数据标准,提出了敦煌彩塑元数据标准和敦煌壁画元数据标准[16]。
国内文博机构并没有直接按照国外成熟的艺术品元数据标准对馆藏艺术品信息资源进行描述,主要是在行业标准的基础上,建立各自的馆藏数据库标准。中国国家博物馆在本馆元数据标准建设中,提出了由7个元数据元素集、60个元素,342个限定元素构成的元数据概念模型[17]。2013年,根据《文化部关于开展全国美术馆藏品普查工作的通知》,全国共320家美术馆参与藏品普查工作,其中藏品登记著录规范复用了《馆藏文物登录规范》[18],是我国为数不多的艺术品馆藏机构参与统一元数据管理的实践。贾君枝等[19]利用Alexa综合排名工具,调查分析了7个国内知名数字博物馆网站,发现数字对象特征选取普遍集中在时代、类别、名称、地点和作者5项,标引项覆盖面小、缺乏主题和个性化描述。
1.4 已有规范和研究现状总结
目前国外的相关研究及实践较为完善,广泛涉及数据结构标准、数据内容标准、数据值标准和数据交换标准,而国内的研究及实践大多只是围绕数据内容标准展开,形成少部分数据结构标准。对国内外艺术品相关元数据标准的比较分析如表1所示。
表1 艺术品相关元数据标准比较分析
通过对这些标准、研究及应用进行梳理,可以对国内外艺术品元数据的现状作如下总结。
(1)丰富的研究成果与各自为政的管理实践。在国外,VRA Core、CDWA等相关元数据标准已经在学术领域得到认可和广泛应用,由核心元数据、扩展规则、映射规则等内容构成完整的艺术品元数据体系,国内外各类研究也提出了具有独创性和实用性的元数据方案。然而,仅有CDWA得到了较广泛的应用,国内外大多数博物馆仍然以独立的馆藏数据标准运作。不通用的馆藏数据标准带来了元数据互操作问题,虽然通过元数据映射规则可以应对互操作问题,但对管理人员在元数据互操作中的专业素养提出了较高要求。
(2)扁平化的数据架构。国外主流的艺术品元数据标准没有对艺术品元数据的类目进行划分,元数据框架结构扁平化,无法对元数据进行分类管理。在国内,虽然相关标准和研究都是在分类的基础上进行的,但类型划分较为粗糙,如《馆藏文物登录规范》仅划分了基本信息、管理信息、影像信息。而部分研究即使进行了较细致的分类,也没有给出分类的依据和对实践的适用性。空泛地划分元数据类别脱离了元数据采集与应用的实际,对元数据管理的作用很小。
扁平化而缺乏细致分类的元数据架构在数据采集端难以明晰权责,在数据应用端则容易混淆数据的应用场景。如许多博物馆直接将馆藏元数据用作对外藏品数据库中的艺术品特征描述,导致“入藏库房”“入藏日期”等不受公众关注的管理信息被多次地展示出来,就是缺乏合理分类导致的应用场景混淆。
(3)弱化艺术品特征信息的数据内容。当前元数据的研究重点主要是对网络环境下的数据描述和数据管理[20],在艺术领域元数据通常用于艺术品馆藏数据的记录、检索和管理,导致艺术品元素项的设计忽视了艺术品特征信息的重要性。如《馆藏文物登录规范》和龚花萍等[14]的数字文物博物馆信息资源分类将艺术品特征信息划分在艺术品基本信息的范畴内;而包括VRA Core在内的国内外艺术品元数据管理实践,对艺术品特征信息仅在材质、度量值、局部信息等基本方面对艺术品特征信息进行描述。然而,对于艺术品研究而言,最关键的信息之一就是物理特征,目前的艺术品元数据规范已经具备完整描述大多数艺术品信息的能力,但在艺术品特征信息方面的描述一直不够多元和精细。
基于国内外艺术品元数据研究和实践存在的不足之处,本文通过建立艺术品元数据层次模型来改进已有的研究成果。
2 艺术品元数据层次模型构建
艺术品元数据层次模型从整体上对艺术品元数据标准架构进行规划,描述了艺术品元数据标准在语义层次上的内容,包括元素项的层级关系以及它们之间的关联,可以为艺术品元数据标准的制定提供逻辑框架以及相应可参考的元素项。
2.1 艺术品元数据层次模型建设方法
在构建艺术品元数据层次模型之前,首先需要确定模型的构建原则,也就是根据目前艺术品元数据规范所存在的问题提出相应的解决措施,从而明确模型的建设目标和方向。
2.1.1 模块化划分支持元数据互操作
我国艺术品保护工作面临数量多、种类多、分布广,以及可利用资源十分有限等问题,因此需要全国各文博机构在不同环节共同参与元数据维护。除了通过元数据映射和建立资源描述框架实现互操作以外,目前亟需改进的方向是对元数据类目进行模块化划分,通过明晰元数据的维护权责和应用场景,实现元数据共建共享流程便利化。对元数据类目进行模块化划分的依据主要是元数据的维护主体和功能。
维护主体是指采集、记录、更新、纠正某类数据信息的主体,在艺术品领域主要包括专业研究者和馆藏管理者两种身份类别。需要不同的主体参与维护的元数据,会导致主体之间的权责不明,不利于元数据的维护,因此对具有不同维护主体的数据信息应该划分为不同模块。元数据功能的不同决定了元数据的应用场景,模块化可以使维护主体根据需求选择特定模块进行元数据记录,降低元数据共建共享门槛。艺术品元数据的基本功能可以概括为描述、管理和关联。
因此,根据元数据功能和维护主体的不同,可以划分为基本信息、局部信息、特征信息、馆藏管理信息、对象记录信息、流转记录信息、数字影像信息、辅助资料信息8种元数据模块,如表2所示。
2.1.2 进行特征信息的横向和纵向扩展
对于文博机构和科研机构而言,艺术品特征信息是进行艺术品鉴定与研究的素材。艺术品鉴定的内容可以划分为辨伪、断代、评定价值、评定等级四大方面[21],为实现艺术品鉴定目的,需要对艺术品特征信息进行横向和纵向扩展,进行更细致的描述。横向扩展是指通过增加元数据元素的方式对当前元数据进行语义的扩充;纵向扩展,即对当前元数据元素语义进行更加严格的限定,生成新的元数据修饰词[13]。扩展过程包括3个步骤。
表2 艺术品元数据模块划分
(1)需要单独划分艺术品特征信息模块。艺术品特征信息是对艺术品材质、颜色等底层特征的客观描述,是进行艺术品鉴定研究活动的主要考察对象,它与提供基本描述和检索功能的基本信息存在差异,需要专业研究人员进行特征信息的采集和维护,因此艺术品特征信息应当单独划分模块。
(2)对艺术品特征信息进行横向扩展。艺术品外貌特征涉及化学组成、微观结构以及光谱和颜色等多方面的综合属性[22],简单的材质形状描述难以全面概述。因此,除了材料、测量值两个最基本的元素,还应当根据实际研究需求,对光谱信息、色彩特征、颜料特征、工艺技法等元素进行描述。
(3)对艺术品特征信息进行纵向扩展。传统的艺术品数字采集手段受到环境、设备的影响而无法保证其记录的真实性,以色彩为例,传统的艺术品图像采集所得到的只是特定设备和环境下的色彩显示,且受到随年代变迁而产生的褪色、脱落、变色等问题的干扰,无法记录精确的色彩信息。因此,需要运用更专业的艺术品数据特征采集技术进行数据采集,通过更多的元素修饰词进行元数据纵向扩展,进行更深层次的格式化描述。
2.2 艺术品元数据层次模型
艺术品元数据层次模型在借鉴已有标准体系和研究框架的基础上,结合研究人员与管理人员的元数据使用需求,整合基本功能相同的元数据模块,从描述元数据、管理元数据和关联元数据3个方面设计元数据模型,并给出每个模块的核心元数据,艺术品元数据层次模型如图1所示。
图1 艺术品元数据层次模型
2.2.1 艺术品描述元数据
艺术品描述元数据是对艺术品内容特征、外在特征、背景特征的描述,便于了解艺术品的创作背景、内容、外观状态和底层特征。描述元数据包括基本信息和具体描述,具体描述主要包括特征信息与局部信息两个方面。通过将描述元数据划分为3个模块,能够强调模块所描述内容的差异性,满足不同层次的应用需求,如表3所示。
(1)基本信息。艺术品基本信息是指对艺术品进行描述的基本属性,也是信息检索的主要检索项,是艺术品元数据的核心模块。基本信息以VRA Core为基础,并参考其他元数据规范中基本信息内容的描述,列举出12个元素项,其中名称、创作者、标识、类型、文化背景、时间、描述是核心元素项。
(2)局部信息。局部信息是对艺术品局部区域的特征信息描述,反映了特定艺术品与其他艺术品的本质区别。题识、献辞、标记等局部信息是对历史文化事件脉络的记录,对考古与历史研究具有重要价值。每一项元素包含一个核心元数据修饰词,分别是纹饰描述、题识内容、献辞内容、标记描述、附属品名称。
(3)特征信息。特征信息是对艺术品整体对象的外在特征描述,是艺术品鉴定活动的结果记录,也是艺术品研究所需的关键信息。首先对VRA Core中的Measurements、Material、Technique元素项进行重用,通过横向扩展,在已有元素项的基础上增加光谱特征、颜料组成等元素项,从而丰富对艺术品特征信息的描述;然后,通过纵向扩展用修饰词进行格式化地详细描述,精确记录艺术品特征信息。其中测量值纵向扩展了形状、长度、体积、重量四个维度,光谱特征纵向扩展了波长阈值、波长间隔阈值、参考样本光谱三个方面,颜料组成包含色彩成分序列和颜料成分序列两类,材质组成纵向扩展出质地类别和材料成分序列进行修饰,工艺技法纵向扩展了成型工艺和装饰工艺两类。纵向扩展增加了艺术品特征信息的深度。
2.2.2 艺术品管理元数据
艺术品管理元数据是对艺术品保存管理和历史记录管理信息的描述,从而保证艺术品及艺术品信息的安全性、管理规范性。本文给出的艺术品管理元数据将《馆藏文物登录规范》中的馆藏文物管理信息拆分为馆藏管理信息、对象记录信息、流转记录信息3个模块,如表4所示。
表3 可参考的艺术品描述元数据
表4 可参考的艺术品管理元数据
(1)馆藏管理信息。馆藏管理信息是馆藏机构对艺术品在机构内保管情况的记录,是通过馆藏数据库对艺术品进行安全管理的工具,属于核心元数据模块。馆藏管理信息包括入库记录、保管信息和注意事项3个元素项,其中入库记录与保管信息是核心元素。馆藏管理信息只在馆藏机构的内部数据库进行记录,艺术品流转至其他机构时馆藏管理信息不参与共享。
(2)对象记录信息。对象记录信息是对艺术品本体活动的历史记录,是保证信息完整性、提高艺术品鉴定效率的必要工具。艺术品鉴定、修复与损坏情况需要进行专业评估,因此对象记录信息的维护需要专业研究人员的参与,由专业研究人员与管理人员共同完成数据记录。对象记录信息包括鉴定记录、修复记录、损坏记录3个元素项。
(3)流转记录信息。流转记录信息是艺术品因特定原因发生地理位置或保存环境变动的历史记录,是体现艺术品价值的关键信息;同时,流转记录通过描述完整的移动轨迹,为艺术品安全性提供了保证。本文根据艺术品流转活动类型,列举出发掘记录、收藏记录、交易记录、赠与记录、展览记录5个元素项,根据实际流转情况进行描述。
2.2.3 艺术品关联元数据
艺术品关联元数据是对与艺术品相关的资料和资料保存状况的描述,是对艺术品背景、状况和特征的侧面描述,从而为艺术品研究鉴定活动提供支持,包括数字影像信息和辅助资料信息两个方面,如表5所示。
表5 可参考的艺术品关联元数据
(1)数字影像信息。数字影像是以图像、视频、三维建模等形式对艺术品的数字化描述,是馆藏机构对艺术藏品制作的数字副本,以直观的视觉效果展示艺术品特征。数字影像信息包含普通图像、光谱图像、三维影像、其他影像4个元素项,并用修饰词描述与数字影像制作、存储、管理相关的数据信息。
(2)辅助资料信息。辅助资料是对艺术品背景信息或特征信息进行记录、描述、研究的文献资料,是研究人员进行艺术品研究活动时的参考资料。辅助资料信息记录了相应文献资料的基本信息,为参考资料的查阅提供索引。根据载体形式的不同,辅助资料信息可以划分为文字资料和数字资料2个元素项,根据载体特点使用不同的修饰词对辅助资料进行描述。
经过对艺术品元数据模块的划分,整合为艺术品描述元数据、管理元数据和关联元数据3种类别,并选择、优化与扩展对应的元素项。另外,还需要进行语法层次上的规定,即对确定的元数据进行标准化与格式化管理,须完善的内容包括受控词表、编码体系、著录规则等[23],通过一系列工作初步建立起规范化的艺术品元数据标准。
2.2.4 艺术品元数据层次模型特性
艺术品元数据层次模型相比国外的ISO 21127:2014和CDWA等相关元数据标准,最主要的特点是进行了元数据的分类,可以明晰元数据的维护权责与应用场景,在文博机构各自为政的元数据管理实践环境下,从底层设计的角度为众多的异构元数据标准之间进行互操作创造了条件。本文将艺术品元数据划分为描述元数据、管理元数据和关联元数据3个方面,照应《馆藏文物登录规范》的基本信息、管理信息、影像信息,用于形容元数据基本功能和性质的差异,但在实践中元数据的分类管理依赖于模块的划分。通过从维护主体和模块功能两方面划分出的8个模块,可以保证元数据分类符合元数据管理实践的切实需求。
在数据内容上,艺术品元数据层次模型与其他标准相比主要是对特征信息进行扩展,单独将特征信息作为一个模块,而非在基本信息中简单描述特征信息,利用横向和纵向扩展来解决元数据实践中数据项覆盖面小、难以满足研究需求的问题。对每个模块的元素及修饰词,本模型参考和融合了不同标准的数据内容,通过查漏补缺和去除冗余,建立了较完整的元素集。
3 结语
本文通过分析现有元数据规范与研究的不足,提出模块化的艺术品元数据层次模型,划分了8个元数据模块,并根据元数据基本功能的不同,将8个元数据模块整合为描述元数据、管理元数据和关联元数据,通过搭建树状层级结构为艺术品元数据互操作提供可能的路径。在艺术品描述上,区分了提供基本描述和检索功能的基本信息,提供具体描述的局部信息和特征信息,并对特征信息进行了横向和纵向扩展,提高艺术品特征信息描述的精度;在艺术品管理上,根据维护主体和应用场景的不同,划分了馆藏管理信息、对象记录信息和流转记录信息,提供了相应可参考的元素项,使艺术品管理流程更加清晰;在艺术品关联上,通过整合现有规范,区分了采集拍摄获取的数字影像和收集整理获取的辅助资料,从不同维度辅助艺术品的研究鉴定活动。总之,艺术品元数据层次模型可为我国相关领域的规范和研究提供思路,通过模块化划分,为艺术品元数据互操作创造更加有利的条件,从而更便捷地实现文化遗产艺术品的数字化。而具体元素项与修饰词的制定以及语法层次上的规定,还有待进一步的探索与完善。