基于用户协作的非物质文化遗产数字资源分类模式研究
2017-04-07刘向红
刘向红
〔摘要〕非物质文化遗产数据库对非遗资源的分类,必须遵从《非物质文化遗产数字化保护专业标准》,但这种分类方式存在一些问题。为了充分揭示非遗资源的特性和非遗资源之间的文化关联性,以建设承德地区非遗数据库为例,引入大众标注标引资源的方式来补充专家分类的不足:用户协作建设基础标签库,使用基础标签作为推荐标签,使用时间、空间、文化场所标签作为文化空间标签,由推荐标签等形成的高频标签作为专家分类的二级类目的备选,构建基于用户协作的非遗数字资源混合分类模式。
〔关键词〕非物质文化遗产;大众标注;分类;标签;数字化
DOI:10.3969/j.issn.1008-0821.2017.03.004
〔中图分类号〕G2541〔文献标识码〕A〔文章编号〕1008-0821(2017)03-0021-05
〔Abstract〕For classification of intangible cultural heritage resources of the intangible cultural heritage database,《Digitized safeguarding of the intangible cultural heritage(ICH)》must be followed.There are some problems for the classification of heritage intangible cultural heritage resources for the existing database system.In order to reveal the characteristics and cultural relevance of intangible cultural heritage resources,for example,the construction of database of intanginble cultural heritage in Chengde,learning classification method of WEB20 system,that folksonomy tags resources to overcome defects in expert classification:build basic tags database by user collaboration,use basic tags as recommended tags;use time,space,and cultural places tags as cultural space tags;use tags in high-frequency that come from the recommended tags as alternatives of the twice classification of expert classification,form mixed classification model of intangible cultural heritage base on user collaboration.
〔Key words〕intangible cultural heritage;folksonomy;classification;tags;digitalization
非物質文化遗产(以下简称“非遗”)是民族文化和地方文化的精华,很多非遗由于其传承的特殊性,无法得到广泛传播,而利用数字化等手段保护和传承我国的非物质文化遗产,一方面能够使非遗得到广泛传播和永久保存;另一方面也为相关人员研究、挖掘各民族、各地区的历史文化关联提供了便利,所以逐渐成为各地区、各民族非遗保护和传播的重要渠道。非遗资源种类繁杂,内容多样,相似及关联性强,国内现有的非遗数据库对资源的描述与组织方式较为单一,一般多为海量信息的简单堆积,进而使具有重要价值的非遗资源不能得到高效和整体性地利用和推广,对传播受众失去吸引力。这些未能以显性方式得到表达的信息资源可能恰恰是非遗传承与传播的重要内容及难点所在,如何从纷繁复杂的数字资源中提取细粒度的非遗信息,是亟待解决的问题[1]。
河北省承德市位于燕山腹地,长城之北,毗邻京津,特殊的区位和地理环境,决定了承德文化遗产的多源性和多样性。历史上,承德是北方多民族繁衍生息之地,特别是清代,历经辉煌、屈辱和光复的历史沧桑,聚居生活在这里的满、蒙古、回、朝鲜、汉等各民族沉积下了丰厚的非物质文化遗产[2]。承德地区现有人类非物质文化遗产1项、国家级非遗9项,省级非遗41项,市级非遗134项。本文以承德地区非遗数据库建设为例,探讨基于WEB20的互联网应用,构建用户协作的非遗数字资源分类模式,对非遗资源进行细粒度、多维度分类重组,实现其数字化保存和传播,推进非遗资源文化关联研究。
1我国非遗数字资源分类现状
11现状
目前,我国的非遗分类方法主要有四类法、六类法、八类法、十类法、十三类法和十六类法。其中,十类法使用最为普及,首先,各省、市、地区在进行非遗申报和审批时多采取十类法分类,有的地区如承德市在申报非遗时,会依据非遗资源的特征在10个类目下划分出二级类目。
其次,国内建设的非遗官网对非遗的分类多采纳十类法分类,考查目前国内基于数据库的非遗网站,以文化部主管的中国非物质文化遗产网[4]最具官方和权威表述,各省市非遗网站基本依此建设。此类非遗官网的核心类目(导航)“国家名录”将非遗项目均按十类法类目划分,均无二级类目。
还有,非遗数字化建设标准也是按照十类法类目制订。为便于非物质文化遗产数字化保护工作开展,保证数字资源建设质量,并为资源互通共享奠定基础,2016年6月,全国文化艺术资源标准化技术委员会发布了《非物质文化遗产数字化保护专业标准》(以下简称《标准》),向全社会征集意见。这一标准从技术要求和专业要求的不同层面覆盖我国非物质文化遗产所有门类,使我国非物质文化遗产数字化保护工作能在统一标准和机制下有序开展[3]。《标准》依据十类法类目分类制订,并要求非遗数字化过程中,对非遗资源的分类要依据十类法。
十类法是根据“国发〔2008〕19号《国务院关于公布第二批国家级非物质文化遗产名录和第一批国家级非物质文化遗产扩展项目名录的通知》”内容,将我国非物质文化遗产名录项目分作10个门类:民间文学,传统音乐,传统舞蹈,传统戏剧,曲艺,传统体育、游艺与杂技,传统美术,传统技艺,传统医药及民俗[3]。
十类法类目经过专家反复研究和多年的非遗工作实践验证,设置科学、规范,按照非遗资源的组织特性,借鉴了艺术学、社会学的分类思路,参考了档案资源、文物资源和旅游资源的分类方法,反映了非遗的内涵及本质,有利于系统描述和揭示非遗资源的特性。
12存在问题
基于十类法进行建设的非遗数据库应用系统,符合《标准》建设要求,但作为网络资源分类,相较于现在的WEB20互联网模式,还存在着一些缺陷。
121分类粒度粗,无法深入揭示非遗的文化背景
十类法目前还没有统一、标准的二级类目,分类粒度过粗,在组织种类繁杂、规模庞大的非遗资源时显得捉襟见肘。另外,十类法分类维度不足,造成对非遗资源尤其是非遗文化空间揭示的缺失。非遗的文化表现形式与文化空间息息相关,文化空间可定义为“活动场所”或“活动的时间”,也可定义为非物质文化遗产特殊价值的集中表现[2]。研究非遗的历史文化背景离不开其生存的文化空间,往往同类的非遗由于存在的文化空间不同,其内涵、历史渊源就有很大不同。但由于文化空间的表达晦涩、模糊,无法与十类法的其他类目成为并列类目,所以现有的非遗Web数据库都对非遗的文化空间存在描述缺失。
122垂直的分类体系无法揭示类目之间的关联信息
传统的非遗数据库系统基本属于垂直类目,可以科学地揭示类目间的隶属关系,但无法以扁平化的类目关系揭示事物的内在关联。即使细化分类粒度,扩大分类维度,依然无法全面深入揭示和描述非遗资源的内涵。
非遗数字化的目的之一是为便利相关人员以历史背景为依托,研究、挖掘各民族、各地区的历史文化。各类非遗之间由于其文化背景、地域背景等方面的异同,存在着大量的关联关系,这对研究非遗文化非常有价值。以承德地区的国家级非遗“丰宁满族吵子会”和省级非遗“蝴蝶舞”为例,“蝴蝶舞”诞生于清康熙年间,类属于民间舞蹈,“吵子会”诞生于清乾隆年间,类属于民间音乐,“蝴蝶舞”是由“吵子会”来伴奏的,是当地民间花会的主要表演项目,二者发源地相同—丰宁县八间房村,发源时间接近,相差不过几十年,都是满族骑射文化的产物,即产生和存在的文化空间类似。按照十类法分类模式,数据库将这两种非遗项目分别设置为“民间舞蹈”和“民间音乐”,非但没有揭示二者错综的内在关联关系,反而人为地将两个项目分离,这就是垂直分类的局限。
为了突破目前非遗数据库对非遗类目划分的局限,本文提出数据库对非遗的分类可以借鉴Web20系统的资源组织形式,以用户协作的方式来重构非遗数字资源分类模式。
2基于用户协作的非遗数字资源分类模式构建机理
Web20系统是指以普通用户及其生成内容为主体,依赖于众多用户社会化交互与协作的自组织Web系统[3]。豆瓣、Wiki、Flickr、del.icio.us、CiteUlike、Facebook等都属于Web20系统,Web20系统显著特征主要包括:用户协作生成内容,资源的自组织特性,用户的交互性。Web20系统很多使用大众标注这种自组织方式,英文名称是Folksonomy,也有人将其称为大众分类、分众分类,认为这是一种自组织分类方式。本文构建的非遗数字资源分类体系就是借鉴上述Web20系统,融合大众标注这种用户协作的信息资源自组织方式,构建一个混合分类模型。
21大众标注与专家分类优势互补
大众标注这种资源组织方式允许用户使用标签(Tag)存储和管理自己的信息资源,并通过标签实现信息的分享和交流[4]。以此为基础的Web20系统的内容植根于广大普通用户,与传统WEB系统相比,内容题材更为广泛,有生活化、平民化的特点[5]。
中国非物质文化遗产网这样的传统WEB系统的信息内容是由权威机构或专业人员(相对于普通用户)制作的,分类层级结构是垂直的,体现了知识的科学隶属关系,以下称之为“专家分类”;以大众标注组织的Web20系统一般由资源(内容)、用户、标签三部分组成,标签之间、资源之间是扁平化的组织关系,能够按照资源内容聚类。大众标注的优势是,扁平化的标签能够多维度揭示资源,用户可以贡献标签和内容,比专家分类有更好的实时性和可扩展性;其次,学习成本低,简单易用,用户体验度高,便于用户参与。这种组织方式可以弥补专家分类固化、更新慢、用户体验度低的缺点。而且用户参与贡献的标签和内容体现了用户集体智慧,是个性化内容和社会化内容的集合体。但是大众标注的缺点也很明显,自由度过高,语义稀疏模糊,缺乏等级结构,容易产生检索歧异和信息漏检,所以主要应用于综合性社会化标签系统中,很少应用于专业网站系统。
显而易见,大众标注和专家分类是优势互补的,二者的缺点正是对方优势所在。例如,目前的十类法未设统一的二级类目,主要是由于专家类目的增设需要反复论证,建立和维护成本较高,而使用大众标注这种组织方式,可以借鉴Web20系统的建设架构,以用户协作的方式贡献标签,标签可作为专家类目的有效补充,对非遗资源实现多层次、多维度重组,挖掘其内在关联。
22混合分类模式的組织机理
专家分类代表了专家的权威认知,源于人们对非遗特性的共识,这种共识表现为明确定义的类目。Web20系统中的标签是网络用户描述、定位其所感兴趣的资源的关键词,虽然用户个人使用的标签是依个人自己的看法和理解分配的,但在Web20系统开放的环境下,标签是共享和可见的,大众标注反应的是用户社群的群体意识倾向和知识背景,用户会采用相似或相同的标签来描述相关资源,并根据标签使用频率达成共识,从而形成在用户中共享相似兴趣的词汇表。在这样的词汇表中,任何标签都不是孤立存在的,标签之间必然存在着一定的关系,如从属关系、相关(同义词)关系、并列关系等,并有部分标签与专家类目重合或形成隶属、并列关系。因此,用户标签与专家类目是可以实现映射的,也就是说,用户标签可以向专家类目嫁接。