浅析传统童谣元数据标准的设计
2018-01-20王昆鹏
王昆鹏
摘要:设计制定元数据标准是对传统童谣进行数字化保护的基础工作。该文梳理了比较成熟的元数据标准,分析了设计传统童谣元数据的作用和意义,总结了童谣元数据设计思路,并参照都柏林核心元数据(DC)标准,确定了童谣元数据的10个核心元素。
关键词:童谣;元数据;非物质文化
中图分类号:G25 文献标识码:A 文章编号:1009-3044(2018)31-0014-02
童谣,也叫民间儿歌,古代称“孺子歌”“童子歌”“小儿语”,是在兒童中流传的口头短歌,节奏明快、音韵和谐、朗朗上口、幽默有趣。在古代,由于儿童文学不被重视,童谣一直仅限于民间流传,偶尔出现于史料典籍和地方志中,没有被系统搜集整理。近现代以来,少数学者注意到了传统童谣的价值并进行了收集,但从最终结果看,收集成册的童谣只是冰山一角,还有大量童谣在民间流传,并有失传危险。所以,童谣的整理保护工作应该引起重视。
传统童谣作为一种非物质文化,采用数字化的手段进行保护是较为合理的做法。在数字化保护过程中,设计建立传统童谣元数据标准是一项基础性工作。解决对传统童谣信息的著录和描述问题,为传统童谣信息的收集、整理、保护、共享、发现提供技术支持,从而建立传统童谣信息库,完成对传统童谣的数字化保护。
1 元数据发展现状
元数据(Metadata),又称中介数据、中继数据,被称为描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。
目前元数据的研究和应用已比较成熟,形成了不少国际标准,比较有影响的有:
1) CDWA,适用于博物馆和艺术作品;
2) DC,适用于网络资源;
3) EAD,适用于档案和手稿资源;
4) FGDC,适用于地理空间信息;
5) GILS,适用于政府信息;
6) TEI,适用于电子形式全文;
7) VRA,适用于艺术类可视化资源;
8) MARC,适用于图书馆和文献资料。
国内也制定了不少切合实际应用的元数据标准。例如国家图书馆地方志元数据、国土资源信息核心元数据、中国科学院的科学数据库核心元数据标准、教育部的基础教育教学资源元数据规范等等。
这些元数据标准都为相关行业的信息化起到了促进和基础支撑功能。
2 童谣元数据的作用
方便童谣信息的采集建库。建立了元数据标准,就有了童谣数据库建库的支撑,可以将文献资料或现场采集到的信息进行有效序化,完成信息资源库的建设。
方便童谣信息的查找发现。元数据可以为童谣提供一套规范的数据标准,为每一则童谣建立一条完善的信息数据。为童谣信息的查找发现带来极大的方便。
方便童谣信息的获取和共享。元数据中包含童谣的出处、类型等信息,因此信息的获取变得容易。经过著录的信息都采用统一或相互兼容的元数据来描述,可以很容易实现童谣信息的共享。
方便传统童谣的数字化保护。对传统童谣的整理,大多数依然是采用结册出版成书的形式。这种方式对于童谣的保护只能起到部分作用。限于纸质文献的篇幅和出版限制,基本上是不能容纳所有收集到的童谣内容。元数据标准的制定可以规范童谣的收集整理工作,起到童谣保护的推动工作。
3 童谣元数据设计思路
确定传统童谣的著录对象。童谣是一种口头传唱的民间文化,通过口口相传的方式传播。在古代不属于正统文学范畴,很少有童谣被专门的文献记载,只有少部分出现在史料中。现代以来,因为被部分学者注意,出现了一些童谣的征集活动,并有整理成书出版。在元数据设计时,为了能广泛适用于童谣的现状,覆盖的范围应包括文献中记载和实地采集的所有童谣。所以,元数据设计过程中应明确著录对象是童谣,而不是记录童谣的各种文献。
元数据标准制定。在国际标准元数据格式中,机读目录(MARC)和都柏林核心元数据(DC)是目前应用较多的两种。这两种标准都是为了将资料信息格式化,方便存储,完成对信息内容和形式特征的揭示,方便检索。机读目录(MARC)是一种书目著录标准,数据结构完整,描述能力较强,广泛应用于图书馆和图书期刊等出版物领域。都柏林核心元数据(DC) 是在网络环境下产生的,特点是格式简洁应用灵活,非常适用于网络环境下的信息发现,是目前应用最为广泛的标准。在明确著录对象是童谣而不是文献的情况下,可以容易得出,都柏林核心元数据(DC)比机读目录(MARC)更适用于传统童谣。所以传统童谣元数据可以参照都柏林核心元数据(DC)标准进行设计。
4 确定元数据核心元素
在都柏林核心元数据(DC)标准中,共有15个元素,基本上涵盖了数据信息的字段。结合传统童谣的情况,可确定10个核心元数据。
1)资源形式,对应都柏林核心元数据(DC)中的Format元素,具体对于传统童谣,资源形式主要包括出版物和非出版物,出版物指收集在图书期刊等文献上的童谣,非出版物指现场采集到的数据。
2)题名,对应都柏林核心元数据(DC)中的Title元素,指童谣的标题。传统童谣通常情况下并没有严格的标题,往往需要收集整理者命名。在已出版的文献中,整理者一般已经为童谣命名。现场采集的童谣,采集者可以根据内容组织命名,也可以以首句作为童谣的题名。
3)主要责任者,对应都柏林核心元数据(DC)中的Creator元素,一般指作者,但传统童谣口口相传,没有明确的作者。主要责任人可以是相关出版物的责任人或是童谣的收集整理者。
4)其他责任者,对应都柏林核心元数据(DC)中的Contributor元素,在童谣元数据中,可以标识采集口述人。
5)出版项,对应都柏林核心元数据(DC)中的Date,Publisher元素,指童谣出处出版物的出版信息项。
6)歸属类别,流传至今的传统童谣数量很多,对其进行科学分类可以方便研究。传统童谣的分类可以按照大多数出版物采用的主题法,根据童谣的主题内容进行分类,如育儿歌、数数歌、颠倒歌等等。
7)采集地点(流传区域),传统童谣具有强烈的地域属性和方言特点,在一定范围的区域流传。
8)主题词,对应都柏林核心元数据(DC)中的Subject and Keywords元素,采用自由词标引。
9)全文,收录童谣的全文文本。
10)相关文献,相似童谣、其他收录文献、原始采集视频链接等等。
5 结论
传统童谣的数据信息相对比较复杂多样,与出版物、视频图片等资料相比,格式化的程度不太高,切信息量有限。所以在制定元数据标准和具体应用中,如何体现信息的灵活性和如何最大限度地揭示信息的准确性是应特别强调。另外,针对童谣信息的情况,在数据收集整理阶段如何细化主观内容部分也需专门研究,如题名设定、分类、主题词等等。
参考文献:
[1] 姚伯岳,张丽娟,于义芳,等.古籍元数据标准的设计及其系统实现[J].大学图书馆学报,2003(1):17-21.
[2] 夏翠娟,林海青,刘炜.面向循证实践的中文古籍数据模型研究与设计[J].中国图书馆学报,2017,43(6):16-34.
[3] 崔运鹏,钱平,苏晓鹭.农业科技信息核心元数据标准框架研究及其著录信息管理系统[J].中国农业科学,2007(4):685-692.
[4] 熊拥军,陈湘,彭维.非物质文化遗产相关资源元数据标准比较研究[J].图书馆,2016(2):33-37.
[5] 张勇,蔡璐,李月明.非物质文化遗产数字资源元数据标准应用的研究和思考[J].图书馆,2016(2):38-42.
[6] 许鑫,张悦悦.非遗数字资源的元数据规范与应用研究[J].图书情报工作,2014,58(21):13-20+34.
[7] 陈正平.巴渠民间文学与民俗研究[M].四川大学出版社,2001.
[8] 赵景深,车锡伦.古代儿歌资料[M].少年儿童出版社,1962.