APP下载

高校图书馆音乐特藏数字人文研发实践

2022-06-21畋,张

内蒙古科技与经济 2022年8期
关键词:特藏语义人文

曹 畋,张 婧

(南京晓庄学院,江苏 南京 210000)

1 起源

特殊馆藏是图书馆的唯一标签,也是图书馆的重要资源。[1]图书馆“张仲樵民间音乐特藏室”现有音乐特别收藏中的资源,包括3 500余卷民间音乐收藏,其中一些是清代和“中华民国”的稀有书籍以及从1960年至今的1 000多种音乐视频和录音材料,300多种“中华民国”音乐手稿,67个手写笔记,珍贵唱片和350多个音乐磁带。珍贵的特殊收藏品是“诺亚方舟”,被视为研究江苏民间音乐的重要资料。

2 音乐特藏数字人文发展的问题和前景

音乐特藏具有内容的独特性。音乐特藏的大部分内容的以视听档案的形式存在,但是,我国视听档案理论的研究才刚刚起步。从中华人民共和国成立以来,研究主要集中在如何保存和保存声音文件上。

2.1 数字人文在音乐特藏开发和使用中的有关问题

①在开发和使用过程中必须有效地保证完整性和真实性。音乐特别收藏品的完整性和真实性不仅涉及内容信息本身,而且还涉及特藏藏品的声音、图像、背景、结构信息的完整性。②传统的视听管理方法不能满足当前音乐收藏的发展和使用。迫切需要在数字人文环境中进行更有效率的管理、集成、开发。需要使用数字人文开发的思想和方法。③数字人文的相关开发理念与特藏音乐的发展非常吻合,但音乐特藏的具体发展和研究仍处于探索阶段,可供参考的案例非常有限。

2.2 音乐特藏数字人文学科发展的前景

数字人文的概念为特殊音乐收藏的发展提供了新的切入点。现有的数字人文科学的通用开发方法,例如GIS、区块链、语义分析、虚拟现实等,可以有效地解决对音乐特藏藏品开发的多种限制。

3 图书馆音乐特藏的数字人文研究与开发

在图书馆的“张仲樵民间音乐特藏室”中有大量视听资料。这些内容具有不同类型的媒体和广泛的来源的特点。所以,在其中读取某些内容所需的软件和硬件环境更加复杂。这导致管理、开发和使用视听文件的难度增加。

数字人文平台通常需要为特定的人力资源选择技术方法。对于本图书馆中的音乐特藏,有关特藏的更多信息可以在语义上关联。许多音乐特藏藏品需要基于以前的数据库系统的排序进行广泛的索引编制,对信息的进一步探索以建立数据关联以及用于用户音乐特藏使用的内置搜索工具。链接数据可以组织和组合多种类型的信息资源并进行检索。特殊集合中的关联数据形成关联关系,这通常是数字环境中人文开发的先决条件。最终目标是将全国甚至更大范围内的相关信息与相关数据和服务结合起来。因此,数字人文下特藏音乐的建设可以分为4个层次,如图1所示。

第一层数据采集层。特藏音乐数字人文开发的基础是在视听资源的开发和使用中建立数据采集层。音乐特藏中的视听内容通常来自不同的渠道和年代,媒体的形式也多种多样,包括诸如磁带和光盘之类的模拟视听文件,以及原生的数字视听文件。音乐特藏资源的基本分类和重复数据删除应尽可能匹配上下文信息,或恢复音频和视频资源的数据。进而改善原始数据库信息。在语料库中建立元数据和这些元数据的参数,可以准备进一步的关联音乐特藏的数据。由于本图书馆的音乐特藏中的信息源多种多样,因此很难处理各种不同类型内容。因此,首先使用内容相似性或上下文相似性算法对音乐特藏中的视听资源进行聚合和重复数据删除,并准备好进行批处理。处理后的信息存储在关系数据库中,以准备语义层描述和后续的数据关联。

图1 面向数字人文音乐特别收藏开发的数据基础架构层次

第二层是语义描述层。音乐特藏的数字人文开发的初步准备工作主要包括视听数据的收集、编目处理、格式转码、内容存储、工作流控制、视听数据发布、存储管理、用户管理等。语义描述层根据语义元数据格式构造视听资源本体,并将其安排为机器可以使用RDF(Resource Description Framework,资源描述框架)理解的语义描述格式。视听信息的语义内容描述通常是矢量化的描述,即从声音、图像、图形等中索引资源。面向数字人文开发的音乐专辑提供以下服务:音乐主题信息、时间背景、事件背景、空间背景、动作信息等。相关的语义信息对于用户理解音乐专辑中视听资源的内容和使用音乐专辑至关重要。相关语义信息对于用户理解音乐特藏的音像资源内容和知识的再创造具有重要意义。该层是语义描述层,需要定义数据库中的每个数据项,将原始数据库中的数据定义转换为具有业务意义的专业名称,甚至需要能够通过语义描述来实现功能控制。例如:通过权限的管理和控制,调用接口以及信息传输。语义描述层在资源收集层的基础上,实现了文本与音乐特藏中的相关信息之间的初步关联,为特殊收藏中的信息服务提供了支持。

第三层是基于数字人文技术的信息关联层。该层是音乐专辑中视听资源相关数据的信息组织的核心。特殊音乐收藏中的视听资源通常具有不可替代的特征,并且经常与其他相关资源相关联,尤其是描述性文本信息和地理信息。因此,音乐特辑中的视听资源也需要本体技术来构架资源描述,并利用类,映射,实例和包含等关系来构建各种信息关联。以音乐专辑中视听资源的语义内容为核心的多属性联想网络关系包括资源,时间、地点、人物、事件和主题的语义信息。以主题的形式构建本体,实现信息的有序组织和深入挖掘,提高对音乐特藏资源的准确利用。

第四层是音乐专辑中的视听资源利用层。有序组织特殊音乐收藏中的音频和视频资源,为特殊收藏的用户提供更加便捷的服务。除了发布基本结果和语义检索之外,还包括信息发现、知识分析、个性化资源推送和移动搜索。依此类推,形成了专门的音乐和视听资源收藏组织体系。特别收藏不仅以网站和管理平台的形式呈现,而且可以方便地连接到各种移动终端和显示终端。通过特殊音乐收藏中视听资源的内涵进行标准化的索引和记录,为搜索查询提供更多的检索渠道,并提供在线流媒体播放特殊收藏音频并呈现其他类型的特藏相关资源,从而充分展现音乐特藏资源。该层可以为用户提供关键字,分类、全文、声音片段以及搜索和检索方法的各种组合,并为检索的信息设置在线播放,授权下载和其他功能。外部接口是系统与其他平台之间的数据交互的通道。数字人文研究专用音乐收藏的开发和建设,不仅要关注过去的资源,而且还需要形成一种可以重复处理资源以使收藏“活化”的机制。

4 结束语

近年来,数字人文学科在图书馆领域的研究和应用发展迅速,但是对于音乐特藏,很少有研究和案例可供参考。如何充分利用数字人文学科开展特色收藏发展是一个重要的研究领域,如何利用数字人文开发音乐特藏和发展音乐特藏是一个新的命题。本文基于南京晓庄学院图书馆内现有音乐收藏资源,是对高校图书馆音乐特藏的数字人文开发进行数字人文方面的研究与开发中的一次探索。

猜你喜欢

特藏语义人文
图书馆特藏建设研究*
——基于读者接受维度的理论探索
语言与语义
高校图书馆特藏建设工作探微
人文绍兴
批评话语分析中态度意向的邻近化语义构建
“社会”一词的语义流动与新陈代谢
人文社科
“吃+NP”的语义生成机制研究
美国康奈尔大学图书馆特藏发展与实践研究*
谁来教“医学人文”课