APP下载

数字人文视角下档案资源开发与利用研究

2023-06-01李楠

兰台内外 2023年3期
关键词:数字人文档案资源开发利用

摘 要:数字人文视角下,档案资源的开发与利用是将技术理性和价值理性进行弥合的过程,其信息技术与人文研究相融合的特点不仅有助于推动人文历史类檔案的深入研究,也有助于丰富专题档案内容,促进档案信息化建设。本文以数字人文视角下档案资源开发与利用的价值意蕴为切入点,发现数字视角下档案资源开发与利用存在的开发主体协同不够、开发技术应用薄弱、开发成果形式有限、开发内容延伸乏力等问题。从数据组织、价值挖掘和服务创新三个层面寻找突破口,为实现数字人文在档案领域的深度融合提供参考。

关键词:数字人文;档案资源;开发利用

数字人文是数字技术与人文学科交流碰撞而成的新兴领域,是一种全球性的、超越历史并跨越媒介的创建知识及意义的路径,现已渗透到许多学科并对其产生重大影响[1]。数字人文开发过程应用的理念、技术、工具和对档案资源组织的方法给档案资源开发与利用带来的新的思路,对于丰富社会和民族记忆、传承优秀传统文化、促进人文历史研究都具有积极意义。对此,档案部门应充分把握数字人文视角下档案资源开发与利用的价值意蕴,坚持技术与人文有机结合,运用数字人文方式方法,提升档案资源开发与利用效能。

1 数字人文的内涵及特点

数字人文融合传统的人文研究与新兴的数字技术,既是对人文研究的具体实践,也是应用新兴信息技术的全新建模方式,更是对知识和资源的重组与开发。数字人文与档案资源开发与利用在资源组织、研究方法上具有一定的重合,这也为二者的融合发展提供基础。目前,数字人文尚处于快速发展期,社会各界对于数字人文的开发也处于探索实践阶段,各学科对于数字人文的定义也尚未形成统一认知。从档案资源开发与利用的角度来看,数字人文就是融合各种人文研究方法、数字工具和档案资源相结合的新范式,以人文研究者和社会公众的需求为导向,以档案资源为基础,以数字研究方法和技术为工具,以资源开发与利用为目标,呈现出跨机构、跨学科融合、开放性和协作性的特点。

1.1 跨学科

数字人文自诞生起就融合人文科学、社会科学和自然科学的研究方法和工具,随着数字人文项目开发不断成熟,学科间交叉和融合愈加频繁。数字人文在传统人文研究和理工科研究之间搭建起了桥梁,其开发项目也从一开始历史、艺术和文学扩展到了其他学科。

1.2 跨机构

数字人文跨学科的突出特点也决定了其开发需要多个机构的参与。目前,数字人文项目开发的开发主体主要为学术机构和高校,资源机构主要是档案馆、博物馆和图书馆,其他诸如系统供应商、传播团队等主要负责前端运营工作。

1.3 开放性

与传统人文研究和档案服务项目相比,数字人文档案项目具有高度的开放性,体现在资金来源、内容获取、用户服务等方方面面。在互联网环境下,数字人文中设计的知识生产、组织的传播都是开放包容的。这种开放性有助于各个参与主体的充分沟通,也有利于充分了解用户的需求,以最大化的发挥档案资源价值。

1.4 协作性

数字人文跨学科和跨结构的特点决定了其在开发和应用过程中也需要多个主体的协同工作,通常包含大学、研究机构、软硬件供应商和用户,即使是在同一主体内,也具有高度的协作性。

2 数字人文与档案资源开发与利用的适应性分析

2.1 数字人文有助于推动人文历史类档案的深入研究

档案领域中的数字人文项目多聚焦于人文历史类档案的组织与利用,“全国数字人文年会”中获奖的多数项目便体现了这一特性。数字人文是一种将计算机方法与技术融入人文研究,进而提出并回答人文问题的新范式,其在档案领域的应用具有三重优势:一是提高档案内容的阅读与查询效率。随着档案信息化建设的推进,数字化资源已逐渐成为档案馆最为主要的馆藏资源,如果运用传统的内容分析和查询方式,从海量数字化资源中获取有用信息需要消耗大量人力物力,但应用关联聚合、内容聚合和知识图谱等数字技术,能够快速且准确地完成对内容的抓取和提炼,同时还能够避免人工检索的失误。如中国历代人物传记资料库,共收录超过42万条人物传记资料,记录了各方面的详细数据,这些数据可以为各领域的人物关系和历史事件研究提供基础数据支撑,检索技术可以帮助研究者快速获取所需数据[2]。二是提升文学类档案研究的深度。对于人文历史类档案的研究,不能只聚焦某一时间段和某一类型的作品,而是要从多个维度和要素切入。如对于文学类档案,传统的细读方法已无法满足研究者和社会大众的需求,运用可视化技术和社会网络分析的方法对文本中出现的人物、事件乃至叙事结构进行描绘,就给文本阅读与研究提供了全新的思路和研究路径。三是推动不同机构、部门间的协作。目前,档案资源开发与利用的协同化已成为数字人文项目的重要特征,能够满足创新要素整合、资源组织协调和利用服务多元等多项要求,主要体现在档案馆在数字人文项目开发过程中,需要推进与图书馆、博物馆、文化馆、党史陈列馆和信息技术公司等机构的跨界合作[3]。

2.2 数字人文有助于丰富专题档案内容

数字人文项目开发的覆盖面广、涉及主题内容丰富,极大地扩充档案内容建设,为专题档案的编研、著录提供参考。目前,采用数字人文方法和技术构建而成的档案资源体系具有丰富多样的主题内容,包括但不限于文化遗产、城市记忆、历史名人、弱势群体、专业知识、重大活动和突发事件等[4]。如由中国人民大学开发的《高迁古村数字记忆网站》,旨在以数字人文新的知识生产与传播方式,构建古村落数字记忆,为古村落原生态保护提供新的范式。武汉大学数字人文中心开发的《基于IIIF的敦煌壁画数字叙事系统》,综合运用多项数字人文技术实现对数字图像的增强展示。上述数字人文项目都是以人文历史中的问题为切入点,回应社会公众对多样化档案资源的诉求,而这种诉求就要求档案馆或研究机构对档案资源进行数据组织、价值挖掘和服务创新,其中数据组织就需要建立多样化的专题档案资源库,为后续的知识关联和知识发现提供基础。

2.3 数字人文有助于档案数字化建设

当前,数字化已成为档案领域的重要发展方向,大数据、云计算、区块链和人工智能等新兴信息技术的应用给档案管理带来的新的机遇和挑战。首先,数字人文推动档案学研究。与自然科学、社会科学相比,档案科学对信息技术的采纳较为单一和滞后。通过数字人文的快速发展,人们对于“人文”与“数据”关系的认识得以进一步更新。数字人文不仅强调知识生产、表现与传播,在科研方面也表现出开放、创新、共享的精神,特别是学术活动中推动协同、众包、互联、交互、跨学科、跨国界、跨专业合作等学术理念的普及与范式创新,能够有效促进档案科学的发展与进步。其次,数字人文有助于推进档案信息化建设。数字人文中大量应用新兴计算机科学,在基础设施建设、硬件适配和软件开发上都有一定要求,而作为面向人文研究者和社会大众的文化产品,不仅提高了人文历史的传播力和影响力,其巨大的社会效益和经济效益还能够反哺档案数字化建设[5]。在数字人文项目开发过程中形成的管理模型、系统软件和硬件设施也能够为档案信息化建设提供一定的方向指引。

3 数字人文视角下档案资源的开发与利用对策

3.1 建立面向数字人文的数据组织

3.1.1应明确档案资源开发与利用的數据类型。从档案产生主体的视角看,应用与数字人文的档案资源主要涵盖了结构化数据、半结构化数据和无结构化数据,从载体上看则多为数字化资源。在实际的应用中,数字人文对档案资源结构化、规范化、标准化的要求较高,因此应用最多的是结构化数据,为推动分散的档案资源转为结构化的档案数据,可从以下三个方面入手:一是立足数字人文的要求,对馆藏档案进行全面摸底,加快纸质档案资源的数字化转化;二是进一步提升档案规范化与标准化水准,通过档案数据化技术将碎片化的档案资源整合到一起;三是推动政府部门、社会机构、社群和个人的广泛参与,在丰富档案资源的基础上提升档案治理水平。

3.1.2基于数字人文的需要构建档案数据集。在总体规划上,以数字人文的管理与实践为基础,综合运用数据库技术(数据挖掘与分析等)对档案文本进行深度分析,特别是对档案的著录、编目、标引等,为档案的组织与利用提供基础保障,同时打造以数字人文为核心的专题数据库。从具体实践层面来看,应重点关注前端与后端的开发与管理[6]。前端应加强控制体系建设,拟定面向数字人文的数据及建设规范与标准,推动数字人文档案的共建共享,同时建立通用管理框架,内部嵌入不同类型数字人文的具体应用,为数字人文资源的多样化管理与利用提供平台。后端应做好数据集的建设与开放工作,分模块确定好数字人文的档案数据集范围,并根据数据特点选择合适的前端发布平台。

3.1.3组建面向数字人文的档案数据描述方法。在传统的数据库系统建设中,逻辑层承担数据库的控制和处理,其最主要的工作就是对实体、实体属性和实体之间的关系进行处理,而关键就在于如何把抽象化的档案信息资源通过一系列的加工以可视化的形式呈现在前端,同时也要将前端的数据逻辑通过一系列的处理编码成数据库中的信息。在数字人文视角下,就应根据其面向人文研究者和社会公众的特点灵活增减实体,例如,可采用时序与空间分析相结合等方法对时序内容信息与空间内容信息进行整合,并从人、地、时、事、物等维度来描述与组织相关的面向数字人文实践需求的档案数据。

3.2 运用数字人文工具挖掘档案价值

基于上文中建立的面向数字人文的数据组织,应综合运用多种数字人文工具(如语义网、关联数据等)实现对基础数据集的知识化和语义化,进而结合社会公众和人文研究人员的需要通过文本分析、时序分析和可视化等前端技术让档案知识重新呈现在利用者面前。主要分为三个步骤:一是实现档案数据的知识化组织。主要目的是将原本无序和杂乱的档案知识转化为对应的知识单元。在实践中,多采用“元数据标注-本体建模”的方法对档案资源进行组织,一方面可以根据数字人文应用的具体需求对相关的元素进行抽取,另一方面也可以数字人文应用的特殊性自主设计元数据标准的元素,能够实现个性化的知识组织。二是档案知识关联。在完成元数据标准和本体建模后,档案知识实际上还是独立单位的形式存在着的,单元间缺乏关联。为实现知识单元间的聚合,常用的方法是采用知识图谱的形式对各个单元的关系进行解析、界定和融合。如北京大学数字人文研究中心搭建的宋元学案知识图谱可视化系统,就对《宋元学案》这部理学巨著的全文本进行文本挖掘和深度分析,将学案中的人物、时间、地点、著作以及它们之间的复杂语义关系提取出来构造成知识图谱,在此基础上提供数字人文遥读、多种可视化呈现、交互式浏览等功能。三是档案知识发现。档案知识组织和关联是对原有资源的再组织,而知识发现则是在二者的基础上进一步挖掘档案中蕴含的价值,让原本难以被发现的关键信息和隐藏要素通过细粒度更低的挖掘方式形成新的图谱。如上海博物馆开发的《董其昌数字人文展示系统》,通过对数据的深度分析,以可视化的处理方法展示了董其昌生平、交游、以及人脉关系,还原出一个以董其昌为中心而构筑的晚明时代的艺术生态圈。

除此之外,还要实现档案利用的协同化。推动档案馆的外部合作,提升档案馆服务社会能力,可以与人文研究者、高校、研究机构加强沟通联系。个人用户需求方面,建立起良好的沟通反馈机制和用户服务体系,注重发挥数字人文的经济效益和社会效益,根据用户需求的变化调整馆藏结构,更好的为各主体服务。与此同时也可以将编研成果通过展览、档案网站发布等形式进行宣传,紧密联系社会各界的人文信息发布平台,扩大数字人文应用的宣传范围,使数字人文成果得到充分的转化,实现档案的价值。

3.3 开发面向数字人文的档案服务方式

3.3.1档案服务接口设计。根据数字人文应用的不同场景,在服务接入可采用web服务程序,通过标准的Web协议提供服务,目的是保证不同平台的应用服务可以互操作。服务接口除了集成数字人文应用外,还应提供其中涉及档案内容的过程信息,如版本号、时间、操作管理员等,借助统一接口实现集中管理、集中开发,形成完备的数据库,集成检索服务,构建一站式的服务平台。同时,构建个性化的档案服务方式。具体而言,提供模块化的服务功能,用户可根据个人需求在管理系统的各个服务模块查询和获取信息,这就改变了传统档案的中心服务模式,用户与档案资源直接的距离进一步缩短,点对点的利用方式也有助于提高档案利用率,化解传统模式下的信息孤岛难题,构建出多主体参与的协同服务模式。

3.3.2以主体需求为导向创新服务方式。档案类型众多,数字人文背景下的开发以结构化数据开发为主,但随着个体成为档案产生的重要主体之一,碎片化和分散化档案资源的开发利用也必将成为档案开发与利用的趋势。对此,档案部门应根据档案资源特点和主体需求创新服务方式。如针对个体用户,数字人文项目要重点开发资源的个性化检索与组织,同时还要探索更为深入的内容服务,接入图书文化、文化自信相关内容的数据接口,让民众能够更方便、更直接地享受档案服务。针对人文历史研究者,则更要突出档案利用与开发的技术特点,可以将多种阅读模式结合,获得全新知识图景,提供跨学科、跨时空的全新阅读方式。

参考文献

[1]张钰桐,徐健.数字人文视域下的家谱档案资源重构:价值、逻辑及框架[J].档案学研究,2022(05):94-101.DOI:10.16065/j.cnki.issn1002-1620.2022.05.013.

[2]向敏.数字人文视角下综合档案馆档案利用服务发展策略研究[J].兰台世界,2022(09):104-106.DOI:10.16565/j.cnki.1006-7744.2022.09.26.

[3]廖蓓蓓.基于数字人文视域下档案资源整合与服务转型[J].黑龙江档案,2022(04):311-313.

作者简介:李楠,大学学历,国网天津市电力公司电力科学研究院综合管理部文书档案管理、工程师,研究方向:科技项目档案未来发展趋势及前沿方向/档案电子信息化前沿。

猜你喜欢

数字人文档案资源开发利用
数字学术与公众科学:数字图书馆新生态
高校校史馆建设中档案馆藏资源的作用与开发利用
跨界与融合:全球视野下的数字人文
跨界与融合:全球视野下的数字人文
浅谈档案资源的功能与合理利用
大规模古籍文本在中国史定量研究中的应用探索
审计供给侧改革背景下的审计成果利用探析
天台县忍冬科野生观赏植物资源及开发利用
云南食用花卉开发利用浅析
档案的开发利用在供电公司全面管理中的作用