数字人文视角下的奥运档案资源开发
2022-02-25辽宁大学耿睿
文/辽宁大学 耿睿
奥运档案指的是在申办、筹办以及举办奥运会的过程中,各相关组织及个人形成的具有保存价值的历史记录。奥运档案作为奥运精神的重要载体,对其进行有效开发可以对奥运精神进行有效的传承与弘扬,是对历届奥运会奥运精神的见证,奥运档案资源开发人员应当用好用活奥运档案资源,对其进行有效开发,以期发挥其最大的价值。
传统的奥运档案资源开发存在着档案征集力度不够大、档案利用条件封闭以及奥运档案专题数据库有待建设等一系列的问题,需要一些新的理念与技术参与到奥运档案资源开发的过程之中。在与奥运档案管理相关的研究中,陈洁指出,要通过加强奥运档案的信息化管理、鼓励,以跨机构合作的方式进行奥运档案的开发,运用知识管理的方法管理奥运档案,从而实现奥运档案的数字化与价值开发。在档案学与数字人文理念相关联的研究中。靳文君提出在落实档案学与数字人文项目相关联的过程中,要突出档案部门在整个项目中所占的主导作用,鼓励相关项目的落地与实施。张卫东等认为工具关系并非是“数字人文”和“档案资源整合”间的唯一关系,可以将“数字人文”和“档案资源整合”分别解构为主体、客体、技术、方法以及服务五个元素,并在此基础上构建面向数字人文的新型档案资源整合模式。综上,数字人文与档案学研究相结合是目前档案学界研究的热点之一,通过对数字人文和档案学研究的交叉融合,能够为档案资源的深度开发提供新的工具,也为本文提供了研究思路。
一、数字人文对奥运档案资源开发的影响
(一)推动奥运档案资源开发进入“数据化”阶段。北京2022年冬奥会和冬残奥会期间,北京奥组委设立了奥运档案数字档案室,主要包括档案数字化系统以及综合档案管理系统两个子系统,其目的是对电子档案进行集中管理,实物档案数字化工作同时有序进行。上述工作的目的是为了减轻相关研究人员的工作负担,使研究人员能从机械的资料收集过程中解放出来。但是,仅仅将资料收集起来是远远不够的,利用这些资料来分析和解决问题的工作仍需要人来进行,也就是说,现阶段的奥运档案资源开发工作尚未进入“数据化”阶段,未能发挥数字人文技术对海量数据进行统计分析的优势。如果不能将数字人文技术引入奥运档案资源开发过程之中,档案信息的粒度就不能从文件级转变为数据级,从单元转变成知识节点,机器也就不能对奥运档案资源进行分类、名称识别、跨媒体检索、组织和图像语音识别等。北京冬奥组委会采购了档案管理系统,可实现与OA系统的对接,这对于奥运档案的数字化工作来讲是很大的进步,相关奥运档案信息尽管可以在北京数字档案馆系统中进行查询,但仍有大量的奥运档案没有原文信息,仅仅以标题名称的形式存储在数字档案馆系统中,没有提供相关的数据库系统进行关联检索查询。
(二)丰富奥运档案资源的展现形式。我国的奥运档案主要由承办奥运赛事城市的相关档案馆进行保管,因此奥运档案资源开发主体是档案馆。在数字人文技术高度发展的背景下,奥运档案的开发利用形式以现场实地借阅、展览等为主,展览中大多以文字、图片等信息为主,图片以及文字内容相较以往有些许创新,但在开发新意上并没有进步,不能吸引大众的眼球。无论是展出形式还是展出规模都无法与同为文化事业机构的博物馆、图书馆相比较,如在博物馆领域有“数字故宫”“数字敦煌”等项目,用户通过手机、电脑等足不出户就可以对博物馆内的文物进行线上观展;而在图书馆领域,上海市图书馆早已将数字人文技术引入图书馆建设过程中,于2016年上线了“家谱知识服务平台”,这是上海市图书馆的第一个数字人文项目。通过该平台,相关研究人员可以查询到有关姓氏的家谱文化以及家规家训,方便相关人员进行利用。
(三)推动奥运档案资源的跨机构合作开发。跨学科以及跨机构进行合作研究是数字人文的重要理念之一,奥运档案形式多样、数量庞大,相较于档案部门独自开发,跨机构开发能够更好地实现奥运档案的价值。英国早已尝试对奥运档案进行跨机构合作开发。2012年,伦敦奥运会所产生的奥运档案集中数字化并保管在英国“The Record”项目专栏网站中,该项目网站由英国国家档案馆牵头规划,英国博物馆、图书馆等机构参与其中,地方小组也发挥了作用,不同机构在这个项目中通力合作,共同推动了“The Record”项目网站的建成。
二、数字人文视角下奥运档案资源开发利用路径
(一)应用机器学习技术帮助奥运档案进行智能分类。基于机器学习的文本分类方法是指计算机对文本中的数据按照一定的分类模型进行智能分类标记,常见的构建文本分类模型的算法主要有逻辑回归、朴素贝叶斯、决策树、支持向量机和神经网络等,上述算法有着各自的优点,但都可以用于对奥运档案进行文本分类。奥运档案中蕴含着大量的有利用价值的财富,运用传统的方式管理奥运档案信息,会消耗大量的人力和物力,这是文本信息量级关系而导致的结果。人工处理的方式因为包含人为因素的不确定性,可能会造成一定的分类误差。利用机器自动对文本进行分类,是人类解决文本分类必须经历的一个阶段。国外一些档案馆已经开始了尝试,如澳大利亚新南威尔士州档案馆利用机器学习技术,对州政府部门产生的大量的非结构化数据进行智能分类。奥运档案涉及大量的非结构数据,如奥组委办公产生的电子邮件、有关奥运赛事的图片、音频以及网络上有关奥运会的网页信息等,因此应用支持向量机等机器学习技术对其进行文本分类是必要的。
(二)应用文本挖掘技术助力奥运档案信息提取。
文本挖掘是抽取有效、新颖、有用、可理解的、散布在文件文本中的有价值知识,并且利用这些知识更好地组织信息的过程。利用文本挖掘技术得到的奥运档案可视化知识图谱能够为下一届奥运主办国进行赛事承办以及为将来的大型体育赛事积累组织经验,更直观地理解奥运档案的潜在价值。在北京奥运会期间,档案编研主要以图书、报纸、举办展览为主,这些开发方式耗时耗力、推广难度大。此次北京冬奥会所产生的档案完全可以借助文本挖掘技术从海量信息中发现内在联系,科学分析结果并挖掘内在价值。借助文本挖掘的技术特点可以很好地分析奥运档案资源使用者的需求,分析确定奥运档案资源展览以及奥运相关产品的取材及选题方向,从而更好地迎合大众的口味。2021年12月,由北京市档案馆牵头主办的“我们的奥运”主题展览根据奥运档案的不同主题并结合所产生的时间、地理位置等背景信息,综合考量用户需求,设计出能满足不同年龄、不同职业参观者的奥运档案展览。
(三)应用关联数据技术优化奥运档案检索服务。
在2006年的语义网项目会议上,关联数据(Linked date)这个概念被首次提出。关联数据技术主要采用资源描述框架(RDF)来对资源进行描述,利用URI来对资源实体进行命名以及标识,从而构建一个能够为万维网所理解的HTTP URI以帮助用户获取相关的信息资源。关联数据技术具有很强的开发性,在满足用户最基本的检索、查询等需求的基础上,还能提供各种数据服务。不同的奥运档案之间在信息层面存在关联,大量的奥运档案数据信息聚集在一起,从而构建起整个奥运会的赛事全貌。关联数据技术可以在不同的数据之间建立联系,将与目标事件相关的如时间、空间等各个要素串联起来,从而形成一个相互关联的信息网络,更加直观地展现检索结果。例如,用户在查询北京冬奥会场馆之一的首钢滑雪大跳台中心时,可以将包括国家速滑馆、国家体育场等在内的其他相关信息一并提供给用户,并为用户提供相关链接,以优化用户的查询检索体验,提高奥运档案资源的查全率与利用效率。
(四)基于可视化技术,对奥运档案进行直观展示。数字人文理念中所包含的Web3D可视化技术、GIS技术以及全系投影技术等都可以用作奥运档案资源数字化展示的开发工具。Web3D可视化技术作为实现网页中虚拟现实的前沿技术,为传统的人文社会学科提供了新的开发工具。通过对奥运档案进行3D建模,将丰富的立体沉浸式交互展示功能融入其中,呈现奥运档案的原貌以及其中所蕴含的奥运故事情节和赛事信息,在用户终端全方位呈现高保真的视觉效果,传递奥运人文价值。相较于传统形式的实物展览,奥运档案管理人员不仅可以利用可视化技术对数字化的奥运档案资源进行在线可视化呈现,也可以将奥运档案综合数据库中所包含的视频、音频以及图片格式的奥运档案进行可视化显示,并将数字化后的奥运档案通过PC端、平板端等各类设备实现随时、随地、多平台的交互观展,成为奥运知识数字化传播的新模式。目前,国外利用Web3D技术在文物和艺术品展览领域已经进行了尝试。2011,Google&Culture成立,通过360实景等数字虚拟与现实技术,实现了馆藏艺术品数字智能可视化,使人在虚拟的场景中拥有身临其境的体验。截至2018年,已经与包括故宫博物院、上海龙美术馆、三星堆博物馆在内的70多个国家和地区的1700个文化机构展开了合作,展出了超过5800件线上作品并进行了160多次线上展览。奥运档案资源开发人员应当主动汲取先进经验,为将来奥运档案资源展览引入可视化技术做好准备,从而提升奥运档案资源利用者的体验感与参与度,实现奥运档案资源的深度开发。
(五)加强多方协同合作。传统的奥运档案资源开发模式基本是由档案馆为主体牵头进行组织,这种开发模式必然导致奥运记忆的分散、破裂乃至消失。数字人文视角下的奥运档案资源开发应当打破过去以档案馆为单一开发主体的模式,扩大开发主体的范围,通过多方合作的形式,共建奥运档案信息集成平台,从而有效推动资源共享。首先,档案馆应当以用户需求为导向,挖掘用户感兴趣的奥运档案资源并及时发布在用户可以接受的如微信公众号平台上以便于用户利用。其次,档案部门应意识到数字人文研究团队在奥运档案资源开发过程中所起到的支撑作用,主动与数字人文研究团队合作,充分利用数字人文研究团队的相关资源,打破时间、空间等限制条件开启跨界合作,共享开发成果。最后,要鼓励社会公众参与到奥运档案资源的开发过程之中。公众是奥运档案资源开发过程中的参与者和反馈者,档案馆应当给予公众反馈渠道,促进档案馆开发的积极性与主观能动性,形成奥运档案资源开发的良性循环。
三、结语
数字人文理念作为近年来新兴的研究思潮,对奥运档案资源开发提供了新的思路和视野。一方面,它突破了传统的档案单一收集理念,推动了多机构、多领域的协同建设;另一方面,利用数字人文的技术工具,提高了资源整合的质量和效率,同时结合可视化等技术创新了奥运档案资源开发模式。此外,数字人文作为一个较为广泛的领域,包含着门类众多的技术应用,在推动数字人文与奥运档案资源开发融合的过程中,还应当进一步提高奥运档案管理人员对数字人文工具认识的高度与深度,推动奥运档案资源开发更加多元化与智能化。