高校数字化校史协同编研体系的构建研究
2023-10-07孙安宁中国计量大学
孙安宁/中国计量大学
校史编研在高校档案工作中具有重要价值,是基于档案史料挖掘,弘扬办学精神,讲好大学故事,实现档案育人的重要手段,内容精彩、影响深远。《中国档案》刊登的一篇专访中指出:应该把更多的时间和精力放在开展编研上,因为档案部门开展编研所具备的条件是其他任何部门所不具备的,而做好编研工作又是提高档案工作服务水平的重要举措[1]。
回顾高校校史编研的发展历程,呈现出三方面的特点。一是机构专门化,从清华大学1959年成立校史研究室的前身“校史编写组”,到如今各高校或依托机关部门或依托档案馆或依托历史系成立的校史编研机构,校史编研工作正逐步走向常态化。二是队伍稳定化,早期可以追溯到1988年,群众性学术团体“中国高等教育学会校史研究分会”成立;经过20年的发展,“浙江大学校史研究会”这一高校校史研究学术组织也在2009年应运而生,可见无论从国家层面还是高校层面,校史研究队伍逐步壮大。三是内容专题化,既有志书、年鉴等资料性工具书的编写,又有人物、事件等个案研究;既有革命史、发展史的视角,又有社会学、教育学的切入,校史编研的内容日趋丰富。
校史编研越来越受到重视的同时,反观学术界和理论界却对其研究甚少。在中国知网总库中,以校史编研为主题进行搜索,共搜索到学术期刊、学位论文和会议交流94篇,其中近3年刊发的文章只有7篇。对研究成果进行分析,不难发现研究内容多集中在校史编研的功能、特点和启示,校史编研与校园文化传承的关系,口述档案兴起及对校史编研的推动等。《浙江档案》2022年第1期《基于Spark技术的高校校史编研系统研究与实现》一文是数字技术应用于校史编研的较新的研究成果,可见理论研究滞后工作实践较为突出。
校史编研取得积极的进展,但是传统的众手成书的编研形式,依然面临着馆藏档案查找效率低下,关键信息重复核对内耗严重,编研成果呈现形式单一、利用率不高等困境。在数字浙江建设深入推进的大背景下,截至2021年4月,浙江省已有16家高校档案馆达到省高校示范数字档案室(馆)建设要求。80%以上馆藏永久、长期档案的数字化率给高校校史编研提供了新的机遇,也带来新的挑战。本文依托协同办公基本原理,在档案管理系统中嵌入校史协同编研平台,以期构建高效整合校史资源、多形式展示校史编研成果的高校数字化校史协同编研体系。
1 基础:数字化校史资源建设
1.1 馆藏纸质档案数字化加工
纸质档案在高校馆藏档案中占比95%以上,数字赋能校史编研,必须要对纸质档案进行数字化加工,这是档案资源共享共用的基础环节。首先,要对馆藏纸质档案进行全面梳理,按照应数尽数的原则,部署纸质档案的数字化加工工作,如果无法一次性全面完成的,按照共享性强、利用率高、保管期限长等原则分步实施。其次,要注重档案数字化过程管理,保障数据质量。可以在数字化全过程采取“三核对”检查办法,通过人、机双重校对,全面核查馆藏档案数据,具体为:第一,数字化前对实体档案的页号、题名等著录信息进行核对,保证原始档案的正确性和完整性;第二,数字化过程中对形成的电子文件进行核对,保证扫描图像端正、清晰,还原度高;第三,数字化结束后对电子文件的目录和档号进行二次核对,确保电子文件的档号和档案管理系统中的档号一致,顺利实现成果与目录的 100%挂接。
1.2 纸质档案数字复制件光学字符识别(OCR)
纸质档案数字复制件光学字符识别(OCR)是管控数据质量的关键环节,对档案资源的开发利用至关重要。2019年12月16日,档案行业标准《纸质档案数字复制件光学字符识别(OCR)工作规范》(DA/T 77—2019)由国家档案局发布,并于2020年5月1日起正式实施。该标准对档案OCR工作进行规范,明确其组织、实施和管理要求。由于人员限制,现阶段高校纸质档案OCR工作基本采用外包形式,因此在对外包企业的选择上要严格把关,全方位考量企业的相关资质和业内服务情况。一些自主开发能力强的高校档案馆,也可以通过在档案数字化生产平台中开发相应的模块,采取抽检的方式对档案OCR图像导入、图像预处理、比对识别、修改校正、成果整理输出等业务环节的全过程进行有效控制[2]。
1.3 声像档案修复和图像特征提取
声像档案在客观、准确还原历史场景上,有着纸质档案难以企及的优势。随着时间的推移,高校馆藏电影胶片、录音带、录像带、幻灯片、照片等声像档案慢慢损坏,其依赖的存储载体、数据传输模式也逐渐被淘汰,很多声像档案面临着无法利用,或是信息丢失的现状,迫切需要声像档案的修复和数字化转存。在声像档案数字化的基础上,可以对学校发展历程中的重大事件、重要人物、标志性景观等数字资源进行图像特征提取,为后续校史编研的有效利用提供素材。当然,如果条件允许,则可以对所有的数字化声像档案资源进行图像特征提取,通过计算机算法,对数字化声像档案进行分类或聚类,为校史编研挖掘更多的信息,提供更丰富的素材。
2 核心:数字化校史协同编研实施
2.1 基本思路
协同是数字化时代组织效率的本质,协同编研则是推进数字化校史编研的核心。数字化校史协同编研与传统的人工或是半自动编研最大的区别在于,其是以主题为中心,提供基于工作流的多人协同编研平台,以进一步提高编研效率。流程大致可以分为六步:一是确定编研主题,分为年鉴等常态化编研和根据高校阶段性的工作中心任务或是特定的时间节点提出的特定主题编研两部分。二是设计编研模板,对于常态化编研,可通过固定的编研模块来重复实现,而特定主题编研则需要编研人员根据主题定制不同的模板。三是明确编研规则,包括行文规范、成果体现、审校流程等,并将规则转化为计算机语言。四是设定数据调用范围,根据编研主题进行数据挖掘和分析,再结合人工比对,判断数据的准确性。五是人工编研,在前期数据收集、校对的基础上,编写人员分块协作加工,包括语言组织、重点凝练、结构优化、几审几校等。六是终审发布,编委会终审通过后,根据编研内容,确定发布形式和公开范围,通过相应的数据接口进行成果展示。
2.2 平台构建
数字化校史协同编研必定依托档案数字化编研系统实现,因而设计、提供一个能满足多人协同编研需求的平台是建设核心。当然,建立合理的组织机构是第一步,是科学、高效搭建平台的前提条件。以年鉴编写为例,这项工作涉及高校每个部门,要根据部门编写人员、部门审核人员、年鉴编写办公室编辑、副主编、主编和年鉴编委会委员、副主任、主任等不同角色搭建好组织机构,赋予不同的职责和权限。在编研过程中,所有流程的实施与管理都要能在编研系统中体现。模块按性质可以分为两类:第一类是工作模块,第二类是管理模块。工作模块主要实现调用、编辑和输出功能。具体而言,调用功能主要指的是档案数字化编研系统与档案管理系统相衔接,并从中读取馆藏数字档案资源,提取既定编研模板;编辑功能是校史协同编研的核心环节,一方面实现调取数字资源的校对、整合、利用,另一方面可以进行自主录入编辑,从而完成计算机原始数据整理到人工智能开发的转化;输出功能是编研最终成果的展示,可以多元化的、多类型的呈现,满足不同编研成果的展示需求。管理模块则包括系统管理、规则管理、数据流管理和工作流管理。简而言之:系统管理主要保证档案数字化编研系统安全、稳定、高效、有序运行,确保数据安全;规则管理则是尽可能实现编研过程标准化,包括数据规范、模板统一、编研规则一致等,提高校对效率;数据流管理,旨在实时记录编研的过程,协同编研操作者调用、修改、审校所有数据被一一记录并可以回溯,实现数据层面的有效管理;工作流管理主要针对编研流程的管控,可以根据进度和计划引导编研工作有序开展。
2.3 特色功能
基于校史编研实践,在数字化校史协同编研系统中建议增加三项功能。一是数字资源来源回溯功能。在调用档案管理系统中的数据时,不但调用具体内容,建议同时提供调用链接。为编研过程中反复回溯查考提供便利。二是智能检索功能。相对于传统的手动检索,智能检索功能可以为协同编研提供强大的数据支撑。数字化校史编研的优势在于对馆藏档案资源的全方位便捷利用,相较传统载体档案,智能检索可以通过数据分析比对梳理档案之间的内在联系,为编研人员提供新的思路、视角以及丰富的素材。智能检索应用于声像档案,可以通过以图搜图、以图搜视频、以人搜图、以人搜视频等检索手段,全面高效挖掘整合馆藏资源,凸显编研特色和亮点。三是模板定制功能。基于编研主题,开发不同类型的协同编研模板,其目的是使主题编研更加便捷、规范,展示效果更强。比如科研获奖情况,可以用表格的形式进行梳理;大事记,则用时间轴的形式来体现更直观;班级、活动图片,用相册来体现视觉冲击力更强等等。
3 预期:数字化校史编研成果呈现
3.1 两微一端动态展示
两微一端动态展示是目前采用最多的数字化校史编研成果展示方式,能够较为便捷的实现,为大多数阅读者接受。高校档案馆大多拥有自己的公众微信号,一般都设有校史编研专栏,有的学校还有自己的校史网站。重大校史编研成果不但在高校档案馆微信公众号发布,高校官方公众微信号和官方微博也会及时转发。比如:浙江大学档案馆在其公众微信号上与档案编研相关的主题栏目设置了校史编研、求是学人、系科发展、发现档案、影史钩沉等五大板块;上海交通大学档案文博管理中心,在疫情期间推出云游文博系列活动,发布《云上文博剧场,伴你抗疫且行,静心雅意待春归》主题推送,让读者与历史、文化、艺术对话中感受优秀文化的无限魅力;中国计量大学42周年校庆时,在学校官方公众微信号和官方微博中发布“岁月如歌!李乐山与中国计量大学”推文,深度解读分享李乐山同志与中国计量大学的深厚历史渊源。两微一端平台为校史编研成果的实时动态展示提供了有效的平台。
3.2 SQLite+H5静态展示
采用SQLite+H5静态展示,可以使校史编研成果脱离编研系统,解决了离线环境或是没有系统支持的编研成果展示需求。部署过程中,编研成果脱离系统以压缩包形式导入各种展示平台,使展示速度更快,部署更便捷,安全性更高。比如:一些高校在校史馆展示的校友学籍查询平台,就是在前期整理历届校友成绩单、毕业照、活动照片的基础上,导入学籍查询系统,实现静态展示。
3.3 VR虚拟场馆展示
通过云端VR技术,使参观者打破时间、空间的限制,在视觉、听觉等立体化运用的基础上,全方位沉浸式感受校史编研成果。VR虚拟场馆展示主要运用于两个方面:一是临时展馆因时间、场地等原因拆除后,开通虚拟场馆,满足长期的参观需求;二是作为长期展馆现场参观的补充,使参观者足不出户就能在电脑上或通过手机扫描便捷参观。目前,吉林大学、河海大学、上海师范大学、合肥工业大学等诸多高校建设了VR全景校史馆,中国计量大学则在“王大珩与中国计量大学”展实体展厅拆除后,自主开发了VR展厅。这些都是VR虚拟场馆展示校史编研成果的具体实践。
3.4 读屏概念展示
读屏概念展示,将传统纸质编研成果电子化,适应读屏时代阅读者的阅读需求。全媒体时代,阅读的平台和载体改变巨大、更新加速。电脑屏、IPAD屏、手机屏,使阅读可以随时随地进行。纸质书、电子书、有声书正成为主流的三类知识载体,“忙时读屏,闲时读书”已成为越来越多人的选择。校史编研成果适应读屏时代的阅读,首先要求编研工作者在编研成果的标题上下功夫,拟定一个准确、传神的标题来吸引阅读者;其次要在内容上下功夫,编研内容尽可能精炼化、生动化,结合图文、视频、音频,吸引阅读者的快阅读和碎片化阅读。