数字化转型背景下档案馆红色档案资源挖掘研究
2024-03-19黄浩宇房小可王海燕
黄浩宇 房小可 王海燕
摘要:国家文化数字化战略的提出,为红色档案资源的挖掘提供了新的可能和思路。论文对档案馆红色档案资源挖掘现状进行梳理和分析,得到数字化转型背景下档案馆红色档案资源挖掘中存在的挖掘主体协同不足、红色档案数据要素价值不突出、红色档案挖掘深度不够的问题。针对以上问题,论文提出以项目为驱动,促进主体协同合作;注重打造红色档案数据基座,发挥红色档案数据要素价值;加大挖掘技术应用,深耕红色档案项目成果转化的对策。
关键词:数字化转型 红色档案资源 档案资源挖掘
红色档案是记录中国共产党光辉历程的珍贵史料,是弘扬红色文化、传承红色基因的重要载体。对红色档案资源进行挖掘、传承红色文脉一直以来是档案学界研究的重要课题。以数字经济为代表的产业链影响着用户利用档案资源的需求和方式,关于某个事件的红色档案资源是否全面、挖掘内容是否深刻,是当下满足受众需求时需要考虑的重点。诸多学者在理论层面提出了红色档案资源的建设及开发路径,但对档案馆实践层面的探讨和分析不够。如何在数字化转型的当下,提升档案馆挖掘红色档案资源的业务能力,升华红色档案资源价值,向公众生动传播红色文化,是档案部门需要解决的重要问题。
一、我国档案馆红色档案资源挖掘现状
目前档案资源挖掘在学术界并没有一个确定的概念,夏琳芳等[1]认为档案资源挖掘建设要扩大红色档案征集领域。赵瑞红等[2]从数字人文角度出发,认为档案资源挖掘是对档案信息进行多维度挖掘和信息提取,形成可视化的成果。因此,数字化转型背景下的红色档案资源挖掘的内涵包括两层含义:其一为重视以数字化手段收集或征集红色档案资源,以保持其完整性;其二为对已有相对完整的红色档案资源的深层次分析和挖掘。前者是红色档案开发利用的基础,后者是红色档案开发利用的关键。本部分以此概念界定为基础,从挖掘主体、挖掘渠道和挖掘内容三个方面梳理我国档案馆红色档案资源挖掘现状。
(一)挖掘主体多元化
红色档案资源挖掘的主体十分广泛,主要是指参与红色档案资源挖掘工作的机构、团体和个人,主要包括综合档案馆、高校档案馆及社会力量等。例如,2016年4月湖北省档案局在武漢大学主办了首届赣鄂湘档案编研高级研讨班,赣鄂湘三省在档案人文历史领域的合作正式开启,也为区域红色档案资源的整合与开发提供了机制保障。在新中国成立70周年之际,江苏省委党史工办、江苏省档案馆及《扬子晚报》联合推出“红色丰碑”寻访影视剧英雄原型,讲述英雄故事。此外,重庆市档案馆、四川省档案馆联合举办了“‘印记100——川渝地区档案馆馆藏中国共产党红色珍档展”,展出的档案为川渝两地各级各类档案馆精心选出的有关党史、新中国史、改革开放史、社会主义发展史的珍贵档案。
(二)挖掘渠道多样化
对红色档案资源的挖掘不仅有传统的内容分析法,也有以新技术为基础的新方法。其一为根据某一线索进行追踪,力求红色档案事件相对完整。如朱琳等[3]在研究中提道:“毛泽东写给毛岸英、毛岸青的信这份档案,结合这份家书的内容和写作时间、人物等背景要素,串联成一个完整的故事,让观众体会到作为父亲的毛泽东对子女的爱护之心和谆谆教诲。”周耀林等[4]基于叙事主线,提出红色档案资源的社会共建模式,保证红色档案叙事的完整性。其二为运用数字人文等技术实现红色档案资源挖掘。如郑慧等[5]提出建立红色记忆数字资源库及数字记忆展示平台,用数字化方式推动红色档案开发成果的共享。在实践层面,上海市档案馆联合《解放日报》·上观新闻及黄浦区档案馆,运用数据库、人机交互、GIS等技术实现档案数字化转型,共同打造“跟着档案观上海”数字人文平台。
(三)挖掘内容丰富化
对红色档案资源的挖掘既有对以往纸质档案及老照片的梳理和编排,如北京市档案馆挖掘现有馆藏,出版了《五四运动档案史料选编》和《中国共产党北京(平)党组织活动纪实》等编研成果;也有针对某个重要历史人物或事件的挖掘以讲述背后的故事,如湖南省档案馆在纪念抗日战争胜利70周年之际开展网上“血战三湘卫山河”图片展;更有通过多媒体技术等手段对红色档案资源进行整合和展示,如上海市档案馆利用馆藏资源,将“党的诞生”通过地图、老照片及音频整合的方式可视化呈现在所搭建的数字人文平台中,将党的诞生以故事化重组形式呈现给公众。
二、数字化转型背景下档案馆红色档案资源挖掘存在的问题
依据新一轮科技革命的发展,对挖掘现状进行分析,发现数字化转型背景下的档案馆红色档案资源挖掘主要存在红色档案资源挖掘主体之间协同不足、红色档案数据要素价值不突出、红色档案资源挖掘深度不够的问题。
(一)红色档案资源挖掘主体之间协同不足
由于红色档案资源的形成分布具有区域性特点,往往使得围绕同一历史事件形成的红色档案被存放在不同档案馆中,例如五四运动档案会因地域性被存放于各地档案馆中。由前文可知,档案馆之间、档案馆与其他机构及媒体相互合作,合作模式呈现多元化,但依然存在着问题。一方面,红色档案资源挖掘主体之间的合作实际上主要以线下为主,线上协同有待进一步加强;另一方面,合作主体具有较强的地域性关联,无论是京津冀、赣鄂湘抑或是川渝地区,都由于地域特征而合作较多,但随着数字时代的到来,馆藏机构之间的合作不应该只拘泥于地域限制,可以根据实际需要跨地域甚至跨国度开展线上项目协同合作,形成资源融合共享,使其发挥更大价值。
(二)档案馆红色档案数据要素价值不突出
2020年3月30日中共中央、国务院印发的《关于构建更加完善的要素市场化配置体制机制的意见》将数据作为新型生产要素写入文件,其中强调要推进政府数据开放共享,提升社会数据资源价值,加强数据资源整合和安全保护。2021年12月中央网络安全和信息化委员会印发的《“十四五”国家信息化规划》指出“建立高效利用的数据要素资源体系”的重要任务和重点工程,充分发挥数据作为新生产要素的关键作用。[6]数据要素本身价值有限,对其进行深度开发和利用才会更加凸显其价值。当前档案馆红色档案数据基础依然薄弱,具体体现在两个方面:其一是各馆的红色档案挖掘成果特色不足,没有充分体现红色档案数据要素与其他类型档案数据要素的不同,导致红色档案叙事与其他类型的档案叙事成果雷同;其二是档案馆的数字人文平台虽然实现了基于多模态的线上展览及可视化成果,但依旧是不同模态的浅层整合,对于红色档案资源内容数据提取不够,这直接影响技术的应用,导致红色档案数据要素价值发挥受限。这些归根结底是由数据基础不够坚实,红色档案数据要素价值不突出造成的。
(三)档案馆红色档案资源挖掘深度不够
以内容为切入点挖掘档案背后的故事一直以来都是档案工作的重点,也由此形成诸多编研成果,为公众提供了有效服务。这种依靠专家深厚的知识背景对档案内容进行研究和梳理是档案馆传承下来的重要方法。随着档案数字化转型的推进,也催生了一些数字编研工具,即通过数字化手段辅助原始的人工编研。但技术应用的目标更多集中在人工重复性工作和内容展示形式上,而非内容的挖掘上。因此,如何将档案挖掘理论落地,运用新理念、新技术、新方法细粒度挖掘红色档案资源,积累红色档案数据,形成基于内容的数字编研成果是需要加强的。此外,诸多档案馆的数字人文平台表面上是档案数字化转型的显著成果,但实际往往是档案馆展示什么用户利用什么,其本质上是一种单向的受众传播,如何运用大模型及自然语言技术挖掘红色档案资源的叙事特征及语义关系,通过知识重组的方式实现以用户为主体的问答式互动依然是需要探索的方向。
三、数字化转型背景下档案馆红色档案资源挖掘策略
针对档案馆红色档案资源挖掘存在的问题,拟从主体协同合作、档案数据价值发挥、档案项目成果转化三个方面提出挖掘策略。
(一)以项目为驱动,促进主体协同合作
新文科及数字人文的兴起推动了跨学科跨领域的合作,也为档案数字化转型提供了新途径。其中比较突出的如上海市档案馆的“跟着档案观上海”数字人文平台和上海市图书馆的“盛宣怀档案知识库”。上海市在档案深度挖掘和开发利用方面是比较领先的,两个平台的成功都来自各自组建的数字人文项目团队,以项目推进的方式进行档案资源的开发,参与主体既包括馆藏机构,也包括技术公司及团队。馆藏红色档案资源的挖掘可以借鉴成功经验,组建红色档案资源挖掘项目核心团队,以项目目标为导向,联合跨领域专家团队,融合项目管理思想,分阶段、高质量推进红色档案资源的挖掘,以用户评价为依据,进一步优化挖掘成果及展现形式。此外,在项目成果试运行中,可采用众包形式,鼓励公众积极参与到红色档案资源建设中,如纠错、上传私人档案等,让公众由红色档案资源的利用者转变为红色档案资源的建设者。如ICA-AtoM(Access to memory)[7]开放资源档案描述工具,即可融合公众力量完成档案征集、描述和著录工作。对于红色档案资源,同样可以动员社会力量,融合开源工具进行收集和挖掘。
(二)注重打造红色档案数据基座,发挥红色档案数据要素价值
对于档案数据的理解,上海大学于英香教授[8]提出,档案数据内涵超越档案信息,不仅包括档案内容,还包括其软硬件平台、日志、維护信息等相关信息。赵红颖等[9]认为数字化更多体现为一种传统著录方式的粗粒度描述,而数据化是从细粒度角度揭示档案资源组织与关联,进而形成数据态。综上,本文认为,红色档案数据要素不仅包含红色档案本身,也包括在红色档案基础上进行加工而产生的背景、著录、关联数据等档案信息,总体上体现为:一次档案数据,主要指档案原始记录,体现为语义连续的档案信息;二次档案数据,指在一次档案数据基础上进行加工产生的档案产生背景、著录的相关数据,包括软硬件平台、日志、维护信息、文件题名……体现为语义离散的档案信息;三次档案信息,面向档案内容,在一次及二次档案数据基础上进行加工产生的档案内容数据,包括时—空—人—地相关数据,以及叙事数据、关联数据等,体现为数据重组的语义增强信息。因此,打造红色档案数据基座,不仅要注重档案载体及内容的收集,也要注重红色档案挖掘过程中著录信息及语义信息的收集与保管。对红色档案资源挖掘的前提是获取以上档案数据要素,形成档案基座(如知识库等),在此基础上才能进行更深层次细粒度化的挖掘工作,也才能将红色档案数据要素转化为生产要素,发挥更大的教育功能及文化价值。
(三)加大挖掘技术应用,深耕红色档案项目成果转化
档案馆在资金允许的范围内,应加大挖掘技术应用。随着当前数据挖掘技术的不断发展和成熟,学者及行业技术者推出了许多挖掘工具和模型,这些工具和模型可以直接投入使用。此外,信息化时代,需要档案馆做出角色转变,从以往单纯的内容提供者转变为内容提供者及技术内容开发者。技术内容开发者不是要重新学习技术架构和使用方法,而是能理解相关方法与工具的原理及其可以解决的问题,这样才能针对项目目标,准确梳理出所需技术或工具,也才能有的放矢地与技术合作方进行深入研讨,避免内容和技术两张皮。此外,红色档案资源挖掘的目标是传承红色文化、赓续红色血脉,因此需要深耕项目成果转化,将其真正落地,为社会公众所用,实现推广作用和价值。例如,上海市图书馆运用新技术深入挖掘馆藏资源,形成盛宣怀档案知识库、家谱知识服务平台等成果,并构建了数字人文项目的开放数据平台,以关联数据等形式向公众发布上海市图书馆的基础知识库、本体词表、相关论文、课件等成果资料,这些均可为档案馆红色档案项目开发及成果转化提供借鉴。
四、结语
红色档案资源的挖掘是传承红色基因、赓续红色血脉的重要前提。随着国家文化数字化战略的提出及档案数字化转型的不断推进,探讨数字化转型背景下的档案馆红色档案资源挖掘是必要的。然而红色档案资源的挖掘不是一蹴而就的,需要学习成功经验,根据红色档案资源主题及特色制定挖掘目标,以目标为导向成立项目、建立多学科团队、融合跨领域资源、提取红色档案数据要素、加大技术应用和推广。希望本文的探讨能为档案馆红色档案资源开发利用工作提供有益借鉴。
*本文系国家档案局项目“北京市档案馆红色档案资源挖掘探索研究”(项目编号:2022-R- 006)、北京市属高等学校优秀青年人才培育计划项目(The Project of Cultivation for young topmotch Talents of Beijing Municipal Institutions)“多源数据驱动的北京公共数字文化智慧服务研究”(项目编号:BPHR202203216)阶段性研究成果。
注释及参考文献:
[1]夏琳芳,李钢.关于挖掘和丰富红色档案资源的思考——黄冈市开展红色档案资源建设的做法[J].湖北档案,2014(7):26-28.
[2]赵瑞红,陈香.数字人文视域下校史资源挖掘与文化传播研究[J].兰台内外,2022(15):79-80.
[3]朱琳,闫静.党史学习教育背景下红色档案叙事研究——以百集微纪录《红色档案》为例[J].山西档案,2022(3):68-75.
[4]周耀林,张丽华,刘红.叙事传输视角下红色档案资源社会共建模式与实现路径研究[J].档案学研究,2023(1):82-90.
[5]郑慧,韦兆焯,王清楠.数字记忆视角下西南民族地区红色档案开发策略研究[J].北京档案,2022(3):26-28.
[6]中央网络安全和信息化委员会.“十四五”国家信息化规划[EB/OL].(2021- 12- 27)[2023- 12- 07].http:// www.cac.gov.cn/202112/27/c_1642205314518676. html.
[7]ICA.ICA-AtoM Project[EB/OL].(2020-10-11)[2023- 12- 25].https://www. accesstomemory. org/en/docs/2.8/.
[8]于英香.从数据与信息关系演化看档案数据概念的发展[J].情报杂志,2018,37(11):150-155.
[9]赵红颖,张卫东.数字人文视角下的红色档案资源组织:数据化、情境化与故事化[J].档案与建设,2021(7):33-36.
作者单位:1.教育部机关服务中心2.北京联合大学应用文理学院3.北京市档案馆