数字人文视域下浙西南革命档案开发路径研究
2022-02-22高元武丽水学院
高元武/丽水学院
近年来,数字人文技术逐渐成为档案馆、博物馆、图书馆等人文信息资源加工处理、研究的辅助性手段。“数字人文”作为信息计算技术与人文交叉的新兴学科,重视对各式档案信息进行数字化处理,通过对档案、文史资料、传世文献等资源进行数据采集、加工、组织和整合[1],协助研究者开展文本挖掘、信息关联、文意分析、数据整理等相关研究工作。通过数字人文技术对档案文献资源主体和客体产生范式性的深刻影响,这恰恰是当下红色档案资源开发利用亟需转型的理念[2]。挖掘红色档案价值,打造红色教育基地,见证初心使命、传承红色基因,推动档案数字化转型,同样是浙江档案事业发展“十四五”规划的重要内容之一。
随着我党革命档案资源保护利用的开展,浙西南革命档案作为浙江革命斗争史的重要组成部分备受各界关注。1927年,丽水遂昌建立了浙西南第一个党支部。1935年,中国工农红军北上抗日先遣队余部组建中国工农红军挺进师,在浙江丽水、衢州、金华等地开创了中国南方唯一新建立的一块革命根据地——浙西南革命根据地,在我党革命斗争史上具有重要意义,党史上称其为“浙江的井冈山”。周恩来、刘英、粟裕等老一辈革命家和无数革命先烈均在此留下了光辉的战斗足迹,缔造了“忠诚使命、求是挺进、植根人民”的伟大“浙西南革命精神”[3]。浙西南革命档案是党在浙江革命斗争史的历史见证。
为更好赓续红色血脉,以多种形式开展对浙西南革命档案进行创造性转化和创新性开发就显得尤为重要。“档案资源在数字人文研究和项目实践中具有不可比拟的优势”[4]。基于数字人文技术理念,不仅能促进浙西南革命人物档案研究的体系化,还能提升浙西南革命档案知识的结构化,最重要的是数字人文技术能够增强浙西南革命档案开发的效能。借助数字人文技术作为档案资源开发手段,在拓展浙西南革命档案遗产开发保护路径的同时,也为研究宣传、赋能社会发展提供了更为便捷的途径。故而,浙西南革命档案的开发,亟待数字人文技术理念的加持。本文拟以浙西南革命档案为例,探析数字人文支撑下红色档案遗产开发,总结浙西南革命档案遗产开发利用存在的问题,构建数字人文视域下浙西南革命档案资源开发路径。
1 浙西南革命档案资源开发存在的问题
浙西南革命是浙江党史、革命史研究的重要内容,取得诸多研究成果。当前浙西南革命档案资源开发体现为三种类型:一是浙西南革命档案资源的收藏保管;二是对部分浙西南革命档案进行数字化整理;三是对浙西南革命档案所蕴含的革命精神进行诠释。显然,浙西南革命档案资源的整理开发尚处于初步阶段,浙西南革命档案资源开发存在以下问题:
1.1 浙西南革命档案资源分散
浙西南革命斗争区域广泛,加之后来行政区划变动,浙西南革命档案暂时没有实现集中统一保管。浙西南革命档案资源分为如下类型:其一,浙江省档案馆馆藏纸质文献。主要包括浙南党组织建立和发展形成的工作计划、决议、报告、通告、农运、妇运等,1935年挺进师入浙作战,创建浙西南根据地等纸质文件档案;其二,广泛分布的革命遗址遗迹等不可移动文物。主要分布于丽水、衢州、金华、温州等地,如永嘉县五鸿村红十三军军部、青田万山村阻击战、庆元竹口战役、挺进师驻地王村口等数百处浙西南革命斗争的遗址遗迹;其三,实物类档案资源。丽水浙西南革命根据地纪念馆,保存了千余件革命实物档案,这其中既有浙西南革命年代遗留的长矛、土枪、弹药、自制地雷等各式武器,也保存了中共中央闽浙赣特派员、中共浙江省委书记刘英烈士遗物,还有国民政府镇压革命使用的脚镣等刑具;其四,口述档案资料。近年来,丽水市组织专家学者奔赴各地进行调查,实地采访革命英烈后人,汇编成浙西南革命口述史料。如丽水青田北山镇组织录制浙西南革命口述资料,丽水党史办依据口述资料编写的《浙西南革命故事》,丽水莲都区开展“浙西南革命精神”口述史采集建档工作[5]。
1.2 浙西南革命档案编研迟滞
浙江省档案馆馆藏浙西南革命档案资源已经完成数字化工作,但其他地市档案馆藏资料尚未开展系统编研、数字化工作。按照传统档案编研模式,浙西南革命档案应由各地档案馆编研为主体,以各档案馆馆藏资料为基础,协同史志等部门开展编研工作,同时组织领域内的专家学者或档案资源收藏者开展整理编辑工作。但浙西南革命档案面临保存机构众多且分散,档案类型多样,各类型档案资源提取信息难度较大,地方编研力量薄弱,编研过程较为复杂,效率较低等问题。采取数字人文技术对浙西南革命档案进行编研,构建各主体联合协同编研机制,依照编研协议对各地馆藏纸质档案、实物档案、遗址遗迹等进行信息挖掘,快速建立各地浙西南革命档案之间的数据关联,通过数字人文技术加速呈现浙西南革命档案编研成果。
1.3 浙西南革命档案开发过程中信息技术渗透低
馆藏档案数字化,其本质上是对档案进行信息技术数字化渗透。目前,仅浙江省档案馆馆藏浙西南革命纸质档案完成了数字化加工,按照时期-地区-年代分类组卷,其数字化成果已经实现了文件级检索目录。浙江省档案馆馆藏浙西南革命档案,因缺乏数字人文的加持,档案之间的信息关联、数据挖掘、文本分析等尚未进行有效开发,距离真正“档案数字化”还有一定距离。其他各地所藏浙西南革命档案资源仍未开展基本的数字化工作,革命遗址遗迹缺乏规范的数据信息标注,故而浙西南革命档案资源在开发过程中信息技术渗透较低,档案资源的多重脉络难以解读。因此利用数字人文对浙西南革命档案进行开发是一种必要的技术创新。
2 数字人文视域下浙西南革命档案的基础设施构建
借助计算机信息技术对浙西南革命档案资源进行数据处理,是数字人文视域下浙西南革命档案进行开发的基础前提,更是浙西南档案后续一系列数字人文开发的重要基础设施[6]。
2.1 数字化:浙西南革命档案数字化整理与加工
浙西南革命档案资源具有内容时间跨度大,档案类型多样,保存主体不统一等特点,总体上可分为原生档案、档案汇编、浙西南革命纪要、浙西南革命回忆录及日记、口述资料、声像资料等几种类型,数字人文对每一种类型档案资料均有相应的数字化标准。
首先,确定浙西南革命档案资源数字化所要遵循的相关标准规范,这些数字化标准有《纸质档案数字化技术规范》(DA/T31—2017)、《照片档案管理规范》(GB/T 11821—2002)、《录音录像档案管理规范》(DA/T 78—2019)、《图书馆馆藏资源数字化加工规范》(GB/T 31219.2—2014),对于各地保管的浙西南革命文物史迹应符合文化文物统计信息系统的数据标准要求;其次,需要数据专家确定浙西南革命档案资源数字化的整体框架,对纸质档案、文物史迹等进行编码设计,制定数据采集行之有效的方案;最后,设计浙西南革命档案的描述元数据。对于浙西南革命纸质资料,依照国家图书馆纸质文献描述元数据,同时依据档案内容及格式编制浙西南革命档案数据库字段,对于文物史迹通过图像及其相应技术进行整理。浙西南革命档案数字化是整个数字人文基础建设的基石。
2.2 数据化:浙西南革命档案多层级标注
首先,在浙西南革命档案数字化整理的基础之上,由数据专家对各类型浙西南革命档案进行分析提炼,得到浙西南革命档案多特征词汇资料底表,作为进一步对浙西南革命档案进行数据标注的基础;其次,数据专家对浙西南革命档案词汇资料底表进行相关关联,分析浙西南革命档案词汇所蕴含的显性和隐性知识,通过人工标注、机器学习完成浙西南革命档案“自动分词、自动词性标注、自动命名”,同时不断对数据模型进行精准修正以提高数据标注的可靠性,以实行对浙西南革命档案中的“人、时、地、事、物”等进行精准一体化的标注;最后,通过一系列专业化数据标注,形成多层级的浙西南革命档案语料数据库,这为后续数字人文研究者利用浙西南革命档案语料数据库,关联相关研究主题,为知识化研究奠定基础。浙西南革命档案实现从数字化到数据化语料库建构的转变,从而建立起可供信息终端阅读、逻辑关联的文件,以实现对浙西南革命档案进行智能化开发。
2.3 知识化:浙西南革命档案语义知识化建构
浙西南革命档案语义资料库需要进行知识化建构,目的在于对浙西南革命档案进行知识重构,通过信息终端理解浙西南革命语料库中词句所蕴含的语义,借此对相关主体进行关联并做逻辑运算,从而实现发现新知识、研究新问题的主旨。
首先,浙西南革命档案知识化,离不开知识本体建构。知识本体是指主题领域内具有特定内涵的概念及概念关系之间的逻辑关联,而具体构建方法有企业建模法、骨架法、Methontology法、IDEF-5法、七步法,辅以斯坦福大学医学院开发的构建工具Protege软件[7],利用本体对浙西南革命档案的语料库进行标注,建立各知识点之间的逻辑关联,满足各知识点的逻辑控制与主题研究应用、数据贡献,奠定浙西南革命档案数字人文研究的底层基础;其次,通过知识数据关联技术(Link Data)和知识图谱(Knowle dge Graph)技术,建立起浙西南革命档案各知识点之间的逻辑关联。由于知识数据关联技术,浙西南革命档案各知识之间会建立起彼此之间逻辑联系,从而进一步推动信息终端对浙西南革命档案推理的实现,有助于研究者利用知识关联技术,为研究者提供深层次语义所隐含内容的知识系统;最后,引入机器学习方法,尤其是基于神经网络的深度学习技术(Deep Learning),在事关浙西南革命档案的自然语言处理(NLP)、名称实体识别(NEI)、自动标引和自动分类领域[8],机器智能学习有助于推动浙西南革命档案实现发现知识、知识增长的自动化,从而打通浙西南革命档案数字研究的智能化。
3 数字人文视域下浙西南革命档案资源的开发路径
浙西南革命档案文献资源的开发利用需要创新思维,数字人文技术为浙西南革命档案提供了开发利用的新路径。
3.1 多主体协同,构建开发“共同体”
跨界协同、多主体融合协作是数字人文技术的先天优势。数字人文技术在推动浙西南革命档案资源开发实践中,需要整合档案资源保管方、数字人文技术实施方、专家学者研究方、社会多元需求方。浙西南革命档案资源保管主体较为分散,数字人文技术加持下的资源开发,必须摒弃保守的壁垒思想,主动寻求跨界合作,构建跨地域、跨主体、跨类型的“三跨”“共同体”[9]。
首先,重视宏观组织保障上的联合。浙西南革命档案资源的数字人文技术开发,有赖于浙江省市协同构建宏观上的组织保障平台,由省主管部门统筹策划中枢,各地搭建区域分工协同平台,从而形成上下联动的宏观组织保障“共同体”;其次,中观上重视不同开发主体之间组建“共同体”,搭建多元参与主体协同开发的生态圈。浙西南革命档案资源开发涉及各地档案馆、地方高校、图书馆、研究机构和革命遗址遗迹管理机构,利用保管浙西南革命档案的资源优势,组建多元同质异构的中观开发“共同体”,在“统一领导,分工合作”的背景下,共建、共享浙西南革命档案10];最后,微观上推进不同学科之间的融合共进。对浙西南革命档案的解读与诠释,需要历史学、档案学等多学科之间的协同。数字人文技术对浙西南革命档案进一步挖掘需要知识产生、分散、收集的数字人文手段,借助信息数据检索、超文本、多媒体、计算统计、数据可视化等信息方法延伸浙西南革命档案研究的时空维度和文本信息挖掘纵深。
多主体融入浙西南革命资源开发“共同体”,不仅有利于统一整合浙西南革命档案,开发构建资源库,同时对于各地馆藏资源进行跨界编研和数字人文技术开发提供了极大便利。
3.2 融合创新技术,拓展场景应用
数字人文技术在发展的过程中形成了数字化、文本信息的数据管理与分析、文本信息的可视化技术、VR/AR以及机器自我学习等完善的技术体系,广泛应用于资源富集、知识重构、场景重建、增强艺术等方面[11]。
浙西南革命档案数字人文开发可由数字化保存开始,进而采取知识化开发,最后实现多场景可视化展示。浙西南革命档案数字化保存,主要使用数字化技术和数据信息管理技术,并按照档案主题、时间、空间有序实现数据化,构建数字档案资源库。浙西南革命档案知识化开发,主要是对档案文本进行数据挖掘,从错综复杂的信息中发现其内在联系,深入挖掘浙西南革命档案隐藏的关系网络信息,采取社会网络分析、空间轨迹分析、时序分析等,科学分析挖掘的结果及蕴藏的价值,为场景可视化应用做好准备。多场景可视化展示,利用CAD制图技术、3D展示、GIS地理信息系统等信息技术对浙西南革命档案时间序列、革命人物、革命事件、革命轨迹等进行场景还原再现。当社会各方想再现浙西南革命峥嵘岁月时,便可利用场景可视化技术展示还原历史场景,有助增强公众对中国共产党近代革命斗争史的深入认知。通过数字人文技术对档案进行“活化”开发,在“中国历代人物传记资料库(CBDB)”“数字敦煌”“中国记忆”“唐宋文学编年地图”等档案资源项目中均得到成功实施。
拓展浙西南革命档案场景应用,是数字人文开发路径的关键策略。针对浙西南革命档案资源既有区域色彩,又是中国共产党近代革命事业的重要组成部分,深入挖掘浙西南革命档案的内容精髓,实现多场景特色应用。英国泰恩-威尔郡档案馆开发的“隐秘的纽卡索”项目,借助地理信息分析系统,打开App软件便可再现街区的历史老照片,讲述历史故事。浙西南革命档案的开发亦可借鉴其经验,利用VR、AR、5G等技术,对革命遗址遗迹、革命斗争事件、革命人物、革命故事等进行数字人文赋能,再现浙西南革命的场景史实,借此开展浙西南革命特色红色文旅项目,以此打造“沉浸”式体验和“在场”式效果。浙西南革命可歌可泣的斗争史实,亦可作为党史教学内容,利用GIS与VR技术提升党史教育的成效。
3.3 关联数据,拓展浙西南革命档案资源开发利用
始于二十世纪三十年代的浙西南革命根据地,是中国共产党领导下土地革命和抗日战争的重要组成部分,档案所载历史信息并非孤立的,与全国土地革命、中华民族伟大抗战息息相关,以此构成党领导近代革命斗争事业的全貌。
数据关联就是将碎片化、异构化的浙西南革命历史档案资源建立起逻辑关系网络,将浙西南革命相关的革命人物、革命斗争事件等相关要素,形成完整的信息网络,进一步厘清各碎片化信息的关联维度,从而促进档案资源更好的聚合[12]。基于土地革命和抗日战争,浙西南革命档案资源可以进一步扩展数据信息关联,与长征、反围剿、北上抗日先遣队,乃至周恩来、粟裕、刘英等建立起相互链接的信息网络,从而进一步拓展浙西南革命档案资源开发利用的路径。
通过对浙西南革命档案进行“URI标识”,不仅可以将浙西南革命档案所载的信息资源进行标识,同时对于浙西南革命档案的非信息资源采取RDF/XML编码进行元数据描述,从而建立起数据关联[13]。这一技术有助于浙西南革命档案的人文数字技术开发,能够较好地把浙西南革命档案文献运用到近代革命斗争史研究中。例如丽水青田籍革命烈士麻植,通过数字人文数据关联技术的标识,可以较为顺利地关联到《邓颖超证明麻植烈士身份的复函》《麻植家书》以及周恩来、聂荣臻等关系密切的革命领导人。
4 结语
美国密歇根大学本特利历史图书馆馆长弗朗西斯·布劳因认为:“档案正在成为理解、回复和表达社会记忆这一挑战的中心问题”[14]。一直以来,浙西南革命档案主要通过举办各种形式的红色档案实物展览,实现对浙西南革命历史及档案精神文化内涵的传播。浙西南革命档案实物展览的方式,让社会在一定程度上加深了对党领导浙西南革命斗争史实的认知,但并不能将浙西南革命档案的其他价值给予充分挖掘并展示出来。浙西南革命,因档案资源开发利用路径的狭窄,这一段社会历史记忆表达的深度与广度受到挑战。
数字人文技术理念的加持,突破了浙西南革命档案价值展示的路径限制。通过对浙西南革命档案采取数字化、数据化、知识化的人文技术处理,既有助于学术界加强对浙西南革命斗争的党史研究,同时通过融合创新技术,拓展了场景应用,借助数据关联,提升了浙西南革命档案资源开发利用,从而不失为浙西南革命档案开发利用的有效尝试。