数字人文视域下滇缅抗战史料数据库建设研究*
2021-06-07何志丽陈子丹
何志丽 陈子丹
(云南大学历史与档案学院,昆明 650091)
滇缅抗战指第二次世界大战期间发生在中缅印战区的抗日战争,是中国国民政府正面战场唯一获得彻底胜利的大规模进攻作战。滇缅抗战留下了浩如烟海的珍贵史料,散存于中国、日本、美国、英国、缅甸、印度及其他相关国家与地区。本文以中国内地所存的滇缅抗战史料为研究对象。这些史料客观还原了滇缅抗战的历史现场,对后人了解、铭记、研究和反思历史具有重要价值。然而,目前滇缅抗战史料的资源分布与管理呈条块分割状,史料信息资源平台建设较为滞后,无法体现本该具有的价值,难以满足数字时代历史人文学者的研究需求。因此,如何将滇缅抗战史料进行有效整合与开发,使之完整传承与再焕生机,成为亟需解决的问题。
数字人文视域下滇缅抗战史料数据库的构建,为解决上述问题提供了一种全新思路。数字人文是指用计算机技术处理和分析传统的人文研究资料,并将人文学科方法论和计算机工具相结合进行人文研究[1]。本文提出构建数字人文视域下的滇缅抗战史料数据库,是“数字人文方法论+特定领域知识组织”的一次有益尝试,前者强调方法与技术,后者注重滇缅抗战史料领域的知识重组与人文解释,二者相互结合,形成一种全新的数据库构建方式。本文将在梳理相关研究和实践现状的基础上,探析该数据库构建的必要性,并从数据库的建设思路、主要内容和建设步骤三方面来探讨数字人文视域下滇缅抗战史料数据库的建设。
1 滇缅抗战史料相关的理论研究和实践情况
目前,学术界取得了部分滇缅抗战史料整合与开发的研究成果。如赵周等[2]从理论和实践层面阐述如何建设滇西抗战资源总库,论述建库原则、建库意义、建库思路和建库框架,并介绍了建立滇西抗战资源总库的机遇和挑战;华林等[3]对南侨机工文献遗产数字资源整合进行研究,提出建立统一的南侨机工文献遗产数字平台;邹绪先[4]提出通过开展编纂、编史修志、撰写论著、拍摄专题纪录片、举办展览等活动来进行滇缅抗战档案的发掘利用。总体来看,滇缅抗战史料整合与开发的理论研究成果数量不多,研究质量有待提升,研究存在较大空白。
与此同时,国内也开展了一些滇缅抗战史料的实践工作,主要是进行了大量史料的全文数字化工作。如中国第二历史档案馆完成涉及滇缅抗战的“国防部史政局和战史编纂委员会”全宗档案的数字化工作,对其所保存的350卷、7万多页滇缅抗战时期相关档案进行了数字化处理。又如,云南省保山市中国远征军滇西抗战档案史料中心所存的滇缅抗战档案史料除少量实物外,绝大部分纸质史料和声像资料均被数字化。但是,目前仍有大量滇缅抗战史料尚未数字化,更未出现一个以知识服务为核心的滇缅抗战史料信息资源平台,系统化和数据化的滇缅抗战史料信息资源整合与开发项目在国内尚属空白。
2 数字人文视域下滇缅抗战史料数据库建设的必要性
2.1 滇缅抗战史料的资源现状亟待优化
一方面,滇缅抗战史料仍处于分散保存状态,资源分布不集中,缺乏协同管理。目前,国内数字化和实体形态的滇缅抗战史料主要散存于:①中国第二历史档案馆;②重庆市图书馆与重庆市档案馆;③云南省档案馆;④保山市及各县区的档案馆、图书馆、史志办、纪念馆;⑤德宏傣族景颇族自治州(德宏州)及少部分县区的档案馆、图书馆、史志办;⑥怒江傈僳族自治州(怒江州)及少部分县区的档案馆、图书馆、史志办;⑦大理白族自治州(大理州)及少部分县区的档案馆、图书馆、史志办;⑧民间组织和收藏家手中。同时,管理滇缅抗战史料的相关机构受限于行政归属与权限,掣肘于理念、技术、资金、人才的匮乏,在管理上各自为政,缺乏对滇缅抗战史料资源的交流,亦没有资源建设上的共建共享。
另一方面,滇缅抗战史料资源的信息化程度远远不够。虽然大量滇缅抗战史料已进行数字化工作,但仍有部分滇缅抗战史料未实现数字化,导致滇缅抗战史料形态不一、结构复杂,难以进行有效的资源整合与开发。同时,已经数字化的滇缅抗战史料基本上处于粗粒度的“数字态”,远远达不到更细粒度的“数据态”,无法进行史料数据的关联、挖掘、分析与处理,难以满足数字时代人文学者对滇缅抗战史料利用的更高要求。
2.2 滇缅抗战相关数据库的建设现状亟待提升
目前,在滇缅抗战相关数据库建设层面,具有典型性的是云南省保山学院图书馆构建上线的滇西抗战资源总库。该库涵盖了滇缅抗战相关的图书、档案和其他资源,分为九大板块,初步构建了一个Web特色资源数据库。它是国内滇缅抗战研究中较具创新的探索,提供了该领域进一步研究与实践的新思路。但是,该库亦存在一定不足,具体表现为三方面。
一是目前保山学院图书馆馆藏相关滇缅抗战图书680本(部分为档案汇编)、影印版日文档案56本、图片(含照片)1 000多张、日记10本(包括未出版的),还有大量相关旧期刊、旧报纸等,但是受限于版权、资金、技术和理念等因素,这些资源仅少部分上传至数据库中,导致该数据库各板块下所涵盖的内容较为薄弱单一,与馆藏的丰富性不成正比。
二是由于滇缅抗战史料资源的管理各自为政,滇西抗战资源总库所涵盖的资源大多局限于保山学院一地所藏,缺乏机构间、地区间资源的交流互通与共建共享,客观上成为一座“信息孤岛”。
三是该数据库是传统型数据库,基本功能围绕“检索”展开,虽然方便图书、档案等资源的搜集与碎片式查阅,但无法彰显出滇缅抗战史料之间的种种关联,无法使用户进入身临其境的史料利用环境。
2.3 数字人文视域在滇缅抗战史料数据库建设中具有优势
针对以上滇缅抗战史料资源及相关数据库建设情况,笔者认为数字人文视域能够为滇缅抗战史料数据库建设提供新的思路和方法,提高滇缅抗战史料的资源整合与深层开发程度,其具体优势如下。
一是数字人文是一种全新的方法论。针对目前滇缅抗战史料资源分散、多方管理、数据粗粒度、缺乏相互关联的现状,以知识本体为核心的数字人文,将碎片化的史料信息资源进行全新组配与整合后,使相关信息全部涵括在特定的实体中,并通过技术手段进行全景式的可视化呈现,这对目前散存的滇缅抗战史料来说是全新的思路与模式。
二是数字人文带来了全新的技术工具。数字人文所涉及的知识本体、关联数据、数据挖掘及可视化等技术,贯穿滇缅抗战史料信息资源的整合与开发全过程,带来了史料数据处理技术上的更新换代。
三是数字人文视域符合滇缅抗战史料数据库的全新角色定位。传统数据库建设的着力点在于史料的保存与检索,而数字人文视域下的数据库建设则更强调数据的挖掘与分析。滇缅抗战史料数据库不仅是帮助学者找到相关资料,它所扮演的角色应当是建设新的研究环境,帮助使用者发现、观察、分析资料[5]。以“检索—获取”为核心的传统数据库无法承载这样的功能与使命,而以关联、挖掘、分析、可视化为核心话语的数字人文数据库,则能促进滇缅抗战史料的高度关联、充分整合与深层开发,形成一幅关于滇缅抗战的全景式史料画卷。
3 数字人文视域下滇缅抗战史料数据库的构建
3.1 数据库的建设思路
滇缅抗战史料资源具有内容复杂、类别多样和保存分散的特点,笔者采取了多种途径获取数据:对云南省保山市、腾冲市和龙陵县等地的档案馆、图书馆、博物馆、纪念馆和史志办实地调研;对相关文献进行文本调研;对相关权威网站进行网络调研;对无法亲至的相关机构(如中国第二历史档案馆)进行电话调研。在初步摸清国内滇缅抗战史料的资源情况后确立了该数据库建设的总体思路(见图1),具体包括六大板块主要内容和五个阶段建设步骤。
图1 滇缅抗战史料数据库建设的总体思路
3.2 数据库的主要内容
3.2.1 原生档案
笔者通过各种途径与方式,对国内滇缅抗战原生档案的现状进行调研,获知滇缅抗战原生档案主要集中在中国第二历史档案馆、重庆市档案馆、云南省档案馆、保山市档案馆的“中国远征军滇西抗战档案史料中心”及保山市辖区内部分县区档案馆、腾冲市档案馆、滇西地区的一些市县两级档案馆。笔者认为,应将现行政策允许公开的滇缅抗战原生档案尽可能全面收录入库。首先,中国第二历史档案馆是目前国内存有滇缅抗战原生档案最为丰富的机构,所存滇缅抗战档案主要集中在全宗号为787的“国防部史政局和战史编纂委员会”民国档案中,内容主要涉及中国远征军军事活动与战时国民政府、地方政府的各种行政活动,应在政策法规允许的前提下入库。其次,保山市档案馆中国远征军滇西抗战档案史料中心藏有滇缅抗战文书档案647卷、5 448件、68 728页,照片档案45盒、2 743张,光盘档案188盘、缩微胶片20盘,图书资料171册,也应入库。再次,云南省档案馆保存着大量的滇缅抗战相关档案,内容主要涉及滇缅公路的修筑与管理,它们分散在馆藏民国档案中的近30个全宗中,也应大量收录至数据库中。最后,散存于滇西各市县区档案馆的滇缅抗战原生档案,也需应收尽收,录入库中。
3.2.2 档案汇编
档案汇编是目前滇缅抗战史料的重要组成部分。中国第二历史档案馆、云南省档案馆、滇西各市县的史志部门等都先后编纂出版了众多的滇缅抗战档案汇编。这部分编纂成果也应作为滇缅抗战史料数据库的重要组成部分。首先,中国第二历史档案馆近年来出版的最具价值的两部滇缅抗战档案汇编——《滇缅抗战档案》和《国民政府抗战时期军事档案选辑》,涵盖了中国远征军从出征、失利、转移、重组、整训到反攻胜利的全过程,具有重要的史料价值,应收入库中。其次,云南省档案馆编纂出版了一些滇缅抗战相关的档案汇编,其中代表性的是《抗战时期的云南——档案史料汇编》和《南侨机工档案史料选编——云南省档案馆馆藏部分》,这两部汇编均体现了档案的原始性、真实性和权威性,具有很高的历史价值,应收入数据库。最后,云南省保山市、德宏州、怒江州、大理州作为滇缅抗战发生的主阵地,其史志系统多年来一直在进行滇缅抗战史料的收集、整理、编纂和出版工作,成果较为丰富,其中值得一提的是中共保山市委党史地方志工作委员会2015年12月编纂出版的《滇西抗日战争史集》,全书共180多万字,分为九大板块,是目前滇西地区史志系统滇缅抗战档案汇编的集大成者,具有重要价值,也应收录入库。
3.2.3 战史纪要
滇缅抗战的主力部队是中国远征军第十一集团军和第二十集团军、国民革命军第八军和中国驻印军,他们都留下了各自的战史纪要。但是,战史纪要的原版大多未在中国内地翻印出版,而多以复印版形式流传于各网络平台,亟需规范化整合,将其收录至史料数据库不失为一种解决思路。目前,滇缅抗战中国军队战史纪要主要有《第十一集团军滇西龙芒地区作战经过报告》《第二十集团军腾冲会战概要》《陆军第八军怒江西岸松山围攻战斗经过概要报告书》《中国驻印军缅北战役战斗纪要》等。这部分史料虽存在部分观点有失公正、撰写者有争功推诿倾向等缺陷,但它们是当时公开的权威资料,是研究滇缅抗战历史的第一手资料,也应成为滇缅抗战史料数据库的重要组成部分。
3.2.4 回忆录与日记
滇缅抗战结束后,部分远征军将士撰写了回忆著作(文章)和日记,这些回忆录和日记,由“亲历者”撰写,是现存滇缅抗战史料的有益补充,亦应收录至数据库中。代表性滇缅抗战将士回忆录有《中国远征军入缅对日作战述略》《回忆滇西抗战》《中国驻印军始末》《第八军松山战役述略》《八年抗战小史》《滇西作战实录》《亲历中国远征军》等。其中《中国远征军入缅对日作战述略》由中国远征军副司令长官杜聿明亲撰,《回忆滇西抗战》节选自中国远征军第十一集团军总司令宋希濂回忆录《鹰犬将军宋希濂自述》,均具有很高的历史价值。代表性滇缅抗战日记有中国远征军第十一集团军第二军军长王凌云的《王凌云机密作战日记》、中国远征军第十一集团军副总司令兼第六军军长黄杰的《滇西作战日记》、中国远征军第二百师师长戴安澜的《戴安澜将军日记》、中国远征军第十一集团军第七十一军、军长陈明仁的《陈明仁日记》等。这些将士回忆录与日记价值高、意义强、作用大,亦应是滇缅抗战史料数据库的重要内容之一。
3.2.5 口述资料
口述资料指留存于世的亲历滇缅抗战远征军老兵、南侨机工与各界民众等以亲身经历讲述当时的战争状况、社会生活和相关重大历史事件而形成的文字、录音、录像等资料,是留存和传承滇缅抗战历史的重要补充,应摘选其中有价值的部分收入数据库。例如,《见证历史——滇缅抗战见闻实录》一书分为上、下两集,上集为20位滇缅抗战亲历者的回忆,下集是云南省保山市李义钦先生历时经年采访滇缅抗战老兵的口述记录。又如,《刘放吾将军与缅甸仁安羌大捷》由中国远征军新三十八师一百一十三团团长刘放吾将军次子刘伟民编著,内容由其父亲口述、再由刘伟民整理成文出版。再如,从2009年开始,云南省保山广播电视台《让我们铭记——寻访远征军老兵》大型电视节目,先后寻找并采访了50多位当时还健在的中国远征军老兵,制作了由亲历者口述滇缅抗战历史的23集大型纪实节目。这部分口述资料,也应摘其重点,收录入库。
3.2.6 声像资料
第一,滇缅抗战期间,美国第164照相联队拍摄了约2.3万张关于这场战事的照片,它们一直沉睡在美国国家档案馆,直到2010年才由章东磐团队复制部分回国,并精选其中500张整理出版了《国家记忆》一书。该书内容的重要性不言而喻,需全部收录入滇缅抗战史料数据库中。第二,国内还有部分关于滇缅抗战的老照片原件或复制件分散在各相关档案馆和民间收藏家手中,至今尚未经过系统性整理,也应尽快进行资源整合与处理,收录入库。第三,国内根据滇缅抗战拍摄了一些纪实性的纪录片,用影像的手段整合历史资源,还原历史真相,如《记忆的伤痕——日军慰安妇滇西大揭秘》《寻找少校》《松山,松山》《腾冲腾冲》《中国远征军滇西抗日战争纪实》等,也应收录至数据库中。
以上滇缅抗战史料数据库的六大主要内容构成了滇缅抗战史料数据库的六大板块。如何对这些史料数据进行关联、挖掘、分析与处理,使该数据库成为一个滇缅抗战大型知识服务平台,是我们要解决的关键问题。
3.3 数据库的建设步骤
数字人文视域下滇缅抗战史料数据库的建设是以滇缅抗战史料的知识本体(knowledge ontology)为核心,以关联数据、数据挖掘和可视化等信息技术为支撑,依次构建一个集成化、数字化、数据化、知识化、平台化的滇缅抗战史料信息平台。
3.3.1 集成化:滇缅抗战史料的资源整合
建设一个数字人文视域下的滇缅抗战史料数据库,首先要进行滇缅抗战史料的资源整合工作,但目前此项工作由各机构分条块进行,因此需从四个方面推进资源整合。
(1)进行资源整合的顶层设计。滇缅抗战史料分散在国内多个省市,其资源整合应由国家档案局进行统筹设计,由其出台相应的法规制度,制定一系列配套政策,并在资源配置、机构设置、协调机制等方面进行统一规划,才能推进滇缅抗战史料资源整合的广度与深度。
(2)明确资源整合的领导机构。应由国家档案局出面组建由图书馆、档案馆、博物馆等相关文化事业单位人员、领域专家、技术专家共同组成的“滇缅抗战史料资源整合工作委员会”,作为滇缅抗战史料资源整合的领导机构,并由其确立资源整合的原则、方法与政策,制定资源整合的标准与规范。
(3)建立资源整合的执行机构。在资源整合的具体执行层面,应依托“滇缅抗战史料资源整合工作委员会”,组成“滇缅抗战史料资源整合领导小组”,在该领导小组下设办公室,办公室设在云南省档案馆,由该办公室牵头负责进行滇缅抗战史料资源整合的具体工作,统筹协调南京市、重庆市、昆明市、保山市、德宏州、怒江州、大理州联动进行滇缅抗战史料的资源整合。
(4)创建资源整合的协同机制。应在国家档案局制定的法律法规和规划指导下,尽可能加强各地档案馆、图书馆、博物馆、纪念馆的合作,建议各地、各机构的滇缅抗战史料资源,特别是数字史料资源,逐步汇总至云南省档案馆,其间涉及的管理权属问题、版权问题、涉密问题、资金问题等,由“滇缅抗战史料资源整合工作委员会”按国家档案局所制定法规制度进行统一协调与处理。
3.3.2 数字化:滇缅抗战史料的数字化加工
完成滇缅抗战史料的资源整合之后,数字化是构建该数据库的关键性基础工作,是完成后续一系列工作的必由之路,需做好以下工作。
(1)遵循统一的数字化标准。滇缅抗战史料数字化工作要遵循已有的档案、图书、声像数字化标准,所依据的标准有《纸质档案数字化技术规范》(DA/T 31—2005)、《照片档案管理规范》(GB/T 11821—2002)、《图书馆馆藏资源数字化加工规范》(GB/T 31219.2—2014)等,所遵循的数字化标准须涵盖著录格式、标引规则、数据指标、符号表达与转换、流通规则、软件和硬件系统的兼容性[6]等内容。
(2)利用数字技术进行各种形式的数字化工作。一是利用扫描技术和照相技术,将滇缅抗战纸质史料和老照片全部扫描,将原来在纸质载体上存储的文本和图像信息形成计算机可识别的图片格式,最终做成PDF格式的数字文本。二是利用OCR技术进行滇缅抗战史料的识别和转换。传统的史料数字化通过人工录入,采集十分缓慢,滇缅抗战史料数字化利用OCR技术快速扫描识别,其管理、编辑、存储工作都将更加轻松,并为后续的内容校勘和知识重组提供极大便利。
3.3.3 数据化:滇缅抗战史料素材库的构建
在完成集成化和数字化的基础上,将数字化文本转化为数据化语料库,可实现对史料的智能化整理,目的是实现机器的可阅读、可计算,从而保证滇缅抗战史料数字资源的完整性、真实性和数据性。
首先,建立滇缅抗战史料数据化的标准和规范。即从自动断句、标签和词汇标注的角度,探索滇缅抗战史料数据化的标注标准、标注层级、标注流程等问题,最终形成一系列史料数据化的标准和规范。其次,在数字化形成的基础素材库之上,构建一个滇缅抗战史料素材的数据集。即由数据科学家针对词汇的显性与隐性语义知识,通过人工标注、机器学习的策略,进行数字化文本的分词、词性、命名实体和断句的自动标注[7],并通过构建与修正这些标注的模型,进一步提升数据质量,最终得到一个数据集。最后,进行一体化标注。即对史料中涵盖的“人、时、地、物、事”等命名实体进行一体化标注,得到一个多层级标注、结构化的史料语料库[7]。
传统史料数据库的素材是数字化的史料,是以“文献”为最小描述单位,而数字人文视域下的滇缅抗战史料数据库,其素材是更加细粒度的数据,其知识描述单位更细致,能解释史料中的“人、时、地、事、物”的内容特征及其相互关系,真正做到机器可读,为下一步的知识化奠定基础。
3.3.4 知识化:滇缅抗战史料知识库的构建
滇缅抗战史料的知识化主要是在滇缅抗战史料数据化的基础上,进行数据的处理与分析,实现滇缅抗战史料的知识重组,目的是让机器能够理解数据中蕴含的语义,能够基于大规模的关联关系推算出新的知识,并且能够实现机器的可自主学习,最终实现知识增长的自动化。滇缅抗战史料的知识化需做好以下工作。
(1)构建滇缅抗战史料的知识本体。知识本体,指某一领域内可共享的概念及概念间关系的形式化定义[8]。所谓滇缅抗战史料的知识本体是基于通用资源标识(URI)和资源描述框架(RDF)来完成滇缅抗战知识领域建模的一种技术。滇缅抗战史料知识库的构建,需利用本体对所有数字资源进行语义标注,建立词汇间的语义关系,并存储对象类、属性及对象之间的语义关系,为后续滇缅抗战史料知识库提供深度的语义层面知识[7]。这一环节的工作是让机器能够理解已多层标注的结构化语料库,促使机器的理解能够跨越领域和系统的限制,真正做到机器对机器的理解,实现滇缅抗战史料信息资源的高度关联与整合。
(2)利用关联数据(Link Data)技术,建立滇缅抗战史料信息资源的知识单元之间的关联,并将结果进行可视化呈现,实现机器的可推理。关联数据就是在知识之间建立可被机器理解的关联关系技术[8]。在滇缅抗战史料数据库构建领域的实现机制是:由于关联数据技术,滇缅抗战史料知识单元之间的关联呈丰富多样性,因此这种关联越多,越能促进机器可推理的实现,越能帮助用户自动获取由机器提供的滇缅抗战领域的初步研究结果。总体而言,滇缅抗战史料知识库的构建就是利用关联数据技术的一整套技术、方法和流程,依靠上述滇缅抗战史料素材库,建立一个为用户提供各种深度语义层面知识的知识系统,并在此过程中不断提升滇缅抗战史料的共享程度。
(3)引入机器学习方法,逐步实现滇缅抗战史料数据库的人工智能化。其中最重要的就是引入基于神经网络的深度学习技术,它是一种实现机器学习的技术,更是一种实现人工智能的途径,它能使所有的机器辅助功能都变为可能。在滇缅抗战史料数据库的构建中,引入深度学习技术,可以在自然语言处理(NLP)、名称实体识别(NEI)、自动标引和自动分类等领域[8],大有可为。
3.3.5 平台化:滇缅抗战史料数据库的形成
平台化是滇缅抗战史料数据库的“门户”建设过程,即在实现上述知识库的基础上,着力构建一个为用户提供滇缅抗战史料的知识服务平台。为此,需做好两项工作。
(1)进行滇缅抗战史料数据库系统的设计与开发。首先,在本体建模过程中得到经过清洗与加工的RDF数据,是滇缅抗战史料数据库构建的资源基础,整个数据库系统的设计与开发需在此基础上进行;其次,在滇缅抗战史料数据库开发过程中,需要对知识本体再进行调整或修改,使之能够符合系统性能的需求;最后,虽然目前国内数据库建设领域处于主流地位的是关系型数据库,但由于滇缅抗战史料数据资源中非结构化数据、半结构化数据众多,且从数字人文跨领域、大范围、大规模的特性出发,利用非关系型数据库进行滇缅抗战史料数据库的构建,在操作的扩展性和大数据量处理方面将具有优势。
(2)基于滇缅抗战史料信息平台开展面向用户的知识服务。知识服务是指以用户需求为导向,从知识资源中提炼信息内容,搭建知识网络,为用户提供解决方案的信息服务过程。如在滇缅抗战史料数据库建设中,针对部分用户对检索结果可视化的强烈需求,可以利用虚拟现实(VR)技术,在滇缅抗战史料数据库平台上重现中国远征军战争状况的实景,让用户有身临其境之感。数字人文视域下的滇缅抗战史料数据库,应该是一个以用户需求为导向、以服务为核心的,具备数据存储、知识检索与可视化、众包编辑、专题服务及社交化应用等功能的大型知识服务平台。
4 结语
数字人文作为“方法论共同体”空前促进了研究方法的交叉渗透,且为公藏机构的资源挖掘带来了新的空间,使得文献利用本身即创造文献的价值[9]。数字人文在滇缅抗战史料数据库建设领域的引入,将改变传统的史料数据库构建模式,促进方法的革新和技术的迭代。该数据库的构建,不仅是对滇缅抗战史料深层次整合与开发的一次尝试,更丰富了历史人文学科的研究范式,具有一定的开拓意义。
不过,数字人文视域下滇缅抗战史料数据库的构建亦存在诸多问题亟待解决。例如,部分文化事业机构滇缅抗战史料的信息公开程度较低,限制了滇缅抗战史料的资源集成化;部分滇缅抗战史料存在机构之间的归属争议,容易产生推诿扯皮现象,导致史料无法上传至数据库中;滇缅抗战史料数据库与其他抗战文献数据的关联还未被充分考虑,各个抗战文献数据库之间未充分共享资源;在利用滇缅抗战史料数据库的过程中,用户可能会因为资料获取的便利性和快捷性,忽视了传统史学功底的训练,忽视了深度阅读等。这些问题的解决,还有待学界和业界的持续关注与努力。
虽然面临诸多问题,但笔者希望能抛砖引玉,通过构建数字人文视域下滇缅抗战史料数据库,推动滇缅抗战史料的资源整合与开发朝着纵深方向发展,真正体现出滇缅抗战史料所具有的历史价值与重要意义,为传统的抗战史料研究注入新活力、提供新视角,促进对这段历史的更深层次的解读。