档案整合与数据库建设研究进展
——基于国家社科、教育部人文社科基金项目的分析
2023-08-03廖素虹苏玖雯张彭嘉
■ 廖素虹 周 铭 苏玖雯 张彭嘉
一、引言
随着社会对档案信息资源需求的增长,档案资源管理的分散性、布局的不均衡性以及孤立与互通的矛盾性日益凸显,且档案管理工作逐渐向数据态转型,需要利用现代信息技术手段对分散独立的档案资源进行整合,使其相互联结成有序化、结构化、系统化的整体,形成集成式管理[1]。然而,为了实现对档案数据信息的有效管理,构筑档案数据共享利用空间,数据库建设成为一种必然选择。从20 世纪80 年代初开始,我国档案部门在档案管理工作中采用计算机技术进行了积极的探索,积累了大量的经验;到20 世纪90 年代,档案计算机管理得到了广泛的推广和应用;进入21 世纪,档案数据的信息化建设更是成为了档案工作的主要任务。
2002 年以来,国家档案局先后发布了《全国档案信息化建设实施纲要》、《档案事业发展“十一五”规划》,提出了“建立一批电子文件中心和数字档案馆,实现档案信息资源社会共享”的总体目标;2015 年国务院印发的《促进大数据发展行动纲要》提出“加快政府数据开放共享,推动资源整合,提升治理能力”;2021 年1 月1 日起,新《档案法》开始施行,增加了“第五章档案信息化建设”等内容。在这样的背景下可以看出,加强档案资源整合和档案数据库建设工作、促进档案信息化建设是时代发展的必然要求。
二、筛选与研究方法
本研究数据来源主要从国家社科基金项目数据库和中华人民共和国教育部年度人文社科基金项目立项结果公示中搜索获取。为了准确确定一个项目是否属于档案整合与档案数据库建设研究项目,本文所用数据参考了课题名称、研究方向和最终成果。
首先,分别以关键词“档案”“整合”“数据库”进行检索,从中甄别出档案整合与档案数据库建设项目;继而分别以“文献整合”“文献汇集”“档案集成”为关键词进行搜索补充,加强研究数据的可靠性。
其次,为进一步提高数据查全率,笔者在中国知网中国学术期刊网络出版总库中选用“篇名”为检索项,分别以“档案整合”“档案集成”“档案汇集”“文献整合”“档案数据库建设”“档案数据库建构”“档案数据库构建”“档案数字化平台”为检索词,采用“模糊”检索,鉴别相关基金项目的研究成果是否与“档案整合”或“档案数据库建设”主题相吻合,并根据“基金资助”提示的项目批准号锁定基金项目。
最后,经过检索、筛查,手动剔除与研究主题不相关或重复的项目后,共收集20 世纪90 年代以来档案整合与档案数据库建设国社科基金139 项,教社科基金19 项,总计158 项。按照“项目批准号、项目类别、学科分类、项目名称、立项时间、项目负责人、工作单位”等条目在EXCEL表格中分类汇总进行统计分析,最后将相关数据输入到“微词云”中展开项目主题词频分析。
三、项目总体样态分析
除去14 项没有标明立项时间的国社科基金,两大基金在档案整合与数据库建设类项目上总体呈现上升趋势(总数线性示意)。如图1 所示,从2012 年开始,立项总数呈明显上升态势,并在2019 年达到顶峰,这或与国家档案局关于印发《2013 年全国档案宣传工作要点》的通知中提到的“要结合‘以人为本’战略的实施,宣传‘大档案’资源建设”和2016 年国家档案局印发《全国档案事业发展“十三五”规划纲要》指出“要积极响应数字中国建设,推进信息技术与档案工作深度融合,加快档案管理信息化的进程”有关。可以看出,当立项数量增加到一定程度之后,会出现数量下降现象,该现象或与前一年该类立项数量较多有关,但总体上升态势良好,可以预见,未来几年仍会持续上升[2]。
图1 档案整合与数据库建设类项目两大社科基金年度分布
四、项目类别
重大、重点级别的课题项目可以反映档案整合与数据库建设的学术研究与现实需要的契合性[3]。20 世纪90 年代以来国社科基金重大、重点项目共66 项,占项目总数47.5%,占比非常之高。由表1 可知,从总体纵向来看,立项总体数量与图1 变化一致,呈上升态势。从横向来看,研究主要集中在重大项目56 项、一般项目38 项、青年项目21 项,分别占项目总数的41.73%、27.34%、15.11%。其中重大项目占比最大,且数量在最近几年上升尤为明显;重点项目和一般项目在年度分布上相对比较平均;后期资助有1项,出现在2017 年。
表1 档案整合与数据库建设类项目国社科基金项目类别表
由表2 可知,近30 年来,教社科基金尚未有关于档案整合与数据库建设的重大和重点项目中标,仅1 项一般项目立项。项目主要以规划基金项目和青年基金项目为主,且两者的立项数量较为平均,规划基金占立项总数的42.11%,青年基金占立项总数的52.63%。其中青年项目的立项数量最多,说明青年学者正在不断进入档案整合与数据库建设研究领域中。
表2 档案整合与数据库建设类项目教社科基金项目类别表
五、学科分类
学科分类情况能够在一定程度上体现出某学科对该研究领域的重视程度和研究水平。除43项国社科基金没有注明学科分类外,本研究共统计了96 项两大社科基金关于档案整合与数据库建设项目的学科分布情况。由表3 可知,不论是在国社科基金中还是教社科基金中,都是图书馆、情报与文献学学科较为重视对档案整合与数据库建设的学术研究,其分别占国社科基金和教社科基金总项目的51.04%和57.89%,内容涉及到各个领域,例如古籍数据库的建设研究、数字档案文化遗产整合路径研究、少数民族口述史料数据库建设研究、城市档案整合利用研究等等。
表3 档案整合与数据库建设类项目两大社科基金学科分类对比表
在国社科基金中,除图书馆、情报与文献学外,语言学、中国历史和中国文学占总项目数较多,分别为8.33%、10.42%和12.5%,可以看出,语言学、中国历史和中国文学这三门学科对于档案整合和数据库建设方面的需求相对迫切,需要更深入地探讨。其他学科分布较为平均。分析每年各学科所占比例情况可知,在2010 年以前,只有图书馆、情报与文献学和语言学关注档案整合与数据库建设方面的研究,但直至2022 年,已经有超过15 个学科领域开始关注到自身与档案整合或档案数据库建设方面的联系。
在教社科基金中,所涉及到的学科比国社科基金略少,包括了图书馆、情报与文献学、艺术学、交叉学科/ 综合研究、语言学、马克思主义/思想政治教育5 个学科领域,其中艺术学和交叉学科/综合研究各占项目总数的15.79%。
六、研究单位
对科研立项所属单位进行统计分析,可以反映出各研究单位在该领域的研究状况和项目立项的排名情况[4]。经统计,158 个基金项目中,有11 项是由11 个实际工作部门申请立项,其余147 项均属高校教学机构立项。由表4 可知,两大社科基金的研究单位主要集中在中国人民大学、吉林大学、华中师范大学等综合类和师范类院校。其中综合类院校的立项有84 项,占项目总数的53.16%;师范类院校的立项为41 项,占项目总数的25.95%。其余院校立项数量均为1 项,院校性质涉及语言类、民族类、医药类、理工类等多种类型。
表4 档案整合与数据库建设类项目两大社科基金研究单位
七、地区分布
对立项所属地区进行分析可以客观反映和总结目前研究领域分布的基本状况。如图2 所示,158 个项目在我国七大地理区域的分布存在失衡状况。其中华东地区在立项数量(5 项)上有着绝对优势,占立项总数的31.65%。其次分别是华北、西南地区,立项数量分别为28 项和26 项,分别占立项总数的17.72%和16.46%。华南地区的立项数量最少,为9 项,占立项总数的5.70%。
图2 档案整合与数据库建设类项目地区分布
八、项目名称定性分析
国家级别课题的研究主题分布可以反映档案整合与数据库建设的学术研究重点、热点趋势与研究内容动态变化。本研究将158 项课题名称汇总成“20 世纪90 年代以来国社科和教社科基金档案整合与数据库建设项目名称”,导入“微词云”网站中进行词频分析,获取两大社科基金档案整合与数据库建设项目名称的高频关键词云图(见图3)。剔除不重要的名词、动词或其他单词后,数据库出现频次58 次,集成45 次,档案38次,整理32 次,资源21 次,文献数据库14 次,数字11 次,史料、知识9 次,信息、少数民族、数据、构建8 次,口述7 次,文化资料、文化遗产、民间、整合6 次等。
图3 档案整合与数据库建设两大社科基金项目高频关键词云图
“数据库”是出现频率最高的词语,在158 项课题中,有约46.2%的项目以档案数据库建设为主题。此外可以发现,口述档案、历史史料、文化遗产、少数民族、民间等领域比较看重档案整合与数据库建设方面的研究,且这些领域的档案大都有不易收集、管理分散、急需抢救等特点,因此,对其档案进行资源整合、建立数据库,形成集成式管理成为一项迫切任务。
九、结语
通过对20 世纪90 年代以来档案整合与数据库建设国社科基金和教社科基金的立项数量、立项时间、项目类别、学科分类等进行可视化分析,展示了两大社科基金在该领域的学术研究发展与变化,得出以下结论:
(一)研究单位以高校教学机构为主,档案馆、图书馆等实际工作部门参与度不高。
158 个项目中仅有中国新闻出版研究院、南京大学档案馆、广西壮族自治区图书馆等共11个实际工作部门在档案整合与数据库建设方面有所立项,其余研究单位均为高校教学机构。且通过院校分布可以看出,研究主要集中在经济实力和教学资源较为强大的综合类、师范类院校,而师资力量较弱的院校由于缺少资金或人才资源的支持,缺少对档案整合与数据库建设的立项研究。对此,笔者建议:第一,加大对实际工作部门的支持力度。为分担各部门的工作任务,鼓励其对档案管理中的问题进行改进、创新,可以设立专门的档案研究部门,引进专业的档案管理人才,专门进行档案管理工作的相关研究。第二,促进高校教学机构与实际工作部门的优势互补。高校教学机构有着优秀的人力资源,但在研究过程中容易出现重理论、轻实践的情况。而实际工作部门虽有着丰富的档案资源,但面对大量的档案,缺乏系统性的理论支撑和优秀的人才来进行档案整合和数据库建设工作。因此,高校教学机构与相关实际工作部门应该加强合作,联合推动档案资源整合新技术的应用研究,加强档案数据库平台的建设,提高档案管理系统的可操作性,以适应新时代的社会需求。
(二)相关领域的学术研究已取得突出成绩,但存在地区分布不平衡的状况。
随着中国对档案整合与数据库建设方面的日益重视,我国两大社科基金在该领域的学术研究取得了突出的成绩。首先,2013-2022 年立项总数实现了量的激增,其中2019 年的立项总数(20 项)是2012 年立项总数(2 项)的10 倍。其次,从本领域两大社科基金项目研究热点与趋势来看,目前的基金项目实现了传统研究领域与信息技术的结合,例如广西京族口述历史资料收集整理与其有声数据库建设、数字人文视角下历史档案资源知识聚合与知识发现等等[5]。但从地区分布可以看出,华东地区的立项数量大幅领先于其他地区,其占比为立项总数的31.65%。华北、西南地区占比分别为17.72%和16.46%,华南地区占比最少,仅为5.70%。对此,笔者建议:第一,对不同地区立项进行政策倾斜支持。东北、西北地区的经济实力相对薄弱,政府机关可作出一系列优惠政策,加大对其基金项目的投资力度,给予一定的研究补贴。第二,鼓励华南、东北、西北地区的教学机构和实际工作部门积极申报立项。相关部门要密切关注国家基金项目的申报动态,第一时间转发相关申报通知,召开国家基金项目申报动员会,充分调动华南等地区各类研究单位申报国家基金项目的积极性和能动性。