APP下载

1999—2020 年我国数字档案馆研究回顾与计量分析

2021-03-16肖荣时

兰台世界 2021年1期
关键词:图谱档案馆期刊

肖荣时

自2002 年起,与数字档案馆有关的国家政策相继出台,如《全国档案信息化建设实施纲要》《档案事业发展“十二五”规划》《数字档案馆建设指南》和《数字档案室建设指南》等。2000 年,深圳率先开始了数字档案馆建设的探索[1]8。2014 年2 月,国家档案局成立了“数字档案馆(室)建设领导小组”,开始统一领导全国数字档案馆的建设工作[2]1。但就目前国内数字档案馆的研究现状来看,虽然文献数量较多,但对于数字档案馆的研究热点、研究趋势、研究前沿以及核心作者与研究机构没有交待清楚。随着我国数字档案馆建设不断地推进,对数字档案馆的相关研究进行系统回顾和总结的必要性显得愈来愈突出。

一、数据来源与研究工具

本文使用定性分析和定量分析相结合的研究方法,借助知识图谱软件——CiteSpace,对目前国内关于数字档案馆研究的相关问题进行全面的回顾与总结分析,以期为我国未来数字档案馆的研究以及数字档案馆的实践发展提供有益的指导与帮助。

1.数据来源。本文以中国知网(CNKI)作为数据来源,结合领域的实际发展状况,以“数字档案馆”为篇名或者关键词进行检索(检索时间为2020 年5 月5 日),文献时间跨度为1999—2020 年,文献类型选择核心期刊和CSSCI 来源期刊,剔除一些与主题不符的会议通知、公告等记录,共获得有效文献1325 篇。

2.研究工具。知识图谱以科学知识为研究对象,能够清晰展示科学知识的发展历程、研究趋势以及不同知识域之间的结构关系[3]242。CiteSpace 作为一款信息可视化软件,在知识图谱的相关研究中应用广泛,本文引入CiteSpace 信息可视化分析软件,绘制关于国内数字档案馆研究的关键词共现知识图谱、关键词知识聚类图谱、发文作者合作知识图谱以及发文机构合作知识图谱等,探究我国数字档案馆目前的研究现状和热点问题以及未来数字档案馆的研究趋势,并分析数字档案馆研究作者和机构之间的合作关系。

除了知识图谱外,本文还采用了文献计量工具来反映文献分布与增长规律。根据布拉福德定律[4]257,当某一研究领域相关文献发表的学术期刊的发文量呈现不均匀分布时,发文数量与所发表期刊的专业密切程度相关。按期刊的载文量由高到低排序,可以把期刊分为核心区、相关区和非相关区。核心区数量计算方法是R0=2ln(eE*Y)。其中,R0为核心区数量,E 为欧拉系数,E=0.5772,Y 为最大发文量期刊的载文量。

普莱斯定律能够对某个领域核心作者进行衡量,核心作者是指能够在某一研究领域进行持续地研究,并且是对该领域研究者产生一定影响的作者。作者发表该领域论文的数量,在一定程度上可以反映出其影响力。根据普赖斯定律[5]152,即“在某一特定领域中,全部论文的半数系由该领域中全部作者人数的平方根的‘核心作者’撰写的”,其计算公式为:m=0.749,其中Nmax为最高产作者所发表的论文数。

二、文献增长与集中规律分析

1.文献发表年份分析。从数字档案馆研究文献的年份分布(图1)可见,我国数字档案馆研究大致经历了三个阶段。1999—2001 年为起步阶段,关于数字档案馆研究的首篇核心期刊文献出现于1999 年,介绍了一种新兴的电子档案著录标准——EAD[6]15。其后,关于数字档案馆的介绍开始逐步增多[7]19,数字档案馆的相关概念也开始逐渐引起我国档案界学者的重视。该阶段的发文量较少(24 篇),占所有年份文献数量的1.81%。2002—2013 年为快速发展阶段,主要关注我国数字档案馆在发展过程中遇到的问题以及解决策略[8]6。该阶段共发表文献数量886 篇,占发文总数的66.87%。2014 年至今为成熟阶段,更加注重数字档案馆的实际应用[9]129,强调理论与实践的结合。虽然该阶段的文献数量有所下降(415 篇),但文献的质量进一步提升。由此可见,我国数字档案馆研究随着时间推移而不断取得新进展。

图1 数字档案馆文献年度发文统计

2.期刊来源分析。分析数字档案馆研究文献的来源期刊分布,既能为数字档案馆的相关研究学者发表论文提供指导,也方便办刊者把握办刊方向。经过统计发现,1325 篇文献共分布在68 种期刊中,其中发文量大于等于10 篇的期刊共有12 种,从期刊的载文数量来看,《兰台世界》以225 篇载文量居于榜首;排名第二的是《中国档案》,载文量160 篇;排名第三的是《浙江档案》,载文量145 篇。

根据布拉福德定律,当某一研究领域相关文献发表的学术期刊的发文量呈现不均匀分布时,发文数量与所发表期刊的专业密切程度相关。根据布拉福德定律的计算公式,核心区数量计算方法是R0=2ln(eE*Y),本研究中发文数量最多的期刊为《兰台世界》225 篇。因此R0=2ln(eE*225)=11.99,对R0进行取整,则R0=12。因此,可以判断出排名前11 位的来源期刊为数字档案馆发文期刊的核心区。核心区的11 种期刊共发表文献数量1207 篇,平均每本期刊载文数量为109.73 篇,占所有文献比例的91.09%。根据布拉福德定律可以发现,我国数字档案馆的相关研究文献整体上呈现较为集中的分布特征,《兰台世界》《中国档案》《浙江档案》《档案学研究》《档案与建设》《档案学通讯》《档案管理》是我国数字档案馆相关研究的主要发文阵地。

三、核心作者及核心机构分析

1.核心作者分析。核心作者是指能够在某一研究领域进行持续研究,并且对该领域研究产生一定影响的作者。作者发表该领域论文的数量,在一定程度上可以反映出其影响力。根据普赖斯定律,即,核心作者的计算公式为:M=0.749,其中Nmax为最高产作者所发表的论文数。在本研究中,发文最多的作者为来自绍兴文理学院的潘连根,发表文献数量为16 篇。根据普赖斯定理,Nmax=16,则计算得出M=3,则发表文章数量在3 篇及3 篇以上的作者为国内数字档案馆研究的核心作者。本研究中发文量大于等于3 篇的作者共有67位,其中发文量最多的是潘连根(16 篇);其次为来自浙江大学公共管理学院的傅荣校、上海大学图书馆的倪代川、国防大学政治学院的程妍妍,发表文献数量分别为15 篇、14 篇、14 篇。此外,清华大学档案馆的薛四新(13 篇)、上海师范大学人文与传播学院的吕元智(11篇)、浙江大学档案馆的金更达(10 篇)、中国人民大学信息资源管理学院的安小米(10 篇)、湘潭大学公共管理学院的唐艳芳(10 篇)等作者也是国内数字档案馆的主要研究作者。从作者所属的机构来看,发表文献数量较多的学者主要来自中国人民大学、上海大学、上海师范大学等高校。从作者首次发表文献的时间来看,吉林大学管理学院的王萍、浙江大学公共管理学院的傅荣校、上海师范大学人文与传播学院的吕元智、湘潭大学公共管理学院的唐艳芳等,不仅是我国数字档案馆研究的核心学者,同时也是数字档案馆研究的起源学者。

2.作者合作分析。图2 为利用CiteSpace 软件绘制的核心作者的合作关系图谱,每一个节点代表一位作者的发文,节点越大,表示该作者的发文数量越多,节点之间的连线表示作者之间的合作关系,连线越粗,表明作者之间的合作次数较少;反之,则合作次数越多。

图2 数字档案馆研究作者合作知识图谱

从所获得的图谱数据来看,图谱中共有762 个节点,290 条连线,网络密度为0.001。整体来看,我国数字档案馆研究作者之间的合作关系比较松散,从局部来看,部分作者之间也存在一定的学术交流与论文合作,如薛四新、陶水龙、徐华、张晓、崔伟等学者之间存在较强的合作关系;安小米、孙舒扬之间存在一定的合作关系;李慎民、杨秉光之间存在一定的合作关系;刘越男与张宁、傅荣校与解俞、颜祥林与王兴娅、倪代川与金波、姚乐野与蔡娜、金更达与何嘉荪、王萍与张卫东、谢海洋与卞昭玲、谢永宪与王巧玲等之间存在一定的合作关系。但存在论文合著的研究作者占总体研究作者的很少一部分,反映出我国数字档案馆研究作者之间的合作较少,而且主要以同区域或者同机构合作为主,跨区域、跨学科之间的合作相对较少。因此在未来的研究中,我国数字档案馆研究应加深不同区域、不同学校之间的合作,促进不同学术观点的交流与探讨。

3.核心机构分析。根据普赖斯定律,核心机构的计算公式为:M=0.749 ,其中Nmax为最高产机构发表文献数。在本研究文最多的机构为中国人民大学,发表文献数量为73 篇,根据普赖斯定理,Nmax=73,计算得出M=6.40,即发文数量在6 篇及6 篇以上的机构为国内数字档案馆研究的核心机构。经过统计分析,国内数字档案馆研究发文量大于等于6 篇的机构共有35 所,其中发表文献数量最多的为中国人民大学(73篇),其次为上海大学和南京政治学院上海校区,发表文献数量分别为58 篇和43 篇。此外,武汉大学(42篇)、南京大学(36 篇)、浙江大学(31 篇)、湘潭大学(24篇)、南昌大学(20 篇)、四川大学(20 篇)、国家档案局(19 篇)等机构也是国内数字档案馆的主要研究机构。从机构所属的地域范围来看,北京、上海是我国数字档案馆研究的主要省份,反映出北京、上海凭借其地理位置、人才、资源等优势在我国数字档案馆的研究中占据重要地位。从机构首次发表文献的时间来看,武汉大学、四川大学、苏州大学、中国人民大学、国家档案局、浙江大学、上海大学等研究机构,不仅是我国数字档案馆研究的核心机构,同时也是数字档案馆研究的起源机构。

4.机构合作分析。利用CiteSpace 软件绘制发文机构合作知识图谱(见图3),图谱中共有493 个节点,159条连线,网络密度为0.0013。整体来看,我国数字档案馆研究机构之间的合作关系比较松散,从局部来看,少数机构之间也存在一定的学术交流与论文合作,如以中国人民大学为核心的研究机构团体,其成员主要包括武汉大学、南昌大学、上海交通大学、北京航空航天大学、华中师范大学、江苏大学、北京大学、辽宁省档案局等。除此之外,上海大学与广西民族大学也存在一定的合作关系;北京市档案局、清华大学、北京联合大学、福建师范大学等研究机构之间也存在一定的合作关系;浙江大学、国家档案局、浙江省档案局等研究机构之间也存在一定的合作关系;南京大学、西北大学等研究机构之间也存在一定的合作关系;河北大学、华北电力大学等研究机构之间也存在一定的合作关系;天津师范大学、天津市档案局、天津大学等研究机构之间也存在一定的合作关系。但论文合著的研究机构仅占总体研究机构的很少一部分,反映出我国数字档案馆研究机构之间的合作关系还有待进一步强化。

图3 数字档案馆研究机构合作知识图谱

四、研究热点及前沿分析

1.研究热点分析。关键词可以反映出一个领域的研究热点以及研究主题。一般而言,如果一个关键词出现的次数越多,则表明该关键词所反映的研究问题是该领域的研究热点[10]111。中心度是度量关键词在该研究领域的重要程度的量,其值越大,说明该关键词越重要。利用CiteSpace 对所获取的文献数据进行可视化处理,同时使用CiteSpace 绘制出关于国内数字档案馆研究的关键词共现知识图谱。为了便于统计与分析,分别提取出频率和中心度排名前20 的关键词。在数字档案馆研究关键词共现知识图谱中,每一个节点代表一个关键词,节点间连线代表关键词与关键词之间的共现关系,关键词字体的大小代表该关键词出现的频次的高低,即关键词字体越大,该关键词出现的次数越多,关键词字体越小,该关键词出现的次数越少。

图4 数字档案馆研究关键词共现知识图谱

如图4 所示,数字档案馆、档案信息资源、电子文件是该关键词知识图谱中频次最大的三个节点,关键词频次分别为936、118、82。除此之外,数字档案、档案、档案信息化建设、电子档案、电子文件中心、云计算、数字档案资源、档案信息、档案局、国家档案局、信息服务、智慧档案馆、档案管理、档案信息化、知识管理、档案工作、企业、数字图书馆、档案馆、档案部门、档案资源、企业管理等关键词的频次也较高。

其次,关键词的中心度越高,说明该关键词所在的网络位置越重要,在知识图谱中发挥着越重要的作用。在中心性超过0.1 的关键节点中,档案管理、档案工作、档案数据库是中心度最高的三个关键词,中心度的数值分别为0.4、0.3、0.27。除此之外,档案信息资源、档案局、现行文件、国家档案局、档案信息化建设、档案室、档案信息、档案信息化、电子文件中心、企业、档案事业、档案资源、档案服务、oai、馆藏档案数字化、数字档案资源等关键词的中心度也较高。

为了更好地分析和比较高频关键词背后的含义,利用CiteSpace 中的聚类功能,对关键词共现知识图谱进行聚类分析(见下页表1)。通过CiteSpace 中的LLR算法提取关键词数据,自动生成国内数字档案馆研究的高频关键词聚类知识图谱(见图5)。根据聚类图谱中的Q 值和S 值显示,Modularity=0.7677>0.3,Mean Silhouette=0.5585>0.5,说明聚类效果较好,聚类有明显的轮廓。

图5 数字档案馆研究关键词聚类知识图谱

通过关键词聚类知识图谱可以发现,我国数字档案馆研究主要分为11 个小类别,在综合高频关键词共现知识图谱和关键词聚类图谱的基础上可以发现,我国数字档案馆的相关研究话题主要集中在数字档案馆的概念[11]50、数字档案馆的发展模式[12]87、数字档案馆的体系构建[13]62、知识共享[14]64等相关热点话题的研究上。

2.研究前沿分析。关键词的突现度可以反映出某段时间内影响力较大的研究方向或研究领域,是每一个阶段的研究前沿具体体现,利用CiteSpace 的突现词可以分析我国数字档案馆的研究前沿。本次共获取到25个突现词的相关信息(如表2 所示)。从关键词突现程度来看,排名前5 位的突现关键词分别为智慧档案馆、数字档案资源、数字档案、云计算、知识管理。从突现关键词的持续时间来看,“数字档案资源”持续时间最长(9 年),档案信息资源、大数据、智慧档案馆、数字档案等突现词持续时间也较长。从突现词的时间分布来看,1999—2005 年,我国数字档案馆的研究前沿主要集中在档案信息资源、档案信息、数字化档案信息、馆藏档案、数字化、利用者、档案数据库、馆藏档案数字化、档案网站等相关研究话题;2006—2010 年,我国数字档案馆的研究前沿主要集中在oai、档案用户、电子文件中心、信息服务、知识管理、档案信息化、档案登记备份、信息资源等相关研究话题。从最新的突现词来看,云计算、数字档案资源、生态系统、大数据、智慧档案馆、数字档案、电子档案等相关话题是未来我国数字档案馆的研究重点以及研究前沿。可见,我国数字档案馆研究每一阶段都有不同的侧重点,研究内容也随时间推移不断发生变化。

表1 数字档案馆研究关键词主要聚类分布

表2 Top 25 Keywords with the Strongest Citation Bursts

本研究以国内数字档案馆研究文献为对象,以中国知网中核心期刊和CSSCI 来源期刊中的1325 篇文献为数据基础,使用CiteSpace 可视化软件绘制了关键词共现知识图谱、关键词聚类知识图谱、突现词、作者合作知识图谱以及机构合作知识图谱,综合利用布拉福德定律、普赖斯定律等文献计量学基础理论,对1325 篇文献进行了定量与定性的科学分析。主要研究结论如下。

(1)从发文时间来看,我国国内数字图书馆研究大致经历了起步阶段、快速发展阶段、成熟阶段,我国数字图书馆的相关研究随着社会实践的不断发展,取得新的研究成果。

(2)从期刊来源来看,利用布拉福德定律探究了我国数字档案馆研究的核心期刊,结果发现,《兰台世界》《中国档案》《浙江档案》《档案学研究》等相关期刊是我国数字档案馆研究文献的核心发文期刊。

(3)从作者分布来看,利用普赖斯定律确定了潘连根、傅荣校、倪代川、程妍妍等是我国数字档案馆研究的主要学者;从作者之间的合作关系来看,作者之间的合作程度较低,在未来的相关研究中,应加强不同学科、不同领域之间学者的沟通与交流。

(4)从机构分布来看,利用普赖斯定律确定了我国数字档案馆研究核心机构,中国人民大学、上海大学和南京政治学院上海校区、武汉大学、南京大学、浙江大学等研究机构是我国数字档案馆研究的主要机构;从机构之间的合作关系来看,我国数字档案馆研究机构之间的合作关系并不紧密,不同机构之间缺乏合作,有待进一步强化合作。

(5)从研究热点来看,当前我国数字档案馆的相关研究主要集中在数字档案馆的概念、数字档案馆的发展模式、数字档案馆的体系构建、知识共享等热点话题上。

(6)从研究前沿来看,未来我国数字档案馆的相关研究前沿将会主要集中在云计算、数字档案资源、生态系统、大数据、智慧档案馆、数字档案、电子档案等相关话题上。

猜你喜欢

图谱档案馆期刊
期刊更名启事
期刊简介
基于图对比注意力网络的知识图谱补全
云南省档案馆馆藏《东巴经》
绘一张成长图谱
云南省档案局办公室关于表彰2018年度《云南档案》优秀通联组及发行先进单位的通报
期刊审稿进度表
图表
主动对接你思维的知识图谱
when与while档案馆