基于CNKI会议论文文献计量及共词分析的国内档案学研究概观
2016-09-07徐欣欣王海宁
文·徐欣欣 王海宁
基于CNKI会议论文文献计量
及共词分析的国内档案学研究概观
文·徐欣欣王海宁
文章通过对CNKI会议论文数据库中档案学(G27)的论文进行文献计量和共词分析,发现这些会议主要是2000年后由各档案学会举办的档案工作者的会议,各高校举办的会议没有录入。会议作者发表1篇论文的居多,没有稳定的核心作者群。高产作者的机构主要是各级档案局、各类档案馆,高校人员较少。会议研究热点也是档案工作的各方面内容,尤其关注档案开发利用和民生档案。
会议论文;文献计量;共词分析;档案学
会议论文是分析学科研究热点和发展脉络的很好的材料,因为一个学科的重要会议往往聚焦于该学科的重大前沿及热点问题,甚至引领一个学科的发展方向;历次会议的内容都反映了该学科当时关注的焦点,各种会议其实是几十年来学科研究发展的一个缩影。然而目前我国档案界对国内档案学会议资料的挖掘较为欠缺。通过查阅相关纸质文献,并检索CNKI文献数据库,笔者发现,除了几篇针对某次会议进行概述的文章和一些新闻报道类文章,目前尚无对国内各种档案学会议进行综合分析的论文。鉴于此,本文基于CNKI的会议论文数据库,应用文献计量和共词分析两种方法,对相关文献进行定量和定性分析,以管窥国内档案学研究的历史与现状。
一、 研究方法与数据采集、处理、分析
(一)研究方法
本文主要采用的是文献计量分析法和共词分析法。文献计量分析法是以文献信息为研究对象、以文献计量学为理论基础的一种研究方法;它以定量分析为主,侧重外部表征。而共词分析则以文献中的关键词或主题词为分析单元,统计出文献集中关键词或主题词在同一篇文献中两两出现的频率,形成共词网状,并以数值、图形直观地表现出来;它属于内容分析法,即对文献内容进行客观、系统和量化描述与分析的方法,是以定性分析为主,侧重内部特征[1]。
(二)数据采集、处理、分析
本文数据采集于CNKI国内外重要会议论文全文数据库。笔者于2015年3月7号进行检索,检索条件为“中图分类号”,输入档案学的分类号G27,共检索到5353篇文献。经过去重,剩下4670篇。其中国际会议论文只有32篇,且它们是信息工程、公共管理、创造学等其它学科的会议中涉及到档案学的文献,因此样本反映的主要是国内档案学会议的情况。
数据处理通过excel实现,先统计出会议类别、举办方、年份、作者、作者单位的分布情况;再借助VBA编程进行关键词提取、词频统计、构建共词矩阵并转化为相似、相异矩阵。最后导入SPSS软件进行聚类分析。
二、档案学会议论文的计量分析
(一)会议类别和举办方
按照所属会议对4670篇文献进行归类,如表1所示,除了一些名称缺失的会议,以及一些所含论文很少、且多为非档案学学科的会议(“其它”类中),其余会议可分为8大类,即1个中国档案学会、5个省档案学会、1个六省区档案学会和1个专业档案学会举办的会议。有些会议是这些学会和其它机构合办的,或者是这些学会承办、其它机构主办的,为分类方便,都归于这些学会举办的会议。中南六省区档案学会的学术会议是由广西省档案学会主办。各类会议论文所占比例见图1。
与实际召开的会议情况相比,数据中缺少其它省份或专业档案学会的会议资料,且没有各高校举办的会议。由于各档案学会所举办会议的参与者多为各级档案局馆、各单位档案室的工作人员,高校的科研人员较少参与,因此论文反映的主要是其工作过程中的实际问题,纯理论的内容所占比例较少。这在后面的内容分析中会得到进一步验证。
表1:会议的构成
图1:各举办方的会议论文所占比例
(二)会议年份分布
我国第一次档案学术会议是1981年中国档案学会成立后召开的全国第一次档案学术研讨会,之后到2000年间又召开了4次,另外还召开了两次全国青年档案学术讨论会。除此之外,该期间便无其它重大会议。本文样本中的论文也主要是2000年以后的(见图2),90年代仅有的几篇经查证也都来自非档案学学科的会议。
其中2002年,会议论文陡增,主要是该年召开了中国档案学会第六次全国档案学术讨论会、档案工作应对入世挑战学术研讨会以及江苏省档案现代化管理与档案信息化建设学术研讨会等会议。多种会议的召开反映了该年档案学研究的兴旺,这点通过其它途径也可得到验证,如在CNKI文献数据库中检索档案学的文献,除了2006年之后的情况,2002年的文献量达到峰值。说明2002年不仅有很多会议论文,期刊论文等其它文献也很多。
2008~2012年会议论文也较多,主要是因为这几年分别召开了2008、2010、2012年全国档案工作者年会、2010年全国青年档案工作者研讨会以及贵州、甘肃、山东各省档案学术会议。
图2:会议论文年份分布
(三)会议核心作者
表2中给出了不同发文量的作者人数。按照洛特卡定律,写两篇论文的作者数量约为写一篇论文的作者数量的 1/4;写n篇论文的作者数量约为写一篇论文的作者数量的 1/n2,而写一篇论文的作者数量约占作者总数的60%[2]。对照表2,写一篇论文的作者数量占作者总数的81.90%,远远超过了洛特卡定律的值;同时,写n篇论文的作者数量都低于写一篇论文作者数的1/n2(n>1),低产作者人数过多,未达到洛特卡定律的条件。
表2:会议论文作者分布
4 49 1.07% 98.93% 234 5 25 0.55% 99.48% 150 6 6 0.13% 99.61% 104 7 10 0.22% 99.83% 76 8 5 0.11% 99.94% 59 9 1 0.02% 99.96% 46 10 0 0 99.96% 37 11 2 0.04% 100.00% 31
在洛特卡的基础之上,普赖斯进一步研究了科学家人数与科学文献数量以及不同能力层次的科学家之间的定量关系,提出“在同一主题中,半数的论文为一群高生产能力作者所撰,其中杰出科学家中最低产和最高产科学家所撰写的论文的关系数为m=0.749√”[3]。本文中,m=0.749√11=2.484篇,即杰出科学家中最低产者的撰文量为2.484,因此发表论文 3 篇以上的作者为核心作者。由表3可知核心作者共 172人,他们发表了682篇论文,远远低于全部论文的一半。
因此,无论使用洛特卡定律还是普赖斯定律,结果都表明国内档案学会议中高产作者少,而发文量 2 篇以下的作者形成了长尾,没有一个稳定的核心作者群。
表3:会议核心作者
(四) 会议核心研究机构
表4:作者机构分布
表4给出了发文量10篇以上的26个作者机构,从中可看出,高产单位主要是各级档案局、各类档案馆;高校较少,只有辽宁大学历史学院、云南省红河州财经学校、南京政治学院上海分院军事信息管理系和中国人民大学信息资源管理学院4个。这与前文会议类别的结果一致,会议类型决定了主要参与者与发文者。
三、档案学会议论文的内容分析
本文4670篇文献中共有关键词10416个,总频次36856次。频次在50以上的关键词共有97个,占关键词总数的0.9%,频次计12071,占总频次的32.75%。可以认为,这些关键词反映了本文会议论文的核心内容。去除几个意义过于宽泛的词,如“档案”“问题”“对策”等,还剩91个,篇幅所限,本文仅将部分高频关键词列于下表:
表5:高频关键词(部分)
档案信息 649 企业档案 164 档案服务 113 档案业务 91档案管理 641 现行文件 148 编研成果 110 人民群众 91档案利用 466 文件材料 147 档案意识 102 档案馆藏 87档案资料 382档案馆工作 137 档案内容 101数字档案馆建设87国家档案局 295 开发利用 135 电子文件归档 99 市档案馆 84档案人员 259数字档案馆 126 电子文件管理 96信息技术 84馆藏档案 223档案编研工作 121现代化管理95 信息资源 84档案数字化 217 档案管理模式 115 档案史料 94 单位档案 83
统计这些高频关键词在文献中的共现次数,构建91×91的共词矩阵,并运用Ochiia系数将之转化为相似矩阵,以导入SPSS进行系统聚类分析。聚类方法选择Ward法,度量标准选择计数中的Phi方度量,得出结果树状图(图3)[4]。为便于展示,对其大小进行了调整,过程中部分关键词被自动隐藏,因此图中91个关键词未全部显示。
根据图中聚类情况,并返回原文献中查看关键词具体的涵义和词对共现情况,结合本领域相关背景知识,笔者将其划分为10个子类进行具体探讨。
图3:高频关键词聚类树状图
(一)档案事业
该类是从宏观的方面进行论述,由于会议参与者主要是各级档案行政管理部门、各保管单位以及广大专业档案工作者,因此关于档案事业的讨论是一大热点,很多会议都直接围绕档案事业命名,如“档案事业发展与青年档案工作者的责任”(2010)、“档案事业改革与创新”(2013)。高频关键词的前4位也都在此聚类中。
本论题涉及的内容较多,论述到档案事业的方方面面,如档案管理、档案服务、档案业务、档案人员、档案系统、档案管理部门、档案法制建设、档案学理论等,不过论述的出发点和立足点还是档案事业,典型的论文如《以改革创新精神助推档案事业进步——对湖北档案工作促进发展、服务民生的分析与思考》《档案事业要科学发展法制建设是有力保障》。
(二)文书工作和档案室业务
文书工作是指适应单位开展各种业务活动的需要,围绕文书的生成、接收、运转、办理直至办毕处置等的一系列管理活动[5]。而档案室的任务是集中统一地管理本单位的全部档案,维护档案的完整与安全,积极开发档案信息,为单位各项工作服务。这二者是档案馆工作开展之前的在各单位内的文件管理活动,它们紧密联系,相互促进。
本文涉及此类的论文主要论述文书的立卷归档、机关档案的保管期限、档案室的集中统一管理、基层单位档案管理等。典型的论文有《浅谈文件立卷归档应考虑到档案开放的问题》《浅谈新形势下机关档案工作的创新》《浅论基层单位如何做好档案管理工作》。
(三)档案馆工作
很多会议参与者来自各级各类档案馆,因此围绕档案馆工作的讨论也是一大热点。涉及的内容有档案的收集、档案馆藏、档案资源建设、档案利用以及各级各类档案馆的业务工作等。典型的论文有《对档案接收进馆存在问题的思考》《丰富档案馆藏的途径与方法》《试论档案馆利用率不高的原因及对策》《浅析县级档案馆馆藏建设》。
(四)电子文件和数字档案馆
“电子文件”的概念在我国出现于20世纪90年代。但其研究的真正兴盛是在1996年之后。1996年在北京召开了第十三届国际档案大会,从理论上推进了我国电子文件研究的发展。之后国家“政府上网工程”于1999 年正式启动和实施, 2000 年底 80% 以上的部委和各级政府在网上建立了正式站点,开始构建中国的“电子政府”或“电子政务”,由此电子文件大范围产生[6]。与此同时,关于数字档案馆的研究也开始兴起。
本文中这一类的研究主要围绕档案数字化(包括纸质、照片和声像等各种档案的数字化)、办公自动化、电子文件归档、电子文件管理和数字档案馆建设,相关的论文有《浅谈照片档案的数字化处理》《电子文件在生成、运行、归档、管理中应注意的问题》《对数字档案馆功能定位与构建方式的思考》等。
(五)专门档案
专门档案是各单位在某些专业性强的业务活动中产生的档案,是我国在多年的档案管理工作中,逐渐形成的与文书档案、科技档案并列的概念,包含会计档案、诉讼档案、病历档案等很多种。本文中有关该类的热点研究领域是城建档案、工程档案和企业档案,论文有《武汉城市圈城建档案信息资源共享策略研究》《工程档案质量的全面监控》《民营企业档案工作的现状及对策》等。
(六) 档案开放及开发利用、档案编研和档案信息资源开发利用
这三类都涉及档案的开发利用,只是角度和侧重点有所不同,因此聚类时未成一类。不过我们可将其放在一起论述。“档案开放及开发利用”一类涵盖的内容比较全面,涉及档案的开放、开发(如编研)、利用(如档案信息服务),还从档案库房的角度论述如何优化馆藏以提高档案服务水平。“档案编研”专门针对档案材料的开发,包括档案史料的挖掘等。“档案信息资源开发利用”则借用资源管理和知识管理的视角,论述信息时代和知识经济时代档案的开发利用价值。
三个类别反映出我国档案部门对档案开发利用的重视。近年来,我国越来越重视档案馆的社会服务功能,不断加大档案的开放力度,拉近档案馆和公众的距离。信息技术的应用也改变了档案开发利用的方式,在档案深度加工以及提供网上服务方面取得不断进步。会议对这方面的持续关注说明档案开发利用仍将是我国档案工作的重点。
(七) 民生档案与家庭档案和人事档案
这两类联系紧密,因此也放一起论述。民生,《辞海》的解释是人民的生计。民生档案,就是与普通民众的生计有直接关系的、社会公众关注度高的、人民群众需要查阅利用的档案,如养老保险档案、医疗保险档案、婚姻档案、房屋拆迁档案等等[7]。人事档案,由于记述了每个人工作生涯中的个人经历、思想品德、业务能力、工作状况以及奖惩情况等,也是民生档案的重要组成部分。家庭档案,是每个家庭里,所有成员在各项社会活动中,直接形成的对国家、社会、家庭和个人有保存价值的原始记录。虽不同于民生档案,但记录的是人们日常生活的方方面面,与民生工作有着千丝万缕的联系;两种档案的落脚点也是一致的,最终都服务于人民。
本文中民生档案一类主要是基于国家档案局加强民生档案工作的要求展开论述,从本质上看,此方面的讨论顺应了党和政府推进以保障和改善民生为重点的社会建设的需要。家庭和人事档案,一个以家庭为单位,一个以个人为单位,关注的也是民生。两类研究热点反映了我国档案部门对民生的重视。
四、结语
通过CNKI会议论文数据库中档案学(G27)的4670篇文献,可以发现这些会议主要是2000年后由各档案学会举办的档案工作者的会议;各高校举办的会议没有录入。会议作者发表1篇论文的居多,没有稳定的核心作者群。高产作者的机构主要是各级档案局、各类档案馆,高校人员较少。会议研究热点也是档案工作的各方面内容,尤其关注档案开发利用和民生档案。
会议内容的特点是从实践出发,论述具体问题,鲜活生动,反映了档案工作各环节各领域的情况。然而主要是从档案工作者的视角进行论述,对我国档案学研究整体状况的描述还有待分析各高校举办的档案学者的会议。
●
[1]马费成,望俊成,陈金霞等.我国数字信息资源研究的热点领域:共词分析透视[J].情报理论与实践,2007 (4):438-443.
[2][3]王崇德. 文献计量学引论[M]. 桂林:广西师范大学出版社,1997:145-163.
[4]张勤,马费成. 国内知识管理研究结构探讨——以共词分析为方法[J]. 情报学报,2008(1):93-101.
[5]王健. 文书学[M]. 北京: 中国人民大学出版社,2001:37. [6]王先发,庞涛,甘荣萍.中国电子文件研究综述[J]. 云南档案,2007(8):31-33.
[6]肖秋惠,我国数字档案馆与电子文件中心建设述评,《档案学通讯》,2008(6):11-15.
[7]曹航,宗培岭. 民生档案的概念解析与价值指向[J]. 档案管理,2009(2):19-21.
(作者单位:武汉大学信息管理学院)