近十年我国数字档案馆研究的统计与可视化分析
2014-03-10李晓明,严京生,宫启生
李晓明,严京生,宫启生
摘 要:为客观反映近十年我国数字档案馆研究的相关情况,运用文献计量和可视化分析方法,对CNKI收录的2003年~2012年间研究数字档案馆的期刊论文、学位论文和会议论文从作者、机构和主题角度,结合知识图谱进行统计及可视化分析。结果表明,档案类期刊特别是核心期刊是载文主体,高发文作者数量不多,作者及机构合著较少,高等学校是研究主力,研究热点紧跟信息技术发展。
关键词:数字档案馆;2003年~2012年;文献计量;统计分析;可视化分析;知识图谱
1 引言
数字档案馆是近十几年我国档案领域研究重点和热点之一。随着时代及技术发展,数字档案馆出现多种叫法。罗沛霖早在1991年就提及“电子档案馆”,[1]1997年刘建平文中出现“数字化档案馆”、“虚拟型档案馆”,[2]1998年冯惠玲认为数字档案馆亦可称为“电子档案馆”、“虚拟档案馆”或“无墙档案馆”。[3]
李继红1997年在《档案学通讯》上撰文,论述了电子档案馆的8个特点,[4]开始了比较系统的数字档案馆研究。此后,国内许多专家、学者和档案工作者积极投身数字档案馆的研究与实践,取得了大量的研究成果,国内也不断建成各种类型的数字档案馆。
为客观准确地反映我国近十年数字档案馆研究的有关情况,作者收集了中国知网收录的有关文献,并对整理后的文献进行统计分析和可视化分析。
2 文献来源及数据整理
为使检索结果尽量全面,以表达式“KY=(‘数字档案馆+‘电子档案馆+‘虚拟档案馆+‘无墙档案馆+‘数字化档案馆+‘虚拟型档案馆+‘虚拟化档案馆+‘数字型档案馆+‘电子化档案馆+‘电子型档案馆)”对中国知网的期刊、特色期刊、博士、硕士、国内会议、国际会议、学术辑刊7个数据库进行专业检索,时间范围为2003年~2012年,检索结果2758篇。
为确保各项统计数据的准确,作者对检索到的全文逐一进行了核对,剔除了重复文献和“消息”、“动态”、“讲话”、“书评”、“目录”等不宜用作统计分析的文献,以及有中国知网机标关键词但相关性不强或仅1页的文献,保留了检索词在关键词中无但标题中有的文献。经整理后,用于统计分析的各类文献共计661篇(其中机标关键词文献115篇),仅占检索结果总数的24%,可见,文献分析不能简单地以检索结果作为研究对象。统计文献的年度及类型分布如图1。
图1 统计分析文献年度及类型分布(单位:篇)
经统计,以上文献来源于178种期刊、20家研究生培养机构和13次学术会议,其中期刊占比超过九成。载文前10位的期刊是《兰台世界》(81篇)、《档案学通讯》(43)、《档案学研究》(36)、《档案》(34)、《浙江档案》(27)、《北京档案》(18)、《档案与建设》(15)、《档案管理》(14)、《科技情报开发与经济》(14)、《云南档案》(13)。此外,《山西档案》、《四川档案》、《湖北档案》、《城建档案》的发文量均为11篇,档案类期刊特别是核心期刊发文比重大,发文超过5篇的主要档案类刊物的发文量达357篇,占期刊论文的59.3%。
为便于统计和确保统计数据的准确,对统计文献的作者单位(机构)名称、关键词进行了统一和规范,如将机构“南京政治学院上海分院”、“解放军南京政治学院上海分院”、“中国人民解放军南京政治学院上海校区”等统一为“解放军南京政治学院上海分院”,将各级政府的“档案馆”、“档案局”统一为“档案局”,同属两个机构的只统计第一个机构;将关键词“档案工作人员”、“档案工作者”、“档案馆员”、“档案人员”等统一为“档案馆员”, “大学”、“高校”、“高等学校”、“高等院校”统一为“高等学校”。
3 文献统计与分析
对文献信息进行相关的统计与分析,可以从中发现知识发展脉络、热点前沿等,[5]本文以时间为主线,利用自编软件对作者、机构、关键词等进行规范处理,统计分析了近十年我国数字档案馆研究的作者及机构发文与合作、主题变化,并利用社会网络分析可视化软件,绘制数字档案馆研究的“高发文作者-年度共现”图谱、“作者合著网络”图谱、“高发文机构-年度共现”图谱、“热点主题-年度共现”图谱。
3.1 作者统计与分析。(1)作者发文数量。统计文献涉及作者702人,篇均作者1.37人,其中第一作者发文525人,人均发文不足1.26篇;独著476篇,占72.01%;两人合著文章142篇,占21.48%;三人合著31篇,占4.69%;三人以上合著12篇,占1.82%。
将发文数不少于3篇的作者和发文年度信息导入NetDraw软件,得到以第一作者身份发文的作者-年度共现图谱(图2)。图中方形节点表示发文年度,圆形节点表示作者,连线表示作者在该年度发表了论文,连线上的数字表示发文篇数。发文最多的作者潘连根在2004年~2007年共发表论文17篇,袁红军、金更达、薛四新、唐艳芳在四个年度内均发表了论文,其他作者则在1年~3年间发表了不少于3篇论文。
图2 高发文作者-年度共现图谱
(2)发文第一作者地域分布。统计文献中以第一作者发文最多的为河南省作者,其次是江苏、浙江、上海和北京,以上省市第一作者发文接近统计文献的一半,另外,湖北、广东、山东和黑龙江第一作者发文数也都在30篇以上,作者涵盖了28个省(自治区、直辖市)。
表1 统计论文发文第一作者地域分布(单位:篇)
(3)作者合著网络。合著网络是因学者合著论文而形成的社会网络,[6]以图谱形式来呈现清晰而直观。图3是合作发文2篇以上的作者合著网络图谱,图中方形节点表示发文作者(附机构以区分同名作者),合著关系通过连线体现,连线上的数字为合作发文篇数。统计文献独著占比超过七成,合著网络比较零散。
图3 作者合著网络图谱
3.2 机构统计与分析。(1)第一作者机构发文数量。统计文献中,第一作者发文机构多达355家,其中224家仅发文1篇。最多的是解放军南京政治学院上海分院(27篇),其次是浙江大学(22)、绍兴文理学院(18)、武汉大学(17)、南京大学(16)、湘潭大学(15)。经统计,第一作者发文数量前20个机构的发文总数为246篇,占统计文献的近四成。
利用NetDraw软件绘出第一作者发文机构-年度共现图谱(图4,发文大于等于5),图中方形节点表示发文年度,圆形节点表示第一作者发文机构,连线表示某机构在某年有第一作者发表了论文,连线上的数字表示发文篇数。解放军南京政治学院上海分院、浙江大学、苏州大学、中国人民大学、武汉大学、吉林大学连线校多,表明多数年份发表了论文。图中可看出,高发文机构仅一家基层档案机构。
图4 高发文机构-年度共现图谱
(2)机构类型发文分布。由于部分统计文献作者机构信息不完整,影响统计结果的准确性。统计文献中,高校及其档案馆、图书馆发文量最大,占比达71.7%。
表2 第一作者机构类型及发文数(单位:篇)
(3)机构合著网络。同作者合著网络一样,机构合著网络是因机构合著论文而形成的社会网络。利用NetDraw软件可绘制机构合著网络图谱(限篇幅,图略),与图2相似,机构合著网络也比较零散,没有一家机构与三家以上的机构合作发文超过2篇。
3.3 主题分布与热点分析。关键词是从文献的标题和正文中抽取的最能够反映文献内容的词,通过分析其变化能把握学科发展的过程与规律,反映研究的热点和发展动向。本文选用关键词进行主题分析,并结合年度进行热点分析。
统计文献经规范处理后,共有关键词3050个,篇均4.61个(部分文献有机标关键词,实际篇均数更少)。统计文献涉及关键词1139个,除“数字档案馆”外,前20位的其他关键词出现的频次在16~53之间,出现仅一次的关键词达800个,可见研究的分散度较大。表3是频次前20位的关键词及出现频次。
表3 频次前20位的关键词
表3体现了十年间数字档案馆研究的主要主题、研究热点,但并不能很好地体现研究主题的演化和近期的热点或趋势。而利用NetDraw软件绘出关键词-年度共现图谱(图5,词频大于等于4),则能较好地得以体现(为使图谱更清晰,隐藏了关键词“数字档案馆”)。图中方形节点表示年度,圆形节点表示关键词,连线表示关键词出现在该年度的论文中,连线上的数字表示关键词各年出现的频次。关键词与年度的连线越多,表明该主题研究持续的时间越长,连线上的数字越大,则表明该年度该主题的研究越热。
图5 热点主题-年度共现图谱
从图中可以看出,数字化、建设、档案信息资源、电子文件等关键词与年度连线较多,表明围绕数字档案馆的这些研究持续时间较长,而云计算、信息技术、信息化、信息服务、知识管理等主要出现在近几年,表明这些是数字档案馆研究的新热点,体现出数字档案馆研究紧跟新技术、新研究的发展。
4 结论
通过以上统计和分析,可以得出以下基本结论。
4.1 档案类期刊特别是核心期刊是数字档案馆研究的发文主体,是研究数字档案馆应关注的重点文献,当然,学位论文也值得关注。
4.2 数字档案馆研究虽有一定数量的高发文作者,但高产作者占比偏低,同时鲜有发文较均匀出现在十年间或近几年的核心作者,表明有关学者对数字档案馆研究的持续性和稳定性不够强。
4.3 作者独立发文较多,合著较少,且合著作者多为同一单位,跨地域、跨机构合作的情况较少,机构合著情况亦如此,表明针对数字档案馆研究多为个人自由研究,缺乏较广泛的合作。
4.4 高等学校及其档案馆、图书馆是发文主体,表明高校在数字档案馆研究方面的科研能力较强,同时有几家高等学校十年间绝大多数年份有论文发表,表明部分高校该领域的研究有较强的持续性和稳定性。
4.5 针对数字档案馆相关的数字化、建设、档案信息资源等主题的研究持续时间长,且热度不减,表明这些研究尚有待深入或完善;而近几年针对数字档案馆的云计算、信息技术、信息化等研究,则表明数字档案馆的研究跟上了技术潮流,同时吸纳和借鉴了其他领域的最新研究成果。
*本文系中央高校基本科研业务费资助项目“档案数字化的管理与应用研究”(BESTI-JBKY-201104)成果之一。
参考文献:
[1]罗沛霖.跨进21世纪的文化信息技术系统[J].中国科技论坛,1991(2):29~32.
[2]刘建平.中国档案馆的演化[J].兰台世界,1997(9):30~31.
[3]冯惠玲.无纸收藏《拥有新记忆——电子文件管理研究》摘要之二[J]. 档案学通讯,1998(2):47~50.
[4]李继红.信息化进程中的档案工作[J]. 档案学通讯,1997(6):41~44.
[5]宗乾进,袁勤俭.回顾与展望:近十年我国档案学研究全景透视[J]. 档案学通讯,2012(2):12~16.
[6]程齐凯.档案学合著网络研究[J].档案管理,2009(5):19~22.
(作者单位:北京电子科技学院图书馆(档案馆) 来稿日期:2013-12-18)