APP下载

国内电子文件长期保存文献计量分析

2020-09-09李毅强

资源信息与工程 2020年4期
关键词:基金项目发文计量

李毅强, 郑 川

(1.湖南大学 档案馆,湖南 长沙410083;2.中南大学 档案技术研究所,湖南 长沙410083)

1 引言

信息化时代,电子文件成为了人们记录、传递和交流信息的主要工具,它是一组相关信息的集合,包括文字、声音声像、图表等多种格式的计算机可读文件,具备传统纸质档案特有的原始性、记录性、凭证性等特点,成为了重要的社会记忆。 但电子文件本身具有容易复制、容易删除、容易修改、容易损坏等特性,传统的工作流程、模式和技术,很难满足电子文件管理的要求。 尤其在技术更新频繁、快速迭代的今天,使电子文件满足真实性、完整性、可用性和安全性四性检测要求,实现电子文件长期保存,更是业界所关注的焦点。 本文从文献计量的角度对国内电子文件长期保存相关文献进行梳理和统计分析,以期为该领域研究提供参考。

2 研究方法和数据来源

2.1 研究方法

通过文献计量法、内容分析法和知识图谱对我国电子文献长期保存相关文献进行分析。 计量分析工具使用文献管理软件NoteExpress 3.2.0 和电子表格软件Microsoft Excel 2016。 NoteExpress 是一款专业级的文献检索与管理软件,其核心功能涵盖文献检索、采集、管理、应用和挖掘等知识管理的所有环节[1]。 Microsoft Excel 可以方便地处理表格数据和进行图形分析,且具有直观的可视化界面和优秀的图表工具,适用于各种数据分析。

2.2 数据来源

本文以中国知网CNKI 为数据来源,检索式 “主题=电子文件and 长期保存(精确匹配)”;发表时间不限;文献来源不限,检索时间为2019 年11 月10 日,得到中文文献376 篇。 将这些文献题录以自定义格式导出为文本文件后通过 “ CNKI-Export(Custom)” 过滤器导入NoteExpress,再由 “CNKI-中国知网(IP 登录)” 批量下载所有文献全文。 通过逐篇阅读摘要的方式对文献进行数据清洗,剔除重复题录6 篇、新闻资讯6 篇、卷首语1 篇、期刊要览1篇、内容无关文献15 篇、访谈稿1 篇,最终得到346篇国内电子文件长期保存的相关文献。

3 国内电子文件长期保存文献计量分析

3.1 发文时间计量分析

在NoteExpress 通过文件夹统计信息功能对346篇文献的 “年份” 字段进行统计,将结果另存为文本文件导入Microsoft Excel,按年度发文量绘制发文时间及数量分布曲线图如图1 所示。 国内电子文件长期保存相关文献最早出现在1997 年,在随后的二十多年时间里,该领域发文数量呈明显上升趋势,由于文献收录存在一定的滞后和检索时点原因,2019 年发文数量缺乏参考性。 根据发文时间及数量分布曲线图,我国电子文件长期保存研究可分为两个阶段,1997 年~2004 年为起步阶段,年发文数量在5 篇左右较为稳定;2005 年至今为稳步发展阶段,年发文数量呈稳定增长态势,近3 年年发文数量均在35 篇以上。总体上看,我国对电子文件长期保存的研究与我国信息技术发展进步、科研投入的增长呈正相关[2]。

图1 发文时间及数量分布曲线图

3.2 文献作者计量分析

在NoteExpress 中使用数据及分词管理器对电子文件长期保存文献的 “作者” 字段进行统计,346篇文献共涉及作者405 名,其中发文量最多的作者发文数量为9 篇。 根据普赖斯定律(Law of Price)计算公式,发文量在m=0.749×Nmax篇以上的作者为核心作者[3],计算得m=2.247,即发文量大于等于3 篇的作者为该领域的核心作者:发表9 篇的刘家真、刘越男,发表6 篇的有钱毅、肖秋会,徐义全发表5 篇,毛义春和张美芳各4 篇,发表3 篇的有陈晓晖、程妍妍、冯惠玲、侯衡、祁天娇、孙瑾、屠跃明、张健、张梦霞、张雅君、赵淑梅、赵屹等。 由核心作者形成的核心作者群是推动学科发展和学术创新的重要力量。 346 篇文献中署名人数2 人及以上的共106篇,独立作者论文240 篇,论文合著率30.6%属于较低水平[4],说明该领域的科研合作有待加强。

3.3 发文单位计量分析

直接统计346 篇电子文件长期保存文献共涉及发文单位253 个,分析发现作者署名单位通常为所在机构的具体部门,会给发文单位统计带来误差,因此对署名单位进行标准化处理:发文单位统一以一级单位统计,如 “中国人民大学信息资源管理学院”和 “中国人民大学电子文件研究中心” 统一记为 “中国人民大学”;合著论文以通讯作者所在单位进行统计。 处理之后共有发文单位174 个,发文量大于等于4 篇的单位统计如表1 所示。 发文数量高的单位,与该领域的核心作者群所在单位的重合度较高,且高等院校与档案局、档案馆等档案管理机构是电子文件长期保存研究的主要单位。

表1 发文数量≥4 篇单位统计表

3.4 来源期刊计量分析

346 篇电子文件长期保存相关文献中,除会议论文与学位论文外,有期刊论文296 篇。 在NoteExpress中通过文献类型字段=“期刊” 筛选后,使用数据及分词管理器统计来源期刊,296 篇期刊论文分布在87 种刊物上,取载文量前十(含并列)的期刊绘制环形图如图2 所示。 布拉德福定律(Law of Bradford)把载文期刊分为核心区、相关区和非相关区,理论上每个区间的载文量占总发文量的三分之一[5],可以发现电子文件长期保存相关文献的来源期刊中,核心区期刊和相关区期刊全部为档案学学科的期刊,档案学学科是该领域的主要研究力量。 其中《档案学研究》和《档案学通讯》为CSCD 来源期刊,也属于核心区期刊;《档案与建设》、《北京档案》、《档案管理》、《中国档案》和《浙江档案》为北大中文核心期刊,前两者属于核心区期刊,后三者属于相关区期刊。 CSCD 来源期刊和北大中文核心期刊在核心区期刊和相关区期刊中占比达46. 7%,发文量占比达59. 6%。 可见档案学的CSCD 来源期刊和北大中文核心期刊是电子文件长期保存研究领域最重要的刊发平台。

图2 载文量前十(含并列)期刊统计图

3.5 基金支持计量分析

基金项目是我国政府对科学研究资助的主要方式之一,基金项目的研究通常代表该研究领域的创新性成果和前沿性进展[6],也在一定程度上成为文献创新性和前沿性的衡量指标之一[7]。 从电子文件长期保存相关文献获得各类基金资助的情况看,346 篇论文共有61 篇标注了基金项目,占比17.6%。单篇论文标注多个基金项目的,取级别较高的进行统计,结果如表2 所示。 国家社科基金项目对电子文件长期保存的研究资助力度最大,共计29 个项目占比8.38%;其次是省部级基金项目,共计19 个项目占比5.49%,省部级基金项目以教育部项目、省级科技项目、省档案局项目为主。

将标注基金项目的论文按发文时间做升序排列,得到不同年度各类基金项目对电子文件长期保存研究的资助情况。 最早出现的基金项目为1999年教育部 “九五” 规划基金,标注该基金的论文为武汉大学刘家真的《 保护数字信息长期存取研究综述》[8]。 1999 年~2008 年期间,该研究领域所获基金项目支持数量较少,年均不到1 项;2009 年~2018年期间,各类基金项目对该领域的支持稳步增加,近3 年年均接近9 项。 基金项目支持数量的逐年增加,与图1 所示的年发文数量增长呈现同步的趋势。

表2 文献标注基金项目情况统计表

4 结语

随着社会信息化程度越来越高,各类信息系统在人们的生产生活活动中不断深入,电子文件的长期保存问题也越来越重要。 通过对该领域文献的计量分析发现,二十年来相关文献数量和各类基金项目数量稳步增长,已形成较稳定的核心作者群,档案学核心期刊是该领域研究的主要来源期刊,高等院校与档案局、档案馆等档案管理机构是电子文件长期保存的主要研究单位。

猜你喜欢

基金项目发文计量
七部门联合发文 进一步完善和落实积极生育支持措施
CPMF-I 取样式多相流分离计量装置
计量检定在食品行业中的重要性
CPMF-I 取样式多相流分离计量装置
Optimization Reform of Education Mode for Dissertations of New Media Majors in Application-oriented Universities
The Discussion of Tittle on John Steinbeck’s Of Mice and Men
The Internet as a Forget-Cue: The Effect of Assumptions About Future Accessibility of Information from the Internet on Memory
Research on Integrating Modern Educational Technology into High School English Teaching
校园拾趣
爷孙趣事