国内数字资源长期保存论文的计量研究
2012-03-15
随着数字技术和因特网的发展,数字资源已成为人们获取知识和信息的主要来源。然而,由于数字资源及其利用所依赖的网络和存储媒体的不稳定性,使数字资源容易消失,难以长期为人们所利用。因此,越来越多的国家和机构开始关注数字资源的长期保存的研究。
我国对数字资源长期保存的研究始于20世纪90年代,本文以国内论述数字资源长期保存相关论文为出发点,通过对论文数量、作者、来源期刊、主题和引文等相关信息进行分析,从而概括我国数字资源长期研究的进展情况,并指出研究中的不足。
1.论文数量分析
本文以CNKI为检索工具,选择中国期刊全文数据库,分别以“数字资源长期保存”、“网络信息长期保存”、“数字信息长期保存”、“数字资源长期存取”、“网络信息长期存取”、“数字信息长期存取”为题名检索,检索时间段为1999年到2011年,得出216篇论文,去掉征文通知和会议通知等无效论文,得到有效论文205篇。根据这些论文的发表时间分年汇总,得出论文时间分布表和文献增长曲线,如表1和图1。
从表1和图1可以看出,我国关于数字资源长期保存的研究始于20世纪末,伴随着国内学者对数字资源长期保存的重视,该领域的研究文献逐年增长,根据文献增长速度可以把数字资源长期保存的研究分为三个阶段:第一阶段(1999年到2002年):这一阶段是我国数字资源长期保存研究伊始,文献增长缓慢,所发表论文多是关于数字资源长期保存策略和技术的研究,2002年关于数字资源长期保存的论文发表了10篇,相比2001年明显增长,这表明数字资源长期保存这一研究已经引起了我国相关专家的重视;第二阶段(2003年到2006年):这一阶段关于数字资源长期保存的研究论文稳步增长,主要是因为数字资源长期保存的研究已经引起我国政府和相关专家的重视,特别是2004年中欧数字资源长期保存研讨会在北京举行后,对数字资源长期保存的研究不仅包含国外经验的借鉴,我国学者开始重视长期保存的技术问题,寻求我国数字资源长期保存的技术策略;第三阶段(2007年到2011年):这一阶段我国关于数字资源长期保存的研究已趋于成熟,主要是针对我国数字资源长期保存管理、法律、责任和技术等方面策略的研究。
2.著者分析
2.1 著者发文数量分析
检索到的205篇论文中去除1篇未署名的,共有著者146人,其发文情况见表2。
从著者人数与所著论文数之间的关系来看,发表1篇论文的著者有117人,发表2篇论文的著者有17人,发表3篇论文的著者5人,发表4篇论文的著者3人,发表5篇和6篇论文的著者各1人,发表8篇论文的著者2人。洛特卡定律指出:写n篇文章的作者数是生产1篇作者数的1/n2,且生产1篇文章的作者数是全体作者数的60%左右。从表2可知,发表1篇论文的著者数量约占总著者数的80.1%,这与洛特卡定律的描述不符,表明数字资源长期保存的研究尚未成熟,写1篇论文的群体过大。
表1 论文时间分布表
2.2 著者活跃度分析
为进一步分析这一领域著者结构,本文引用邱均平教授“作者活跃度”这一概念,领域年龄=当下年份-作者在该领域内发表第一篇论文的年份;著者活跃度=作者发表该领域论文/领域年龄。领域年龄越长而且活跃值越高的作者群是该领域的领军人物,领域年龄小而活跃值比较高的作者群,则是构成该领域发展的中坚力量。笔者分别计算发文量前七位的著者的领域年龄和活跃值得出著者活跃度表(见表3)。
从表3可知,刘家真、宛玲、吴振新为数字资源长期保存研究领域的领军人物,郭家义、刘喜球为该领域的中坚力量。其中刘家真教授的领域年龄最长,因为其发表的文章都集中在前期,所以发文量高但活跃值不高;刘喜球教授虽然只发了四篇相关论文,但其领域年龄只有三年,所以活跃值较高,可能成为本领域的领军人物。
3.来源期刊分析
检索到的205篇论文分布在69种期刊上,其中图情和档案类期刊53种,占总期刊数的76.8%;学报类期刊10种,占总期刊数的10%;其他类期刊6种,占总期刊数的8.7%。由此可见,关于数字资源长期保存的研究多集中在图情和档案类期刊,受到了图情及档案领域学者的重视。笔者按每种期刊发表数字资源长期保存相关论文的数量进行排序,选出前十位期刊得出论文期刊分布表(表4)。
从表4可知,数字资源长期保存论文刊登较集中的11种期刊全部为核心期刊,其中10种为图情专业核心期刊,1种为档案专业核心期刊,说明数字资源长期保存的研究受到了足够的重视,且多集中在图情领域。这11种期刊上发表的关于数字资源长期保存研究的论文数量为92篇,占本领域论文总数的44.88%,形成了该领域的核心期刊群。
4.主题分析
笔者将1999年到2011年期间国内关于数字资源长期保存的研究主题分为综合策略研究、技术策略研究、国外经验介绍、管理策略研究及法律策略研究五个方面,将205篇论文按主题进行分别统计,得到主题分布表(见表5)。
从表5可知,1999年到2011年期间国内关于数字资源长期保存的研究中最多的是关于综合策略的论文,共77篇,其次是关于技术策略的论文,共52篇,两者论文数量占总数的62.93%,说明我国学者数字资源长期保存的综合策略研究已取得一定成果,且重视长期保存过程中的技术问题。伴随着数字资源长期保存实践的进行,我国学者也逐渐认识到管理策略和法律策略研究的重要性,关于这两方面的研究数量从2007年以后增幅明显。
表2 作者发文情况
表3 著者活跃度表
表4 论文期刊分布表
表5 主题分布表
表6 引文统计表
图1
5.引文分析
论文被引用次数是衡量该论文学术水平和科研价值的重要尺度之一,对文献进行被引分析可以让我们了解该学科领域的经典文献和成果。
笔者将数字资源长期保存方面论文按被引用次数进行排序,得出被引用次数较多的10篇论文,并对其排列得出引文统计表(见表6)。
在本文统计的引文统计表中,被引次数最多的是刘家真教授在1999年发表的《维护数字信息长期存取的管理策略》,说明刘家真教授的《维护数字信息长期存取的管理策略》是该领域的经典文献,为以后数字资源长期保存的研究奠定了基础;在被引用次数最多的10篇论文中排名第二、第三、第六和第九的4篇论文均为宛玲所著,说明宛玲为数字资源长期保存研究领域的经典学者。
从表6可知,被引频率较高的10篇论文中有9篇都刊登在本专业核心期刊上,有7篇为核心著者所著,说明被引频率较高的10篇论文质量普遍较高,但从发表时间来看这10篇论文均发表于2006年以前,时间较长,在一定程度上影响论文的权威性。
6.结语
我国数字资源长期保持方面的研究已经取得了一定的进展,论文数量稳步增长,确定了核心期刊群和核心著者群,发表了一些经典论文,但论文总量较少,著者活跃值不高,研究缺乏持续性,研究方向主要是一些理论性问题,缺乏对我国数字资源长期保存实践的研究。
[1]邱均平,矫翠翠.网络链接分析论文的计量研究[J].情报科学,2008(8):1130-1134.
[2]邱均平,刘华华.网络信息计量学的文献计量规律及发展现状研究[J].图书馆论坛,2009(6):58-62.
[3]张靖,邵波.国内数字资源长期保存研究定量分析[J].新世纪图书馆,2011(1):33-35.
[4]邱均平.信息计量学[M].武汉:武汉大学出版社,2007.1.