APP下载

国内外数字档案馆研究主题比较:基于WOSS与CNKII的计量分析

2015-05-30王芳张妍

北京档案 2015年9期
关键词:类目档案馆学者

王芳 张妍

摘要:本文构建了数字档案馆研究主题分类表,包括13个一级主题类目和相应的二级主题类目。并以此为基础,选择了自“数字档案馆”概念出现以来15年间(1998~2013年)WOS和CNKI收录的数字档案馆研究论文,主要从研究主题方面对文献进行计量分析与比较,讨论了国内外数字档案馆研究的相似与不同之处。

关键词:数字档案馆文献计量比较研究WOS CNKI

Abstract:In this study, a coding schema was built for subjects of digital archives research, includ? ing 13 primary categories and corresponding sub-cat? egories. Based on the coding schema, subjects of pa? pers on digital archives in WOS and CNKI from 1998 to 2013 were coded respectively. Then a compara? tive study between bibliometric results from two da? tabases was conducted on research subjects, and the similarities and differences in digital archives re? search between China and other countries were dis? cussed.

Keywords: Digital archives;Bibliometric analysis; Comparative study; WOS; CNKI

一、导言

自20世纪90年代以后,美国的数字档案馆建设迅速发展。1997年,美国国家档案与文件管理局(NARA)正式提出了建立电子文件档案馆(ERA)的计划。[1]此后,美国先后建成西北数字档案馆( Northwest Digital Archives)、日美关系数字档案馆、因特网档案馆等。[2]随后,加拿大、荷兰、英国(如国家档案馆项目NADA)、澳大利亚、日本等国家相继开始进行数字档案馆建设。

随着数字档案馆建设实践的深化,国内外学者对数字档案馆的理论研究逐渐增多。在相关的理论研究中,特别是对数字档案馆文献的计量分析上,国外研究侧重数字档案馆的一些具体问题。例如,2012年,Sinn对在《American Historical Review》(2001~2010年)上发表的论文进行统计,分析数字档案在历史研究中被使用的频率与广泛度。[3]2013年,Gracy与Kahn对2009~2010年间,数字图书馆文献中的图书馆数字资源保存工作面临的紧张局势、大规模数字化及其对档案资源的影响等五个方面进行了计量分析。[4]我国的相关研究始于2012年,肖秋会与冯亚兰从数字档案馆模式构建、资源建设、技术应用、信息服务四个方面,对2007~2011年间我国数字档案馆的研究成果进行统计,发现我国数字档案馆研究群体以高校档案学者和机构档案工作者为主,一些图书情报领域和计算机专业的实际工作者也参与其中。[5]2013年,马宏正对基于知识管理的数字档案馆研究进行计量分析。[6]同年,赵亮等对WOS引文数据库收录的电子健康档案研究文献进行计量分析,发现美国发表相关主题的文献居首位(60.46%);发表机构中,哈佛大学最多。[7]

总体看来,虽然国内外学者对数字档案馆研究进行了一些综述与计量分析,在文献时期、文献国别以及研究领域上各有侧重,但尚未有对国内外数字档案馆研究进行系统的计量分析。为全面揭示国内外数字档案馆研究的差异,本文拟对自“数字档案馆”概念出现以来WOS和CNKI收录的全部研究文献进行计量分析和比较。

二、数据收集与分析方法

目前,文献中与数字档案馆相关的常用英文主题词主要有“Digital archives”(数字档案馆)、“Electronic ar? chives”(电子档案馆)与“Virtual archives”(虚拟档案馆)。本文以此为检索词,分别在WOS和CNKI中对题名、关键词与摘要进行模糊检索。虽然与数字档案馆相关的主题词还有电子文件、数字管护、电子保存等,但是为保证本文研究主题的聚焦性与可操作性,对这些概念不予考虑。

按照时间顺序进行界定,笔者结合WOS的检索结果,抽取了1998~2013年(15年)发表的数字档案馆文献。剔除不相关的检索词,并经数据清洗后,最终得到661条有效数据。在CNKI中,共检索到3325篇文章,删除不相关数据,最终保留1631条有效数据,并利用End-note Export将其导出分析。

三、国内外数字档案馆文献研究主题分布的计量比较

文献特征包括主题、作者、机构、期刊分布、合著情况、引用情况等。对新兴研究领域而言,主题是揭示其研究内容的发展与分布情况的最重要指标。受篇幅所限,本文主要对数字档案馆研究文献的主题特征进行计量分析,关于其他特征的分析将另文展开。

(一)数字档案馆研究主题类目编码

本文基于现实的文献研究内容,并在此基础上,编制了数字档案馆主题分类表。为保证主题分类的可信度,按照定性分析法,分别对WOS和CNKI的数字档案馆文献内容做主题分析,并采用归纳法进行主题编码,提炼出主题类目,比较分析结果,并讨论修改。最终确定了13个一级主题类目,每个一级主题类目又包含数目不等的二级类目,如表1所示。考虑到“实践应用项目介绍”类文献与其他主题类目会存在重复,规定完整的案例介绍就归入前者,只是在研究各类问题时举例提到某个案例则归入各类。“问题、挑战与展望”、“技术”也作相同处理。

(二)WOS与CNKI收录文献的主题分布情况比较

1.从总量分布来看,(1)在论文发表期刊及学科领域的分布上,WOS比CNKI分散。WOS主要涉及信息科学、图像处理及具体的科学领域,CNKI则集中在档案学专业期刊上。例如,WOS收录的数字档案馆研究论文,661篇论文发表在312种会议或期刊上。其中,发表论文3篇及以上的会议有11种,发文180篇。发表论文3篇及以上的期刊有10种,发文70篇。相关学科涉及数字图书馆、数字遗产、信息科学、文献学、天文学、图像处理、生物技术等领域。而CNKI收录的数字档案馆研究成果,则主要发表在档案学专业期刊上,其中发表最多的期刊是《兰台世界》。(2)随时间变化,WOS收录总量后劲不足,CNKI则稳中有升。15年间,WOS收录数字档案馆文献总量在2003年达到最高,此后逐渐趋缓,并在2012年达到最低。而CNKI自1998年以来持续增长,2013年达到最高。笔者认为产生这种差异的原因在于:一是2003年后,欧美国家出现了一些专门研究数字档案馆具体问题但尚未被WOS收录的期刊,如问世于2006年的由DCC和英国爱丁堡大学联合主办的专业期刊《International Jour? nal of Digital Curation》;二是在CNKI上的相关论文主要发表在档案学专业期刊上,且近年来年轻学者不断发表文章,因此研究数量呈逐年攀升之势。如图1所示。

2.就一级主题文献数量而言,(1)国外学者关注技术、数字保存、数字档案的利用与服务等;国内学者则更注重概念探讨,对战略规划及收集归档讨论较多;国内外学者都没有给予数字档案馆教育以足够的重视,如国外为1%,国内尚属空白。具体来看,在WOS中,技术主题占比最高,为23%;其次为数字档案的组织、收集归档与保存(22%),其中数字保存占总数的11%,表明数字档案馆技术和资源管理,尤其是数字保存是国外学者研究的重要问题。而在CNKI中,基本理论占比最高,为23%;其次为数字档案的组织、收集归档与保存三项加总(共计15%)以及战略规划(15%),收集归档占11%,保存仅占2%。值得注意的是,在WOS中,数字档案的利用与服务占比达18%,高于战略规划(15%),而在CNKI中战略规划占比(15%)高于利用与服务(11%),可见国内学者对数字档案馆利用与服务的重视度不如国外学者。但在数字档案馆的安全问题上国内学者(6%)远高于国外学者(1%)。如图2所示。(2)随着数字档案馆建设实践的发展,国外研究更加注重对实践经验的总结和对问题的反思。而国内研究则趋于多样化,且在数量上稳中有升。在WOS中,技术类、数字档案利用与服务类、数字保存类和理论研究类主题的文献数量均在2003年达到最高;规划与问题分析在2012年达到最高。如图3所示。在CNKI中,理论研究稳中有升,在2011年达到最高;利用问题、规划问题、项目评估类、安全问题、保存问题等持续受到关注。其中,技术、安全、保存问题均在2012年达到最高。如图4所示。

3.数字档案馆技术,数字档案的利用与服务,数字保存及数字档案馆项目介绍,是四个包含二级主题最为丰富的一级主题类目,也是WOS中文献数量占比最高的四个一级主题。限于篇幅,笔者仅选择四个二级主题最为丰富的一级主题进行具体分析。

(1)就“数字档案馆技术”类文献分布而言,一是国外学者更注重数字档案馆实用技术在应用过程中出现的问题,而国内学者更多地讨论新概念在数字档案馆发展中可能的应用趋势。在WOS中,技术类占比23%,位居第一。其中,关于数字档案管理系统与软件的论文,占技术类文献数量的84.9%。其次,图像表示与可视化技术占3.3%;音频视频档案处理技术占2.6%;移动传感技术占1.3%。而在CNKI中,管理系统占52.6%,远低于WOS;其他技术(云计算、数据仓库、数据挖掘技术、信息技术架构等)占43.4%,高于WOS。如图5所示。二是国外学者对新技术的敏感度高于国内学者。在WOS中,数字档案管理系统在2009年达到最高,表明自2009年以后数字档案管理系统技术已经趋于成熟。移动传感技术在2010年达到最高,表明2010年以后随着移动互联网技术在数字档案馆领域的深入应用,该主题再次受到档案学研究人员的关注。如图6所示。而在CNKI中,对数字档案管理系统的关注持续上升,在2013年达到最高。值得注意的是,我国档案学者对计算机类的技术关注较少。如对图像表示技术的关注,2005年后基本无人问津;音、视频技术2004年后一直沉寂,2012年回落至最低;移动传感技术研究一直空白,直到2013年才有相关研究。如图7所示。(2)就“数字档案利用与服务”类文献而言,国内外学者关注角度差异较大。在WOS中,数字档案利用与服务,数据挖掘,知识管理成为关注的焦点。而在CNKI中,国内学者对检索、网站、数据分析、资源整合的关注程度均低于国外学者,其他问题如个性化服务、用户研究、服务方式与行为模式的研究等方面,高于国外学者。(3)就“数字档案保存”类文献数量而言,国内学者对数字保存的关注度远低于国外学者,数字保存、格式与载体的探讨偏低。2000年以后,WOS中关于数字保存的文献数量迅速增加,在73篇数字保存文献中,数字保存35篇,数字存储14篇,数字管护1篇,格式与载体类23篇。而CNKI中共34篇,远低于WOS。(4)就“数字档案馆项目介绍”类文献的国别而言,国外的数字档案馆项目介绍以欧美国家居多,WOS收录了53篇数字档案馆项目介绍,其中美国6篇,欧洲25篇。

综上,从数字档案馆未来的发展趋势来看,随着数字档案管理系统的成熟和数字档案馆馆藏的不断积累,关于数字档案馆技术的研究将进一步转向数据管护的具体环节,如数据抽取、数据挖掘、数据的长期保存等。同时,随着传统档案馆数字化建设的深入,数字档案的元数据互操作、资源整合、利用与服务、网站建设、绩效评价等将成为重要课题,而数字档案馆的法规建设、职业教育也将成为影响数字档案馆建设的根本性问题。另外,关于数字档案馆的理论研究将突破概念辨析阶段,进入深层分析,如数字技术对档案利用过程中的深层社会关系的影响等。

注释及参考文献:

[1]Thibodeau, K. Building the Archives of the Future: Advances in Preserving Electronic Records at the National Archives and Records Administration," D-Lib Magazine, Vol. 7, No. 2(February 2001).

[2]王芳,史海燕.国外Web Archive研究与实践进展[J].中国图书馆学报,2013,3, 39(204):49-59.

[3]Sinn, D. Impact of digital archival collectionsonhistoricalsearch[J]. Journalof the American society for informa? tion science and technology,2012,63(8): 1521-1537.

[4]Yu, H C, Tsai, H H, Kocaoglu, D F. Developing Digital Content Industry in Taiwan [C]. Proceedings of the Portland International Center For Management of Engineering and Technology,2013.

[5]肖秋会,冯亚兰.2007—2011年我国数字档案馆研究综述[J].档案,2012(3):9-11.

[6]马宏正.基于知识管理的数字档案馆问题研究综述与分析[J].广州广播电视大学学报,2013(4):101-106.

[7]赵亮,黎勇,张睿等.基于Web of Science电子健康档案文献的计量研究[J].中国循证医学杂志,2013(11):1307-1312.

作者单位:南开大学商学院信息资源管理系

猜你喜欢

类目档案馆学者
学者介绍
学者简介
学者介绍
本期练习题类目参考答案及提示
关于县级档案馆馆藏档案开发利用的思考
全省部分档案馆新馆掠影
学者介绍
when与while档案馆
《中图法》第5版交替类目研究综述
黄三角、长三角、珠三角明、清及民国通志一级类目比较*