三十余年图情领域重要期刊文献量化分析
2015-02-03刘春年张曼
刘春年 张曼
[摘要]利用Histcite、SPSS和Citespace等工具,对Web of science数据库收录的图情领域重要期刊进行量化分析,研究发现美国和英国为其重要文献来源国,我国学者研究文献被收录数量相对较少但却具有较高的学术水准和参考价值。同时发现图情领域研究发展历程中始终围绕图书馆和信息科学两大主题展开研究,经历了传统研究方法的应用——方法理论改善——新评价手段提出——新评价手段体系构建和完善的发展历程,且逐渐从满足社会需求和推动科学进步的角度,挖掘并提升图情研究的存在价值和意义。
[关键词]图书馆学;情报学;科研评价;主题分析;文献计量学;学科价值
[中图分类号]G250.252 [文献标识码]A [文章编号]1008-0821(2014)11-0110-09
社会和科学的进步在为图情领域研究带来机遇的同时,也挑战着图情研究的存在和发展。面对信息化社会的到来,信息的急剧增长,如何提高信息服务水平,提高信息优化能力,促进信息资源的有效利用和共享等,对该领域研究者来说是重要的责任和义务,也是保障图情领域未来可持续发展的研究方向。与此同时,社会的高度发展带来的日益增多的多样化和个性化需求逐渐要求服务质量和服务水平高精化。在此背景下,图情领域研究有着怎样的研究现状,其研究的热点点在哪,有着怎样的研究前沿和发展历程,如何找到其发展的突破点?为了解决上述问题,探析图情研究与科学及社会发展的吻合度,提供图情研究的信息服务水平,本文选取15种重要期刊为分析对象,通过对其进行量化分析,探究图情领域的研究发展现状和发展动向,从而为进一步提升我国图情研究的信息服务能力和水平,推动我国图情研究的未来发展提供参考思路和研究视角。
1、结果分析
根据Cooke学术搜索提供的以H5指数为排名依据的图情领域排名前20的国外期刊,并从中选取被Web ofScience(WOS)数据库中的SCI-E和SSCI子数据库收录的15种期刊,作为本文数据的来源。其中检索策略为出版物名称,检索时间跨度为1981-2013年,共检索到符合条件的文献记录12 281条。将检索结果以纯文本格式保存并导入Histcke、Citespace和SPSS软件进行文献计量分析。本文所用检索策略,检准率高,不需剔除不相关文献,故选定检索所得文献用于量化分析。
1.1 期刊与作者分布
将本文用于分析的图情领域的15种重要期刊按其载文量大小进行排序,如表1所示。可见,在载文量方面,sci-entometrics、Online Infommtion Review和Journal of InformationScience排名前三。但由于各期刊在WOS数据库中被收录的时间具有一定的差异性,所以仅从载文量方面不足以反映这些期刊在图情研究方面的重要性的排名。某期刊本数据集被引用次数(TIES)在一定程度上反映了该期刊的学术水平和参考价值,而篇本数据集被引用次数(TLCS/N)可以具化期刊所载文献的平均学术价值,因此本文认为按TLCS/N对期刊进行排序可以得到Journal of Informetrics、sci-entometrics和Journal of Information Science排名前三。因此,图情领域研究者可以根据需要选择并关注该15种期刊及其所载文献,以获取图情领域重要的研究成果和进展。
对该15种期刊所载文献进行作者分析,可以得到共有11 923个相关作者。匈牙利科学院图书馆(Lib Hungarian A-cad Sci)的Glanzel w在发文量与TLCS/N方面均排名第一,可见其在图情方面的研究具有较高的学术水平和参考价值,值得该领域研究者的关注。同时从作者所知单位可以看出,匈牙利科学院图书馆、英国伦敦城市大学与比利时林堡大学大学为主要高产和高质量研究者所在单位。
1.2 研究地区及研究机构分布
对该15种期刊所载文献进行国家分布分析,按拥有文献量排序,可得如表2所示的排名前五的国家分布;按TIES排序,可得如表3所示的排名前六的国家分布。就表2而言,美国、英国和西班牙在该15种期刊收录方面位居前三,其中美国和英国为文献重要来源国家,其被收录文献量均大于排名其后的西班牙、中国和加拿大三国被收录文献量之和,共占总文献量的44.48%。就TLCS/N而言,我国排名第一,在一定程度上反映了我国学者虽然在国外图情重要杂志发表的文献量相对美国和英国较少,但却具有较高的研究水准和成就。在表3中,匈牙利、比利时和荷兰进入排名前六的国家分布列表中,分别排名第三、第四和第五,且在TLCS/N方面这3个国家分别排名第一、第二和第三,表明了这3个国家在图情方面的研究文献具有较高的学术价值和参考意义。因此可以看出,图情领域15种重要期刊收录文献的研究活跃的国家为美国、英国、西班牙和中国,同时匈牙利、比利时和荷兰等国在图情方面的研究文献也是值得该领域学者关注的。
对图情领域15种重要期刊所载文献进行机构分析,可以得到共有4 188个研究机构,且在发文量方面英国伦敦城市大学(City Unlv London),新西兰惠灵顿维多利亚大学(Victoria Urdv Wellington),英国谢菲尔德大学(UrdvSheffield)位居前三。但发文量排名前五的机构中,就其TLCS/N而言,比利时鲁汶天主大学排名第一,英国伦敦城市大学和谢菲尔德大学排在其后。所以仅以发文量来定位该15种重要期刊的活跃研究机构的准确性有待商榷。本文进一步筛选出TLCS值大于300的研究机构,并按其TIES/N值进行排序,如表4所示。其中,匈牙利科学院图书馆(Lib Hungarian Acad Sd)、匈牙利科学院(Hungarian AcadSci)、瑞士联邦理工学院(ETH)和英国苏塞克斯大学(u-niv Sussex)位居前列。这4个研究机构的TLCS/N大于8,远大于按发文量排名前五的研究机构的TLCS/N。可见,结合发文量和TLCS值来判定活跃的研究结构,将有助于提高判定的准确性。图情领域研究者可以选择性的关注这些研究机构该领域的研究文献和动态。endprint
1.3 高被引文献分布
根据某文献的本地被引次数(LCS)值可以判定该文献在其研究领域所受的关注度及其影响力,因此可以通过LCS值来找出高影响力文献。对数据集中文献按I_CS排序,选取LCS在值较大的文献,从而得到该15种期刊所载的高影响力文献。表5为ICS值大于58的排名前lO的文献,可以看出,该15种期刊所载的排名前10的高影响力文献分布在Scicntomctrics期刊上,与前文该期刊在此类期刊中的排名相呼应。表中10篇文献的编号为HistCite系统自动产生,在引文编年分析中将会使用表中编号描述其所指代文献,并对其研究要点等进行阐述。
1.4 引文编年分析
对选定的图情领域重要期刊所载的文献进行引文编年分析,设置节点为30,绘制引文编年图,如图l所示。从引文编年图中可以看出图情领域LCS值排名前30的重要文献的被引情况,对这些重要文献的分析可以探测出图情领域该15种重要期刊所载文献的研究主题,内容,热点和进展等,从而有助于洞察并预测图情领域研究发展的态势和研究方向等。
根据图1可以看出,1985年发表的1020号文献为图情领域15种重要期刊所载文献中最早的重要研究文献,该文献在早期使用同被引文献对科学引文索引(SCI)数据库的聚类实验的基础上,提出结合小数引用计数和可变的水平聚类两种方法将有助于提高绘制聚类科学图谱的准确性。1986发表的1155号文献指出不同科学领域文献出版和引文习惯上的差异,阻碍了跨领域的科学计量学指标的建立,但可以构建特定科学领域的出版和引文参考标准的相对指标,从而对科学家、机构、国家等进行比较评估。1996年由MacRobertsMH和MacRobens BR发表的1278号文献用两种不同的方法研究了引文分析中的重要问题,对传统引文分析认知中的问题如无引证影响,反复引证,二手引证和自引等进行总结和实证研究,对比研究了不同科学观念下的引文分析问题。
图情领域15种重要期刊所载文献中的重要文献主要出现在2000以后。2458号文献研究了化学领域国际作者共现与引文影响的关系,并发现国际合著比纯粹本国论文具有更高的被引率;同时该文献提出了一个代表不对称的合著链的新指标来揭示共同合作的“吸引力”和“排斥”的中心。2503号文献参考了2458号文献的研究视角,研究了国际科学合著关系中的民族特色,同样发现国际合著比纯粹本国论文具有更高的被引率,此外还发现国际合作的影响在不同的国家之间引证影响具有一定的差异。2843号重要文献运用交叉引用矩阵可视化研究期刊影响因子和其他期刊引证评价方法的构建,讨论了科学期刊引用影响力的单一或复合测评方法的优势和不足。7655号文献在参考2843,4483及4312等重要文献研究成果的基础上,综述了h-指数及其相关指数的有关研究,对h-指数的优缺点及其特性等进行剖析,并研究了h-指数在不同科学领域的应用,计算了不同数据库下科研产出的h-指数。8551号文献参考2843号文献研究视角提出了期刊引文影响的测度指标一源标准化论文影响力指数,该指数考虑了期刊不同主题的特性,测度了期刊文本的引文影响力。
3080号重要文献设计了用于科学计量(评估)社会科学和人文科学领域及其子领域的两级分级系统,并阐述了系统相关概念和部分初步实验结果。5455,5299,4297号文献都对该文献进行了引证,其中,5455号文献还参考了4315和4359号文献的研究成果,实例验证了基于h-指数的期刊h-指数理论模型。5299号文献在3080号文献的研究思路下,研究了用于引文率计算的指标问题,提出了z一分数引文指标,该指标给每个出版物分配相等的权重,并考虑不同领域引文率的变化以及以引用出版物的偏态分布问题。同时参考3080和2503号文献的4297号文献研究了出版物发行与其引文影响之间的演进关系,对出版物和引用模式的趋势以及国家出版物的配置文件展开分析以期在拉丁美洲区域中查找国际合著与研究配置文件和引文影响之间关系的统计证据。
2005年和2006年间出现了较多排名前10的高影响力文献,且主要集中在2006年,其文献编号包括:3698,3723,4312,4315,4483和4311。其中,3698号文献基于自然科学和社会科学期刊,重构了类似地图制图的科学结构的新图谱,并基于科学引文和社会科学引文综合索引文献,提供了8种可供选择的评估期刊相似度的方法。而3723号文献研究了h-指数有效性问题,并在对委员会同行审议的研究中发现,在平均水平上成功申请博士后研究奖学金的人科研产出h-指数高于非成功申请的。4483号文献参考3723号文献的研究观点,进一步研究了用于评价科研工作者的h-指数问题,并指出h-指数依赖于其评估的科研领域,因此该文献对提出了一个互补指数ht-指数。并指出了ht-指数在对比评估不同科研领域产出时的优势。4315号文献参考3723和4483号的研究主题,基于h-指数和期刊影响因子对比分析其对期刊的评估作用。4311号文献在考3723和4359号文献研究思路的基础上,通过源项术语对应用于信息计量学研究中与的h-指数进行了模型扩展和研究,并指出在每个信息生产过程中都具有独特的h-指数。其中,4359号文献通过概率分布模型研究了h-指数的基本特性,并根据帕累托分布发现文献及其引文之间的关系,并得出h-指数具有明显的数学特性。而LCS值最大的4312文献参考4359号文献研究成果,引进了g-指数,并对其理论及其应用进行了阐述,其中g-指数是对h-指数的改善,是用来测度一组文献全球引文表现的指数。其他重要文献,如文献编号为4713,4153和5457号文献分别从不同角度研究了科研评价问题。4713号文献研究了期刊排名中的相关问题,对比研究了网页排名算法和ISI期刊影响因子对期刊的排名效果,引进了结合网页排名和期刊因子的Y一因子对期刊进行排名。4153号文献对人文社科中研究成果进行了文献计量分析,概述了(基本)科学和人文社科之间的出版物和引用行为的主要区别。5457号以西班牙科学研究委员会科学家为研究对象,文献参考了编号为4483、4315、3723、4359和4312等多篇文献的研究成果,从宏观角度研究了h-指数与其他文献计量指数的关系。endprint
其他重要文献如5784号文献对关于科学家引证行为的研究文献进行了综述,并提出了“引文改善重要措施”这一重要议题。8565号文献参考了1155和3698号文献研究思路,进一步对科研绩效评估常用的归一方法和手段展开阐述和说明,并实例验证了莱顿标准化的效果。9239号文献在参考多篇研究文献成果的基础上,检验了皇冠指标标准化机制的理论基础,指出新标准化的机制具有较高的性能,并准备提出基于新标准化机制的皇冠指标。
从对以上重要文献的分析可以看出,图情领域的研究重点关注对科学研究的计量分析和评价等问题,包括对科学合作的研究,科研评价指标的研究等。从最初关注科学引文相关问题到关注科研评价指标及机制的构建,经历了科研评价的方法的应用研究——方法理论改善——新评价手段提出——新评价手段体系构建和完善的发展历程。从历年重要文献的分析中可以看出,图情领域的研究在研究主题和内容逐渐深入和发展的过程中,文献之间的引用关系也逐渐紧密,并逐渐形成多支研究演进路径,如1155→8565→9239、3080→529→9239、3723→4315→5455→7655和3723→4359→4312→5457→7655等。
1.5 研究热点分析
研究热点分析可以探测某研究领域的研究态势和发展动向。词频分析法是利用能够解释或表达文献核心内容的关键词在科研文献中出现的频次,来确定某科研领域研究的热点问题。选取词频大于200的关键词制作高频关键词词表,如表6,对图情领域15种重要期刊所载文献利用词频分析法进行研究热点分析。
在高频词词表中词频大于1000的关键词可得,该15种重要期刊的主要研究是围绕着信息和图书馆展开的,在一定程度折射出这些期刊之所以是图情领域的重要期刊,与其期刊主题和该领域科研主题的高度相关性密切相关。根据词频大于400小于1000的关键词分析得出,该15种重要期刊的研究热点包括科学、学术、图书馆、互联网、数字化、引文、影响和知识等关键词代表的研究方向和内容。从词频大于200小于400的关键词可以总结出图情领域重要期刊所载文献涉及管理、技术、社会学、文献计量、联机、数据、指数、国际化、合作、指标、评估和绩效等关键词代表的研究主题。
对高频关键词进行聚类分析科研进一步探究高频关键词所代表的的研究方向和特点,从而更好地把握研究主题的研究热点和发展态势。利用SPSS软件,对表6中的高频关键词进行聚类分析,可以得到如图2所示的高频关键词聚类图。
由图2可知,高频关键词可以分成3大类,8小类。第一大类包括序号为1,2,3的关键词,其中,2和3又可以被归为一小类,1为单独小类。第二大类包括序号为4~28的关键词,其中序号4~6的关键词可以分为一小类,7~10为一小类,11~17为一小类,8~28为一小类。同理其他序号所代表的的关键词被分为第三大类,同样可以被分为两小类。结合表9和聚类分布可知,上文根据词频大小的展开分析具有合理性和可行性。同时,由各分类可以看出各类组内关键词所代表的研究主题和热点。如第一大类的关键词information、hibrary和research表明了图情领域研究的核心主题是对信息科学和图书馆的研究,第一大类下的酬、类又表征了图情领域的研究与图书馆研究紧密相连,与信息科学的高速发展密切相关。第二大类关键词如sci-ence、libraries、technology、social、management、services、ci-tation、web、academic等揭示了图情领域的主要研究主题和热点。第三大类关键词如Intemet、data、index、approach、collaboration、international、public、indicators、assessment等反映了图情领域的基本研究点和内容,其中各小类热点反映了不同的图情领域研究方向和发展动向。
1.6 研究前沿分析
通过对突变词语的提取可以实现对研究前沿的侦测,即利用其内嵌的Find BurstPhrases算法功能,将出现频次快速增加的专业术语(即突变词语)确定为研究前沿术语[驯。利用Cite.SpaceⅢ软件提供的突变词提取功能,获取2004~2013年10年间图情领域研究文献的突变词及其词频以便探究图情领域的研究前沿及其未来可能的研究方向。突变词运行结果共得到131个突变词,并选取突变率大于4的前沿术语进行分析,如表7所示。
由突变词分析可以看出,2004-2013年间,图情领域研究出现了较多的前沿术语,紧紧围绕着图书馆和信息科学两大主题,并与不同时代背景下科学研究发展的紧密相连。在2004-2005年图情领域研究的研究前沿有information-management,web-pages、knowledge-management、science-citation-index、scientific-information、basic-research、re-search-field和molecular-biology等,而这些前沿术语表现了图情领域研究在时代发展下的巩固与创新,同时与当时计算机科学和分子生物学等科学研究的发展与应用密不可分。2006~2008年全球信息化进入全面发展和应用阶段,诸如web-site、institutional-repositories、digital-age、infor-marion-science-research、information-policy、joint-use-li-brary、digital-library、information-needs等前沿术语称为图情领域的研究前沿,可见图情领域研究发展与信息爆炸的时代背景具有密切关系。同时也可以看出随着社会的发展,图情领域的研究也开始注重对用户需求的满足,从用户的角度提升和体现图情研究的价值,并促进图情研究的发展。2009-2012年出现的突变词如social-media、public-library、journal-impact-factor、prison-library、citation-network、so-cial-implications、parliamentary-library、crown-copyright、preservation-program、research-library和personal-knowledge-management等都反映了时代发展背景下,图情领域研究在对自我价值进行提升和探索研究,注重挖掘其对社会需求和发展的满足以及推动作用。
2、结论
对图情领域15种重要期刊进行量化分析可知,图情领域研究与科学研究和社会的发展具有紧密的关联性。一方面,对传统的图情研究进行思辨和创新,从最初对科研文献的分析及其研究手段的改善到对构建完善的科研评价指标体系,经历了传统研究方法的应用——方法理论改善——新评价手段提出——新评价手段体系构建和完善的发展历程。另一方面,随着社会和科学的发展,越来越多的其他领域的技术和研究方法被引用与图情领域的研究中。并围绕图书馆和信息科学两大主题逐渐展开其对社会需求的满足和科学进步的促进等存在价值的挖掘和提升的研究。
在对图情领域重要期刊进行地区和机构分析时发现,美国和英国为这些期刊所载文献的重要来源国家,我国研究者在所分析期刊上的发文量不高,但我国学者所发文献的学术水平和参考价值较高。这一方面反映了国外图情领域重要期刊主要刊载以英语为母语的国家其学者的研究文献,在一定程度上为我国科研评估现状的改善提供参考性思路;另一方面,从侧面反映了我国图情领域研究者的研究对图情领域的发展具有推动和促进作用,在一定程度上可以成为我国图情领域研究者的研究方向和动力即更好的挖掘其对科学和社会发展的促进作用及其自身价值的提升。
图情领域的早期发展与文献的收集、整理和利用具有紧密联系,信息时代的到来大大推进了图情研究发展的进程,不同发展阶段下的图情领域的研究具有不同的主题和研究特色,但是不同时代背景下的图情研究的目标即推动社会发展和进步总是相同的。在当今科技高速发展,信息爆炸式增长的背景下,如何更好地深入挖掘图情研究自身的价值,如何与其他领域科学技术手段相融合,提高信息优化能力,提高信息资源的有效利用,提高信息服务水平等是图情领域未来可行的研究法方向。此外,除了对科学研究进行评估,对信息进行整合和优化,图情领域研究者还可以关注时代发展背景下,图情领域与其他科学研究在研究方法、手段、技术和理论上的融合,突破图情领域研究思维定式,将是未来图情领域可行的研究方向和突破点。endprint