科学合作与论文影响力之间的相关性研究
2019-04-20杨瑞仙李贤
杨瑞仙 李贤
摘要:[目的/意义]随着科学研究综合性逐步加强,合作日渐成为主流的科研方式。通过对科学合作和论文影响力之间相关性进行研究,以探究科学合作是否对论文影响力存在着提升作用。[方法/过程]本文基于JCR的期刊数据,在Web of Science核心合集中选取了复合材料、图书情报和科学史与科学哲学领域2009-2012年的发文和被引数据,借助多元统计软件SPSS210和社会网络分析软件等从作者、机构、国家等3个层次研究科学合作和论文影响力之间的相关关系,进而以高被引论文为研究对象探寻最佳的合作规模。[结果/结论]在不同的学科中,作者合作、机构合作和国家合作均与论文影响力呈显著的正相关关系,但科学合作的边际效益不同。科学合作的规模不可能无限扩大,最佳的作者合作规模为2~4人,最佳的机构合作规模为1~3个,最佳的国家合作数目为1~2个。
关键词:科学合作;论文影响力;固定引文窗口;相关性研究;最佳合作规模
DOI:10.3969/j.issn.1008-0821.2019.04.015
〔中图分类号〕G30〔文献标识码〕A〔文章编号〕1008-0821(2019)04-0125-09
The Correlation Study of Scientific Collaboration and the Influence of Paper
Yang Ruixian1Li Xian2*
(1.School of Information Management,Zhengzhou University,Zhengzhou 450001,China;
2.Medical College,Zhejiang University,Hangzhou 310058,China)
Abstract:[Purpose/Significance]As the comprehensive trend of scientific development is gradually strengthened,scientific cooperation has become an increasingly popular method.Through the study of the correlation between the scale of authors and the influence of the thesis,we can find whether the influence of paper is beneficial from cooperation.[Method/Process]Based on the data of journal of the JCR,the paper retrived from the Web of Science and get all the papers and citation in the field of materials science,composites,information science and library science and history & philosophy of science from 2009 to 2012.And it studied the correlation between collaboration and the influence of the paper with the help of multivariate statistical software SPSS210 and social network analysis software in the case of authors,affiliations and country.Furthermore,it explored the best scale of cooperation with highly cited papers.[Results/Conclusions]In the fields of materials science,composites,information science and library science and history & philosophy of science,author cooperation,institutional cooperation and international cooperation were all positively related to the influence of the paper,but the marginal benefit of scientific cooperation was different.The scale of scientific cooperation could not be expanded indefinitely.The best cooperation scale of the authors is 2~4,institutional cooperation is 1~3,and national cooperation is 1~2.
Key words:scientific collaboration;influence of paper;fixed citation window;correlation study; the best cooperation scale
隨着科学发展的不断推进,科学研究问题越来越复杂,专业化分工趋势也愈发明显,单打独斗的科研模式显得捉襟见肘。因此,科学家向外寻求帮助,集中不同成员的智慧共同解决问题,科学合作逐渐成为多数科学家首选的科研模式。在大科学时代,科学合作主要有3种形式:科学家之间的合作、科研机构之间的合作以及国家之间的合作。然而并非所有合作模式都是有效的,因此,需要通过论文影响力来判断不同合作模式的有效性。从整体来看,目前评价论文影响力的方法主要是同行评议和以计量为基础的评价方法,但由于同行评议方法本身的要求,导致这种方法主观性较大,结果难以控制。所以,本文采用以计量为基础的评价方法来测度论文影响力,使用论文被引频次作为论文影响力的衡量指标,并提出如下假设,通过实证研究验证假设是否成立。
H1:作者合作及作者人数与论文影响力呈正相关;
H2:机构合作及机构数目与论文影响力呈正相关;
H3:国家合作及国家数目与论文影响力呈正相关;
H4:上述假设在不同的学科中存在着差异。
1相关研究综述
17世纪60年代,首个无形学院成立[1],学术群体之间的合作联系开始兴起。随后,科学合作的迅猛增长引起了科学家们的广泛关注和研究兴趣。从目前来看,科学合作的相关研究主要集中在科学合作规律探寻和科学合作绩效评估两个方面。
11科学合作规律探寻
国内外学者对科学合作规律的探寻主要是采用定量分析的方法来研究科学合作的比例和科学合作呈现的趋势。1963年,DJ Price[2]分析1910-1960年化学领域的论文发现,50年内作者合作比例从不足20%增长到60%以上;1968年,HA Zuckerman[3]统计24 297篇美国期刊论文后发现,20世纪以来科学合作的比例每25年增长约25个百分点;1996年,W Glnzel等[4]分析了SCI数据库中的4 534篇论文,结果显示90%以上的论文为合著论文,且篇均作者人数为45人;2013年,王贤文等[5]对中国的国际间合作情况进行研究,结果表明中国国际合作日益频繁,合作对象多为北美和欧洲国家。
除对科学合作的比例进行研究外,还有对科学合作趋势的研究。1968年,RK Merton[6]从知识交流和科学奖励等方面发现科学合作中存在着明显的“马太效应”;1994年,JF Miquel等[7]从8个学科对98个国家的国际合作、国家间关系和科学产出模式3个方面进行调查,进而揭示不同国家存在着不同科研行为;2000年,ME Newman[8]调查了医学、物理学和计算机科学3个领域的科学合作网络结构,发现“小世界”效应十分显著;次年,ME Newman[9-10]再次從网络结构、最短路径和中心度等方面对科学合作网络展开研究,将科学合作网络加权之后,可以在网络中发现与其他节点平均距离最近的节点;2002年,我国学者梁立明等[11]利用CSCD数据库揭示了我国学者跨省区合作对象会倾向选择科学生产能力高的地区;2004年,丁堃等[12]对我国管理科学领域合作规模、地域分布和第一作者年龄分布做了调查,结果显示在管理科学领域小范围的合作会更加容易产生创新性思维,合作范围集中在同单位,第一作者的平均年龄为3579,年轻化趋势明显;2013年,杨思洛等[13]又对中外图书情报领域合作强度、合作范围与合作网络等展开细致地比较,发现在合作强度上国内合作略高于国外,主流合作模式是同城合作,合作网络均呈现出集中分散的态势;2017年,丁颖等[14]研究科学合作参与者的研究差异对论文整体影响,结论显示跨领域合作可以提倡,但是不应过度。
12科学合作绩效评估
科学合作绩效评估研究主要集中在两个方面,分别是科学合作与论文生产力之间的关系、科学合作与和论文被引频次之间的关系。1966年,DJ Price等[15]对555名作者的合作关系和生产力之间的关系进行研究,发现两者呈正相关;1980年,P Hodder[16]分析了机构合作数量与论文产出之间的关系,结果表明两者存在着倒U型关系,即存在着最佳的机构合作数目;2001年,A Hollis[17]通过339位经济学家的面板数据来评估科学合作和科研产出之间的关系,发现在科学合作和论文产出之间呈现负相关,在此基础上,A Hollis又深入分析了出现负相关的原因,包括合作团队工作的低效、团队成员之间的信息不对称等问题。相对而言,国内学者对此也做出了一些积极的探索。2007-2012年,刘则渊等[18-19]以威布尔分布和核密度分布曲线分别对Web of Science中物理学和分子生物学的合作规模和产出关系进行拟合,结果发现核密度曲线的拟合程度较高;2017年,刘俊婉[20]发现分子生物学、遗传学和物理学领域的高被引科学家中,合作者的论文数量呈负指数函数分布,且随着合作者数量增多,论文产出量也随之增多。
在科学合作和论文被引频次之间的相关关系研究方面,1972年,Arthur E Nudelman等[21]通过问卷调查对美国、加拿大225名社会学专家进行分析,结果显示,合作研究比独著具有更高的学术声誉;1986年,SM Lawani[22]对癌症领域的论文进行研究发现,随着作者人数的增加,高质量论文的比重上升,自引总比重下降;1990年,F Narin等[23]也发现多国家合作论文被引频次约为单个国家的2倍;2001年,W Glnzel等[24]发现化学领域有相当比重的国际合著论文被引量小于样本的平均水平,并形象地称之为“冷链”;2010年,M Franceschet等[25]以3人为单位对合著作者进行分组,按照被引频次在整体样本中分布将论文质量划分为4个等级,并以此来研究作者合著规模和被引频次之间的关系,表明小规模的合作是较为有效的;2013年,钟镇[26]将作者人数窗口变为1人,并以相应人数窗口下的篇均被引作为论文影响力的衡量指标考察图书情报领域中作者合著和论文被引频次之间的关系,结果显示4人是最佳的合著规模;2014年,林卉[27]通过社会网络分析法来探讨生物信息学领域机构合作对论文影响力之间的相关关系,发现机构数目为5个、国家数目为6个是最佳的合作规模。
13相关研究的不足之处
通过对相关文献的梳理和总结,我们可以看出现有研究还存在以下不足:1)论文影响力的测量指标比较混乱,现有的研究对论文影响力的测量方法大多为同行评议和论文的篇均被引,而且没有消除引用时间长短对论文被引频次带来的累积影响;2)科学合作的外延定义较小,目前对科学合作的研究主要是从作者合作展开,少量的成果涉及到机构合作和国家合作;3)研究样本多局限于某一学科领域或者某一期刊,其研究结论不具有普遍实用价值。因此,本文是相关研究的基础上,明确论文影响力测量指标,扩大科学合作外延,选取多学科领域的样本,研究科学合作和论文影响力之间的关系,分析科学合作是否对论文影响力存在着提升作用,以期为学者探寻最佳的合作模式提供参考。
2数据来源和研究方法
21数据来源
本研究的数据来源为WoS核心合集,选取了复合材料(Material Science,Composites)、图书情报(Information Science & Library Science)、科学史与科学哲学(History & Philosophy of Science)3个学科的数据,这3个学科分别是理工科、社会科学和人文科学的代表。考虑到论文的被引频次需要时间的累积,因此本文选取了距今至少有5年的发文及其被引数据,即3个学科2009-2012年分别被JCR收录的期刊及其发文和被引数据。从检索结果来看,Review类型的文章多为独著,且被引频次较高,容易对实验产生较大的影响,所以被排除在外,仅收集文献类型为Article的数据。检索时间为2018年1月13日至2018年1月19日,共得到39 399条记录,其中复合材料10 456条,图书情报12 202条,科学史与科学哲学5 822条,如表1所示(括号中数字代表当年JCR收录的期刊数量)。
22研究方法
为消除引用时间长短对实验结果的干扰,本研究使用5年固定引文窗口的被引频次作为论文影响力的衡量指标,即仅统计论文发表之后5年时间的引文数量。笔者首先将题录信息导入Excel表,统计每篇论文的被引频次。在假设验证部分,采用Excel和SPSS210作为数据统计和分析软件,首先对作者人数、机构数目、国家数目的分布情况进行统计,分析论文的合作情况;进而利用SPSS210分析作者合作、机构合作、国家合作与论文影响力的相关性关系,验证本研究中提出的假设;根据科研成本控制中的成本效益原则[28],科学合作规模不可能无限地扩大,因此,笔者分析高被引论文中作者、机构、国家的合作情况,以此來发现最佳的合作规模。
本文将机构界定至二级单位,但确定机构的过程较为复杂,出现了以下3种问题:1)一篇论文的同一作者属于不同的单位;2)部分数据不存在C1字段,无法直接提取出作者所属的单位名称;3)少量的论文作者署名为匿名(Anonymous)。针对上述问题,笔者制定了对应的处理措施:1)若一篇论文的同一作者属于不同的机构,笔者只选取排名第一的单位名称作为论文作者所属的机构,这也就意味着独著作者只存在着一个机构;2)部分数据不存在C1字段,对此,笔者根据记录的TI字段重新检索,使用论文Online链接原文网站提取论文信息、通过论文原文的作者简介匹配作者的机构名称、使用ORCID与ResearchID追踪作者在论文发表时的所属机构3种方法,解决C1字段缺失的问题;3)少数论文作者署名为匿名(Anonymous),这种情况无法确定论文作者的具体信息,但这种情况较为少见,且均为独著,所以对实验结果影响较小。
3结果分析与讨论
31描述性统计分析
根据数据统计结果,表2~4分别是复合材料、图书情报、科学史与科学哲学领域(学科顺序下同)作者人数、机构数目与国家数目的分布情况。由表2可以看出,3个学科的合作情况差别较大,复合材料、图书情报的合著率分别为941%、679%,合作比例较大,但科学史与科学哲学的合著率仅为237%,这与人文学科的学科特点有关,人文学科研究个人见解比重大,个性化较强,不适合做集体研究[29]。但综合比较3个表发现,相对于作者合作,机构合作和国家合作水平仍然处于较低的水平,这说明了科学家倾向选择同一机构或者同一国家的合作伙伴。除此之外,笔者分别考察了论文数目随作者、机构、国家的变化情况,发现论文数目与作者、机构和国家的变化情况大体上符合洛特卡定律[30]。
32科学合作与论文影响力相关性分析
在分析科学合作与论文影响力之间的相关性之前,笔者首先检验被引频次不符合正态分布,所以在分析科学合作与论文影响力相关性使用Spearman系数。
321作者合作与论文影响力相关性分析
作者人数的增加,通常意味着团队智慧的增长。为了分析作者合作和论文影响力之间的相关关系,本文使用0~1虚拟变量来代替论文独著和合著,表5是虚拟变量独立样本t检验结果,结果显示,3个学科合作论文的影响力均显著大于非合作论文。在此基础上,笔者考察作者人数和论文影响力之间的相关关系,结果如表6所示。由此可见,在上述3个学科中,作者人数和论文影响力显著的正相关关系,假设1成立。
322机构合作与论文影响力相关性分析
从机构层面分析科学合作与论文影响力之间的相关关系,笔者仍采用独立样本t检验和双变量相关分析,分别从平均水平和整体水平来分析机构合作对论文影响力之间的关系。表7是机构独立样本t检验的结果,多机构合作论文的篇均被引要显著大于单机构论文。表8是具体考察每篇论文的机构数目和论文影响力之间的相关性检验结果,结果表明上述3个学科机构数目和论文影响力也均呈现出显著的正相关关系,假设2成立。
323国家合作与论文影响力相关性分析
基于提取的论文国家数据,构建国家之间合作矩阵,其中中国大陆与中国台湾地区的合作不视为国际合作,从共现矩阵结果来看,科学合作大多发生在同一国家内。笔者对国家合作和论文影响力的相关性分析,仍从平均水平和整体水平两个方面展开,表9、10分别是国家数目和论文影响力独立样本t检验结果和相关性检验结果,表9的结果表明,从平均水平来看,多国家合作的论文影响力要显著高于单国家完成的论文,表10的结果说明在整体水平上论文影响力与国家数量呈现出显著的正相关关系,假设3成立。
33高被引论文科学合作情况
上述分析结果表明,科学合作与论文影响力之间的正相关关系显著成立,但根据科研成本控制的成本效应原则[28],科学合作的规模不可能无限扩大。因此,本文在相关性分析的基础上,进一步以高被引论文为研究对象来探寻最佳的合作规模。