外文参考文献与学术期刊影响力的关系*
2020-01-09俞立平张再杰
俞立平,张再杰
0 引言
知识进步是基于前人的研究结果,典型体现是在论文的参考文献中。参考文献是学术成果的重要组成部分,是作者撰述时参考其他论著思想的语句,体现了学术研究的继承性和规范性。参考文献可以用于衡量期刊的学术水平和创新程度,展现学术期刊的学术地位及其知识整合能力。中国中文学术期刊多,北大核心期刊2014版共收录中文核心期刊1,982种,来源期刊更高达12,400多种。这些期刊论文均采用中文,其中的参考文献多以中文为主,但部分也参考了非母语的文献。在一定范围内,作者如果能更多地跟踪国际最新研究成果,对提高论文质量具有重要作用,进而会提高论文的影响力。对学术期刊而言,如果能够充分引用外文文献,会对学术期刊质量和影响力产生影响。探究中文学术期刊引用外文参考文献数量与影响力的关系,对提高学术期刊质量具有重要意义。
不少研究关注了期刊的参考文献语言和数量问题。Böttiger[1]研究了英语、法语、德语和瑞典语4个语言地区7种医学期刊的8,251条参考文献,发现篇均引用文献13~27条,英语参考文献占91%。Winkmann等[2]基于SCI数据库1995-2000年出版文献,发现53%德语论文和45%英语论文引用了德语期刊论文。Pardo 等[3]分析1985-1994 年622 篇西班牙护理研究论文的参考文献,发现篇均参考文献数量随着时间增加而增加,西班牙语占60.3%,英语占36.1%,且英语参考文献有所增加。Muñoz-Soler等[4]对6种西班牙语护理期刊(2000-2002)和2种英语护理期刊(2000-2001)的796篇文章进行研究,发现西班牙语护理期刊的平均参考文献数量最少,英文参考文献数量最多,说明西班牙语护理期刊的科学性虽然有所提高,但是其英文文献的低引用率清晰地揭示了其研究的孤立性。
关于中文论文引用外文的研究也有一些成果。学者更加喜欢引用母语撰写的文章[5-6],这一点对中国学者而言可能更是如此。Shu等[7]发现中文论文与大部分非英文论文一样存在引用偏好。Li等[8]认为与英文相比,中文文章不存在引用偏好,但对引用非中文论文有偏见。邓三鸿等[9]基于2003-2007年CSSCI引文数据图书馆情报与文献学期刊研究,发现情报学类期刊引用外文期刊较多,图书馆学类和档案类期刊相对较少,说明研究内容本土特征明显,学术活动相对保守。王安萌[10]统计《大学图书馆学报》的外文参考文献,发现有5,752条,占参考文献总数32.34%,外文参考文献比率较高,表明我国图情学界吸收国外知识的能力得到了提高。
目前关于参考文献与期刊影响力关系的研究不多。Biglu[11]研究SCI中参考文献数量对影响因子的影响,发现在期刊引证报告(JCR)中,期刊的影响因子和参考文献总数之间呈显著的正相关。Campanario[12]研究JCR期刊的参考文献对2年和5年期刊影响因子的贡献,发现同期参考文献与影响因子都呈现出相似的分布与高峰。Araújo等[13]提出新的科学计量指标——引文h指数,即至少有h 篇论文的参考文献数量大于h,并用巴西运动与体育科学领域拥有博士学位研究人员的论文数据进行验证,发现研究人员的h指数和引文h 指数相关,但相对最高产的研究者,这两者之间并不相关。葛赵青等[14]基于《中国科技期刊引证报告》2000-2013年的数据,研究发现篇均引文量与平均总被引频次呈现良好的线性关系,与平均影响因子呈现较好的三次多项式关系。
从现有研究看,英文是国际学术界交流的主要语言,非英文论文难以获得更广泛的引用。对德语、法语、西班牙语、瑞典语论文的参考文献,英文文献也占据重要地位。在中文论文的参考文献中,英文文献也具有越来越重要的作用。从分析方法看,除了采用外文参考文献数量与比例外,缺少其他更深入的指标。一些学者开始研究参考文献数量与期刊影响力的关系,但较少研究外文参考文献数量与期刊影响力的关系,研究方法也主要采用回归分析为主。
本文对中文学术期刊引用外文参考文献与期刊影响力关系进行分析,除传统的篇均外文参考文献数量、外文参考文献比两个指标外,提出两个新的指标:外文参考文献h指数、高外文参考文献比例,并以CSSCI中收录的图书馆情报与文献学期刊为例,基于偏最小二乘法,研究引用外文参考文献与期刊影响力之间的关系,并对外文参考文献指标用于学术评价进行讨论。
1 理论与方法
1.1 引用外文参考文献与期刊影响力的关系
无论从学术论文角度还是从学术期刊角度,外文参考文献对学术期刊影响力均具有重要作用。外文参考文献对期刊影响力的关系见图1。一方面,中文作者阅读英文文献,能较好地把握研究热点,提高论文影响力。任何学科领域总有研究热点,研究热点相关论文总是容易取得较高的关注和引用,这些论文绝大多数发表在英文国际期刊上。如果中文论文作者养成经常阅读英文文献的习惯,会受到研究热点吸引,并与自己的研究方向相结合开展相关研究,因为研究的是热点相关领域,所以中文论文发表后容易被他人引用,提高中文论文的影响力,这是一种直接效应。另一方面,中文作者阅读英文文献,能提高中文学术论文质量,进而提高影响力。中文论文的作者如果能够大量阅读相关外文文献,能较好地把握全球学科知识前沿,拓展知识吸收的宽度与深度,启迪思维,规范研究方法,更好地进行创新,从而提高中文论文质量,而论文质量的提高也会吸引更多中文论文读者和作者阅读论文,使得论文被更多地引用,从而扩大论文影响力,这是一种间接效应。当然,由于研究领域不同,学科不同,不同类论文引用英文文献对论文质量的提升效应也有差异。一般而言,阅读英文参考文献对自然科学的论文质量提升作用更大。(3)从学术期刊角度看,鼓励广大作者阅读和引用外文参考文献,有利于提高期刊影响力。加强中文论文中外文参考文献的引用,会释放出积极信号,形成学习效应,促进作者多读并引用外文文献,有助于提高期刊的创新水平和学术质量。
图1 引用外文文献与影响力关系
1.2 外文参考文献h指数与高外文参考文献比例
本文选取4个外文参考文献指标进行相关研究:篇均外文参考文献量、外文参考文献比、外文参考文献h指数和高外文参考文献比例。篇均外文参考文献量是期刊平均每篇学术论文的外文参考文献数量,外文参考文献比是外文参考文献数量占所有参考文献数量的百分比。此外,本文还提出两个新的外文参考文献指标:外文参考文献h指数和高外文参考文献比例。外文参考文献h指数是在Hirsch[15]建立的h指数基础上提出的,中文期刊的外文参考文献h指数,简单地说就是指至少有h篇论文引用了h篇外文参考文献。其计算方法是,将中文期刊某个时间段所有论文的外文参考文献数量由高到低排序,确定有h篇论文的外文参考文献数量至少为h篇计算而得。高外文参考文献比例就是指中文期刊中,外文参考文献数量大于或等于外文参考文献h指数的引文比重,是衡量期刊引文国际化高端水平的一个指标,其原理如图2所示。
图2 高外文参考文献比例原理
假设中文学术期刊在研究区间内一共有n篇论文,将每篇论文的外文参考文献数从高到低排序形成一条离散的曲线f(i),虚线为45度,其与f(i)交叉点的横轴与纵轴坐标均为h,即外文参考文献h指数。将外文参考文献分成两个部分,大于等于外文参考文献h指数的部分称为高外文参考文献区,如图2中阴影部分所示,面积为S1;小于外文参考文献h指数的部分称为低外文参考文献区,面积为S2,高外文参考文献比例Z为:
其中,C表示期刊某个时间段所有论文的外文参考文献数之和,表示高外文参考文献数之和。
1.3 偏最小二乘法
本文探究中文学术期刊外文参考文献与影响力之间的关系,由于涉及外文参考文献的变量有多个,而衡量期刊影响力的指标也有多个,且外文参考文献变量之间、期刊影响力变量之间也存在高度相关关系,采用传统的回归分析就不合适,也难以解决变量之间的多重共线性问题,如果采用相关分析又过于简单,导致研究不够深入,因此,本文采用偏最小二乘法研究中文期刊外文参考文献与影响力的关系。
偏最小二乘法(PLS)是由Wold等[16]提出的一种数学优化算法,它将多元线性回归分析、典型相关分析和主成分分析相结合,因此其分析结果较合理,而且能得到更加丰富、深入的信息。特别当因变量个数较多且相互关联而观测数据较少时,相较于传统的经典回归模型等方法,用偏最小二乘法建立的回归模型更优。
关于论文影响力指标的选取,本文重点以影响较为广泛的影响因子和h指数来进行分析,研究这两个指标与外文参考文献h指数以及高外文参考文献比例之间的关系。
2 变量与数据
为研究中文学术期刊外文参考文献对期刊影响力的影响,本文以图书馆情报与文献学CSSCI期刊为例来进行研究。目前CSSCI图书馆情报与文献学期刊共20种,由于《情报学报》的数据存在部分缺失,故将其删除,只采用19种期刊进行评价。关于外文参考文献变量,采用篇均外文参考文献量、外文参考文献比、外文参考文献h指数和高外文参考文献比例4个变量。关于期刊影响力变量,由于基础数据处理工作量过大,仅选取影响因子、h指数2个变量。所有数据来自于中国知网CNKI引文数据库,计算相关变量时,来源文献选自2014-2015年2年数据,被引数据为2016年,这样保证所有变量数据的时间区间标准一致。
表1为原始数据。本文统计数据时,论文全部选取学术论文,删除新闻报道、会议综述、书评等内容。对外文参考文献的定义是非中文引文,即参考文献是用中文标注的即算作中文引文,即使是外文文献,一旦翻译成中文出版并被作者引用,也不算外文参考文献。外文参考文献以英文为主,但也包括少量的日文、俄文、韩文等外文。
表1 期刊基础数据统计表
2014-2015年中国图书馆情报与文献学19种学术期刊共发表10,700篇中文论文,共引用参考文献155,355 条,篇均参考文献14.52 篇;共引用外文参考文献55,927篇,篇均引用外文文献5.23篇。变量描述统计见表2。
表2 变量描述统计
3 实证结果
3.1 变量之间的相关系数
外文参考文献变量与期刊影响力变量之间的Pearson相关系数如表3所示。篇均外文参考文献量与影响因子的相关系数最高,为0.698,属于较高水平;高外文参考文献比例与影响因子的相关系数为0.487,外文参考文献比与影响因子的相关系数为0.470,属于中等水平;外文参考文献h指数与影响因子的相关系数为0.304,但没有通过统计检验。再看外文参考文献变量与h指数的相关系数,外文参考文献h指数与h指数的相关系数最高,为0.846,属于较高水平;篇均外文参考文献量与h指数的相关系数为0.448,但没有通过统计检验,外文参考文献比与h指数的相关系数为0.393,也没有通过统计检验,相关水平中等;高外文参考文献比例与h指数的相关系数为-0.281,并且没有通过统计检验。
表3 外文参考文献与影响力指标相关系数
3.2 偏最小二乘法估计结果
为使得回归系数具有弹性意义,同时降低异方差,所有变量均取自然对数进行偏最小二乘法估计,解释变量比例如表4所示。随着隐含成分的增加,拟合优度R2也在不断增加,当隐含成分为3时,解释变量累计方差贡献率0.995,接近1,并且继续增加隐含成分数量对拟合优度几乎没有影响,因此最终选取隐含成分为3的回归结果,见表5。
表4 方差贡献率
表5 偏最小二乘法回归结果
总体上,外文参考文献与期刊影响因子呈中等程度的相关,拟合优度R2为0.587。外文参考文献h指数与期刊影响力的回归系数最大,其弹性系数为1.223;其次是高外文参考文献比例,弹性系数为0.945,篇均外文参考文献量的弹性系数略小,为0.931;外文参考文献比的弹性系数最小,弹性系数为0.875。引用外文参考文献与期刊影响力密切相关,其中h指数性质的外文参考文献h指数相关系数较高(见图3)。从偏最小二乘法估计结果看,与相关系数的估计结果结论也不一致,相关系数估计结果中,外文参考文献h指数与高外文参考文献比例的相对重要性降低了,这主要是由于相关系数估计是孤立地分析两变量之间的相关性,而偏最小二乘法估计更为系统。
图3 外文参考文献与期刊影响力
4 结论与讨论
(1)引用外文参考文献有助于提高期刊影响力。本文分析中文学术期刊引文外文参考文献对于期刊影响力的作用机制,认为从中文论文作者角度,较多地参考外文文献能把握研究热点,使得中文论文容易被引用,直接提高期刊影响力;参考外文文献也有利于提高论文质量,从而间接提高论文影响力。从中文学术期刊角度,作者参考外文文献能够扩宽知识广度,思考问题更全面,从而提高论文的学术质量,有助于提高中文学术期刊影响力。实证研究结果表明,外文参考文献对期刊影响力的解释水平R2达到0.587,这是非常高的水平。
(2)外文参考文献h指数和高外文参考文献比例可用于评价中文期刊。针对中文论文中外文参考文献问题,本文提出了两个新的文献计量指标用于对中文学术期刊进行评价,一个是外文参考文献h指数,即至少有h篇中文论文引用了h篇外文文献;二是是高外文参考文献比例,是指外文参考文献数量超过外文h指数的参考文献比重。实证研究表明,外文参考文献h指数、高外文参考文献比例对期刊影响力的回归系数超过了传统的篇均外文参考文献量和外文参考文献比,从而更有利于评价中文学术期刊。
(3)外文参考文献h指数和高外文参考文献比例也可供其他语言的学术期刊借鉴。本文以中文学术期刊为例开展相关研究,所提出的外文参考文献h指数、高外文参考文献比例两个指标也可以用于其他语言的学术期刊,尤其是与英语相差较大的其他国家语言的学术期刊,如日语、韩语等。受数据来源所限,本文仅仅以图书馆、情报与文献学期刊为例开展研究,但对其他学科的中文期刊,研究结论是否有相似性质有待进一步的探索。