引用视角下高影响力学术成果特征分析
——以农业工程学科为例
2022-02-18潘颖沈钰淇卢章平刘桂锋
潘颖 沈钰淇 卢章平 刘桂锋
1.江苏大学图书馆 镇江 212013;
2.江苏大学科技信息研究所 镇江 212013
引言
论文是科技创新成果的一种表现形式,是学术交流的重要载体,反映了科学研究内在的质量和水平[1]。2018年以来,中共中央办公厅、国务院办公厅等先后印发了关于深化项目评审、人才评价、机构评估等措施及指导意见,重点提到科研领域要关注“标志性、代表性成果”。2020年教育部、科技部印发《关于规范高等学校SCI论文相关指标使用树立正确评价导向的若干意见》,鼓励发表高水平、高质量,有创新价值,体现服务贡献的学术论文。为提升科学研究质量,促进更多高影响力论文产出,学界对高影响力论文的内外特征及产出规律进行深入研究。对合作数量、合作范围[2,3]、标题/摘要长度[4]、引文数量[5,6]、引用期刊质量、期刊声誉[7,8]、基金资助[9]等外部特征;对与研究热点的关系[10,11]、被引特征[12]、学科交叉[13,14],学科属性/学科演化[15],研究方法[16]等内部特征进行探索;在学科领域方面,选取太阳能[14]、图书情报[17]、植物营养学[18]、化学[19]等领域或专题进行了实证研究。
上述文献主要从单个角度开展研究,较少从多个层面对研究对象开展特征挖掘和深度对比,较少引入时间因素研究特征的稳定性,较少考虑研究成果类型对特征的影响。综述型和研究型论文在性质、写作要求等方面有较大差异,应该区分研究。特征的量化数值是一个范围,与群体相比,需要从时间维度研究特征的稳定性。知识储备是科研创新的前提和基础,文献是“为记录知识的各种载体的统称”,阅读文献是研究人员获得和聚积知识的重要途径,对研究成果有着积极的启发意义,被引用文献在一定程度上反映了论文的理论基础和知识构成[20]。文献的时间、数量、来源等侧面反映所记载知识的新旧、所属学科、体量、是否可靠稳定等情况。从引文角度,采用文献计量学可以在一定程度上分析所吸收知识、信息的时间、学科、来源等特征与论文影响力的关系。本研究以农业工程学科研究型论文为例,从引文视角开展高、低影响力论文的对比分析,探索高影响力论文对知识收集、吸收、采纳的偏好特征,同时引入时间维度,考察特征的稳定性,为在知识吸收层面促进科研成果质量提升提供参考。
1 研究框架与数据来源
1.1 研究框架
引文是研究人员在其发表的论文中所列出的参考文献,反映了科研人员在科研过程中对以往不同类型知识的参考。如何参考知识,参考什么样的知识在一定程度上影响成果质量。本研究基于引文视角,采用SPSS、VOSviewer等软件通过统计学、知识图谱等方法从时间、所属学科、体量、来源质量、来源稳定性五个方面对高被引、零被引两类论文进行分析比较,挖掘这两类论文在知识引用方面的特征和规律。研究思路如图1所示。
图1 研究思路框架
1.2 数据来源
选择Web of Science核心合集数据库,选定WOS中农业工程学科,时间设置为2011-2020年,文献类型限定为article,以避免综述性文章的知识引用对实质研究类成果的干扰。最高被引的论文品质虽然不能肯定最优,但一般具有广泛的影响力[21],所以采用被引频次判断论文的影响力。一般来说被引频次越高,其科学影响力越高[22],对科学进步、领域知识的贡献越大[23],被视为是一种学术论文影响力具有代表性的评价方式[24]。
根据《中国高被引分析报告2012》中高被引论文的定义(将某学科在某一年里被引用过的论文中,按照论文被引频次高低排序,排位在前1%的论文定义为(该年)高被引论文[25],该方法也被科睿唯安采纳),筛选出当年的高影响力论文,而当年的零被引论文视为低影响力论文,对两类的引用文献进行分析。获得高影响力论文382篇,其引文共17026条,低影响力论文2227篇,引文共55526条。
2.1 引用时间
2.1.1 总体引用年份特征
引用的年份代表了知识的新旧。一般来说发表时间越近,知识越新,发表时间越早,知识越旧。高、低影响力两类论文引文的年份—数量占比分布如图2所示。横轴表示引用的年份距该论文发表年份的差值,纵轴表示该年成果数量与总引用量的占比。比如在横轴为“-2”时,高影响力论文显示占比14%,低影响力论文显示占比8%,说明在高影响力论文引用知识中,前两年成果数量占总引用量的14%,而在低影响力中是8%。从图2可以看出两类论文都呈现出引文年份越近,引用数量占比越多的共同特征。但是,高影响力论文近4年成果的引用占比远高于低影响力论文,而发表5年以上成果的引用占比小于低影响力论文。且低影响力论文曲线较缓和,高影响力论文曲线更陡峭,说明高影响力论文对新知识的吸收更激进。
图2 两类影响力论文的引用文献时间占比分布
2.1.2 年度引用年份特征
进一步分析两类论文历年引用年份特征及其趋势。因篇幅有限,本文将通过2011、2015、2019三个年份的数据来反映相关特征在十年间的趋势变化。如图3所示,其横坐标以当年的时间为断点,箱宽度设置为2年,分别向前、向后展示引用文献的数量。可以看出当年低影响力论文直方图分布较高影响力论文-(修改为时间跨度更长),说明前者对年代较远的文献引用数量多于后者,前者直方图最高峰较后者偏向左侧,反映高影响力论文更重视新知识、新成果的学习。纵观十年数据,高影响力论文对新知识偏好的特征较稳定。同时两类论文都存在对下一年度知识的引用,但这种情况很少,引用的数量也极低。表1列出了两类论文历年知识引用最多的年份。高被引论文较常引用近1、2年前发表的文献,比如2017年发表的文章,其参考文献较多是2016年或者2015年发表的,且随着时间推进更趋向于引用一年前发表的文献。而低影响力论文对4、5年前发表的文章引用的较多。由于论文引用受时间影响,所以2020年低影响力论文存在部分论文未被充分引用,其最多引用文献的时间是两年前发表的。
表1 两类影响力论文引用最多的年份
图3 两类影响力论文引文数量-时间分布(部分年份)
2.1.3 引用半衰期
半衰期(Half-life)原指放射性元素的原子核有半数发生衰变时所需要的时间。Bernal[26]将该概念引入图书情报领域来表征文献情报老化速度。本研究采用学科引用半衰期[27]概念计算论文引用半衰期,定量描述其利用文献的新颖程度。图4展示了两类论文引用半衰期变化情况。可以发现高影响力论文引用半衰期明显小于低影响力论文,其均值为3.83年,反映引用文献老化速度较快,文献能够被利用的时间较短,这是因为高影响力论文的研究主要围绕学科的热点、前沿问题,所以引用的文献更注重时效,引用半衰期较短。而低影响力论文均值达到8.13年。随着年份的推进,两类论文引用半衰期均缩短,反映信息时代新知识对科学研究的重要性。
图4 两类影响力论文引用半衰期趋势
2.2 引用学科
农业工程学是一门综合现代生物学和工程学的技术科学[28],不同于纯工科类专业,具有学科交叉与集成属性[29]。2010年成立的国家信息农业工程技术中心汇聚了若干国家重点学科的交叉与融合。研究发现农机装备学科呈明显学科交叉特点,融合了经济、作物、控制工程、计算机、植保、环境、化学工程等研究方向[30]。全球新一轮科技革命和产业变革加速多领域的知识汇聚融合,多学科交叉融合作为新工科建设的核心内容之一[31]。本研究采用Leydesdorff等[32,33]的研究成果,从学科多样性、均衡性、差异性三个层面分析两类论文学科交叉特征及整体差异。
2.2.1 学科多样性
学科多样性(Variety)是指在研究引用中所涉及学科种类的数量。学科种类数量越多,学科多样性越强、丰富性越高。如图5所示,高影响力论文学科多样性指标有波动,但是总体显著高于低影响力论文。前者篇均参考学科数量超过15个,而后者低于10个,可以看出高影响力论文知识来源的学科范围较广,如图6所示。除了农业工程学科外,能源和燃料、生物技术与应用微生物学、环境科学、工程/化学、工程/环境是高影响力论文重点引用的学科,绿色可持续科技学科近年引用表现突出,木质素的生产、提取与升级研究引用更多具有绿色可持续科技学科的RENEWABLE& SUSTAINABLE ENERGY REVIEWS、GREEN CHEMISTRY、CHEMSUSCHEM等期刊。而农学、环境科学、水资源、农业/多学科、食品科技是低影响力论文主要引用的学科。高影响力论文引文期刊多属于跨学科期刊,排名前十的BIORESOURCE TECHNOL、ENVIRON SCI TECHNOL等刊物均属于2个及以上学科,篇均跨学科期刊占比62%;低影响力论文前十引文期刊中50%是单学科期刊,T ASAE、T ASABE、REV BRAS ENG AGR AMB等期刊仅属于农业学科单一学科。篇均低影响力论文跨学科期刊占比22%。高影响力论文比较重视对不同学科知识的参考,同时青睐发表在跨学科性期刊上的研究成果。
图5 两类影响力论文学科多样性
图6 两类影响力论文引用主要学科(前20)
2.2.2 学科均衡性
学科均衡性(GINI)反映了不同研究领域知识体量的差异。本研究采用基尼系数表征学科均衡性。基尼系数越小,表明各学科知识吸收量越均匀,学科均衡性较好;反之,各学科知识吸收量存在差异。从图7可以看出高影响力论文学科均衡性值大约在0.5左右,低影响力论文学科均衡性值大约为0.3。低影响力论文对不同学科知识吸收量的差异要低于高影响力论文。高影响力论文集中或者高频率引用某类或某几类学科的研究成果。除了农业工程学科外,高影响力论文的引文学科集中在能源&燃料、生物技术与应用微生物学、环境科学、工程/化学等领域;低影响力论文则聚集在农学、农业/多学科、环境科学、水资源等领域。
图7 两类影响力论文学科均衡性
2.2.3 学科差异性
学科差异性(Disparity)是指两个学科间的差异程度。该指标反映是参考相似学科的知识还是吸收了差异较大的学科内容。整体上看两类论文的学科差异性不大,并且两类论文在该指标差异也较低,说明两类论文还是重在对相似学科领域的知识进行检索查询,如图8所示。虽然论文也存在对差异度较大的学科进行引用,比如应用微生物与能源燃料的学科差异性达到0.78,农业工程与农学为0.6,但是这部分比例较小,整体上学科差异性较低。可以看出WOS农业工程学科还是在相似学科领域开展文献检索与参考,侧重理论与方法的吸收与借鉴。
图8 两类影响力论文学科差异性
2.2.4 学科交叉性
综合学科多样性、学科均衡性、学科差异性三者表现,计算两类影响力论文的学科交叉性。图9显示两类论文的学科交叉性指标,可以看出高影响力论文学科交叉性显著高于低影响力论文。运用曼-惠特尼检验对两类论文特征进行差异分析及特征稳定性分析,如表2所示。结果显示两类论文在学科多样性、均衡性、交叉性上均有显著差异,但学科差异性指标无显著差异,反映高影响力论文引用的学科数量多于低影响力论文,对不同学科引用的集中程度高于低影响力论文的特征具有统计学意义。通过时间分组,Cruskal-Wallis秩和检验显示高影响力论文的学科差异性和学科均衡性特征较稳定,不随时间发生显著变化,多样性随时间有显著差异,主要是早期年份与近期年份的数据不同。低影响力论文的学科融合特征均因时间因素有显著差异,特征并不稳定,如表3所示。
表3 两类影响力论文学科融合特征Cruskal-Wallis检验统计
图9 两类影响力论文学科交叉性
表2 两类影响力论文学科融合特征曼-惠特尼检验
2.3 引用来源
2.3.1 来源数量
引文是指科研人员了解学习前人的研究成果和经验,其数量表征了科研人员对本领域发展动态的认知水平和掌握程度[34]。篇均引文数量趋势如图10所示,可以看出高影响力论文引文数量整体远高于低影响力论文,并且均随时间成波动上升趋势。前者的引文数量都在12~249区间,而后者在1~187区间。比如2019年的高被引论文“利用木质纤维素生物质生产5-羟甲基糠醛和乙酰丙酸及其催化升级”有161篇引文。2011年的“泰米尔纳德邦农业妇女参与不同水稻种植实践的数量”只有1篇参考文献。经独立样本T检验,两类论文引文数量在统计学上具有显著差异(p<0.05),同时单因素方差显示两类论文各自引文量在时间上也呈现显著差异。可以看出高被引论文研究成果在前期文献资源检索、吸收、消化等方面更充分,文献调研、论证分析工作更扎实。
图10 两类影响力论文篇均引文量趋势
2.3.2 来源DOI
DOI(Digital Object Unique Identifier,DOI)是数字资源永久性标识,解决了传统URL链接中的“死链”和异质科技资源相互引用/链接问题[35]。分析显示高影响力论文引文中DOI文献占比高于低影响力论文,并且两者的数据均成上升态势,如图11所示。网络时代信息资源的标识、链接、控制对科研人员信息检索和数据重用有重要意义。高影响力论文引用的知识较多具有DOI号,具有较好的稳定性和回溯性,其不会随持有者或存储地址等属性的变更而检索失效,可以实现后续数据的重用和验证。
图11 两类影响力论文来源稳定性趋势
3 总结
本研究选取WOS中农业工程学科2011—2020年高、低影响力两类论文,基于文献计量学、统计学等方法,运用SPSS、VOSviewer等软件,从引文半衰期、学科多样性、学科差异性等指标开展所参考的知识在时间、学科、体量、来源稳定性等方面的对比分析,研究发现两类论文在知识吸收的类型、时效、学科种类、数量等方面具有一定差异。总体而言高影响力论文呈现以下特征:
(1)关注新近研究成果。高影响力论文引文半衰期为3.83年,也就是说有一半的引用文献是近四年发表的,这个数字远低于低影响力论文的8.13年。同时年度引文时间分析显示高影响力论文对1~2年前发表的成果引用量最多。知识是创新的前提和基础,创新本质上是新知识的获取和应用。技术发展加快了知识更新迭代速度,持续跟踪领域内研究进展,关注行业新问题,将新方法、新理论、新技术运用到问题解决、研究发现中去。
(2)倾向跨学科知识融合。高影响力论文更倾向广泛参考多种学科,篇均引文量逐年上升,跨学科期刊引用占比均值为62%,近年更是达到67%。在引用数量上呈现聚焦某几类固定学科,如农业工程、生物技术等,体现了较强的学科集聚性。同时引用范围主要限于相似领域。当下科学技术高度分化,学科交叉融合、跨学科研究蕴含着创新的巨大潜力。打破学科壁垒,开展多学科融合,合理渗透、重叠、交融、移植、借用不同领域学科知识、研究范式、工艺技术等,有利于促进知识互补,激活创新思维。
(3)偏好高质量、来源稳定的知识。高影响力论文偏向引用高质量期刊论文,篇均WOS收录期刊引用占比90%,篇均引用量超过50篇。而低影响力论文33%引用文献来自WOS收录期刊,篇均引用量低于40篇。高影响力论文较多引用来源稳定的正式出版的研究成果,该类文献在网络环境中可长期永久保存定位,便于数据重用和验证,而低影响力论文来源稳定、可溯文献占比较低,但是呈现上升趋势。稳定的知识来源对持续研究、跟踪研究,同行学习参考有着重要价值,高质量论文的学习也有助于拓宽研究思路、提高研究起点、学习先进的研究范式。
上述研究结论是基于对农业工程领域研究型论文研究反映的论文影响力与知识引用特征的主要关系。由于学科差异性,其他学科高影响力论文的知识引用特征还需进一步论证,且不排除少数论文由于各种原因其影响力暂未被发现的情况。未来将对其他学科高影响力论文、“睡美人”等特殊类型论文开展进一步的研究。总体而言,高影响力论文体现了科研创新,而创新就是通过重新配置知识元素的联结方式,对已有知识元素进行重组以创造新知识组合的过程[36,37]。知识元素的获取及其联结方式是创新途径。从研究前沿、领域进展、研究动态获取新知识,开展跨学科研究,关联不同学科知识,思考知识的移植、借用、联结,有助于产生更多创新思路,形成高影响力学术成果。