不同学科的作者贡献分布差异研究
——以图情和医学领域的四种期刊为例
2018-11-28
0 引言
随着大科学时代到来,科研合作在广度和深度上都有更高的要求,高效的合作是科研成果数量和质量的保证。科研成果的署名能够证明该作者在研究过程中作出了实质性的贡献,且要求作者对论文负责,因而作者署名作为衡量科研水平和能力的重要依据,逐渐受到重视。人们通常认为完成主要研究工作的第一作者和提供指导支持的最后一位作者,在科研过程中起到举足轻重的作用,而中间署名的作者仅提供辅助[1]。合著论文的日益增多,引发了滥用署名权等学术不端的现象,以及马太效应引起的部分学者受到贬低的不公平现象[2-3]。Chao Lu等[4]也基于作者贡献的测度,探究科研合作中各作者的相互关系。因此,对作者贡献的特征进行分析,对作者贡献声明的规范化及学术评价的科学化有着重要的意义。
1985年,国际医学期刊委员会[5](International Committee of Medical Journal Editors,ICMJE)提出作者贡献要素的4个标准。此后,相关组织陆续出现,明确“作者贡献声明”的具体规范,科研过程更加公正公平。近年国内一些学术期刊,如图书情报领域(以下简称“图情领域”)的《图书情报工作》《数据分析与知识发现》,提出有关作者贡献的明确要求,并逐渐规范和完善。但我国关于“作者贡献声明”的研究较多地停留在探讨设立意义[6-8]、设想贡献要素[9]的初级阶段,并逐渐出现贡献权重算法的研究[10-12]。作者贡献声明率先在医学领域得到发展并逐步规范,且要求作者贡献声明的国内期刊主要集中于图情领域和医学领域。本文基于这两个领域的四种期刊,通过对作者贡献要素的分类,归纳得到作者贡献的标注体系,并结合学科领域、署名顺序、通讯作者等对其进行统计分析及非参数检验,探究两个学科作者贡献要素分布的差异及原因,了解不同学科领域在科研合作过程中作者的贡献特征。参考医学领域的作者贡献,旨在为作者贡献声明在图情领域的合理发展及其他学科领域中的研究与应用提供借鉴。
1 相关研究工作概述
1.1 作者贡献声明规范性研究概述
国内普遍将作者贡献大小同署名顺序相关联,这样做法存在以下不足:(1)科研成果一直是各单位业绩评定、奖金发放的参考依据,随着科研合作增多,部分学者对署名的严肃性和重要性缺乏认知,存在滥用、篡改署名等学术失范甚至不端的行为[13-14];(2)单从署名的顺序,无法明确合著作者的具体贡献和责任,也不能由此简单地判断作者贡献的大小[15-16]。
1985年,ICMJE提出作者贡献要素的4个标准,至今仍不断作修订。20世纪90年代以后,美国哈佛大学Harvard Ombudsman Office[17]、英国发表道德委员会[18](Committee on Publication Ethies,COPE)等组织为应对相关实际问题而相继出现。1999年,Nature首次要求论文刊载需标注“作者贡献”[19]。2014年我国期刊《数据分析与知识发现》[20]推行“作者贡献声明”,随后《图书情报工作》[21]《中国全科医学》[22]等均增加“作者贡献声明”版块。张晓林[23]、Frische[24]、Clement[25]等均对作者贡献声明的必要性展开讨论,认为科研成果归所有署名作者拥有,其贡献应进行明确标示,从而尽可能减少名誉作者的出现。朱大明[26]、Allen等[27]认为贡献声明能够增强作者的责任感,便于读者了解科研合作过程,有助于学术透明和学术交流。李静然等[28]认为设立“作者贡献声明”能够激励科研人员的积极性,约束作者的学术道德,增强监督力度,有效避免不正当行为产生的学术纠纷。作者贡献声明逐渐规范和推广,为本文研究奠定了基础。
1.2 作者贡献要素分类及其权重研究概述
若要对合著作者的贡献及学术能力进行合理评价,应按照对应的贡献要素及其权重进行计算。Baerlocher等[29]、Bates等[30]以 ICMJE 为标准,对作者贡献要素进行归纳和梳理。Bhandari等[31]、张闪闪等[32]通过调研将作者贡献的进行分类,包括研究主题设计、数据获取与分析、撰写论文等,但类别和表述均差异较大,尚未出现统一标准。作者贡献要素应基于事实进行分类,也应考虑学科特性差异、合著作者数量等产生的影响。Mattsson等[33]也表示对作者贡献进行评价时,既应考虑论文的合著作者数量,也应考虑其署名顺序。
学术界对合著作者的贡献大小衡量方法不同,从仅计算第一作者贡献变为对所有合著作者等同对待,再到区别对待的调节计数法。张闪闪[34]将前人的研究分为基于作者数量、作者位置、论文角度等方面的贡献权重算法。Van Hooydonk[35]、樊玉敬[36]反对使用平分法计算作者贡献权重,提出基于作者署名顺序对贡献大小进行计算。张明[37]对比分析线性分布和指数分布中合著作者数量对作者贡献权重的影响。李栎等[38]、Shen等[39]均提出了不同的作者贡献率分配算法,能较为公正地对作者的学术影响力进行评价。Feeser等[40]通过研究具体的作者贡献要素来对合著作者的贡献大小进行量化。我国学者对作者贡献权重的研究大都是结合署名顺序和通讯作者对贡献大小的算法作出改进[41-42]。
国外学者针对作者贡献分布特性进行了深入研究,Larivière V等[43]探究来自PLOS及WOS中不同学科文献的作者贡献种类与学术资历、署名顺序的关系。国内对作者贡献的研究刚刚起步,主要从作者贡献声明设立意义、作者贡献权重运用等方面进行评价,也得出一些有意义的成果。近几年,逐渐出现对贡献要素分布特性的研究,如崔林蔚等[44]根据《图书情报工作》2015~2016年的作者贡献数据,给出29类作者贡献要素说明,并结合署名顺序对贡献要素的分布情况进行统计分析。丁敬达等[45]分析比较图情领域三种期刊中作者贡献分布与署名次序的关系。本文针对图情与医学两个学科对作者贡献要素进行归纳总结,综合考虑学科差异、合著作者数目及署名位置的影响,探究不同学科的作者贡献特征。
2 作者贡献分布差异研究思路与方法
2.1 研究思路
本研究选取图情领域和医学领域四种期刊的论文数据,通过相关数据的采集,进行数据分类标注,对作者贡献情况进行统计分析。研究思路如图1所示:(1)制定采集规则,使用火车采集器抽取标题、PageUrl、作者、摘要、通讯作者、作者贡献声明、年卷期字段存储至数据库;(2)统一原始数据格式,去除无法下载、无作者贡献声明及非学术性文献;(3)设计作者贡献分类标注体系,制定标注规则,并实施数据标注。(4)对标注数据进行统计分析。其一,针对不同学科领域探究不同作者贡献要素的独立完成率及分布情况;其二,探究不同合著作者数目下的贡献程度及贡献要素分布同作者署名顺序的关系;其三,探究不同合著作者数目下,通讯作者的贡献要素分布特征。
2.2 数据来源与预处理
数据库中具有“作者贡献”的文章多出现在图情及医学领域,Larivière V[46]等发现PLOS中相关文献集中于生物医学及临床医学领域。《图书情报工作》《数据分析与知识发现》(原《现代图书情报技术》)均是图情领域核心期刊;《中国全科医学》《世界华人消化杂志》也均是较为权威的医学学术性刊物。近年四种期刊均出现较为规范的作者贡献声明,适合本研究。本文抓取数据的情况见表1。
表1 作者贡献声明数据来源及统计
随后对上述四种期刊的作者合著数目进行简单统计。图情领域的独著文献占比为19.7%,远高于医学领域(0.04%),且图情领域论文的合著作者数主要集中在2-4人;而医学领域多数在2-7人,最多达11人。这是由于实验性较强的学科所需资源和能力相对较多,更倾向于分工合作。为防止数据量过小导致分析结果的普适性较差,本文在涉及作者署名顺序时仅选取合著作者在2-5人间的文献进行研究,对不同学科的作者贡献进行宏观统计,但在探究通讯作者的贡献内容时则使用全部非独著数据。获得论文全文数据后,对所需信息进行抽取并存储至数据库,主要包括两部分:(1)题录信息,即标题、作者、摘要等;(2)作者贡献信息,即作者顺序、通讯作者、作者贡献声明等。
2.3 作者贡献分布差异研究方法
2.3.1 作者贡献分类框架设计
在对相关文献调研的基础上[47-50],对期刊所列的“作者贡献声明”进行文本切分。利用关键词匹配对切分结果分类,并进行词频统计。加以人工的判别和修订,给出11类的作者贡献分类框架,分别对应A-K,如表2所示。
表2 作者贡献分类标注说明
2.3.2 数据标注
根据标注框架并参考论文摘要对作者及其贡献进行分类标注。本实验分为两步:第一步,对每种期刊的前100条数据进行实验,根据实际情况改进标注标准;第二步,根据改进后的标准重新进行分类标注,并对自信度较低的分类数据进行二次标注,获得分类标注数据集。利用python编程对分类标注数据集进行处理,结果如表3所示。
表3 作者署名顺序及通讯作者标注结果(示例)
3 作者贡献分布差异结果分析
3.1 作者贡献同学科特性的关系
学科特性影响作者署名及其贡献行为。本文对图情领域及医学领域中各作者所作贡献的种类数目进行统计。经非参数检验,p值为0.535,大于0.05,两领域作者贡献种类数的总体分布不存在显著差异。两领域均由于科研协作的需要,多种角色的署名作者较少,而专注于一两项贡献的署名作者较多。但医学领域的研究活动分工更加明确,43%的作者仅完成一项任务。Larivière V等[51]在其研究中也证实生物医学和临床医学是作者贡献更加分散的学科。相对来说,图情领域的作者更倾向于完成两三项工作,最多作出7种贡献。但署名作者是否都作出实质性贡献还有待考证。
为更好地探究作者贡献同学科特性的关系,本文对图情领域及医学领域中的作者贡献分布做宏观统计,并对不同贡献要素的独立完成比例进行探究。如图2所示,撰写和修订是论文发表的重要环节,因此论文起草撰写和论文修订审阅也是占比最高的作者贡献要素。
思路提出、设计研究方案及数据资料收集整理是图情领域内较为注重的部分。由于学科交叉的影响,系统设计与开发也出现在图情领域,但仅被8%的文献所提及。医学是偏实验性、应用性的学科,数据及实验相关的作者贡献较多,而思路及研究框架设计较少。此外,质量控制与评估作为独特的贡献要素为医学的严谨性提供保障。
对图情领域及医学领域中贡献要素的独立完成率分布进行非参数检验,p值为0.001,小于0.05,存在显著差异。图情领域中,每类贡献均有50%以上的文献由单一作者完成,尤其是思路提出等指导性的任务,这些偏向概念、知识性的贡献更倾向于独立完成,也更能体现个人成果。而实践性相对较强的医学领域对资源和能力的需求更为丰富,合作现象也更明显,每项任务一般由多作者合作完成,尤其是实验实施及数据收集处理,仅有9%的文献其实验实施由一位作者单独完成。
3.2 作者贡献同署名顺序的关系
3.2.1 不同作者数目下贡献程度与署名顺序的关系
通常认为作者贡献大小与署名顺序紧密相关。本文分别在合著作者数为2-5人的情况下,对不同署名位置的作者在该研究成果中的贡献种类数目进行统计。以合著作者是3人的情况为例,如图3所示,“2种贡献”代表在不同署名位置下,作出11种贡献中的任意2种。总体来看,随着署名顺序延后,两领域中作者贡献种类依次减少,单一贡献的作者比例逐渐提高。但医学领域中22%第一作者作出单类贡献,而图情领域中仅3%第一作者贡献单一。相同署名位置下医学领域的作者贡献种类数目普遍小于图情领域。医学领域偏重技术、实验,对各种资源和能力的要求更大,合作作者数目更多,专人发挥专长,每个作者的贡献广度则相对较小。作者署名能够较为严格地遵循按照贡献大小排列的原则。
3.2.2 不同作者数目下贡献要素与署名顺序的关系
依据贡献种类的多少,并不能全面准确地判断作者的贡献大小。因此,本文对不同署名顺序下作者的具体贡献内容作出探究。
整体上作者的署名顺序一般可以用第一作者、中间作者以及最后的作者来划分,并在贡献要素分布上呈现出一定规律。分别对不同位置下两领域的作者贡献要素分布做非参数检验,p值均略大于0.05,表明差异并不显著。以三个作者合作的情况为例,如图4所示,第一作者作为学术研究的主导者,基本参与并完成大部分研究工作,尤其是数据收集处理、论文起草撰写以及论文修订审阅,具有较高的权重。而中间作者及最后的作者则一般负责增补性或指导性的工作,随着署名顺序的延后,数据处理、分析等操作性的贡献以及论文修订审阅的比重逐渐提高。此外,图情领域较为注重宏观指导性的贡献,而医学领域对数据及实验等操作性贡献较为关注。在科研评价时应考虑学科特性,分别对不同的作者贡献赋予不同的权重,弥补仅通过署名位置进行科研评价的缺陷[52]。
3.3 作者贡献同通讯作者的关系
一般来说,第一作者是研究工作的主要参与者与论文撰写者,而学术界对通讯作者的定位却有一定争议[53]。有学者认为通讯作者一般是权威专家,仅负责成果发表和稿件的对外通信;也有学者认为通讯作者往往是该研究项目的负责人,是主要研究思想的提出者,是研究的建议者和把关者[54]。为此,本文对通讯作者的署名位置及贡献内容进行探究。
图情领域倾向于将第一作者、第二作者作为通讯作者,其中《图书情报工作》多以第二作者为通讯作者,而《数据分析与知识发现》多以第一作者为通讯作者;而医学领域较多将署名最后的作者作为通讯作者。通讯作者在两个领域中的署名顺序差异较大,但非参数检验结果显示,在贡献要素分布上不存在显著差异。以三个作者合作的情况为例,如图5所示,通讯作者的贡献要素分布与其署名位置下作者的贡献要素分布类似。图情领域的通讯作者主要作出思路提出、研究方案设计及论文撰写与修订等贡献,而医学领域的通讯作者主要完成思路提出、实验实施、论文修订、质量控制与评估等贡献。总之,通讯作者作为对外通信的负责人应全面了解研究思路,参与论文写作并对文章负责,在医学领域的科研过程中还应承担实验实施等关键性任务,其贡献的重要程度和地位大小不容置疑。
4 研究结论与展望
贡献声明的出现,有助于读者更好地了解作者的研究过程,并对署名的透明和规范进行监督,保障作者的合法权益。为给作者署名提供参考,促使作者贡献声明在各领域的合理发展,本文从学科特性、署名顺序、通讯作者三个角度进行统计分析,探究图情领域及医学领域下作者贡献的特征及规律。
从学科特性来看,除数据处理与论文写作外,图情领域更注重思路设计,而医学领域则更注重实验实施。两个领域作者贡献种类数的总体分布不存在显著差异,作出少数贡献的作者较多,但贡献要素独立完成率分布的差异十分显著,医学领域的合作率相对较高,作者分工更加明确。从署名顺序来看,第一作者作为研究的主导者,通常完成大部分实质性工作,尤其是论文写作;其余作者作出增补性贡献,更有利于专人发挥其专长;医学领域中署名最后的作者,其指导作用较为明显。从通讯作者角度来看,图情领域的通讯作者多为第一作者、第二作者,而医学领域的通讯作者一般署名靠后。两领域的通讯作者贡献分布差异较小,除思路指导性贡献外,也参与论文撰写修订等实质性工作,通讯作者的重要性不容质疑。
作者贡献声明在国内期刊中尚未普及,国内索引数据库也未做明确要求。本研究仅选用医学和图情两个领域的四种期刊,总体样本数量较少,可能在一定程度上影响了研究结论,具有一定的局限性。随着作者贡献声明表述的进一步规范,以及更多学科领域期刊对贡献声明的采纳,笔者将在未来研究中加入经济学、文学、理学、工学、管理学等学科领域,更加规范和完善作者贡献分类体系及标注过程,选取更为完整的作者年龄、性别、科研产出等信息进行分析,从而提高作者贡献特性研究的广度和深度,为作者贡献声明在图情领域的合理发展及其他学科领域中的研究与应用提供参考。