不同计数方法在国际合作论文中分析机构贡献度的应用
2021-07-09但琼洁
但琼洁
北京工业大学图书馆 北京 100124
引言
当前,科学研究中的国际合作越来越多。我国的“双一流”学科建设中亦要求高校深化国际合作交流,大力推进高水平实质性国际合作交流,成为世界高等教育改革的参与者、推动者和引领者。各大高校的科研单位或图书馆在针对本校进行学科竞争力分析时,都会分析其国际合作研究现状[1,2]。但大多数分析报告或论文中只统计了其国际合作论文数量,通过单一的数量结果来比较不同高校同学科间或者同一高校不同学科间的差异。
在分析作者影响力时,有多种分析手段,例如引文分析、论文署名次序分析或多种方法结合的复杂算法等[3],来平衡论文合著作者对文章的贡献度。由此可见,在分析高校学科的国际合作论文现状时,不应只用数量进行对比,还应运用更多的方法深入分析这些合作论文中高校的贡献度,不同层次的、全方位的比较说明其在国际合作中的参与程度。
国内外学者曾在这方面都进行过相应的研究。国家科学图书馆的刘筱敏[4]即通过统计第一作者论文和其他论文中的出版指数来分析中国科学院在国际合作论文中机构贡献度。Waltman等[5,6]则从理论计算角度盘点了全计数法和几种分数计数法来计算国家的贡献度。以上分析中,均有涉及第一作者所在机构在论文中的贡献,但都没有提及通讯作者所在机构在论文中的贡献。通讯作者通常为研究的负责人和指导者[7]。在国内研究活动中,通讯作者通常是第一作者本人或者其指导老师。通讯作者所在机构在研究过程中,给予了重要的支持和贡献。在研究机构贡献度时,对于通讯作者所在机构应给予同样的重视。Chuang K 等[8]提出结合总论文数、第一作者论文数、通讯作者论文数、独著论文数及合作论文数五个指标来评价国家、机构以及作者的影响力。但对于合作论文中,除给予第一作者和通讯作者所在机构较高权重外,如何评价其他参与机构的贡献度,也是需要解决的问题。
基于以上研究背景,本文综合介绍了全计数法和几种不同方式的分数计数法,其中分数计数法是在Waltman的基础上加入了通讯作者计数法,并通过示例来演示不同计数法的运用。然后以北京工业大学的土木工程和环境科学与工程学科2019年的国际合作论文为对象,用多种方法多角度全方位的分析比较了二者的国际合作情况,并在分析中提出,在研究国际合作论文中机构贡献度时,可用第一作者计数法和通讯作者计数法给予第一作者和通讯作者所在机构高权重的贡献度,对其他的合作论文可按照作者级或者机构级计数法计算相应的机构贡献度。
1 不同计数方法的概述及应用
1.1 全计数法
全计数是对共同发表的文献进行多次计数,每位作者、机构或国家均被记录一次。在这种计数方法下,文献将完全分配给每个作者、机构或者国家。在Incite数据库中,就是使用全计数法记录高校或其他科研单位的国际合作论文,输出的指标为“国际合作论文(篇)”。
用“国际合作论文篇数”除以“某机构或国家的总篇数”,就得到相应的“国际合作率”。很多文献或报告在分析机构或者国家的国际合作论文时,即采用该值来作为国际科研合作的重要绩效指标,衡量其国际化程度。例如,2020年张莹等[9]研究者的论文中,详细比较了我国在康复机器人领域的国际合作率及国际平均合作率,并列举了国际合作率排名前5位的国家(地区)。另外,浙江大学图书馆的郑江平等[10]也是通过国际合作率的逐年升高来反映食品科学领域国际科研合作的活跃。同时该文还引入合作广度和深度的概念,认为一篇国际合作论文所包含的国家数、作者数、机构数越多,则代表合作广度越高、合作深度越深。这些概念,也是应用了全计数法去统计作者、机构和国家。
更多的计量学学者认为,全计数法扭曲了作者、机构或者国家的产出。例如,如果某个文献是由三个机构共同完成的,那么该文献是否应该是每个机构的完整文献,还是每个机构占三分之一?为了消除扭曲的情况,分数计数法被提出来,并被深入研究。
1.2 不同方式的分数计数法
分数计数法是将文献的贡献度按一定比例分配到每个作者、机构或者国家。基于不同的计数单元,衍生出不同方式的分数计数法。Waltman等[5,6]在这方面进行了长期的研究,并在2015年的文献中提出几种不同方式的分数计数法。国内学者陈莉玥[11]从信誉值分配的角度提出计数方法分类的两个要素,将计数方法分为全计数法与分数计数法两大类,并从论文指标、引文指标、网络指标的视角,比较计数方法的差异。本文基于以往的相关文献,综合描述了几种不同方式的分数计数法,并通过示例来演示不同计数法在分析机构贡献度时的应用。
1.2.1 基于不同计数单位的分数计数法
基于作者的分数技术法有三种:第一作者计数、通讯作者计数和作者级分数计数。第一作者计数是为第一作者分配权重为1,其他作者的权重均为零。通讯作者计数是为通讯分配权重为1,其他作者的权重均为零。作者级分数计数是指论文中的每位作者具有同等的权重。
地址分数计数法是指论文地址列表中列出的每个地址具有相等的权重。机构分数计数法是指论文地址列表中列出的每个机构具有同等的权重。国家分数计数法是指论文地址列表中列出的每个国家都具有同等的权重。需要注意的是,执行分数计数的级别不需要与分析的级别一致。例如,分析组织或国家这级的贡献度时,可以在作者或地址级别进行上进行分数计数。
以一篇由5个作者合作完成的论文为例:5个作者来自3个不同的机构,2个不同的国家。其中作者1是第一作者,作者5是通讯作者。这篇论文的作者机构和国家之间关系如表1所示。
表1 作者机构和国家的关系
因为示例中未涉及地址,因此选用上述除地址外的另五种分数计数方法以及全计数法,计算这篇国际合作论文中,3个机构的贡献度,见表2。在全计数法中,3个机构的贡献度均为1。用第一作者计数法时,只赋予第一作者权重1,其他作者为0;而第一作者属于机构1和机构2,因此机构1和机构2均为1。用通讯作者计数时,只赋予通讯作者权重1,其他作者为0;而通讯作者属于机构1,因此机构1贡献度为1,而其他机构为0。用作者级分数计数法时,每个作者的权重为1/5=0.2;属于机构1的作者有4个,因此机构1贡献度为0.2*4=0.8,同理机构2和机构3的贡献度为0.2。用机构级分数计数法时,每个机构的权重为1/3=0.33。机构作为计数单位时,要小于国家,因此此时不用考虑国家级分数计数法。同理,如果是分析作者贡献度时,就不用考虑地址级、机构级和国家级分数计数法,只需要考虑第一作者计数、通讯作者计数和作者级分数计数三种方法。
表2 基于五种分数计数方法求解的机构贡献度
1.2.2 综合运用多种分数计数法
在已发表的文献中,针对国际合作论文的分析,往往不局限于一种方法,而是综合运用多种方法,全方位、立体的呈现某领域或者某机构的国际合作现状。
中国科学院国家科学图书馆的刘筱敏等[4],在2012年的《图书情报工作》杂志上发表了“国际合作论文中机构贡献度分析——以中国科学院为例”。这篇文章中提到的“出版指数”,即基于作者级分数计数法分析机构的贡献度。文中采用第一作者计数,计算了中国科学院第一作者的国际合作论文占全部作者国际合作论文的百分比。将数据集划分成2个子集:第一作者属于中国科学院的子集和其他合作作者子集。在2个子集中,又再次应用作者级分数计数法计算出版指数。综合分析发现中国科学院为第一作者时,机构贡献度值较好;中国科学院为合作者时,机构贡献度较低。
郭丽娜等[12]在2020年发表的文献中,则综合运用了全计数法、第一作者计数法和通讯作者计数法。通过全计数法找出与中国合作度高的国家排名,又分别在中国以及这些国家的数据集运用第一作者计数法和通讯作者计数法分析不同国家间的合作网络及模式。需要提及的是,这篇文章在数据处理时,针对作者分属两个机构以上的情况,只取第一个机构进行计算。实际上作者分属两个机构以上时,不应人为断定哪个机构更为重要。另外该文在选取数据时,未选取非第一且非通讯作者的论文。
基于2.1中介绍的几种分数计算法和相关论文中的应用,笔者认为在应用分数计算法评价国际合作论文的机构贡献度时,可分别计算第一作者论文、通讯作者论文(或者二者的合集)以及非第一且非通讯作者论文。针对非第一且非通讯作者论文,可运用作者级计数法或者机构级计数法量化机构贡献度。
2 以北京工业大学的土木工程和环境科学与工程学科为例
全计数法和不同的分数计数法在解决相关问题时具备不同的特点和优势。如Incite数据库使用全计数法可快速比较不同高校或科研单位在某领域或者某学科的国际合作论文的合作率。学校在进行研究者个人学术成果评定时,更倾向采用第一作者计数及通讯作者计数,而不是作者级分数计数。图书馆学科分析及情报研究部门则偏好使用多种计数方法,多角度的分析本校某学科的国际合作研究现状,为学科发展提供助力。
本文即以北京工业大学的土木工程和环境科学与工程学科为例,从文献计量学角度,运用不同计数法比较分析这两个学科2019年的国际科研论文合作现状。
2.1 数据获取及处理
研究数据来源于科学网(Web of Science,WOS)核心集数据库,包括科学引文检索扩展版(Science Citation Index Expanded,SCIE),科技会议文献引文索引(Conference Proceedings Citation Idex-Science,CPCI-S)。检索北京工业大学2019年的全部论文(机构名称Beijing University Of Technology)。在学科映射中,土木工程学科选取 Web of Science 分类中“ENGINEERING CIVIL”。环境科学与工程学科选取Web of Science 分类中“ENVIRONMENTAL SCIENCES” 及“ENGINEERING ENVIRONMENTAL”。在两个学科数据集中再进一步通过“国家/地区”筛选出国际合作论文,形成待分析的数据子集。将检索数据导出为Excel格式,并根据不同计数方法逐条计算并标注机构贡献度。在进行合作国家和机构统计时,将检索数据导入DDA( Derwent Data Analyzer)软件,并针对“国家”和“机构”数据进行人工清洗分析,以高校/研究(院)所为最小单元。
2.2 全计数法分析国际合作率和合作规模
截止检索日(2020年9月28日),共检索出北京工业大学2019年土木工程学科发文191篇,其中国际合作论文55篇,国际合作率28.80%;2019年环境科学与工程学科发文164篇,其中国际合作论文37篇,国际合作率22.56%,见图1。土木工程学科的国际合作论文发文量和国际合作率都高于环境科学与工程学科。
合作论文中所包含的国家数可反映其合作广度,机构数、作者数可反映其合作深度[10]。参考此方法,统计了土木工程和环境科学与工程学科的国际合作论文中合作的国家数和合作的机构数。由图1可知,环境科学与工程学科的国际合作广度更高,但合作深度略低于土木工程学科。
图1 全计数法分析国际科研论文合作情况
2.3 分 数计数法的综合运用和深入分析
参考2.1中的分数技术法,选取基于作者的分数计数法,含第一作者计数、通讯作者计数和作者级分数计数,以及机构分数计数法。按照不同的计数法,分别计算每篇论文中北京工业大学的贡献度,见表3和图2。
图2 分数计数法分析2019年北京工业大学两学科国际科研论文合作情况
表3 2019年北京工业大学“土木工程”和“环境科学与工程”学科国际科研论文比较分析
经统计,2019年土木工程学科的国际合作论文中第一作者单位是北京工业大学的有31篇,占比56.36%;2019年环境科学与工程学科的国际合作论文中第一作者单位是北京工业大学的有21篇,占比56.76%。由此可见,两个学科国际合作论文量虽然不同,但第一作者论文率基本相同。2019年土木工程学科的国际合作论文中通讯作者单位是北京工业大学的有28篇,占比50.91%;2019年环境科学与工程学科的国际合作论文中通讯作者单位是北京工业大学的有16篇,占比43.24%。土木工程学科不仅国际合作论文量高于环境科学与工程,其通讯作者论文率也高于后者。
很多学校在进行学术成果评估时,将第一作者和通讯作者同等对待,因此我们在数据集中进一步统计出第一作者或通讯作者单位是北京工业大学的论文数。由表格中数值可见,我校2019年环境科学与工程学科的国际论文量约是土木工程的2/3倍,但其第一作者论文或通讯作者论文率仅略低于土木工程,且二者都超过各自国际合作论文量的2/3。从第一作者和通讯作者归属的角度来看,在两门学科的国际合作论文中,北京工业大学的贡献度较高。
作者级和机构级的机构贡献度统计时,会受参与的作者数和机构数的影响。表3中虽然统计了作者级和机构级北京工业大学的贡献度,但在此方法的计算中,将第一作者或通讯作者的贡献度等同于了其他作者的贡献度。本文提出统计第一作者或通讯作者的论文数,再另计算非第一作者且非通讯作者的国际合作论文中机构贡献度,见图3。
图3 国际科研论文中北京工业大学机构贡献度分析
在非第一且非通讯作者的国际合作论文中,无论是作者级还是机构级计数法,土木工程学科的北京工业大学贡献度均高于环境科学与工程学科。考虑到土木工程学科的非第一且非通讯作者的国际合作论文数本身就高于环境科学与工程学科,因此此处另计算篇均贡献度,即用总机构贡献度除以该部分的论文数。土木工程学科的非第一且非通讯作者的国际合作论文的作者级篇均贡献度为19.47%,机构级篇均贡献度为26.59%;环境科学与工程学科的非第一且非通讯作者的国际合作论文的作者级篇均贡献度为17.59%,机构级篇均贡献度为21.83%。从数据可见,在非第一且非通讯作者的国际合作论文中,无论是作者级还是机构级计数法,土木工程学科的北京工业大学篇均贡献度均高于环境科学与工程学科。
3 总结
目前的科学研究中国际合作越来越多。在进行学科分析时,针对国际合作论文,需要从更多的角度去分析研究,以更全面的反映其合作情况。
本文综合介绍了全计数法和基于作者的分数计数法(含第一作者计数、通讯作者计数和作者级分数计数)、地址分数计数法、机构分数计数法和国家分数计数法。通过示例来演示不同分数计数法在分析机构贡献度时的运算方式。最后以北京工业大学的土木工程和环境科学与工程学科2019年的国际合作论文为对象,用全计数法分析发现土木工程学科的国际合作论文发文量、国际合作率和国际合作深度高于环境科学与工程学科,但合作广度略低于环境科学与工程学科。另用不同的分数计数法多角度比较分析两个学科间北京工业大学的机构贡献度差异。第一作者计数法显示两个学科国际合作论文量虽然不同,但第一作者论文率基本相同;通讯作者计数法显示土木工程学科的通讯作者论文率高于后者。进一步统计第一作者或通讯作者单位是北京工业大学的论文数,以及其他非第一且非通讯作者的国际合作论文中北京工业大学的总机构贡献度和篇均贡献度。由结果可见北京工业大学的土木工程的第一作者或通讯作者论文率高于环境科学与工程学科;且在非第一且非通讯作者的国际合作论文中,无论是作者级还是机构级计数法,土木工程学科的北京工业大学篇均贡献度仍高于环境科学与工程学科。值得一提的是,两个学科的第一作者或通讯作者论文率都超过各自国际合作论文量的2/3,由此可见,北京工业大学的这两门学科在国际合作研究中不仅仅是参与者,还是重要的主导研究者。
不同计数方法的综合应用,可以多角度反映机构国际合作论文的研究现状,可比较同机构不同学科的国际合作差异,也可用于比较不同机构同学科间的国际合作研究差距。灵活运用不同计数法,可为学科的国际合作研究分析提供更多的信息,助力“双一流”学科建设。