COVID‐19 国际科研合作网络特征及演变研究
2021-12-07吴利俊宋元明
吴利俊 宋元明 陈 坚 王 森 应 峻△
(1复旦大学图书馆 上海 200433;2复旦大学附属华山医院消化科,3感染科 上海 200040;4国家传染病医学中心 上海 200040)
2019冠状病毒病(coronavirus disease 2019,COVID-19)已经在全球引发了大量科学研究,相关论文“井喷式”产生,针对COVID-19 的科学研究所面临的问题也非常复杂,需要全球不同科研主体之间积极开展协同研究工作,才能有望早日攻破难题[1]。然而,这场疫情又在政治、经费、空间等多个角度限制了科研合作的展开,COVID-19 国际科研合作现状及未来趋势尚有待研究。
基本科学指标(Essential Science Indicator,ESI)数据库所标注的高被引论文是指近十年来各研究领域中被引频次排名位于前1% 的论文,通常代表全球科研论文的顶尖水平,针对高被引论文数量进行分析,可对相关地区或机构的学科竞争力进行评估,针对其研究内容的挖掘则可用于指引学科发展方向,能够体现学科研究热点与前沿[2-3]。有研究证实大多数高被引论文均由国际合作完成,而通过对研究领域内的高被引论文进行分析,能够高效地寻找到该领域的国际合作网络结构与特征[4-5]。
社会网络分析法最初是基于数学方法、图论等发展起来的定量分析方法,目前已拓展至科研领域合作关系的研究[6]。利用社会网络分析,通过对研究领域内的国际合作网络的特征演化进行研究,不但有助于了解国际合作网络的动态变化过程,还能够帮助科研人员迅速掌握研究领域的发展趋势以及前沿研究的成果[7]。
本研究以COVID-19 高被引论文作为样本数据,基于社会网络分析方法,深入探究国际科研合作率、科研合作团队规模、合作网络特征及其演变规律,以可视化形式揭示COVID-19 国际科研合作现状以及变化趋势,以期为科研人员和决策人员掌握该领域的研究特点和探索国际合作路径提供参考。
资料和方法
数据来源本研究检索Web of Science 核心合集数据库,选择主题检索途径,设置检索词为“COVID-19”、“COVID19”、“COVID 19”、“2019-nCov”、“2019 nCov”、“SARS-Cov-2”、“SARS CoV 2”、“Coronavirus Disease-19”,“Coronavirus Disease 2019”、“2019 Novel Coronavirus”,在检索结果页面中选择“ESI 精炼”,筛选出检索结果中的ESI 高被引论文。数据采集时间截至2021年04月30日。
数据清理将数据库中采集到的数据导入Excel软件进行人工清理,排除无法确定出版日期以及作者地址字段缺失的文献,按照作者所属机构来标引文献的所属国家或地区,用于国际科研合作网络分析数据来源;沿用ESI 对每一位作者的贡献都给予统计的方法,一篇论文只要作者标注超过2 个国家或地区,则被认为存在国际合作。为了分析合作网络的演化规律,将纳入文献按照出版时间分成4 个阶段,即:(1)第一阶段:2019年12月1日—2020年3月31日;(2)第二阶段:2020年4月1日—6月30日;(3)第三阶段:2020年7月1日—9月30日;(4)第四阶段:2020年10月1日—2021年4月30日。在此基础上,分别建立纳入的样本数据在4 个不同时间窗口的合作共现矩阵。
数据分析社会网络分析法是对社会关系结构及其属性加以分析的一套规范和方法,其分析的对象是社会行动者之间的关系,能够对社会关系进行 量 化 研 究[8]。 本文以COVID-19 相关研究中的ESI 高被引论文作为样本数据,结合多元统计分析方法,统计国际科研合作率、科研合作团队规模等,并利用社会网络分析法,借助Ucinet 软件,绘制出国际合作网络关系的可视化图谱,并分别从网络密度、中心性、核心度等方面对COVID-19 国际科研合作网络结构进行深入分析。
结果
纳入文献总体特征在Web of Science 核心合集数据库中,通过检索获得118353 篇文献,其中,ESI 高被引论文共3794 篇,进一步去除无法确定出版时间的文献(65 篇)以及作者地址字段缺失的文献(14 篇),最终纳入3715 篇文献作为本研究样本数据(图1)。其中,从发文时间来看,2019年1 篇,2020年3687 篇,2021年27 篇;从文献类型来看,综述732 篇,原始研究论文2983 篇。截至2020年4月30日,纳入样本文献在Web of Science 核心合集中的总被引频次为494669,篇均被引频次为133.15。
图1 文献检索和筛选流程Fig 1 Flow chart of the literature search and selection
国际科研合作总览针对样本数据,根据作者机构所属国家或地区进行统计,发现作者共来源于全球118 个国家或地区。其中,ESI 高被引论文数量最多的10 个国家分别为美国(35.90%)、中国(30.31%)、意大利(14.16%)、英国(12.68%)、德国(6.43%)、加拿大(6.27%)、法国(5.90%)、西班牙(5.52%)、澳大利亚(5.25%)和荷兰(4.09%)。论文总数能够反映总体科研能力,而合作率则能够体现各个国家或地区在COVID-19 国际科研合作中的参与度。表1 显示了国际总体科研合作率(34.27%)以及上述10 个国家科研合作程度,结果发现各国总体合作率为34.54%~81.97%,除了中国(34.54%)、美国(50.79%)和意大利(52.47%)以外,其余国家科研合作率都在60% 以上。从不同时间窗口来看,国际总体科研合作程度呈缓步上升趋势,进一步针对中美两国的科研合作率进行统计,发现中美两国的科研合作率在4 个时间窗口中呈现逐步下降趋势(25.40%、20.54%、18.85%、11.85%)。
表1 COVID‐19 发文量排名前10 国家在各时间窗口的科研合作率Tab 1 Scientific research collaboration rate of the top 10 countries in each time window
国际科研合作团队规模有研究表明,科学研究中的国际科研合作团队规模会随着时间的推移呈现逐渐增长的趋势[9-10]。在本研究中,以参与研究的合著者数量的平均值以及国家或地区数量的平均值来表示国际科研合作团队规模。表2 显示了4个时间阶段的团队规模分析结果,与既往学者的研究结果类似,从合著者数量来看,COVID-19 总体科研团队规模(9.34、9.20、11.09、13.46)以及国际合作中的团队规模(10.73、10.55、13.71、17.68)除了在第二阶段略有下降以外,整体随着时间变化呈现上升趋势;从参与研究的国家或地区数量来看,总体科研团队规模也呈上升趋势(1.46、1.81、1.83、1.88),国际合作中的团队规模在第二阶段出现短暂缩小(1.83),在第三、四阶段再次上升并呈稳定状态(3.45、3.30)。
表2 各时间窗口COVID‐19 国际科研合作团队规模Tab 2 Team size of COVID‐19 international scientific collaboration in each time window
国际科研合作网络构建由于不同国家或地区在科研基础和科研资源等方面存在差异,在国家或地区层面上就会表现出特定的合作网络结构。在本研究中,以所纳入的样本数据中的国家或地区作为节点,利用Ucinet 绘制4 个不同时间阶段COVID-19 国际科研合作的可视化图谱。如图2 所示,节点的大小代表度中心性,节点间的连线代表国家或地区之间的合作,连线的粗细代表合作次数。在该图谱中,第一阶段至第4 个阶段分别有46、111、90 和63 个节点,256、2998、2684 和1022 个连接。可以看到,在第一阶段位于中心位置的最大节点是中国,但是,在此后三个阶段中,美国一直处于整个合作网络的中心位置,是全球最大的节点。
图2 COVID‐19 高被引论文国际合作网络结构图Fig 2 COVID‐19 international collaboration network structure of highly cited papers
国际科研合作网络特征及演变网络密度(Density)在社会网络分析中主要用于刻画整个网络的合作情况,密度值越大,说明各个国家或地区之间的联系越紧密,而中心性(Centrality)则是衡量整个网络中心化程度的重要指标,包括度中心度(Degree)、接近中心度(Closeness)和中介中心度(Betweenness)[11-13]。借助Ucinet 软件,本研究揭示了COVID-19 国际科研合作网络的内部结构特征和演变,样本数据在各时间窗口的网络密度和中心性特征参数等指标的测量结果如表3 所示。整个合作网络在第一阶段的网络密度最低(0.186),但是3 个反映中心性的指标较高(1.159、2.422、15.630),说明在第一阶段虽然合作网络不是很大,但是却相对集中;到了第二阶段,网络密度迅速增高(0.690),各中心性指标明显下降(0.630、0.638、12.717),说明这一阶段网络中的科研合作紧密程度进一步加强,网络规模扩大;但是随着时间推移,到了第三和第四阶段,整个合作网络又呈现缩小趋势,表现为网络密度值下降,而合作网络向中心聚集的趋势又在不断加强,表现为中心性指标上升。
表3 COVID‐19 高被引论文合作网络中心性指标Tab 3 COVID‐19 collaboration network centrality of highly cited papers
此外,在社会网络分析中,常用核心—边缘这一结构模型来帮助寻找网络中的核心节点,这类节点通常与其他节点之间的联系较紧密,拥有较大的作用强度,处于网络的核心位置,通常采用核心度(Coreness)这个指标来表示[12]。借助Ucinet 软件,通过计算得到了样本数据中各个国家或地区在各个时间窗口的核心度指标参数值,通过核心度可以追踪到各个国家或地区在合作网络中地位的变化。如表4 所示,总体来看,核心度排在前10 位的国家在各个阶段相对比较固定,与上述发文数量最高的10 个国家比较一致,但是从某个具体国家来看,在第一阶段,中国是核心度最高的国家(0.741),但是随着时间推移,其核心地位在逐渐下降(0.364、0.309、0.205),从第三位逐渐降到第七位,而美国从第二阶段开始,一直稳居整个网络中最核心的位置,英国则紧随其后排在第二位。
表4 各时间窗口核心度排名前10 位国家Tab 4 Top 10 countries with the highest coreness in each time window
讨论
科研合作是解决复杂科学问题和推动科学进步的有效途径[14]。由于科学问题的复杂性日益增加,使得科研合作已经从个人合作、机构合作迈入国家合作的时代,国际科研合作已成为前沿科学发现的主导力量[15]。本研究以COVID-19 相关ESI 高被引论文作为样本,基于社会网络分析,对COVID-19 国际科研合作率、科研合作团队规模、国际合作网络特征和演变等方面进行了深入阐述和分析,从而揭示了COVID-19 国际科研合作发展态势。
国际合作的定义是指论文的合著作者属于两个或以上国家或者地区,既往有研究发现国际合作更加有利于提升论文质量,提高研究深度,以及促进学科成熟[16]。本研究发现COVID-19 高被引论文的国际科研合作率达到34.27%,与此同时,还发现在发文量最多的10 个国家中,除了中国以外,其他国家的国际科研合作率均超过50%,进一步证实加强国际合作将有助于促进高水平论文的产出[17]。这提示中国还需要加强与核心国家的科研合作以提升自身影响力,但同时也从侧面体现出中国具有越来越强大的独立科研实力,在国际合作程度偏低的情况下仍然在核心圈占有一席重要位置。
Cai 等[18]对比分 析了COVID-19 疫情发生前后全球科研合作规模和紧密程度的差异变化,发现随着疫情的发展,科研团队的规模和合作率呈下降趋势。但本研究发现科研合作团队规模和合作率总体呈上升趋势,这可能与本研究选取高被引论文作为研究样本相关。Wagner 等[19]研究发现中美两国合作发展迅速,超过世界上任何两个国家,但本研究发现中美两国在COVID-19 中的合作率随着时间变化呈逐步下降趋势,可能与两国政府主张的政策差异有关,例如,有研究人员会对于美国政府提出的加强对中美合作的审查而产生担忧,这就可能会影响两国科研合作的正常开展[20]。
Zhang 等[21]发现:美国、中国和英国是COVID-19 发文数量最多、国际合作最多的3 个国家;与受影响较小的国家相比,受疫情影响较大的国家通常会更多地参与国际合作;在规模更小、更集中化的网络中,核心还是由部分发达国家组成的精英团体。本研究也发现在COVID-19 整个科研合作网络中,上述3 个国家也是高被引论文产出最高的国家,同时国际合作网络的规模也逐渐呈现缩小趋势,合作网络不断呈向中心聚集。中国在第一阶段是网络核心,可能与中国是疫情初期受影响最严重且科研产出最多的国家有关,从第二阶段开始随着美国病例数增加,其作为全球科研实力最强的国家开始取代中国成为合作网络最核心的位置。各个国家在合作网络中的核心度分析表明,处于核心圈的国家相对固定,也说明科研大国之间的合作仍然在数量上占有绝对优势[22]。
综上所述,本文从上述多个角度针对COVID-19 国际科研合作网络特征及演化进行了分析,获得了有意义的研究结果。本研究也存在明显局限性:(1)由于高被引文献标记需要一定时间积累,导致第四阶段的样本数据量偏少,对数据分析结果的可靠性产生一定影响;(2)对国际合作网络特征的分析仅包括网络密度、中心性和核心度这几个参数,凝集子群、结构洞等网络特征分析不够深入;(3)仅从国家合作角度进行了合作网络的分析,机构合作、作者合作等方面未进一步挖掘。但通过本研究取得的结论仍可以在一定程度上反映COVID-19 国际科研合作态势,为研究人员今后进一步提升科研论文影响力及探寻合作路径提供启示。
作者贡献声明吴利俊 数据采集、清理和统计分析,论文撰写。宋元明 数据清理和核对。陈坚,王森 论文修改。 应峻 研究设计和论文修改。
利益冲突声明所有作者均声明不存在利益冲突。