APP下载

影响不同子领域国际合作的距离因素相同吗?
——来自计算机科学学科的证据

2024-01-03赵毅章成志习海旭

情报学报 2023年12期
关键词:回归系数距离论文

赵毅,章成志,习海旭

(南京理工大学经济管理学院信息管理系,南京 210094)

0 引 言

随着大科学时代的到来,许多科学问题的复杂性及规模逐渐增加,已经超过单一国家的能力范围[1]。2022年8月,我国教育部印发的《关于加强高校有组织科研 推动高水平自立自强的若干意见》[2]中明确指出,为了加强高校有组织科研,高校需要推进高水平国际合作,鼓励支持高校培育、发起国际大科学计划和大科学工程。由此可见,国际合作是解决不同学科复杂问题、提升创新能力的重要方式之一。已有研究表明,国际合作论文呈现逐年增长的趋势,但不同领域的国际合作强度存在一定差异[3]。Wagner等[4]比较了天体物理学、数学、高分子科学、地震学、土壤学和病毒学6个学科的国际合作情况,发现病毒学国际化合作程度最高,在2013年有130个国家参与了国际合作,而数学国际化程度最低,同年只有30个国家参与了国际合作。

在国际合作过程中,来自不同国家的科研人员通过合作可以获取互补的知识、资源等。大量研究表明,国际合作有益于学术论文影响力的提升[5-8]。各国基金委积极设立相关基金促进国际合作,但从总体来看,学术界的国际合作比例并未达到很高的水平[9],那么,对影响国际合作的距离因素进行探索就显得尤为重要。距离因素主要是指两个或多个国家间,因文化、技术发展水平、经济水平等多种维度的差距所产生的障碍可能会影响国家间的交流与合作。已有研究更多局限于探索影响国际合作的某一种或某几种距离因素,尤其是地理距离[10]、经济距离[11]、文化距离[12];主要聚焦于单一领域,如市场营销[3]、生态学[10]、高等教育[13]、人工智能[14-15]、管理学[16]、药学研究[17]等。从学科角度来看,受到学科范式、习惯的影响,不同学科的学者在选择国际合作对象时存在一定差异[18]。从国家角度来看,由于国家发展需求、科学政策以及经费投入侧重等的不同,不同国家的优势学科情况也会不同[19]。因此,为了给制定促进国际合作政策的政策制定者提供更具有普适性的证据,系统比较影响不同学科领域、不同国家国际合作的因素的差异是非常必要的。目前,尚缺乏从比较视角探讨影响不同学科距离因素的研究,且已有研究重点关注顶层学科间的差异。例如,Vieira等[20]将科学研究分为自然科学、工程与技术学、医学与健康科学、农业科学以及人文社会科学5个领域,其研究结果表明,所有距离因素均会阻碍国际合作,但是知识距离会促进农业科学学科的国际合作。粗粒度的学科划分掩盖了影响不同子领域国际合作的距离因素的异质性,且研究结论也无法为精细化政策的制定提供依据。相关研究表明,即使同属于社会科学领域,经济学的学者比社会学和心理学的学者更有可能参与到国际合作中[21-22]。为了弥补已有研究的不足,本文主要探讨了以下问题:

(1)不同子领域的国际合作强度的时空分布是什么样的?

(2)影响不同子领域的距离因素相同吗?

(3)影响不同时期、不同子领域的距离因素存在差异吗?

为了更好地回答上述问题,本文以计算机科学学科为例,将计算机科学划分为不同的子领域,分析不同子领域的国际合作强度的时空分布情况,并按子领域和时期量化地理、经济、企业参与程度、政治、文化和认知6大距离因素对所有参与计算机科学研究的187个国家的国际合作的影响情况。

1 文献综述及研究假设

推动国际合作的因素很多,包括促进国际合作政策出台[3]、科学研究专一化程度的提升[19]、远程通信技术的发展[23]、大科学装置的需求[24]、科学问题复杂化程度的提高[25]等。在已有探索国际合作影响因素研究的基础上,结合上述因素,本文将从地理距离、经济距离、企业参与程度距离、政治距离、文化距离和认知距离6个方面实证估计影响不同子领域国际合作的主要距离因素。

地理距离主要是指两个国家在地理空间上所处位置的远近程度[26]。地理学第一定律表明,任何事物均与周围的事物存在联系,距离越近,联系越紧密。国际合作也是如此,地理上的邻近有益于国家间的合作[27]。有学者认为,随着信息通信技术以及交通运输成本的下降,地理距离已经不再那么重要[28]。近期发表于《自然》杂志的一项工作表明,相比于面对面会议,在线交流会降低人们的创造力[29],而科学研究正是一种需要创造力的工作,因此,国际合作依然具有“面对面”交流的需求。同时,合作需要沟通,而“面对面”的交流更易促进思想的交流与隐形知识的传输[30],所以,国家间的空间距离有可能阻碍国际合作。鉴于此,本文提出第一个假设:

H1.地理距离与国际合作强度存在显著负向相关关系。

经济距离是指两个国家间经济发展水平的差距[3]。国家的经济发展水平在一定程度上可以反映其对科学发展的人力资源、财力资源的投入情况[31]。Vieira等[20]认为,来自落后国家的学者通常缺少科研资金的支持,为了解决复杂的科学问题,他们会向发达国家的学者寻求合作。但有研究表明,经济发展水平相当的国家之间更容易发生合作行为。例如,Nagpaul[32]以45个科研大国作为研究对象,发现经济距离越小的国家间越容易产生合作。Tang等[14]在人工智能领域发现了同样的结论,如果国家之间经济水平相似,那么国家间的合作更为紧密。鉴于此,本文提出第二个假设:

H2.经济距离与国际合作强度存在显著负向相关关系。

企业参与程度距离是指两个国家在某些特定领域中企业参与程度的差距[14]。为了应对激烈的社会竞争环境,企业积极地与高校进行产学研合作,该合作模式也成为推动知识生产、技术创新的一种重要方式,尤其是在计算机科学、生物科学等硬科学学科[33]。Tang等[14]研究发现,在人工智能领域,企业参与程度距离和国际合作程度存在正向的相关关系,其认为企业可以提供计算资源以及资金的支持,而高校可以提供人才和想法,来自不同国家的企业和高校实现了资源的互补,进而有利于国际合作的开展。鉴于此,本文提出第三个假设:

H3.企业参与程度距离与国际合作强度存在显著正向相关关系。

政治距离是指两个国家的政府的政策取向、治理理念的差距[34]。政治距离体现了国家间政治环境的差异,其往往对合作的稳定性产生影响。例如,某个国家对知识产权保护的法律不够健全,或某国实施的单边的、特殊的政策规定限制,诸如军事或高精尖技术类的信息传播,这些均会对国际合作造成影响。目前,有少量研究探索了政治距离和合作的关系。Jiang等[3]发现在市场营销领域,国家间的政治距离越大,国家间更倾向于合作。而Vieira等[20]在医学和健康科学、农业科学以及人文社会科学领域发现了相反的结论。综合来看,本文提出第四个假设:

H4.政治距离与国际合作强度存在显著负向相关关系。

在国际合作研究中,文化距离是指两个国家在宏观文化环境层面的远近程度[35]。如果两个国家的文化越相似,那么科研主体之间也更容易相关理解、相互信任,更容易产生合作。例如,假设学者A来自低权力距离社会,而学者B来自高权力距离社会,那么来自低权力距离社会的学者可能不会过多顾及权威,其更加崇尚扁平化的团队结构,而来自高权力距离社会的学者可能认为人们应该听从权威的领导,较大的文化差异对合作是有害的,这样的合作无法持久[36]。Gervedink Nijhuis等[12]研究发现,权力距离和个人主义/集体主义会影响合作过程中的沟通。但是,当Jiang等[3]将Hofstede提出的文化的4个维度综合为1个指标时,发现该指标和国际合作并不存在显著的相关关系。因此,本文提出第五个假设:

H5.文化距离与国际合作强度存在显著负向相关关系。

在国际合作背景下,认知距离是指两个国家所拥有知识基础的相似程度[37]。从吸收能力理论来看,学者之间有效的交流、学习是建立在两者之间拥有一定程度的知识基础之上的[38],即使在一些跨学科合作中,也是如此。较高的认知距离可以为科研主体完成共同的科研目标提供互补的知识,但是也可能因认知距离过大而导致沟通受阻;而较低的认知距离可以增强科研主体的知识吸收能力,能够促进合作[39]。目前,较多研究发现较小的认知距离会促进合作[20,27,40]。因此,本文提出第六个假设:

H6. 认知距离与国际合作强度存在显著负向相关关系。

2 数据与方法

2.1 数据来源和数据预处理

本文采用的数据集源自计算机科学文献库(DBLP computer science bibliography,简称DBLP)。DBLP收录了计算机科学学科的绝大多数会议和期刊论文,以及少量专著、学位论文和网页等,但原始的DBLP数据并未提供论文更细粒度的学科划分信息①https://dblp.uni-trier.de/xml/。AMiner抽取了DBLP论文的引用数据,并基于微软学术图谱(Microsoft Academic Graph,MAG)的学科分类体系FOS(field of study)为每篇DBLP论文分配了学科信息,因此,本文选择AMiner处理后的DBLP数据集。该数据集发布于2020年4月9日,包括4894081条出版物的元数据信息,其中元数据包含论文标题、摘要、作者姓名、机构、出版物类型、所属学科等字段②https://www.aminer.cn/citation。考虑到期刊和会议论文是计算机科学学科的主要学术出版物,且DBLP数据集中这两种类型出版物的占比高达85.09%(4164361/4894081),因此,仅保留会议和期刊论文两种类型的出版物。基于Manjunath等[41]提出的匹配方法,对每个机构的国家信息进行识别,并完成与全球研究标识符数据库(Global Research Identifier Database,GRID)③https://www.grid.ac/的匹配,获取机构所属类型信息,包括政府、学校、企业、具体场所、医疗保健、非盈利组织、档案馆以及其他8种类型。其中,74.54%(3104118/4164361)的论文可以识别出每个作者的国家信息,82.07%(3417526/4164361)的论文可以识别出至少一个作者的国家信息,本文仅保留可以识别出每个作者国家信息的论文。

为了分析计算机科学学科不同子领域的国际合作情况,本文需要对DBLP数据进行更细粒度的学科划分。MAG的FOS分类体系是一个6层的树状结构的分类体系。计算机科学属于19个最高级别学科层次之一,其第二层包含34个子领域[42]。可以看出,计算机科学中的第二层子领域相对过多,使得各个子领域的论文数量相对较少,从而影响子领域的分析质量。为了解决该问题,本文依据中国计算机学会(China Computer Federation,CCF)提供的学科分类体系④https://www.ccf.org.cn/Focus/2019-04-25/663625.shtml,将第二层中的34个子领域映射到更为广泛的10个子领域组,分别是人工智能、计算机体系结构和系统、计算机科学理论、数据库和数据挖掘、计算机网络、软件和软件工程、计算机图形学与多媒体、网络与信息安全、跨学科和多学科领域、人机交互与普适计算。具体的学科映射如附表1所示。最终,本文数据集由发表于1990—2019年的2153203篇论文构成,不同学科的论文分布情况如表1所示。

表1 不同学科的论文分布情况

2.2 研究方法

2.2.1 国际合作强度测度

通常使用国家间合作论文数量[3,27]、Salton指数[43]、Jaccard相似系数[10]等方法度量国家间的合作强度。其中,使用国家间合作数量测度国家间合作强度的方法,忽略了国家间的论文发表总量;Salton指数低估了小国家和大国家之间的合作强度[44]。因此,本文采用Jaccard相似系数来度量国家间的合作强度。具体计算公式为

其中,Cx和Cy分别表示国家x和国家y的国际合作论文发表数量;Cxy表示国家x和国家y合作发表论文数量;Jxy的值介于0~1,Jxy的值越大,表示国家x和国家y之间的合作强度越大。值得注意的是,本文采用全计数的方法来统计国家间的合作次数,如果某一个国家在机构列表中出现多次,那么只计算1次。例如,论文P有4个作者,分别来自A、B、C和C这3个国家,则对AB、AC和BC这3个国家对分别计数1次。

2.2.2 模型设定和距离因素的度量

借鉴已有研究的计量模型设定经验[3,20],本文构建了影响细分领域国际合作的计量模型,探究地理距离、经济距离、企业参与程度距离、政治距离、文化距离和认知距离6种距离因素对不同子领域国际合作的影响。具体模型设定为

其中,Jijt表示在t时期国家i和国家j之间的合作强度;α0表示常数项;GeoDistijt表示国家i和国家j之间在t时期的地理距离;EcoDistijt表示国家i和国家j之间的经济距离;IndDistijt表示国家i和国家j之间在t时期的企业参与程度距离;PoliDistijt表示政治距离;CultDistijtk表示t时期国家i和国家j在k维度的文化距离,文化距离包括4个维度[45]:权力距离(PowDist)、个人主义-集体主义(Indi‐vDist)、男性气质与女性气质(MascDist)以及不确定性规避(UncerDist);CogDistijt表示国家i和国家j之间在t时期的认知距离,具体指标介绍如表2所示。考虑到被解释变量的值介于0~1,且包含较多0值,因此,本文选择零膨胀beta回归模型对计量模型进行估计[10]。此外,本文在回归前对解释变量进行了标准化,以便比较回归系数。

表2 变量和数据来源

3 结果与分析

3.1 国际合作变化情况

在1990—2019年,计算机科学学科的国际合作论文约占发表论文总量的26.65%(573815/2153203)。由此可以看出,国际合作并未成为计算机科学学科生产知识的最重要形式。图1给出了计算机科学学科不同子领域的国际合作论文占比演化情况。从整体变化趋势来看,不同子领域的国际合作论文占比均呈现稳步上升的趋势。从不同子领域来看,在1990年,计算机网络子领域的国际合作论文占比最低,仅为2.56%;2013年之后,相比于其他子领域,计算机网络子领域的国际合作论文占比跃居第一位;在2019年,其占比达到28.96%。在1990年,计算机科学理论子领域的国际合作论文占比为7.63%,在当年排名第一;2011年以前,相比于其他子领域,计算机科学理论子领域的国际合作论文占比均处于领先地位。此外,从图1可以看出,在1990—2019年,计算图形学与多媒体子领域的国际合作论文占比排名一直处于较低的位置。总而言之,虽然不同子领域的国际合作论文占比均呈现显著的上升趋势,但不同子领域的增长趋势存在一定的差异。

图1 不同子领域国际合作论文的占比变化趋势

3.2 国际合作网络的空间模式

为了回答问题(1),分析不同子领域的国际合作强度的空间分布,本文利用ArcGIS 10.7对计算机科学学科1990—2019年187个国家间的合作情况进行了可视化。在国际合作网络的空间分布图中,仅保留了国家间合作次数超过20次的连边,以确保可视化的效果;考虑到篇幅有限,图2a~图2d仅分别展示了人工智能、计算机网络、软件和软件工程以及人机交互与普适计算4个子领域的国家间合作网络空间分布情况,其他子领域情况如附图1所示。图2中的节点表示国家,节点的大小与该国家的国际合作论文发表数量有关,节点越大,表示该国家的国际合作论文越多;若国家i和国家j存在合作关系,则两个节点存在连边,边的粗细和颜色深浅表示两个国家间合作强度的大小,即Jaccard相似系数的大小,边越粗、颜色越深,表示两个国家间的合作越密切。

附图1 不同子领域的国际合作网络的空间布局(彩图请见https://qbxb.istic.ac.cn)

图2 不同子领域的国际合作网络的空间布局(彩图请见https://qbxb.istic.ac.cn)

此外,为了比较不同子领域的国际合作网络的差异,本文利用复杂网络分析软件Gephi对不同子领域合作网络进行了网络凝聚性分析,计算了国际合作网络的关系总数、网络密度、平均聚类系数和平均路径长度,结果如表3所示。

表3 1990—2019年不同子领域国际合作网络联系特征

从图2a可以看出,人工智能领域的国际合作网络由美国、中国、加拿大以及欧洲国家等科研大国主导。其中,美国发表的国际合作论文数量最多,为55153篇;中国和英国紧随其后,国际合作论文数量分别为38342篇和22065篇。此外,发表国际合作论文超过11117篇的7个国家中有约一半是欧洲国家。从国家间合作强度来看,合作强度高于0.0483的14条国家双边合作关系中(深蓝色和黑色连线),有6条涉及中国,4条涉及美国。其中,中国和美国的合作关系最为密切,合作强度高达0.2219;其次是澳大利亚和中国(0.0940)、中国和新加坡(0.0828)等。这些合作强度高于0.0483的合作关系中有57%属于跨洲合作,有43%属于洲内国家合作。

图2b展示了计算机网络领域的国际合作空间分布情况。与人工智能领域类似,美国的国际合作论文数量最多,为24134篇;但在计算机网络领域,发表国际合作论文超过11117篇的仅有2个国家,分别为美国和中国。从国家间合作强度来看,合作强度超过0.0483的国家双边合作关系有23条,其中超过0.1101的仅有1条。在计算机网络领域合作强度排名前10位的合作关系中,中国和美国依然主导着这些合作。中国和美国、加拿大、英国的合作强度占据前3位,分别为0.2500、0.1100和0.0850。相比于人工智能领域,这些合作强度较高的合作关系中依然以亚洲和北美洲的合作为主,其次是欧洲国家间的合作,亚洲国家间的合作中只有巴基斯坦和沙特阿拉伯的合作出现在合作强度前10名之中。

图2c展示了软件和软件工程领域的国际合作空间分布情况。从国家间合作强度来看,合作强度超过0.0483的国家双边合作关系有19条,超过0.1101的仅有1条。在软件和软件工程领域,美国与中国、英国、德国以及加拿大之间的合作强度分别排名前4位。值得注意的是,虽然中国和美国之间在软件和软件工程领域的合作依然最为密切,但合作强度仅为0.1236。相比于上述两个子领域,在合作强度前10名的双边合作关系中,亚洲国家间的合作关系数量增多,除了排名第六的巴基斯坦和沙特阿拉伯外,中国与日本以及中国与新加坡的合作关系强度也排入前10名。

图2d展示了人机交互与普适计算领域的国际合作空间分布情况。从国际合作论文数量来看,所有国家的国际合作论文数量均未超过11117篇,美国、英国和德国国际合作论文数量排前3位。从国家间合作强度来看,在合作强度前10名的双边合作关系中,有一半涉及美国。与上述其他领域不同的是,在人机交互和普适计算领域,美国和英国之间的合作最为密切,合作强度为0.1256;加拿大和美国的合作强度排名第二,合作强度为0.1199;第三是中国和美国,合作强度为0.0970。合作强度前10名的双边合作关系以洲内合作为主,如英国和德国(0.0968);亚洲国家间合作包括中国和新加坡(0.0620)、中国和日本(0.0584),而巴基斯坦和沙特阿拉伯的合作强度不再位于前10名。

从国际合作网络的凝聚性来看,不同子领域的国际合作网络指标之间存在一定的差异。从关系总数来看,人工智能领域的关系为3013条,在10个子领域中居于第一位;人机交互与普适计算领域的关系总数最少,为1593条。从网络密度来看,不同子领域的国际合作网络密度处于0.141~0.209,计算机体系结构和系统的网络密度最高,跨学科和多学科领域的网络密度最低。总体而言,国际合作网络中各个国家之间的联系较为密切。从平均路径长度来看,不同子领域的国际合作网络密度处于1.844~2.102。从平均聚类系数来看,人工智能领域的平均聚类系数最高,达到0.819;网络与信息安全领域的平均聚类系数最低,为0.769。这说明在不同子领域的国际合作网络中,国家间的联系密切程度是存在差异的。

总而言之,从国际合作网络可视化的结果来看,虽然不同领域的合作由美国、中国、加拿大等科研大国主导,但不同领域的国家间合作模式存在一定差异,例如,在合作强度较高的合作关系中,人工智能领域的国际合作以跨洲合作为主,而人机交互与普适计算领域主要以洲内合作为主。从国际合作网络的网络指标来看,不同子领域的指标也存在一定差异。

3.3 国际合作网络的时空布局

为了进一步回答问题(1),了解同一领域不同时期的国际合作网络的时空分布,本文以人工智能子领域为例,比较1990—1999年、2000—2009年以及2010—2019年3个时期该子领域国际合作网络空间分布情况。

如图3a所示,在1990—1999年,从国际合作论文发表数量来看,美国、英国和加拿大的论文发表数量占据前3位。从国家间的合作强度来看,合作强度超过0.0483的国家双边合作关系有10条,超过0.1101的国家双边合作关系仅有1条。其中,7条关系涉及与美国的合作。加拿大和美国的合作最为密切,合作强度达到0.1190。在合作强度排名前10位的合作关系中,除排名第七的中国和美国以及排名第十的中国和加拿大之间的合作外,其余合作关系均为发达国家之间合作,如德国和美国(0.0929)、日本和美国(0.0851)。

如图3b所示,在2000—2009年,各国国际合作论文普遍增多,美国、中国和英国占据前3位。从国家间的合作强度来看,2000—2009年,合作强度超过0.0483的国家双边合作关系增加到14条,超过0.1101的国家双边合作关系仍仅有1条。在这一时期,中国和美国的合作最为密切,合作强度为0.1468。相比于1990—1999年时期,加拿大和美国的合作强度排名有所下降,跌至第四(0.0761)。值得注意的是,虽然合作强度排名前10位的双边合作关系中,美国的参与程度依然很高,涉及一半的合作关系,但中国的参与程度也在提升,有40%的合作关系涉及中国。此外,亚洲内部国家的合作有所增加,如中国和日本的合作强度为0.0810,位列第三;中国和新加坡的合作强度为0.0751,位列第七。

如图3c所示,在2010—2019年,从国家间的合作强度来看,合作强度超过0.0483的国家双边合作关系增加至16条,超过0.1101的国家双边合作关系仅有1条。中国和美国、澳大利亚、英国的合作强度占据前3位,分别为0.2491、0.1015和0.0855。在这一时期,在合作强度排名前10位的双边合作关系中,加拿大和美国的合作强度排名降至第十。此外,除中国外,发展中国家巴基斯坦和沙特阿拉伯首次出现在合作强度前10名的合作关系中。从网络特征来看,关系总数由1990—1999年的566增加到2000—2009年的2848,合作发表论文的国家对显著增加;合作网络的密度由1990—1999年的0.122增加到2000—2009年的0.194,国际合作网络中的国家间合作的紧密程度不断提升;平均聚类系数由0.771增加到0.818,说明国家间联系更加密切;平均路径长度由2.11下降至1.9,说明人工智能领域的国家间交流合作更为畅通。

总体而言,随着时间的推移,进行人工智能研究的新兴科研大国正在逐渐崛起,如中国、新加坡等,科学合作格局正在由“一极多强”转向“多极合作”,合作网络中的国家之间的密切程度也在不断增强。

3.4 影响国际合作的距离因素

为了回答问题(2),验证影响不同子领域国际合作的距离因素是否相同,本文采用回归分析进行探索,表4和表5分别给出了不同子领域的回归结果以及边际效应。此外,本文计算了每个模型的方差膨胀因子,发现每个模型的平均方差膨胀因子值均小于3,说明多重共线性问题对本文的影响较小。

表4 距离因素对不同子领域国际合作影响的回归结果

表5 距离因素对不同子领域国际合作影响边际效应

地理距离因素(GeoDist)的系数是负值,且在1%的显著性水平下显著,这说明地理距离越近的国家,越有可能进行密切的合作,H1得到验证。地理距离因素的回归系数介于-0.66225~-0.29875。比较不同距离因素对国际合作强度的边际效应(表5)可以看出,地理距离是影响国际合作强度的重要因素之一。地理距离因素在网络与信息安全子领域对国际合作强度的影响最大(0.00328%),在人工智能子领域的影响最小(0.00217%)。

同样地,在所有子领域,经济距离(EcoDist)因素的回归系数在1%显著性水平下为负值,回归系数介于-1.07974~-0.83291,这在一定程度上说明了经济发展程度相近的国家之间更有可能发生密切的学术合作,H2得到验证。从经济距离因素对国际合作强度的边际效应来看(表5),经济距离是影响国际合作强度的重要因素之一。比较不同领域经济距离因素对国际合作的边际效应可以看出,经济距离因素在计算机图形学与多媒体子领域对国际合作强度的影响最大(0.00448%),在计算机体系结构和系统子领域的影响最小(0.00217%),不同子领域间该因素的边际效应差异较小。

就企业参与程度距离因素(IndDist)而言,人工智能领域的回归系数为正值,但不具有统计学意义;其余子领域中该因素的回归系数为负值。其中,软件和软件工程、计算机网络、网络与信息安全、计算机图形学与多媒体、人机交互与普适计算以及跨学科和多学科领域6个子领域的回归系数分别在不同的显著性水平下显著,这意味着在这些子领域,若国家间具有相似的企业参与程度,则可能产生更为密切的国际合作,H3未得到验证。此外,回归系数的方向差异在一定程度上说明了在同一学科下不同子领域间存在异质性。从企业参与程度距离因素对国际合作强度的边际效应来看(表5),不同子领域之间差异较小。其中,在人机交互与普适计算子领域中,该因素对国家合作的影响最大(0.00165%);在计算机体系结构和系统子领域中,该因素对国际合作的影响最小(0.00108%)。

政治距离(PoliDist)因素的回归系数均为负值,但在计算机网络、网络与信息安全、数据库和数据挖掘以及跨学科和多学科领域4个子领域不具有统计学意义,其余子领域的该因素的回归系数均在不同显著性水平下显著,这说明了如果两个国家的政府治理水平越接近,那么两个国家越有可能产生密切合作,因此,H4得到部分验证。

文化距离因素包括权力距离(PowDist)、个人主义-集体主义(IndivDist)、男性气质与女性气质(MascDist)和不确定性规避(UncerDist)4个维度。网络与信息安全领域的权力距离与国际合作强度存在显著负向相关关系,其余子领域的权力距离与国际合作强度均不存在显著相关关系。个人主义-集体主义维度在不同子领域的回归系数均为负值,但回归系数只在计算机科学理论、软件和软件工程、计算机图形学与多媒体、人机交互与普适计算、跨学科和多学科领域5个子领域显著。从个人主义-集体主义对国际合作强度的边际效应来看(表5),该因素在计算机科学理论领域的边际效应最小(0.00062%),在人机交互与普适计算领域的边际效应最大(0.00156%)。男性气质与女性气质维度的回归系数均为负值,但只在数据库和数据挖掘、跨学科和多学科领域具有统计学意义,其余子领域的回归系数均不显著。从不确定性规避维度来看,仅网络与信息安全、计算机图形学与多媒体两个子领域的回归系数在不同显著性水平下显著,其余子领域该维度回归系数均不显著,这说明在这两个子领域中,对于不确定性容忍程度相近的国家更容易产生密切合作,H5得到部分验证。

在所有子领域中,认知距离因素的回归系数均在1%显著性水平下显著为负值,这说明了国际合作更有可能发生在具有相似认知基础的国家之间,H6得到验证。比较不同距离因素对国际合作强度的边际效应(表5)可以看出,认知距离是阻碍国际合作的最大障碍。认知距离因素在计算机图形学与多媒体子领域对国际合作强度的影响最大(0.01834%),在计算机体系结构和系统子领域的影响最小(0.01267%)。

3.5 不同时期影响国际合作的距离因素

为了回答问题(3),本文探索了影响不同子领域国际合作的距离因素是否会随着时间发生变化。本文使用零膨胀beta回归模型对不同子领域在1990—1999年、2000—2009年、2010—2019年3个时期的距离因素的系数进行估计。考虑到篇幅有限,本文仅展示人工智能、计算机网络、软件与软件工程以及人机交互与普适计算4个子领域的回归结果(表6)和各因素的边际效应结果(表7)。

表6 距离因素对不同子领域在不同时期国际合作影响的回归结果

表7 距离因素对不同子领域在不同时期国际合作影响的边际效应

在各个子领域的不同时期,地理距离(Geo‐Dist)和国际合作强度均呈现显著负向相关关系,再次验证了H1。此外,不同时期地理距离的边际效应呈现下降趋势。例如,在人工智能领域,地理距离的影响由1990—1999年的0.00261%下降至2010—2019年的0.00230%;在计算机网络领域,地理距离因素影响的下降幅度更大,由0.00813%下降至0.00323%。

同样地,在不同领域的不同时期,经济距离(EcoDist)因素的回归系数均在1%或5%显著性水平下显著为负值,研究结果支持H2。此外,不同时期经济距离因素对国际合作强度的边际效应呈现增加趋势,例如,在人工智能领域,经济距离因素的边际效应由0.00118%增长至0.00375%。

在部分子领域的部分时期,企业参与程度距离(IndDist)和国际合作强度存在负向相关关系,例如,人机交互与普适计算领域在2000—2009年、2010—2019年两个时期,该因素的回归系数均显著为负值,研究结果不支持H3。此外,企业参与程度距离的边际效应呈现下降趋势。例如,上述两个时期的边际效应在人工智能领域,从0.00149%下降至0.00098%;在人机交互与普适计算领域,从0.00222%下降至0.00134%。

政治距离(PoliDist)因素的回归系数只在部分子领域的部分时期存在统计学意义。例如,在人工智能领域的2000—2009年,政治距离和国际合作强度存在显著负向相关关系。从政治距离的边际效应来看,不同时期政治距离因素的影响逐渐下降,例如,在人工智能领域,从1990—1999年的0.00279%下降至2010—2019年的0.00074%。

从文化距离来看,权力距离(PowDist)维度在不同子领域、不同时期的回归系数均不显著。在软件与软件工程和人机交互与普适计算领域,不同时期个人主义-集体主义(IndivDist)维度的回归系数均显著为负值。此外,这两个领域该因素的边际效应也在随着时间逐渐减小。而男性气质与女性气质(MascDist)、不确定性规避(UncerDist)维度与国际合作强度仅在部分领域的部分时期存在显著负向相关关系。

除了计算机网络领域的1990—1999年时期、人机交互与普适计算子领域的1990—1999年和2000—2009年两个时期外,其余时期不同子领域认知距离的回归系数均在1%显著性水平下显著为负值。此外,认知距离因素对国际合作强度的影响在不同领域均呈现下降趋势。例如,在人工智能领域,认知距离的边际效应由0.03859%下降至0.01751%。

4 结论与讨论

本文基于DBLP科研论文数据,从比较视角出发,揭示了1990—2019年187个国家在计算机科学学科下不同子领域的国际合作强度网络的时空演变情况,并基于计量模型,实证检验了影响不同子领域以及不同时期国家间国际合作的距离因素。

通过分析国际合作的时空演变情况,本文得出以下结论。

(1)不同子领域国际合作论文逐年增多,但变化趋势存在差异。

在1990—2019年的计算机科学学科,国际合作论文约占发表论文总量的26.65%,因此,国际合作并未成为计算机科学进行知识创造的最重要形式。比较不同子领域国际合作情况,发现不同子领域的国际合作论文占比在1990—2019年均呈现显著的上升趋势,但不同子领域的增长趋势存在一定的差异。例如,计算机网络在1990年的国家合作论文占比排名最低,而2013年之后跃居第一位;计算图形学与多媒体子领域的国际合作论文占比排名一直较低。

(2)高强度国际合作关系由科研大国主导,但子领域异质性显著存在。

从国际合作的空间分布来看,国际合作由美国、中国、加拿大等科研大国所主导,但不同子领域的国际合作的空间分布也存在一定差异,例如,在合作强度靠前的关系中,人工智能领域的国际合作以跨洲合作为主,而人机交互与普适计算领域主要以洲内合作为主。此外,从网络指标来看,计算机体系结构和系统子领域的网络密度最大,而人机交互与普适计算领域的网络密度最小。

(3)人工智能领域合作由“一强多极”向“多极合作”模式转变。

从国际合作的时空分布来看,在1990—1999年,人工智能领域国际合作强度较高的合作关系中由美国主导,随着时间推移,中国、新加坡等新兴人工智能强国也逐渐涌现。从国际合作网络结构来看,网络密度由1990—1999年的0.122增加至2000—2009年的0.194,国家间的合作也越来越密切。

通过分析影响不同子领域以及不同时期国际合作的距离因素,本文得出以下结论。

(1)地理距离会阻碍不同子领域的国际合作,但边际效应随着时间变化逐渐下降。

地理距离依然会对不同子领域的国际合作产生负面影响,并没有验证经济学家Frances Cairncross的“距离之死”的假说[28],这与Parreira等[10]、Tang等[14]以及贺超城等[46]的研究发现一致。其原因可能是,面对面的交流更容易实现知识的溢出,有利于隐性知识的传播,距离越近,越容易实现频繁和有效的面对面交流。本文发现,随着时间的推移,距离因素对不同子领域国际合作的影响会减小,这可能是由于通信技术的发展(如腾讯会议、ZOOM等会议软件的出现)以及交通运输技术的推进(如高铁等),面对面的沟通更容易实现,在一定程度上缓解了距离因素对国际合作的阻碍效应。

(2)经济距离会阻碍不同子领域的国际合作,且边际效应随时间变化逐渐增大。

经济距离会阻碍不同子领域的国际合作。目前,已有较多研究证明两个国家间的经济发展水平越接近,那么国家间更容易发生合作[3,20]。国家的经济水平越高,对科学技术发展、人才交流等项目的资金投入也越多。例如,中国的国家留学基金项目旨在促进国内高校与国际高校开展国际化人才培养合作,而获得资助的学生大多选择去往经济发展水平较高的国家。此外,本文发现合作较为密切的国家间通常存在经济伙伴关系协定,经济伙伴关系协定在促进进出口贸易的同时,也意味着更便宜的交通费用,这在会一定程度上促进学者的流动,增加国际合作的可能性。经济距离对国际合作强度的影响随时间变化而增大,说明了国际合作对经济发展水平的依赖程度越来越高。

(3)认知距离会阻碍不同子领域国际合作,但边际效应随时间变化逐渐减小。

与经济距离类似,本文发现认知距离越小的两个国家之间越容易产生合作,而且在每个子领域皆如此,这与Gui等[27]、贺灿飞等[47]的研究结论一致,说明科学合作的顺利开展需要合作双方拥有一定的共同知识基础,才能有助于知识的理解和吸收,进而促进科研创新。此外,本文还发现,随着时间的推移,认知距离对国际合作的影响会下降。其原因可能是,全球化虽然使科学研究的国际分工更为明确,使国家的研究变得专一化,但是由于一些政治因素,如美国对中国的技术制裁,迫使中国开展基础技术方面的研究,使得中国的研究更为多元化,减小了未来与其他国家的合作的认知距离。此外,在科学研究中,由于小国家资源有限,可能局限于某些关键领域和学科,但是大国家在发展优势学科的同时,也会对其他领域进行积极的投入,这可能也是认知距离因素对国际合作影响下降的另一个原因[19]。

本文尚存在一些局限性,只考虑了计算机科学子领域的国际合作的影响因素,在未来的研究中可以对比计算机科学子领域与其他学科子领域的国际合作的影响因素,例如,计算机科学和管理学,这两个学科的研究范式存在差异,那么影响学科子领域的国际合作的因素是否也存在差异是值得探讨的。此外,本文将研究数据局限于研究论文,但其实专利也是计算机科学关注的研究成果之一,在未来的研究中可以综合考虑论文和专利数据。

猜你喜欢

回归系数距离论文
算距离
多元线性回归的估值漂移及其判定方法
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
多元线性模型中回归系数矩阵的可估函数和协方差阵的同时Bayes估计及优良性
每次失败都会距离成功更近一步
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
爱的距离
2013年5—12月最佳论文