APP下载

基于ERGM 的应用基础研究合作网络演化机制研究

2023-02-24高始扬

中阿科技论坛(中英文) 2023年2期
关键词:网络结构学者基础

高始扬

(同济大学经济与管理学院,上海 200092)

具有应用目标导向的基础研究是创新链中的重要环节,在纯基础研究和应用研究间起着桥梁作用。现阶段,实现高水平自立自强已经成为国家战略的重要内容之一,在国际科技竞争进入白热化阶段的重要关口,中国科技创新链条在部分应用基础研究上的短板亟待补足。2020年5月,科技部官网出台的《新形势下加强基础研究若干重点举措》指出,要激发创新主体活力,尊重科研人员的科研活动主体地位,同时营造有利于基础研究发展的创新环境,尊重和认可团队所有参与者的实际贡献。应用基础研究具有周期长、外部性强等特点,科研人员及研究团队是应用基础研究成果质量的首要影响因素,因此探究科研人员的合作网络演化机制对理解研究团队形成、激发学者创新活力、掌握知识创新规律、提高研究合作效率具有重要意义。

已有基础研究主要聚焦于以下3方面:一是基础研究的基本属性(包括内涵、特征、要素等)[1-2];二是基础研究项目的评价体系(包括评价方法、评价指标等)[3-4];三是对地区基础研究能力的实证分析(包括投入-产出分析,对比分析等)[5-6]。可以看出,针对应用基础研究的成果较为匮乏,同时其合作网络的演化机制尚不明确。随着科学研究的复杂程度和综合程度不断加强,科研合作已成为学者进行科学研究的主流形式。科研合作可以整合各方资源、取长补短,有助于提升科研效率[7-8]。

为了厘清应用基础研究的合作网络演化机制,文章从网络结构、互惠关系、学者属性3个维度提出研究假设,基于国家自然科学基金在振动理论领域的论文数据,分阶段考察合作网络的演化特征,并采用指数随机图(ERGM)方法探索关键影响因素及其在网络演化中的变化情况,从而为强化应用基础研究发展提供借鉴。

1 理论回顾与研究假设

1.1 理论回顾

目前,已有文献对学者合作影响因素的探讨可分为以下3个方面:网络结构、学者属性、互惠关系。网络结构方面,如刘凤朝等[9]基于USPTO专利数据研究纳米技术合作网络,发现新进入的节点会优先选择中间中心度、点中心度高的节点合作,且该现象随着网络的演化越加明显。学者属性方面,张利华等[10]基于《管理评论》2004—2008年论文数据发现我国管理科学领域内作者发文数量与点中心度呈显著相关关系。互惠关系方面,如贾茜等[11]研究管理学期刊数据发现地理距临近、社会临近是促成科研合作的因素;郭永正[12]分析了控制理论领域的期刊论文合作,研究结果表明青年-中老年学者间的合作是最普遍的合作模式,青年-青年的合作强度随着合作人数的增加而加强。

虽然很多学者对影响因素进行了深入探讨,但已有研究仅从单一维度研究,忽略了各类因素间的相互影响,同时,受传统研究方法的制约无法将三者放到同一模型进行研究。指数随机图(ERGM)是一种用于识别并检验关系模式的社会网络分析模型,在计算网络结构影响的同时,能将学者属性、互惠关系分别转化为节点属性、边属性一并放入模型中研究网络的演化机制[13]。文章基于ERGM模型,从网络结构、互惠关系、学者属性三个维度研究应用基础研究合作网络演化机制。

1.2 研究假设

1.2.1 网络结构因素假设

(1)传递性机制。传递性是指在复杂网络中当两个节点都与某个节点有联系时,则他们之间也更易建立联系,形成闭合三角结构。科研合作网络中的传递性可以从知识领域和科研社交两方面予以解释。有合作关系的学者之间存在知识共享与传递的现象,学者在共同合作者的影响下会发生知识同化。有相似知识体系的学者间更易进行合作,因此有共同合作者的学者更倾向于合作。此外,学者建立合作关系有出于巩固和加强社会关系的目的,更愿与熟识的人开展合作[14],显然合著者的合作对象是比较理想的选择。基于此,提出如下假设:

假设H1 合作网络倾向于形成闭合三角结构。

(2)择优连接机制。择优连接机制是指在复杂网络中某节点拥有的联系越多,则该节点越容易受其他节点青睐而产生联系[15],形成强者愈强的局面。在网络中表现为存在K-星结构,即与其他多个节点存在联系的核心节点。新学者倾向与阅历丰富的学者建立合作关系,网络中合作关系多的学者在与新节点建立联系上占有优势。机构间的科研合作意向也表现出向优势资源聚集的趋势[16]。学者在属性上的优势(如科研平台优势,科研经历丰富等)会为其带来更多的合作机会,且随着网络的演化逐渐成为网络中的核心节点。基于此,提出如下假设:

假设H2 合作网络倾向于形成K-星结构。

为了更好地解释内生变量假设与模型的关系,总结出假设与对应图例,如表1所示。

表1 网络结构假设与图例

1.2.2 互惠关系因素假设

(1)地理邻近。地理位置上的邻近为学者间知识传播提供了便利,也为科研社交提供了有利条件,从而促进科研合作关系的形成[17]。科研合作主要发生于机构内部或者地理临近的机构间,同省的学者合作是论文合著的主要形式[18]。郭淑芬等[19]指出随着交通、通信技术的不断发展,地理距离对科研合作的影响程度呈减小态势。此研究指出应用基础研究往往依托实验室设施的支撑,地理距离仍是影响合作的重要因素,并提出如下假设:

假设H3 相同省份的学者之间更倾向于合作。

(2)学科领域。学者的论文被引用次数多说明其研究成果与创新点得到了其他学者的认可。当聚焦于特定研究领域时,论文被引量也是学者在领域内影响力的直接体现。温芳芳[20]发现国外学者强强联合的合作模式比较普遍,而国内的学者强强联合并不常见,弱弱联合是较为普遍的合作模式。这种模式虽然能促进学者的成长,但难以产出有影响力的成果。文章将学者力学领域内论文的被引量作为指标,研究是否存在因学科差异导致弱弱联合的现象,并提出如下假设:

假设H4 力学领域的低被引学者之间更容易形成合作。

(3)学术年龄。学术年龄是指学者参与学术研究的年数,计算方式为学者某篇论文的发表时间与首篇论文发表时间的年数差加一。与常用的生理年龄相比,学术年龄是衡量学术生涯的时间标尺[21]。在学术生涯的不同阶段,学者的合作偏好也会发生变化。有研究表明青年学者与中老年学者是最常见的科研合作模式且以师生合作为主[12]。这种合作模式不仅有利于学科知识的隐形传承,中老年学者的经验与年轻学者的创造力相结合也让研究成果更具影响力。但随着科研队伍中年轻学者成为论文发表的中坚力量,青年学者间的合作模式已成新的趋势[22]。这种模式有利于学者的成长,但是不利于产出有影响力的研究成果。文章研究学术年龄如何影响网络关系,并提出如下假设:

假设H5 中老年学者更倾向与青年学者合作。互惠关系假设与图例如表2所示。

表2 互惠关系假设与图例

1.2.3 学者属性因素假设

(1)发文数量。学者的发文量多代表其在科研团队中具有重要地位,与团队中其他学者的联系更为紧密,也为该学者带来了更多团队内部合作机会[10]。受国家自然科学基金支持的论文数量多也说明学者具有较高的学术影响力,能吸引更多科研团队以外的学者与之合作。基于此,提出如下假设:

假设H6 高产学者会有更多的合作机会。

(2)重点实验室经历。国家重点实验室(以下简称“国重”)是国家创新体系的重要组成部分,配备先进科研设施、吸纳优秀学者以开展覆盖各学科领域的基础研究、应用基础研究,承担着推动学科与技术发展、培养优秀基础研究人才、开展高水平交流合作等职责。部级、省级重点实验室(以下简称“部重”“省重”)定位与之类似[23],都汇聚了国内的优质科研资源,但在层级上要低一档。有重点实验室经历的学者有着更强的科研资源获取能力,是其他学者的理想合作对象。基于此,提出如下假设:

假设H7a 有国重经历的学者会有更多的合作机会;

假设H7b 有部重、省重经历的学者会有更多的合作机会。

为了更好地解释外生变量假设与模型的关系,总结出假设与对应图例,如表3所示。

表3 学者属性假设与图例

综上,构建应用基础研究合作网络演化概念模型如图1所示。

图1 应用基础研究合作网络演化概念模型

2 研究设计

2.1 数据来源

文章将中国知网(CNKI)作为来源数据库,选取以基础研究为主要资助对象的国家自然科学基金成果为样本池,在此基础上选择振动理论作为研究对象筛选样本。振动理论是力学中的一个重要分支,在生产技术向大型化、高速化、复杂化和轻量化发展的社会,振动理论的瓶颈问题愈发突出,振动领域内的前沿突破将为航空、船舶、建筑等多个学科领域的高质量发展提供基础保障,因此文章选取振动理论作为应用基础研究的典型代表进行研究。

通过CNKI的高级检索功能,设置基金为国家自然科学基金,时间段选取2009—2020年,期刊类型选为北大核心,文献分类选取基础学科下的振动理论。检索数据并去除不完整的数据后,共检索到论文1 353篇,作者2 650位。获得的论文信息包括篇名、发表时间、作者id、作者署名单位等;作者信息包括作者名、研究领域、发表的期刊论文数量、首篇与最新期刊发表时间等。另外,通过作者单位、作者名在知网查询该作者是否有以国重、部重、省重为单位发表过论文以及在力学领域发文的被引量,并通过作者id进行验证。

2.2 数据处理

在开展实证分析前,需要对样本数据进行以下两个方面处理。

一是演化阶段划分。根据作者id、论文合著关系构建无标度、无向的科研合作网络。此研究聚焦于学者之间的合作关系,选取学术年龄大于5年的科研工作者,在排除研究生作者的同时减少节点数量,缩短模型运行时间,并以4年为一个时间段,将应用基础研究合作网络演化划分为2009—2012年、2013—2016年、2017—2020年3个阶段。

二是节点属性标记。使用Python对网络中的节点属性数据进行处理:①将作者单位标记为对应省份,相关数据从教育部文件与各研究机构、公司的官网上获取。为了对省份加以区分,做了唯一性标识,设置为变量Pro。② 设置变量ArtNum,将网络中发文量≥2的作者设为高产作者,标记为1,否则为0。③设置变量Cite,将力学领域被引量≤20的作者设为力学领域的低被引学者,标记为1,否则为0。④设置变量Age,计算网络中作者各时段发文时间的平均值,减去首篇期刊发文时间计算得到作者的学术生涯时长,将研究经历≥15年的学者设为中老年学者,标记为1。其余学者设为青年学者,标记为0。⑤设置变量Lab2,将曾以国重为作者单位发表论文的学者设为有国重经历的学者,标记为1,否则为0;设置变量Lab1,将曾以部重、省重为作者单位发表论文的学者设为有部重、省重经历的学者,标记为1,否则为0。

2.3 研究方法

指数随机图(ERGM)是一种针对关系数据的统计方法,基于网络结构与概率公式生成和真实网络相仿的仿真网络。其优点在于从网络结构、互惠关系、学者属性3个维度全面研究影响网络的因素,解决了传统模型的缺陷[13],更深入地探究网络生成的潜在机制。ERGM的一般公式为:

3 实证研究

3.1 演化特征分析

将应用基础研究合作网络演化划分为2009—2012年、2013—2016年、2017—2020年3个阶段,利用Gephi软件绘制得到网络的拓扑结构图,如图2所示。

图2 应用基础研究合作网络演化图

由图2可以看出,网络中合作关系有些稀疏,3个阶段的合作网络均未出现大规模的连通子图,以少数节点间的合作联系为主,这说明学者们倾向在小团体内开展科研合作,且随着网络的不断演化小团体的数量逐步增多,团体内部联系也愈发紧密。应用基础研究合作网络结构指标如表4所示,可以看出各个阶段的网络规模差异不大,网络密度均处于较低水平。其中,2013—2016年的网络规模最大,网络边数也最多,但是网络密度最低。虽然3个阶段的网络密度有起伏,但是网络节点的平均度数在稳步提升,说明学者逐步乐意与其他学者建立合作关系,合作的积极性增加。

表4 应用基础研究合作网络结构指标

3.2 演化机制分析

使用R中的社会网络分析工具包构建了3个时间段的ERGM模型。模型使用马尔可夫链蒙特卡罗最大似然法(MCMC MLE)对变量进行参数估计,参数检验采用t统计检验,一般p值小于0.05表示通过显著性检验。同时,只有标准差不大于参数的50%才能被认定为统计量检验结果显著。AIC、BIC是模型优劣比较的评价指标,AIC、BIC值越小说明模型拟合的效果越好,即生成的仿真网络将与真实网络越接近。各模型的估计结果如表5所示。网络结构中的Edge、Gwdsp是模型基本结构变量,Gwesp是网络的传递性变量,Gwdegree是网络的择优连接变量。

表5 ERGM模型结果

(1)从网络结构来看:①各阶段的网络都存在传递性,说明受科研社交、知识体系等因素影响,学者更愿意与自己合著者的合作对象建立联系,假设H1得到验证。②各阶段网络都存在择优连接现象,说明网络中存在核心学者,他们受到其他学者的青睐得到更多合作机会,形成强者愈强的局面,假设H2得到验证。③传递性与择优连接机制两项参数在各阶段中始终大于3,说明网络结构对于应用基础研究合作关系有着关键性影响。

(2)从互惠关系来看:①地理邻近始终是影响应用基础研究合作的重要因素,假设H3得到验证。相同地区的学者更容易建立科研社交关系,且应用基础研究常依托实验室开展,跨地区的合作将变得低效,因此多数合作关系发生在同省份内。②各阶段都出现了力学领域内低被引学者弱弱联合的现象,假设H4得到验证。同时,结合假设H2的验证结论,发现力学领域内具有较强的马太效应,核心学者或高被引学者往往具有创新资源优势,在竞争性项目机制下容易产生研究壁垒,导致难以获得资源的学者只能寻求弱弱联合以换取互补优势。注意到合作模式中的弱弱联合倾向在第3阶段略有减弱,表明合作壁垒有所缓解。③年龄异质的合作偏好在第1阶段和第2阶段得到验证,但假设H5在第3阶段未能得到验证。说明“以老带新”的合作模式正在逐渐减少,说明力学领域应用基础研究团队的年龄结构可能出现显著变化。随着中老年学者步入退休阶段,各研究机构普遍加强了对青年团队的扶持力度,这很可能是导致中老年与青年学者间合作减少的重要原因。

(3)从学者属性来看:①高发文量会为学者带来更多的合作机会,假设H6得到验证。②剔除假设H6发文量的影响后,有国重经历的学者在各阶段上均表现出独立研究的倾向,假设H7a未得到验证。这可能是由于国重具有明确的研究方向、先进的实验设施、完备的科研团队,而科研合作本质上是一个资源互补的过程,享有多项科研资源优势的学者无须再与外部学者合作,通过与实验室内部学者合作即可满足科研需求。在第3阶段学者合作的积极性有所提升。③有部重、省重经历的学者在第1阶段和第2阶段并未表现出显著的合作倾向,但假设H7b在第3阶段上得到验证。说明相较于有国重经历的学者,有部重、省重经历的学者更乐意与其他学者合作。有部重、省重经历的学者在网络的演化过程中合作积极性同样有所提升。

3.3 稳健性检验

采用最优拟合优度(Gof)来验证模型的稳健性,通过度(degree)和边共享伙伴(edge-wise shared partners)两个网络结构指标验证仿真网络与真实网络的匹配性,检验结果如图3所示。黑线是真实网络的统计结果,灰线与箱型图是仿真网络的统计结果,黑线落在灰线与箱线图范围内说明模型拟合效果佳。由图3可知,仿真网络与真实网络在度指标上较为接近,在边共享伙伴指标上无较大差别,总的来说模型拟合结果较好,ERGM估计结果稳健。

图3 模型拟合优度

4 结论与启示

4.1 研究结论

探索应用基础研究的合作网络演化机制对提升原始创新能力、优化基础研究战略部署、建设科技强国具有重要意义。在借鉴基础研究特征和合作网络研究成果的基础上,将应用基础研究合作网络演化的影响因素归纳为网络结构、互惠关系、学者属性3个方面,基于2009—2020年国家自然科学基金资助的振动理论论文数据,构建了三阶段合作网络,并采用ERGM对其演化机制开展了实证研究。研究结果表明:①网络密度低,但学者的合作关系数在上升,其中,小团体是网络中最常见的合作模式。②网络结构对演化进程具有关键性影响。应用基础研究科研合作网络具有传递性,同时网络中存在择优连接机制。受网络结构的影响,与核心学者合作能为学者带来更多潜在合作机会。③在互惠关系因素中,地理邻近是应用基础研究合作的重要影响因素,相同省份的学者更易建立合作关系;领域内马太效应有所减弱,弱弱联合倾向在第3阶段略有下降;“以老带新”的合作模式正在逐渐减少,研究团队呈现年轻化趋势,但同事也会降低部分隐性知识的传承概率。④学者属性因素中,领域内的高发文量能为学者带来更多合作机会。有国重经历的学者仅与少量学者合作,因为他们在多项科研资源上处于优势地位,与外部学者合作难以形成资源互补。现有合作关系已经能满足科研需求,因此不再寻求新的合作机会。相比之下,有部重、省重经历的学者更乐于合作。

4.2 管理启示

结合应用基础研究的合作演化特征,对提升应用基础研究能力给出以下3条管理启示。

(1)鼓励不同背景的学者开展合作。凝聚差异化学者开展科研工作有利于丰富研究团队的外部知识来源,并通过网络嵌入进一步扩大合作网络规模,这将有利于相关领域的快速发展。同时降低竞争性项目比例,确保资源有效、合理地在各类学者间进行配置,以降低研究中可能愈演愈烈的马太效应和研究壁垒,引导应用基础研究的知识成果在合作网络内外充分流动和扩散。

(2)开展具有区域特色的应用基础研究。地方科研管理机构应判断地区的发展趋势和优势学科,牵头省内高新龙头企业与科研机构,开展具有区域特色的应用基础研究。由企业提供资金与研究方向,学者们集思广益来解决企业面临的共性技术难题,形成双赢的局面。

(3)提高国家重点实验室开放共享程度。国家重点实验室开放共享让外部学者有机会使用先进科研设施以产出高水平应用基础研究成果。但开放共享不应局限于科研设施,人才也是实验室的宝贵资源。因此,要鼓励青年学者与实验室内部资深学者积极开展科研合作,促进不同科研团队之间的知识传递和共享,传播前沿研究成果。国家重点实验室承担着高水平交流合作的职责,但不能光有“高大上”的学术交流,也要有“接地气”的科研合作。

猜你喜欢

网络结构学者基础
“不等式”基础巩固
学者介绍
学者简介
学者介绍
“整式”基础巩固
“防”“治”并举 筑牢基础
学者介绍
基于互信息的贝叶斯网络结构学习
知识网络结构维对于创新绩效的作用机制——远程创新搜寻的中介作用
沪港通下A+ H股票网络结构演化的实证分析