中外供应链科研合作网络社团成员演化对比分析
2022-08-18刘婷婷
刘婷婷
(上海理工大学 管理学院复杂系统科学研究中心,上海 200093)
0 引言
我们生活在经济快速发展的时期,经济增速在国际上领先,制造业、新产业、对外贸易等领域也呈现稳定发展的态势。在经济体系建设中,供应链的稳定顺畅,对推动经济建设有着重要的意义。供应链的作用已不单单停留在物流层面,它的稳定发展对企业、对经济,乃至国家的发展至关重要。供应链作为企业的第三利润源,关乎着生产到销售的整个过程,学者对其的研究不断深化与丰富,由此形成的科研合作网络能够帮助我们知晓该领域的发展趋势。利用实证数据构建科研合作网络,探析新老成员是否形成社团,新成员加入社团的行为演化遵循什么样的机制,这些问题的揭示会促进我们对供应链领域学术研究的认知,从而发现在该领域研究中的学者研究行为机制。
目前已有大量的研究探讨了静态网络下的社团识别工作,比如GN算法、模块度优化算法、随机游走算法、谱聚类算法等,这些算法在识别社团方面都各有优势。然而对动态网络的社团演化还不充分,但往往现实中的网络都是在变化着的,随着节点和边的反复无常,下一秒的网络形态可能完全不同于上一秒。在这种背景下,探究动态网络的社团演化显得更加符合实际和重要。在动态社团演化中,主要分为网络级演化与节点级演化。
(1)网络级演化
社团网络级演化是以一个整体性“事件”定义社区中的变化行为。Dakiche等人给出了较为全面的解释,他们将整个社区演化的事件分为出生、消失、增长、收缩、合并、拆分和重现这几个过程。具体过程如图1所示:
图1 社团出生、消失、增长、收缩、合并、拆分演化示例图
社团网络级演化主要可分为(a)、(b)、(c)三组图。(a)图中当T=2时,在原有网络基础上出现了一个新社团,即为社团的出生,反之则为社团的消失;(b)图中T=1时,网络中存在一个社团,T=2时,由于新加入了一个节点,该节点融入了原先的社团当中,成为了一个拥有更多节点的大社团,这种即为社团的增长,反之有节点退出则为社团的收缩;(c)图中原先网络有两个社团,但到T=2时刻,两个分离的社团因为关系的变化合并成了一个新的社团,这就是社团的合并,反之一个社团变成多个社团的演化就是社团的拆分;最后,社团的重现即为经过一段时间的演化,在某一时刻又突然出现之前时刻的社团,即社团的再现,这种现象一般出现的较少。
相关学者就这样的演化现象,进行对动态网络社团的识别研究,如Asur等设计基于社区拆分、合并等“事件”的框架来描述交互网络的演变,并结合节点的加入、消失等行为,在社区发现中取得较好结果,但存在条件严格的局限,后来Bródka等利用决策树将“组”与“事件”匹配,有效解决了该问题。Gou等在社区合并与扩展的基础上,设计了动态加权网络的演化社区发现算法,但是在演化过程中需要手动设置阈值,后来学者利用模块度优化思想有效解决了该问题。
(2)节点级演化
社团节点级演化顾名思义关注的是网络节点的变化对社团的影响。主要涉及节点新增和减少(与网络级演化的增长和收缩类似)、边的新增和减少。在目前的研究中,多数学者将这些节点级行为演化融入到相关算法中,从而不断更新社团,提高动态网络的社团识别效率,如Cordeiro、Xin、蒋等。
以上社团演化中的网络级演化与节点级演化的研究中,尽管已考虑了社区合并、收缩等生长机制以及节点加入、离开等行为,但他们的落脚点在于将这些演化行为融入到算法中,从而大大提高社团识别的效率,缺少对社区节点本身在社区的演化进行深入研究。
因此,本文在这些研究的基础上,将节点演化与网络演化相结合,用新增节点的比例多寡来定义社团的新与旧,并主要就新增节点的行为演化在新社团中的存续关系,提出新指标阐述新节点加入新社团的趋势,从而发现供应链在学者合作网络中的学者合作的潜在演化机制。
1 实验数据
1.1 高产作者选取
本文分别在知网CSSCI数据库与Web of Science核心合集数据库下载了4 727篇国内供应链主题核心文献和8 854篇国外核心文献,并经过数据的预处理将“作者”字段进行提取,得到国内作者5 981名,国外作者17 848名。然而,研究认为某一领域的半数文章大都由一些固定的高产学者所提供,四分之一的文章只由那些仅发表过一两篇文章的学者所撰写,因此研究高产作者的合著网络有助于我们更好、更快地把握当前供应链领域的研究热点与合作情况。目前,识别高产作者的方法有很多,主要运用高频词阈值选取方法,在此之上,除了经典的频次选取法、前N位选取法、中心度选取法等自定义选取法外,为了更客观地展现所选高产学者,本文选用应用广泛的普莱斯定律公式法来进行对高产作者的选取工作。该公式是由美国学者乔治·普莱斯发现,他认为,高产作者人数约是作者总数的平方根函数,该方法最初用来确定高被引文献,由于该方法的简单易懂且比自定义选取方法更有科学的优势,此后越来越被广大学者所接受,且运用到各个领域的研究中。普莱斯公式表示为:
其中:Q即为发文量最多的学者的发文篇数,η即为本文选取高产作者的阈值,定义发文数量超过η的学者为高产作者。
接下来,我们以国内供应链文献为例进行展开,国外研究步骤与国内一致。首先,对国内5 981位学者的发文量进行统计,表1展示了排在前5的学者。
从表1中可知,Q=49,经计算η=5.243篇,取整η=6篇,因此选取发文量大于等于6篇的学者作为高产作者进行进一步的合作网络分析。5 981名学者中发文6篇以上的有292位。
表1 国内发文量Top5的学者排名
同样,国外文献中,Q=60,得出η=5.802篇,因此也选择发文量大于等于6篇的学者作为高产学者进行研究。经筛选,国外文献中高产学者有126位。
1.2 高产作者合作网络构建
为了更方便和准确地研究所提问题,除了运用网络分析软件构建知识图谱,还手动整理相关数据并用Python等程序刻画网络,网络构建过程如下:
Step1:提取出每年包含292位国内高产学者和126位国外高产学者的所有合作关系(删除只有一个作者的记录,合作中只要出现高产作者即为一条合作记录);
Step2:对提取出的所有学者进行编号,并对应形成每年的合作关系表(即网络边的关系表);
Step3:利用Python中Networkx包进行网络转换。
由此,不同的编号代表不同的学者,网络中的节点代表学者,边代表的就是两两学者之间的合作关系。需要指出的是,本文的网络不考虑方向和权重,因此,本文构建的是一个无向无权的网络。
2 研究方法
2.1 Louvain社区发现算法
本文主要运用Louvain社区发现算法进行每个子网络上的社区识别,这是一种基于模块度优化的快速贪心方法,由Blondel等人提出。该方法目的是将网络划分为密集连接的节点群,最终优化网络的模块度。模块度刻画社区的紧密程度,定义如下:
Step1:将每个顶点当作一个社区,此时社区个数与顶点个数相同;
Step2:依次将每个顶点与之相邻顶点合并在一起,计算它们的模块度增益是否大于0,如果大于0,就将该节点放入该相邻节点所在社区,直到所有顶点所属社区不再变化;
Step3:重建网络,将各个社区所有节点压缩成为一个顶点,边的权重即为原来节点间权重之和;
Step4:重复以上的做法,直到网络模块度不再发生改变。
需要指出的是,该算法中的模块度增益是一种衡量迭代效果优劣的数值指标,计算公式如下:
其中:k表示节点i在社区中的权重之和,∑表示社区中总的权重之和,k表示与节点i连接的权重之和。节点i所属社区是在迭代过程中出现最大增益的社区中,前提是增益必须是正的;若迭代过程中,增益是负的,那节点位置仍属于原来社区。当对所有节点重复该步骤直到增益不发生改变,第一次迭代才结束。在这里,由于主要研究的是无向无权网络,因此每条边的权重默认为1。
2.2 社团相似度
为了明确t+1时刻的社团是否是新社团,需要对任意两两社团进行相似度的计算。本节中运用集合相似度的概念来识别新社团,即:
根据图2发现,(a)图国内统计中,当阈值等于0.3时,新社团数量处于中等水平,能够较好反映社团的一个变化过程,而(b)图国外的社团统计中,阈值为0.2时的新社团数量可较好居中反映社团的变化,因此选取0.3作为国内供应链科研合作网络的研究阈值,选取0.2作为国外合作网络的阈值,即将t+1时刻两两社团之间的相似度小于0.3或0.2的社团标记为新社团。下文的演化过程即是在此基础上的新社团中进行。
图2 国内(a)、国外(b)社团相似度σ小于不同阈值下的新社团生存数量
2.3 量化指标
本文提出了一个指标来刻画新节点加入新社团的行为演化,定义如下:
图3 社团成员动态演化简图
图5 国内新老成员(学者)数量与占比演化趋势
2.4 基于随机断边重连的零模型构建
零模型是与实际网络具有某些相同性质的随机化网络,能够为原始网络提供参照,并发现实证结果的一些非平凡性质。本文运用置乱算法构建了基于随机断边重连的零模型来验证本文所研究的学者合作行为是否具有随机性。主要构建思想如图4所示。
图4 基于随机断边重连的零模型构建示意图
模型构建主要思想是:保持原网络节点数量和度不变,将节点打乱,随机断开原网络的两条边e,e,再随机选择不相连的两个节点进行重连,重复多次,得到置乱后的零模型网络。为了充分体现所构建零模型的随机性,将断边重连次数设置为10E次(E为网络边数),并将实证结果的实验过程循环100次取平均之后得到了零模型下该指标的结果,因此本文的对比结果能够较好地反映供应链领域新学者形成社团的行为是否具有随机性这一特点。
3 实证结果与分析
3.1 新老学者数量演化特征
首先统计国内外合作网络的新老学者数量演化趋势,旨在从宏观上把握供应链领域的合作情况。
图5和图6的(a)图主要从新老学者的数量特征出发,(b)图成员占比是指每一时刻的新(或老)学者数量与总学者数量的比例。从国内数量趋势中看到,总体上新学者数量是超过老学者数量的,具体来说,新成员数量从225增长到2016年的285,达到近11年的最高,之后便下降到230,随后又有一个小幅度的上升,最后到2020年新学者达到221;而老学者数量从2010到2016也是在增加,同时达到最高的157,之后是下降趋势,下降到2020年的117。此外,从图5(b)发现,新学者在其中占有较大比重,平均占比达到66.94%。与此同时,发现虽然新学者无论从数量还是占比都超过老学者,但他们之间的差距却是在逐年缩小的,新学者占比从77.05%下降到65.38%,相反的老学者数量却从22.95%增加到34.62%。与此同时,从图6中观察到国外的新老学者数量比例相差更大。新成员数量超过老学者,尤其是2016年之后差距进一步拉大,且占比稳定在70%上下,是老成员的3倍多。
图6 国外新老成员(学者)数量与占比演化趋势
通过以上的分析,无论是国内还是国外,一方面,新学者的加入多于网络中的老学者,平均占比接近老学者的2~3倍,这说明供应链的研究还是吸引不少新学者进行探讨和挖掘,这是在不断发展着的研究领域;另一方面,也看到国内的新学者占比没有国外的高,且国内新学者与老学者的差距越来越小,而国外比较稳定,说明供应链的研究在国内慢慢变得饱和,对新人的吸引力在减弱,新研究主题的开发不是那么容易,在学术研究中越来越多的老学者会对他们某一成熟或熟悉的研究领域进行进一步深入研究。
3.2 新成员形成社团的演化特征分析
社团是社交网络中重要的属性,为了了解新成员是更愿意自己形成社团还是与老成员形成社团,提出了新成员中加入新社团的比例这一指标来探究学者的合作行为特征。
根据图7用ρ(t)、ρ(t)分别表示国内、国外新社团中新成员的比例。横向来看,在国内,明显看见新成员加入新社团的比例比较稳定,都在80%以上,在2016年加入新社团的比重达到最高,占总人数的91.93%,之后开始波动下降如图8(a)所示,这说明了在供应链作者合作中,新人更愿意与新人形成研究团体,但后期这种趋势在下降,也预示着新人们也愿意多与经验丰富的老学者们进行学术交流;在国外,新成员加入新社团的趋势是波动变化的,起伏较大,在2012年达到最低,占比只有60%,2013~2016年呈下降趋势,之后持续上升,达到88.49%,与国内后期呈相反态势如图8(b)所示,说明前期国外学者更倾向于与有研究经验的老学者合作,后期才接受新鲜思想,乐于与新学者进行交流,但总体上国外在供应链合作中,新学者之间还是倾向于自己形成研究社区,这与国内是相一致的。因此,从该指标实验结果来看,基本可以得出,在供应链领域中的学术交流中,新学者倾向加入新社团,即新人之间会进行更多的合作这一学术现象。
图7 国内外供应链高产作者合作网络中新成员加入新社团趋势对比
进一步地,思考上述的行为特征是否存在随机化因素,这对于更好地理解和预测学者合作行为有很重要的意义。因此,引入基于置乱算法的零模型作为随机化网络的参照,与实证结果进行比较,以发现该种行为特征的随机性。
将实证结果ρ(t)、ρ(t)与零模型结果ρ(t)进行对比,发现无论国内还是国外,两者的演化趋势大相径庭,图8明显看到ρ(t)趋势几乎是一条直线,稳定在1左右,与实证结果差距很大,有力说明了在供应链领域学术合作研究中,学者合作并不是随机的,而是有目的的、有选择的进行交流合作,往往学者会选择自己熟悉或在该领域做出杰出成果的人合作,该实验结果也符合现实认知。
图8 国内外供应链新成员加入新社团的实证结果与零模型下的对比
3.3 中外供应链合作网络社团成员演化差异分析
在合作网络的社团研究中,国外新成员增长速度和占比总体上高于国内,说明国外学者供应链领域的研究更吸引新学者的加入;此外,国内新成员占比与老成员占比的差距在缩小,而国外新成员占比呈现稳定态势,说明国内新学者在供应链方面的研究有减少的趋势,国外则稳定输出;最后,在新成员加入新社团的新指标计算结果下,虽然新学者自身形成社团的比例都比较大,但是国内的趋势比国外的趋势更加稳定,比重稳定在80%上下,而且后期国内的比例开始下降,国外则上升,这种现象表明国内对供应链的合作交流在新成员与新成员的合作交流这一主流趋势下,也兼顾有研究经验的老学者,他们也乐意与老学者进行进一步的合作。
4 结束语
本文发现无论国内外,都形成了对供应链研究的学术圈子,都有该领域的一些核心带头人,且对该领域的研究不断有新人加入,其比例逐渐上升,这些都说明供应链领域的学术合作研究比较频繁。由于在科研合作网络中的社团演化研究比较少,而考虑社团成员集体行为的演化对理解网络有着重要的意义。因此本文提出了社团演化新指标,该指标实验结果说明国内外的新成员更倾向于与新成员合作交流,且在与零模型的对比下,发现这种倾向并不是随机的,而是有选择性的,往往学者合作交流的对象是在该领域有所研究的人。与此同时,也看到国内与国外研究的一些差异,即国内的合作程度不如国外,新学者的数量与形成社团的趋势有下降,而国外则上升,表明国内的新学者增长不如国外,且国内后期新学者更愿意与老学者进行进一步合作。本文的研究结果,为更深一步了解供应链领域的学者合作提供了一些新的视角和结论,并明确当前国内与国外的研究差异,更好地为推动我国供应链领域的研究提供一点借鉴意义。
当然,社团的演化是一个可以深挖的课题,未来还有可以进一步提升的空间:如重要节点在社团中的存续问题、针对有向加权网络的社团演化又是怎么样的,这些都是可以作为未来的研究方向。