1973—2019年中国气象观测领域的科研合作特征和机制
2022-11-30侯威杨晓武张楠
侯威 杨晓武 张楠
(中国气象局综合观测司,北京 100081)
0 引言
随着现代科学的发展,迫切需要理解、量化和预测科学研究及其产生的结果,以科学地规划和管理研究团队。正是在这一背景下,科学学应运而生。科学学是一门研究科学整体的学科或学科门类,它以整个科学技术知识体系及其活动为研究对象,探讨科学的社会性质、作用和发展规律以及科学的体系结构、规划、管理和科学政策等[1-2],包括研究各类科学合作的内在机理并建立相应的描述模型,以理解科学研究的发展和创新过程[3]。因此,科学学将整个科学系统视为一个复杂系统,对这一复杂系统的内在结构、动力学与进化机制进行系统研究。作为描述和研究复杂系统的理论基础和有力工具,复杂网络[4-5]为科学学研究提供了重要的方法,其中一个重要方面就是对科研人员之间相互交叉、相互渗透合作关系的复杂性特征的研究[6-9]。
气象观测是指对地球大气圈的物理、化学特征及其变化进行长期、连续、系统的观察和测定,并对获得的信息和数据进行整理和质量控制的过程[10-11]。气象观测具有准确性、代表性与可比较性,可为天气预警预报、气候预测预估及气象服务、科学研究提供高质量的观测数据[12]。因此,气象观测一直处于大气科学发展的前沿,是推动气象科学发展的基础和动力[13-16]。气象观测是一门多领域交叉学科,涉及数学、物理、信息、材料、电子技术等多学科领域,随着各类先进装备制造和先进信息技术的不断发展和应用,全球气候变化背景下的气象观测科学研究也日趋专业化、异构化和复杂化,气象观测领域的科学技术和研究方向也在不断发展和增加[17-19]。因此,气象观测领域科学和技术的发展需要不同学科背景、不同研究方向的科研人员密切合作。气象观测科学是一个复杂系统,需要利用复杂网络深入揭示气象观测领域科研合作的行为模式、机制与规则。对气象观测领域科研合作的发展与质量进行深入探究不仅有助于整合科研资源,提升科研人员的自主和协同创新能力,也是科学学的重要研究领域之一[20-22]。但到目前为止,还没有针对包括气象观测在内的气象领域不同学科或者研究方向的定量研究。
本研究将论文合著作为分析该领域科学研究发展的切入点,基于复杂网络的相关理论构建1973—2019年的历年科研人员合作网络:采用共同作者网络[23-24],描述气象观测领域科研人员之间的合作关系,分析气象观测领域科研人员合作的内在特征和机制,以更好地促进科研合作与交流、提升科研产出与科研质量、推动气象观测科学技术的突破与创新[25-27]。
1 资料与方法
1.1 文献数据
文献体现了科研人员之间合作关系。本研究的文献数据来源于中国现有的三个综合性中文期刊全文数据库:《中国学术期刊网络出版总库》《中文科技期刊数据库》和《万方数据》。这三个期刊数据库是中国连续出版的大规模集成化、多功能学术期刊全文文献检索系统,内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域,收录出版国内各个学科领域专业性期刊、综合性期刊以及港台核心期刊8000余种,包括创刊至今出版的学术期刊4600余种。
(1)论文检索。分别在三个期刊数据库中采用中图分类号P41,针对大气探测(气象观测)方向进行文献检索,检索时间为所有年份,期刊来源为所有期刊;将从三个期刊数据库中检索到的文献信息均保存为NoteExpress格式(包含作者、年份、标题、期刊、关键字、作者机构和作者地址等关键信息),并导入NoteExpress文献检索与管理软件。
(2)文献清洗。基于NoteExpress文献检索与管理软件,采用“作者+年份+标题+期刊+作者机构”的联合关键词,对所有检索到的文献信息进行查重,将重复的文献信息删除,最终得到18638篇文献,时间跨度从1936—2020年。剔除2020年收录尚不完整的文献(共432篇)以及部分缺少作者信息的历史文献(429篇),共得到17777篇文献(图1),时间跨度从1973—2019年。为防止同名同姓作者的影响,进一步提取17777篇文献的作者信息和作者机构信息,将同名同姓但不同机构的作者加以区分,区分方法是在姓名后加数字后缀,如张某1、张某2,以此类推。
图1 1973—2019年历年文献数Fig.1 The amount of the literatures from 1973 to 2019
1.2 网络构建
本研究所要构建和研究的是科研合作网的一种:共同作者网络,这是一个加权无向网络。无向网络是指网络中两个节点间的连边如果仅有一个方向可通行则称为有向边,如果两个方向均可通行则称为无向边。若一个网络中所有的边都无向,则称此网络为无向网。加权网络是指节点间连边有权的图。可记网络为为网络的节点集;,其中为网络的边集,如节点vi和vj之间存在连边,则否则为网络中节点的总数,也就是网络的规模;表示节点vi和vj之间所连接边的权重,本研究中的边权属于相似权表示两点之间无连接,表示两点之间连接了一次,以此类推,边权越大表示两个节点的联系越紧密。
本研究将作者作为网络中的节点[28-29],整个网络的节点数之和是科学家的总数;如果两个作者共同署名发表一篇科研论文,那么这两个科学家之间就存在合作关系,代表两个作者的点之间就存在一条连边;在本研究中不区分作者的署名顺序,同一篇学术论文的多个作者的合作关系用全连接的方式表达,也就是所有作者两两之间均存在一条连边;若两个作者多次共同署名发表科研论文,则把合作次数,即合作发表的学术论文数目作为代表两个作者的点之间边的权重。
1.3 网络特征量
为了刻画复杂网络全面性质,复杂网络的特征量和度量方法常被用于表示复杂网络的拓扑结构特性和动力学性质,包括:节点度、点权和边权,聚集系数、模块性等[30]。
(1)节点度、点权、单位权和差异性
节点度也称为连通度,节点vi的度是指与节点vi直接相连的其他节点的个数。在共同作者网络中,节点度就是与某个作者产生论文合作关系的其他作者的数量,描述了某个作者的合作范围。在加权网中,节点vi的点权定义为即节点的点权等于该点所有边的权重之和,代表节点vi与其他节点直接相连的次数,描述某个作者与其他作者的合作次数。点强度既考虑节点的近邻数,又考虑该节点和近邻之间的权重,是该节点局域信息的综合体现。点权分布P(S)与度分布P(K)的作用类似,主要是考察节点具有点权s的概率,这两个分布结合在一起,提供加权网络的基本统计信息。节点vi的点权增量定义为,代表节点vi与其他节点超过一次直接相连的次数,描述某个作者与其他作者的合作程度。
(2)网络密度、聚集系数和模块
网络密度作为展现网络整体特征的重要参数,能够很好地反映网络的连通性。网络连通性是指如果网络中两个节点之间存在一条连通链路,称它们是连通的;如果网络中任何两个节点都是连通的,则称网络是连通的,即具有网络连通性。网络密度指的是网络中节点之间关系的紧密程度,,其中n为网络中节点的数目,m为网络中边的数目。在共同作者网络中,网络密度越大则意味着越多的科研人员之间存在合作关系,整个网络的连通性越好,科研人员之间的合作越广泛。
聚集系数是一个用来衡量一个复杂网络集团化程度的重要特征参数。加权网络中节点vi的聚集系数[31]可以定义为,描述网络中与节点vi直接相邻的节点间实际存在的边数目占最大可能存在的边数的比例,近邻之间联系越紧密,该节点的聚集系数越高。在计算出每个节点的聚集系数之后,就可以得到所有度值为k的节点的平均聚集系数Ck和整个网络的平均聚集系数,其中n为网络中节点的总数,也就是网络的规模。对共同作者网络而言,一个集团或团队中的作者往往相互熟悉,网络的聚集系数越高,与某一个作者合作过的其他两个作者彼此也合作过的可能性越大。
现实世界中的许多网络是由模块结构组成的。模块结构有两个显著特征,一是模块内部的节点间高度连接,有着直接的相互作用;二是模块与模块之间只有少数甚至没有连接,模块与模块或模块与非模块之间有着清晰的边界。在复杂网络研究领域,模块也称作社区或群落。2002年,Girvan等[32]给出了一种识别模块结构的新算法(GN算法),其基本划分算法如下:①计算复杂网络中每一条边的边介数[33-34];②找到介数最高的边并将它从网络中移除;③重复步骤①和②,直到每个节点就是一个模块为止。GN算法有很高的准确度,但其算法复杂度比其他算法的时间复杂度更高。因此,该方法适用于对中等规模的复杂网络进行模块划分。在共同作者网络中,不同的模块代表不同的科研团队;不同的模块之间的连边代表了不同的科研团队之间存在合作关系,这些模块成为连通模块。
2 网络整体特征分析
1973—2019年共同作者网络的聚集系数在增大(图2a),表明网络的集团化或者模块化程度在增加,网络密度在1993年之前总体是增大的,之后持续减小,但历年共同作者网络密度的最大值仅有0.011,表明网络的连通性不够好。1973—2019年共同作者网络的节点数持续增加(图2b),网络中模块的数量也是增加的,但在2003年之前没有出现过连通模块,历年网络连通模块数的最大值为17(2017年),即47年中最大规模团队合作涉及17个科研团队;历年连通模块数占所有模块数的最高比例仅有2.3%(2017年),其余年份均不超过1%。随着网络规模的增大,网络中孤立点数量也是增加的(图2c),虽然从2012年开始增速加快,但历年孤立点的总数远小于非孤立点;历年孤立点数量占所有节点数量的百分比也在持续下降,但从2012年开始整体保持平稳。
图2 1973—2019年共同作者网的整体特征Fig.2 The overall characteristics of the co-author network from 1973 to 2019
1973—2019年气象观测领域科研人员的数量在持续增加(图2),共同作者网络的规模不断增大,绝大部分科研人员开始由“单打独斗”的研究形式逐渐转为以组成科研团队的形式开展研究,合作范围也在逐渐扩大,科研团队的数量也在明显增加,但随着网络规模的进一步持续增大,加入该领域科研人员及其所组成团队数量的增多,科研人员之间的合作范围并没有显著增强。各年的共同作者网由若干个相互独立的模块组成,同一模块中的任意两个节点之间至少存在一条连通路线,但绝大部分模块之间没有连线。这表明,虽然大部分科研人员选择相互合作而组成相当数量的科研团队,但这种合作关系大都以团队内部合作为主,团队之间合作相对较少。2019年共同作者网络的拓扑结构很好地展示了气象观测领域科学家合作共同作者网络的上述特征(图3),其他年份共同作者网络的拓扑结构与此类似(图略)。由此可见,研究对象是一个高度不连通网络,这一特征决定了很难分析通常意义下整个网络的统计特性(如计算网络平均路径长度、聚类系数等网络特征量),也很难说明其现实意义。所以,结合研究对象的实际特点,本研究进一步分析网络的模块化即科研团队的相关网络特征。
图3 2019年共同作者网络结构拓扑图Fig.3 The topological diagram of co-author network structure in 2019
3 模块特征分析
在共同作者网络中存在节点之间具有相对较强的、直接的、紧密的连接的模块,这些模块的规模一般相对较小并具有“高内聚、低耦合”的基础特征,是组成更大规模模块或连通模块的基础。如图4所示,可将共同作者网因合作而形成的所有模块分为两大类[35]:A类模块为孤立点或全连接模块,即独撰论文的孤立作者和模块内的任意两个作者之间都有合作的全连接模块,代表内部合作型科研团队;B类模块为非全连接模块,即模块内的任意两个作者或任意两个A类模块之间的合作并不是完全确定的,从拓扑结构上看来任意两个作者间总存在连通的合作途径(连通链路),代表开放合作型科研团队。B类模块是由一些A类模块中的活跃作者,与其他A类模块中的活跃作者之间建立起联系而形成的连通模块。A类模块和B类模块的区分十分有利于研究并建立共同作者演化的数学模型及仿真,深入揭示科学合作研究的形成和演变过程及其学科、地域、部门等现实特征。事实上,在更多研究领域、更大空间范围和更长时间尺度的背景下,不同A类模块之间的合作最终会形成具有十分复杂拓扑结构的科学家合作网,所以B类模块的形成和演变过程更能体现科研工作者之间合作关系随时间的演变过程[36-37]。模块中的节点数、边权数分别代表了团队的人数规模、合作次数,节点的度、点权代表科研人员的合作范围及其与其他人员之间的合作次数,边的边权则代表了两个科研人员之间的合作次数。
图4 两类模块类型示意图(蓝色:A类模块;红色:B类模块)Fig.4 Schematic diagram of two types of modules (blue:type A module;red: type B module)
3.1 模块特征量统计
1973—2019年,共存在11122个A类模块,模块总节点数为25675,总边权数为29547。平均每个模块中有2.3个节点、边权数为2.7;模块的最少节点数为1,最少边权数为0并且历年都有出现,最多节点数为14,最大边权数为91(2000年)。节点的度平均值为1.12,度最大值为13(2000年),平均点权为1.15,最大点权为21(2017年),度最小值和最小点权均为0,且历年都有出现,边权离散度的平均值为0.515、最大值为1(占所有存在连边节点数的24.3%)、最小值为0.077。节点的单位权为1.03,最大边权为5(2015年和2017年),最小边权为1,且历年都有出现。
1973—2019年,共存在1351个B类模块,模块的总节点数为14793,总边权数为38105。平均每个模块有10.9个节点、边权数为28.2;模块的最少节点数和最少边权数均为4并且历年都有出现,最多节点数为113(2018年),最大边权数为563(2017年)。节点的度平均值为2.34,度最大值为36(2015年和2017年),平均点权为2.58,最大点权为56(2017年),度最小值和最小点权均为1且从1980年开始历年都有出现,边权离散度的平均值为0.297、最大值为1(占所有节点数的3.5%)、最小值为0.028。节点的单位权为1.1,最大边权为6(2010年),最小边权数为1且从1980年开始历年都有出现。
综上所述,1973—2019年,内部合作型团队的数量及其总人数规模要远多于开放合作型团队,但总合作次数却远小于开放合作型团队,开放合作型团队拥有更大、更灵活的发展空间。开放合作型团队已经形成了数百人规模的超大团队且其最小人数规模已超过绝大部分内部合作型团队。内部合作型团队人数规模、合作次数的平均值、最大值和最小值也都远小于开放合作型团队,同时单个开放合作型团队中人数规模、合作次数的值域范围都远大于内部合作型团队。开放合作型团队中科研人员的平均合作范围和合作次数高于内部合作型团队,最大合作范围和合作次数也远超内部合作型团队,两种类型团队中两个科研之间的最小合作范围无明显差异,并且开放合作型团队中人员之间的合作程度更为均衡,很少出现科研人员A与科研人员B之间的合作,在科研人员A全部合作关系中占主导地位的情况。两种类型团队中两个科研人员之间的最小合作次数相同,且平均合作次数和最大合作次数差异不大。
3.2 模块特征量分布
图5 不同节点数和不同边权数A类模块(a,c)和B类模块(b,d)数量的概率分布Fig.5 The probability distribution of type A modules (a,c) and type B modules (b,d) with different node numbers and edge weights
不同节点数开放合作型团队数量呈对数正态分布(图5b),即,模块数量随其包含节点数的增多而先增加后减少,节点数为6的模块数量最多(14.9%),其中节点数为4~7的模块数量占比50.9%且彼此差异不大;有49.0%的模块内部存在边权数大于1的边,表明接近半数开放合作型团队中作者之间存在多次合作。不同边权数开放合作型团队的数量整体同样分为上下两个相对独立的部分(图5d1),其中上半部分满足指数分布,下半部分满足正态分布(图5d2)。下半部分对应边权数的值域范围相对较小),并且数量呈正态分布的模块总体较少(占所有B类模块数量的8.73%)。对于图5d2中呈正态分布的模块,如图6a所示,其边权数越大,所包含节点数的值域范围也越大,产生相同边权数的模块可以在较少节点数和较多节点数两种情况之间可以平滑过渡,边权数越大的模块可供选择的范围也越大;而呈指数分布的模块(图5d1)则没有这一现象,能产生相同边权数模块的节点数的值域范围都非常狭窄(图6b)。B类模块中不同节点数和边权数的分布特征差异明显,说明B类模块中节点数和边权数之间的关系并不确定,开放合作型团队内的合作机制比内部合作型团队复杂。
图6 图5d2中呈正态分布的模块中节点数与边权数的对应关系Fig.6 The corresponding relationship between the number of nodes and the value of edge weights in the module with normal distribution in Fig.5d2
按本研究的定义,A类模块代表孤立点或全连接模块,模块具有均匀的网络拓扑结构。A类模块可分为两类,第一类是不存在边权大于1的模块(孤立点),模块中的节点之间拥有“平等”的度关系,节点的度值加1即为节点所在模块的节点数,并且模块中不同节点之间形成的连边不存在时间上的先后顺序,即团队中的科研人员之间只会合作一次,不同科研人员的合作时间是一样的;第二类是极少数存在部分节点具有边权大于1的边,其节点的度值和其所在模块的节点数无确定性关系,模块中不同节点之间形成的连边存在时间上的先后顺序。拟合置信度取0.95,A类模块的度(图7a)和边权(图7c)均服从正态分布;由于A类模块中具有边权大于1的边的节点数相对于总节点数而言非常稀少,因此依然可以认为模块中节点的度值与其所在模块的节点数成正比,内部合作型团队节点的度分布是由不同规模团队数量的分布直接导致的。A类模块的点权增量服从指数分布(图7e),只有少数团队中的部分科研人员会和团队中其他人员先后多次合作。
图7 A类模块(红色)和B类模块(黑色)的度分布(a,b)、边权分布(c,d)和点权增量分布(e,f)Fig.7 The distribution of degree (a,b),edge weight (c,d) and increment of node weight (e,f) of type A modules (red)and type B modules (black)
B类模块的度分布(图7b)服从对数正态分布。对数正态分布是某些因素起了突出作用但是未起到左右全局的结果[38]。合作网络的演化动力学分为随机选择和优先选择,当节点以概率p随机选择与其他节点相连,而以概率选择与度值较高的节点相连,此时网络的度分布就会呈现漂移幂律分布[39-43]。研究[44]表明,如果一个模块中包含的节点数为k(图5b),不管N为常量还是满足(对数)正态分布、幂律分布或指数分布,模块中节点的度分布在各种p参数下都遵从漂移幂律分布。按本研究的定义,一个B类模块是由多个在不同时间形成的A类模块所组成的,即B类模块中不同节点之间形成的连边存在时间上的先后顺序,也就是一个开放合作型团队中不同科研人员的加入时间是不一样的。图7b可以认为一种“去头幂律分布”[45];其中对应于完全择优法则,也就是科研人员只和其他具有广泛合作关系的科研人员进行合作,并且几乎不与合作范围(度值)比自己低的科研人员合作;当
满足漂移幂律分布,说明开放合作型团队满足随机-择优混合法则,即科研人员以概率p随机选择合作对象,以概率选择那些合作范围较大的科研人员作为合作对象。这说明开放合作型团队的形成具有两种机制,第一种机制是完全择优法则;第二种机制是随机-择优混合法则,第二种机制起了突出作用但是没有影响全局(占所有节点数的81.6%)。开放合作型团队的边权(图7d)也服从漂移幂律分布,同样满足上述机制。因此可以认为B类模块的网络拓扑结构具有自相似性,即所有B类模块与部分B类模块、或者单个B类模块与其局部之间(整体和部分)、规模较小的模块与规模较大的模块之间(部分与部分)呈现某种相似性,将开放合作型团队的规模视为尺度,则可以认为开放合作型团队所有尺度上都具有自相似的性质,开放合作型团队构成的合作网络具有无标度性质。点权增量(图7f)服从指数分布,点权增量和边权越大,满足要求的节点的数量就越少,说明少数科研人员与其他人员之间存在多次合作,合作程度较深,多数科研人员与其他人员之间只存在一次合作关系。
3.3 团队合作特征
图8 A类模块(a)和B类模块(b)中节点边权离散程度随节点度的变化Fig.8 The variation of node edge weight dispersion with node degree and the probability distribution of node edge weight dispersion in type A modules (a) and type B modules (b)
图9 A类模块(a)和B类模块(b)中不同度值节点至少存在一条边权大于1的边的出现概率Fig.9 The probability of multiple connections between nodes with different degrees and other nodes in type A modules (a) and type B modules (b)
图10 A类模块(a)和B类模块(b)中不同度值节点间的边权Fig.10 The edge weights between nodes with different degree values in type A modules (a) and type B modules (b)
B类模块中(图9b),随着节点度值的增大,其点权增量不为零的概率也随之增大,即度值越大的节点,其存在边权大于1的边的可能性就越大,说明开放合作型团队中合作范围越大的人员,越少出现只与每个合作人员只合作一次的情况,这也证明开放合作型团队中择优机制的存在,合作范围大的人员会成为其他人员优先选择的再次合作对象。B类模块中较大的边权同样没有出现在两个度值很大的节点之间(图10b),而是频繁出现在度值相对较小(不超过15)的两个节点之间,尤其是当两个节点度值差异不大时,而且度值相对较小的各个节点之间都存在不同权重的连边;说明在开放合作型团队中,两个具有中等及以下合作范围的人员之间都会进行合作且倾向于多次合作,当二者的合作范围大致对等时更是如此。同时,如图9b所示,对于度值大于25的节点,其存在边权大于1的边的概率整体上反而降低,说明当人员的合作范围很大时,其被优先选择作为再次合作对象的概率却在变小,和所有合作人员只合作一次的情况在增加,表明开放合作型团队中的“择优”选择也是有条件,这一点在图10b中也有体现,当一个节点的度值大于15时,其与其他度值的节点间较少出现较大边权,或者与其他度值的节点间连接变得稀疏;而当一个节点的度值大于25时,不仅与其他度值的节点间连接变得稀疏,连边也很少出现较大边权。
4 结论和讨论
4.1 结论
本研究基于《中国学术期刊网络出版总库》《中文科技期刊数据库》和《万方数据》三个期刊数据库中1973—2019年气象观测领域共17777篇文献的作者信息,采用复杂网络理论和方法,将作者作为网络中的节点、两个作者共同署名发表一篇科研论文代表两个节点之间就存在一条连边、由节点组成的模块代表科研团队,逐年构建了1973—2019年反映该领域科研人员之间合作的加权无向共同作者网络,并对这一网络的节点度、点权和边权、聚集系数、模块性等网络特征量进行了分析,其中模块中的节点数、边权数分别代表了团队的人数规模、合作次数,节点的度、点权代表了科研人员的合作范围及其与其他人员之间的合作次数,边的边权则代表两个科研人员之间的合作次数。结果表明:
1)气象观测领域科研人员合作的共同作者网络是一个高度不连通网络:随着科研人员数量的持续增加,科研团队的数量也在明显增加;绝大部分科研人员以组成科研团队的形式开展研究,且以团队内部合作为主,团队间的合作较少;也就是单个科研人员更倾向于和其他固定的科研人员合作而不参与其他团队的研究,或者具有“交叉学科”研究能力的科研人员数量稀少。根据网络中模块“高内聚、低耦合”的基础特征,将科研团队分为内部合作型团队和开放合作型团队两种类型;对于内部合作型团队,仅有一人的团队数量最多,绝大部分团队包含1~4个人员,仅有极少数内部合作型团队中的部分作者会合作发表多篇学术论文,说明有相当数量的科研人员不选择合作的方式,即使合作也仅限于少数人之间,合作多次则十分罕见;对于开放合作型团队,包含6人的团队数量最多,超过半数的团队由4~7人组成,接近半数开放合作型团队中的部分作者之间存在多次合作,说明这种类型团队中的部分科研人员具有较强的科研能力,能够保持较好的持续性合作。
2)内部合作型团队的数量及其总人数规模要远多于开放合作型团队,但总合作次数却远小于开放合作型团队,内部合作型团队人数规模、合作次数也都远小于开放合作型团队,开放合作型团队中科研人员合作范围和合作次数高于内部合作型团队,并且开放合作型团队中人员之间的合作程度更为均衡;整体而言,开放合作型团队的合作效率要高于内部合作型团队。总体上,两类团队中多数科研人员与其他人员之间只存在一次合作关系;内部合作型团队中合作范围越大的人员,越多出现与每个合作人员只合作一次的情况,较小规模内部合作型团队中的人员之间倾向于多次合作;而开放合作型团队中合作范围越大的人员,越少出现只与每个合作人员只合作一次的情况,两个具有中等及以下合作范围的人员之间都会进行合作且倾向于多次合作,尤其是当两个人员的合作范围大致对等时;说明内部合作型团队中核心骨干在科研人员间的“粘连”作用不如开放合作型团队。总体而言,开放合作型团队中人员的合作程度要优于内部合作型团队。
3)不同人数的内部合作型团队的数量呈漂移幂律分布;当团队中所有作者都只有一次合作时,不同合作次数内部合作型团队的数量满足指数分布,否则不同合作次数内部合作型团队的数量满足幂律分布。不同人数的开放合作型团队的数量呈对数正态分布;当只能由值域范围非常狭窄的团队人数产生相同的合作次数时,不同合作次数开放合作型团队的数量满足指数分布,否则呈正态分布。
4)开放合作型团队的合作具有两种机制,第一种机制是完全择优法则;第二种机制是随机-择优混合法则,第二种机制起了突出作用但是没有影响全局,而且开放合作型团队中的“择优”选择也是有条件,当人员的合作范围很大时,其被优先选择作为再次合作对象的概率却在变小;将开放合作型团队的规模视为尺度,可以认为开放合作型团队所有尺度上都具有自相似的性质,开放合作型团队构成的合作网络具有无标度性质;而内部合作型团队的合作机制主要取决于团队的规模。
4.2 讨论
考虑到复杂系统往往是随时间变化的动态过程,在得到网络结构复杂性特征的基础上,仍然需要采用复杂网络理论建立该领域共同作者网络的演化模型,分析该演化模型的拓扑统计特性,以及在该演化模型上合作机制的动力学行为。限于篇幅,本研究主要关注气象领域科研人员合作共同作者网络的实证分析,但在基于网络特征量对气象观测领域共同作者网的拓扑性质进行研究过程中,一些拓扑性质的产生机制也同样值得关注,例如:
1)不同人数的开放合作型团队的数量呈对数正态分布,对数正态分布[38,46]常用于拟合人口数量增长、财富增长、生物组织生长等增长率独立随机且与当前规模无关的过程[47],而不同规模开放合作型团队数量的增长率与团队数量是相互独立的,这可能意味着不同规模开放合作型团队数量的变化可以用几何布朗运动进行解释[47]。不同人数的内部合作型团队的数量呈指数分布,内部合作型团队中节点的度分布呈正态分布,后者可以由前者转换得到;研究表明,当网络中的节点数量足够多的时候,随机网络的度分布符合正态分布[48],而科研人员之间的合作不可能是随机行为,同时,一般认为如果一个事件受到许多微小又相互独立的随机因素的影响,但其中任何一个因素都不起决定性作用,则可认为该事件服从正态分布[38],所以除了相互之间的熟悉程度,构成内部合作型团队的科研人员之间的合作关系受其他何种因素的影响值得进一步研究。
3)网络中模块的数量随时间是增加的,但在2003年之前没有出现过连通模块,历年网络连通模块数的最大值为17(2017年),而最大连通模块代表科研团队之间的合作,是科研合作最高级形态,对其形成和演变机制及其演变过程中内部拓扑性质随时间的变化进行研究,更有利于揭示气象观测领域科研合作潜在的共性特征和异质性变化。