美国NSF项目机构间科研合作关系与发展态势研究
2021-04-02文鹏郑翔赖彤胡吉明
文鹏 郑翔 赖彤 胡吉明
收稿日期:2020-11-01
基金项目:国家自然科学基金面上项目“基于深度学习的政务新媒体互动内容摘要自动生成与情感分析模型研究”(项目编号:71874125)。
作者简介:文鹏(1981-),女,博士后在研,研究方向:科教信息资源管理与服务。郑翔(1996-),女,硕士研究生,研究方向:文本信息挖掘。赖彤(1993-),女,博士研究生,研究方向:信息检索、数据开放共享。胡吉明(1985-),男,副教授,博士,研究方向:数字信息资源管理与服务,电子政务与政府信息资源管理。
摘要:[目的/意义]机构合作已成为科研合作的主要形式之一,对其合作结构的研究有助于把握科研机构合作的规律和态势。[方法/过程]本文以NSF 2008—2017年间资助项目中的PI和Co-PI数据进行美国科研机构合作研究。利用统计分析、突发机构检测、合作网络指标计算、合作团体识别等方法,以及合作网络图、战略图等可视化手段,探究美国科研机构近十年来合作的结构、规律和发展态势。[结果/结论]研究发现,由美国NSF资助的科研机构及其合作分布的集中与不平衡现象并存,形成了9个主要的合作团体,地理邻近、研究领域相同或相似以及学术水平相当的机构更容易形成科研合作关系。随着科研合作的发展,科研机构合作网络趋向均衡化发展,机构间合作强度有待进一步加强。
关键词:NSF;科学基金项目;美国;科研机构;合作结构网络
DOI:10.3969/j.issn.1008-0821.2021.04.015
〔中图分类号〕G203〔文献标识码〕A〔文章编号〕1008-0821(2021)04-0154-08
Research on the Science Research Relationship and
Development Trend of NSF Institutions in US
Wen Peng1,2Zheng Xiang3Lai Tong3Hu Jiming3
(1.School of Marxism,Wuhan University,Wuhan 430072,China;
2.Institute of Education Science,Wuhan University,Wuhan 430072,China;
3.School of Information Management,Wuhan University,Wuhan 430072,China)
Abstract:[Purpose/Significance]Institutional cooperation has become one of the main forms of scientific cooperation.[Method/Process]By combining statistical analysis,network indicators calculation,visualization,as well as topological structures of cooperative networks,this paper explores the network structure of cooperation among scientific institutions in the United States in recent ten years.[Result/Conclusion]The study indicated that the distribution of NSF-funded scientific institutes and their cooperation was concentrated but unbalanced,forming 9 major cooperative communities with different institutions as cores.Institutes with similar geographical proximity,research fields and academic level were more likely to form scientific cooperative relations.With the development of scientific cooperation,the cooperation network of scientific institutes tended to develop in a balanced way,and the intensity of inter agency cooperation needed to be further strengthened.
Key words:NSF;science fund;United States;research Institution;collaboration network structure
随着科技的发展,科研合作成为科学研究的主流[1]。科学基金资助作为重要的科研成果指標,成为科研机构间合作关系产生、运行、发展、再生的重要驱动力,并且在知识流动[2]、合作偏好[3]、团体聚合[4]等方面显现出一定的特征和规律,成为学术界关注的热点问题。科学基金资助数据作为反映科研机构间合作情况的原始数据,在表达机构信息方面具备及时性、有效性、准确性等特征,是研究机构间合作关系的可靠数据来源,同时对于预测机构间未来合作趋势具有参考价值。国内外在科研机构合作上的研究已有不少积累,主要以共同出版物数据作为切入点[5],采用社会网络分析方法[6],通过指标计算衡量某一特定范围内相关合作主体的合作情况[7],结合可视化工具与技术,反映合作网络的发展规律[8]。然而,现有研究多基于我国自身科研数据进行机构合作关系的分析及预判,以国外科学基金资助数据为基础,进行科研机构合作特征与形态、资源配置、知识交流及演化规律等问题的深入探索,尚属少有。
美国的国家科学基金会(National Science Foundation,NSF)是目前世界最具代表性和影響力的国家级政府科学基金资助机构,旨在支持全美学术机构的基础研究。本文尝试提出了科研机构合作规律研究的通用性框架,以NSF为数据源,提取其中的机构合作信息[9],综合运用网络分析方法与可视化工具,深入直观地了解近年美国科学基金资助在不同科研机构间的分配情况,探索科研机构间合作关系的生成、运行及发展等规律。美国作为科技创新实力全球领先的国家之一,深入探究其科研机构间的合作关系及其内在的发展机理,总结科研机构合作发展的先进经验,有助于充分认识和发挥科研机构在国家创新发展中的支撑作用,为我国科研合作发展的政策制定提供启发性的借鉴。
1机构合作数据采集与分析方法
1.1基金项目数据获取与预处理
本文首先获取了2008—2017年间NSF所资助的基金项目数据[10],将PI和Co-PI字段中的机构电子邮件域名作为后续机构频次统计和共现分析的基础样本。因机构标识存在较多不规范和不统一等问题,本文首先剔除不具备具体机构含义的电子邮件域名,如Gmail.com;其次,对机构名称不统一的情况进行筛选与合并,如Washington.edu和U.washington.edu均表示同一机构,即华盛顿大学;最后,出现频次过少的机构对机构合作关系分析的意义不大,因此本文根据研究需要和频次占比情况,选取一定阈值之上的机构进行后续分析,同时,将阈值之下的机构合并至包含它的机构中。
1.2机构合作网络构建与分析
本文将出现在同一个NSF项目中的机构看作是合作关系,对两两机构的合作关系进行提取和合作次数统计,最终构建了包含所有机构的合作网络[11]。频次较低或合作较为孤立的机构,不能代表研究的主流,因此本文在选取某频次阈值之上的机构后,进行合作网络的最大连通子图提取。其中,机构对应网络节点,合作关系对应节点连边,节点大小和边的粗细分别与机构频次和合作次数成正比[12]。
其次,本文对机构合作网络的密度、中心势、聚集系数进行计算,以揭示合作的结构特征[13]。密度衡量合作网络内部关联的强度;中心势揭示整体合作网络的向心性和节点在整个网络中的核心程度,也表明了节点对网络的控制和影响能力。聚集系数则表示局部网络因关联关系而聚集成类簇的可能性大小[14]。
最后,结合Louvain算法对合作关系网络进行合作团体划分,保证团体内部节点联系紧密而团体间联系疏松,从而产生区别鲜明的合作团体[15]。每个合作子网络内部机构之间联系非常紧密,表明了合作行为的产生受相似驱动因素的影响,且处于合作关系较稳定的状态。
1.3科研机构合作网络的可视化分析
科研机构的合作网络可以以图谱的方式进行可视化展示,从而更加直观地揭示合作结构。本文借助VOSviewer[16]进行团体间关联及团体内部关联的可视化展示,不同团体内节点和连边的颜色不同,直观展示机构合作整体网络及各个子网络的结构特征。结合度数中心度和密度等网络指标,将团体映射至二维的战略图(Strategic Diagram)中,则可揭示每个合作团体的相对发展状态[17]。Cortext[18]则具有强大的时序演化可视化功能,为分析科研机构合作形成、发展、延续、分化等演化规律与发展趋势提供依据。
2主要发现
2.1NSF项目与机构分布的描述性统计
如图1所示,2008—2017年NSF共资助项目118 057项,每年项目总数总体变化不大。本文研究共提取不重复研究机构8 070个,总频次为145 602。而每项资助项目中,参与机构的平均数为1.23;可见,NSF项目中合作规模并不大,且机构间的合作要少于机构内部的合作。在这10年间,每个项目的平均机构数维持在1.15~1.98之间,与每年参与项目的总机构数量变化趋势基本一致,2015年后每个项目的平均机构数维持在1.24以上,表明机构间合作趋势加强。
从机构频次的分布上看,NSF项目中少数机构的频次之和占据了总频次的绝大部分比例,如频次在50以上的机构共有327个,在累计的总机构数中占比仅为4%,但其总频次之和占所有机构频次之和的84.3%,说明NSF项目中获批的科研机构分布非常不均衡。表1列出了频次排序前30的科研机构,科研机构的频次等于与其相关的NSF项目数。排序前10的机构是当前NSF项目中最为重要的机构,可见NSF资助频率较高的大多为大学,而研究所、博物馆等研究机构则排名较低,未出现在受资助的前30个机构中。
2.2机构合作关联网络分析
本文所选取的327个科研机构恰好组成了最大连通子图,其网络指标反映了NSF项目中主流科研机构的整体和局部特征,机构团体识别则有助于揭示NSF项目中科研机构在研究领域上的合作模式与发展态势。
2.2.1网络特征
科研机构合作网络的指标如表2所示,NSF项目中科研机构之间合作网络的密度不高,总体上各机构合作强度不高,也意味着当前科研机构合作的态势较弱且不够成熟。其次,较高的度数中心势说明科研机构合作的向心性较强,或在某一学科或领域内科研机构的合作非常紧密,且核心机构对整体合作和其他机构的影响和控制较强。较高的接近中心势说明科研机构间的合作关系路径较短,多为直接合作;较低的中介中心势则意味着科研机构间的合作通过第三方的概率较小。最后,较高的聚类系数也说明,多数科研机构多以直接合作的关系,形成以少数科研机构为核心的类团,类团内科研机构合作紧密,而类团间的合作则较弱。
在整体网络指标计算的基础上,本文计算了每个机构在合作网络中的中心度指标,如表3所示。宾夕法尼亚州立大学、普渡大学、科罗拉多大学博尔德分校、密歇根大学、加州大学伯克利分校等10所高校的度数中心度和接近中心势都很高,说明它们是当前NSF合作项目中的核心机构。这些高校对整个合作网络和其他科研机构具有较强影响和控制力;另一方面,与上述整体网络的中介中心势很低相似,每个机构的中介中心势也较低,即科研机构在NSF项目合作中起到的“中介”或“桥梁”作用很弱。值得指出的是,度数中心势和接近中心势Top10的亚利桑那州立大学、威斯康星大学麦迪逊分校和伊利诺伊大学香槟分校并没有出现在Top10的中介中心势列表中,取而代之的是乔治亚理工学院、华盛顿大学和北卡罗来纳州立大学。从中介作用大小的对比上看,中介中心势列表中的Top10高校是当前NSF项目中科研机构合作的重要桥梁。
2.2.2科研机构合作团体
1)科研机构合作团体的网络指标分析
本文中科研机构合作网络可划分为12个团体;如表4所示,每个团体中的机构按频次大小自左至右排列。团体划分的模块度为0.2549,表明合作团体划分结果具有一定的可接受性,各合作团体在学科和领域研究上具有一定的一致性。从研究规模上看,形成了9个合作结构较为体系化的机构团体,3个规模较小的机构团体(因其规模过小,其网络指标不具有可比性,不在后续对比讨论范围内)。结合表5中每个机构团体的规模指标(点数、边数、总频次),9个团体中可分为3个梯队,第一梯队为C1、C2,两者规模指标处于较高的层次,其机构合作对NSF项目的运作至关重要。第二梯队的机构团体有C3、C4、C5,这些机构及其合作也获得了数量较为可观的NSF项目。第三梯队的机构团体有C6、C7、C8、C9,这些机构也获得了数量可观的NSF项目。
通过对C1~C9这9个团体的组成机构进行分析发现,C1团体内的机构以加州和麻省的高校为主,C2团体内的机构全部来自五大湖地区或南部地区,C3团体内的机构以环绕宾夕法尼亚州的纽约州等东部地区高校为主,C4团体内的机构全部来自德州、亚利桑那州和新墨西哥州连成一片的地区,C5团体内的机构以犹他州、科罗拉多州和俄克拉荷马州连成片的地区的高校为主,C6团体内的机构以伊利诺伊州的高校为主,C7团体内的机构以西北地区高校为主,C8团体内的机构以俄亥俄州的高校为主,C9团体内的机构以阿拉巴马州的高校为主。
2)科研机构合作团体的关联结构分析
上述科研机构合作团体虽内部联系更紧密,但因学科研究上的交叉与合作,在团体间也存在大量的合作关系。如图2所示,每个团体用不同的颜色表示,团体的大小与其总频次成正比,团体间边的粗细与其包含的机构合作强度的总和成正比。根据上述分析得到的机构团体梯队划分,其层次也在图中得到了很好地展现。C1、C2、C3、C4、C5、C6这6个机构团体合作关系紧密,特别是C1、C2、C3这3个团体联系最为紧密,三者之间的合作频次占据了团体间合作的71.1%。这些机构及其合作关系对NSF项目的审批产生了重大影响。其他机构团体规模较小且比较孤立,与主流团体合作关系不够紧密,游离于NSF项目的主流科研团体。
9个机构团体的内部合作结构如图3所示。与上述类似,点的大小与其对应机构的频次成正比,线的粗细则与机构间的合作强度成正比。机构越处于中心位置,其重要性和对团体合作的作用越大,距离网络中心越远其越边缘化,所起的作用和重要性则越弱。从每个机构团体的内部结构看,如图3所示,C9最为平衡,上述指标均分布均匀,特别是合作强度上差异最小;C6最不平衡,各项指标的标准差均最大,尤其是合作强度分布上差异最大。此外,C1、C3、C2、C5和C4中合作状态比较稳定以及合作结构较为合理。而C7和C8在面向研究领域的科研合作上处于不稳定的状态。
2.3机构合作的发展态势分析
每个机构合作团体的平均度数中心度和密度体现了其相对发展态势,即在整个合作结构中的核心程度和发展成熟程度。如图4所示,机构团体用气泡图表示,其大小与团体内机构频次之和成正比。机构团体越往右,其度数中心度越大,表明在整个合作网络中其越核心;越往上,其密度越大,表明此团体中机构间的合作越成熟。9个机构合作团体分散在图中的4个象限中,C6、C5和C8处于第一象限,是当前NSF项目中最为核心和最为成熟的机构合作团体,C6中机构对当前NSF项目的申请起到了非常重要的核心作用,且机构间的合作也最成熟和稳定。C7处于第二象限,相对来说在NSF项目机构中并不核心,但其内部机构间合作较为成熟。处于第三象限的是C4和C9,相对来说较为边缘化,且机构间合作也相对不成熟。处于第四象限的是C1、C3和C2,虽然相对来说机构间合作不够成熟,但也是NSF的核心机构,获得了较多数量的NSF项目。值得注意的是,C2非常接近横轴,其内部合作将会越来越成熟。
3结论与不足
3.1研究结论
本文提出探索机构间科研合作网络特征与发展态势的思路,构建了科研机构合作规律研究的通用性框架,并以NSF项目为例分析了2008—2017年来美国科研机构合作关系,通过合作网络的指标计算和可视化展示,揭示了美国科研机构的合作规律与未来发展态势,对我国科研机构合作研究提供借鉴参考,寻求适合我国的高校校际科研合作的政策和发展方向,提升科学研究质量,推动学术发展进程,增强高校学术成果影响力。此外,本文提出的通用框架,也可用于基于其他數据集的机构合作研究,从而揭示特定领域的机构合作规律。基于此,本文得出以下结论。
第一,当前NSF项目的获批机构及合作网络的核心机构均相对集中,且形成了若干明显的合作团体。结合频次、合作网络中心度等指标,目前NSF项目中的核心机构主要为密歇根大学、华盛顿大学、加州大学伯克利分校、宾夕法尼亚州立大学等。这几个机构的地理位置分布在美国东部海岸、西部海岸及五大湖地区,均为全美经济社会发展水平、人口规模和教育资源最为发达的区域。其他机构通过与上述机构的合作关系而形成了区别明显的合作团体,每个团体内部向心性或聚集性都较强。
第二,NSF科研机构合作团队的形成具有明显的空间集聚特征,科研合作的地域化倾向明显。通过对上文中C1~C9这9个合作关系稳定的团体的组成机构分析发现,每个团体内部的机构均存在一定程度的地理邻近性,团队内部的机构主要集中在某一个州或某一片相邻区域。地理邻近性为科研人员建立社会关系、提升认知水平相似性、文化适应性提供了便利条件。地理位置邻近、认知水平相似、社会关系密切、文化制度相通的机构开展科研合作的可能性更高,建立的科研合作关系也更加稳定持久。尤其是位于同一个州的机构,从政策和制度方面更加具有先天的优势。
第三,研究领域相同或相似,学术水平相当且自身具有较强科研创新实力的机构更容易形成科研合作关系。这些因素能够在学术活动中为科研人员创造更多社会联系,从而弥补地理邻近性的不足,促成科研合作的产生。如上述提及的C1和C2是当前规模最大的两个机构合作团体,处于第一梯队。组成C1的8个机构,如哈佛大学、麻省理工学院、斯坦福大学、加州大学伯克利分校、加州大学洛杉矶分校、加州大学圣地亚哥分校、康奈尔大学、华盛顿大学均为全美最顶尖的名校,在科研成果、科研水平、科研创新能力等方面处于同一梯队。机构自身的科研实力越强,对其他机构的吸引力就越强,合作关系越容易形成。同时,科研合作的成功开展,进一步推动科研成果的数量和质量,使科研实力进一步提升,从而形成了科研合作的“马太效应”。组成C2的7个机构,如密歇根大学、明尼苏达大学双城分校、普渡大学、德州农工大学、佛罗里达大学、弗吉尼亚理工大学、北卡罗来纳州立大学均为工程类专业排名靠前的机构,具有相同或相近的研究领域。根据机构合作发展态势分析,C2内部的科研合作将会越来越成熟。
第四,NSF科研机构合作网络趋向均衡化发展,核心区域和核心机构趋向多点密布。针对科研机构合作团队间的合作关系,C1、C2和C3代表了东部海岸、西部海岸、五大湖地区及南部地区。团队之间的合作关系紧密,反映出科研机构合作网络的整体复杂性上升,科研合作核心区域和核心机构数量增加,呈现出多个机构群体为主要合作核心,多所表现突出的机构遍布各地的特点。随着科研合作的发展,布局上将趋于均衡化,不再集中在少数地区。
第五,NSF项目中科研机构之间合作网络的密度不高,机构间合作强度有待进一步加强。尽管NSF科研机构间形成了一定的向心性和群体特征,但科研机构合作的态势仍然较弱且不够成熟。科研机构合作涉及到多方面复杂因素,需要从政策引导、平台搭建、互动交流等多方面激发合作动力。基金委员会可以充分发挥“指挥棒”作用,将高校或机构之间的科研合作作为基金项目申报和评审考核的标准之一。高校或政府也可采取更科学的方式进行科研合作项目的成果归属认定,避免成果署名顺序影响跨校跨机构科研合作积极性。新媒体技术的发展,可以跨越地理位置的局限,提升高校及机构间社会关系密切度和认知相似度,大大促成第一次科研合作的发生。随着高校和科研机构高质量科研成果与学术影响力的积累,必将吸引到更多优质的科研合作伙伴,从而形成“以科研合作带动学术发展,以学术发展反哺科研合作”的良性循环,最终实现科学研究的健康可持续发展。
3.2研究不足
不可否认,本研究在框架和方法等方面存在诸多有待完善之处。首先,本文框架只是选择了机构的共现关系作为合作关系,即将PI和Co-PI等同看待。而机构间的合作中PI和Co-PI在NSF项目中所起的作用是不同的,这在本文中并没有得到体现。其次,本文选取机构合作网络的最大连通子图作为分析依据,虽体现了机构合作的典型性和代表性,但因数据量太大,舍弃了大量的非重要机构,在一定程度上影响了正确性和科学性。本研究团队将深化此项研究,以期获得更有价值的研究成果。
参考文献
[1]朱云霞,魏建香.我国高校社会科学领域科研合作网络分析[J].情报科学,2014,32(3):144-149.
[2]Wu J,Cai J,Jin M,et al.Embedding Funding Consultation in Library Services:A Co-occurrences Network Analysis of Knowledge Flow in Scientific Funding[J].Library Hi Tech,2018,36(3):378-399.
[3]贺超城,吴江,魏子瑶,等.科研合作中机构间科研主导力及邻近性机理——以中国生物医学领域为例[J].情报学报,2020,39(2):148-157.
[4]Newman M E J.The Structure of Scientific Collaboration Networks[J].Proceedings of the National Academy of Sciences of the United States of America,2001,98(2):404-409.
[5]刘利,宋歌,袁曦临,等.论文合著视角下的科研机构合作网络测度分析——以我国电信学科为例[J].现代情报,2014,34(1):94-99.
[6]张洋,谢齐.基于社会网络分析的机构科研合作关系研究[J].图书情报知识,2014,(2):84-94.
[7]董彦邦,刘莉.我国高校高水平论文的机构合作网络演化分析——以1978—2017年的Nature和Science合作论文为例[J].情报杂志,2019,38(11):138-144,157.
[8]冯祝斌,赵丹群.我国图书情报学研究机构合作网络演变分析(2002—2012年)[J].情报杂志,2014,33(8):92-98.
[9]Henry,Small.Visualizing Science By Citation Mapping[J].Journal of the American Society for Information Science,1999,50:799-813.
[10]NSF数据库[EB/OL].http://www.nsf.gov/awardsearch,2020-04-14.
[11]Leydesdorff L,Goldstone R L.Interdisciplinarity at the Journal and Specialty Level:The Changing Knowledge Bases of the Journal Cognitive Science[J].Journal of the Association for Information Science and Technology,2014,65(1):164-177.
[12]Hu J,Zhang Y.Structure and Patterns of Cross-national Big Data Research Collaborations[J].Journal of Documentation,2017,73(6):1119-1136.
[13]Leydesdorff L,Goldstone R L.Interdisciplinarity at the Journal and Specialty Level:The Changing Knowledge Bases of the Journal Cognitive Science[J].Journal of the Association for Information Science and Technology,2014,65(1):164-177.
[14]Doreian P,Lloyd P,Mrvar A.Partitioning Large Signed Two-mode Networks:Problems and Prospects[J].Social Networks,2013,35(2):178-203.
[15]Blondel V D,Guillaume J L,Lambiotte R,et al.Fast Unfolding of Communities in Large Networks[J].Journal of Statistical Mechanics:Theory and Experiment,2008,8(10):10008.
[16]Eck N J V,Waltman L.Software Survey:VOSviewer,A Computer Program for Bibliometric Mapping[J].Scientometrics,2010,84(2),523-538.
[17]Stegmann J,Grohmann G.Hypothesis Generation Guided By Co-word Clustering[J].Scientometrics,2003,56(1):111-135.
[18]CorTexT Platform[EB/OL].https://www.cortext.net/,2019-10-27.
(責任编辑:陈媛)