APP下载

基于社会网络分析的生物医学领域跨学科关联关系特征

2022-01-27姚晓杰屈文建龚花萍陈东有

南昌大学学报(理科版) 2021年6期
关键词:生物医学跨学科关联

姚晓杰,屈文建,龚花萍,陈东有

(南昌大学管理学院,江西 南昌 330031)

现代科学的发展,知识协同是促进知识技术创新发展的重要途径[1],跨学科已经成为当代科学发展的时代特征。近些年来人工智能、纳米技术、神经系统科学、生物信息学等学科领域,均呈现出极高的综合跨学科特征。不同学科之间通过相互融合、渗透,引发了社会重大的科技创新。同时,科学研究也逐步呈现出高度综合的跨学科特征。学科交互融合为原创性科学成果提供了原始动力[2]。学者之间的科研合作也越来越体现跨学科交叉的动态趋势。学科间的交互交融,有效地促进科学研究的创新效率提升。如何更好地促进不同学科之间的交叉,是跨学科研究亟需解决的问题。对于特定研究领域中学科关联关系的研究,有助于有效促进学科知识之间的交互效率,因而成为学者们关注的焦点。

“跨学科”(interdisciplinary)是由美国心理学家伍德沃思最早提出,是指涉及两个或两个以上学科的实践活动[3]。国内外学者对跨学科交叉的研究集中在两个方面:一方面是对学科交叉程度的研究。学者们从期刊的学科性、学科集成及论文产出等视角对交叉度进行度量。Leydesdorff等研究期刊中学科交叉性的指标包括多样性、中心性和引文[4]。黄颖等从学科集成、学科专业化和学科扩散三个指数维度对跨学科性进行研究[5]。另一方面是对跨学科关联关系的研究。以往学者在引文关系、合著关系、共词分析及聚类分析等方面展开了大量研究[6-7]。Reis等通过研究人员的合作探讨了通信和信息科学各领域之间的跨学科关系[8]。谢成等通过共词分析法,构建信息科学、经济学与管理学的学科关联[9]。

然而,目前在跨学科交叉关系方面的研究,学者大都采用文献计量方法,局限于某一个研究角度,较少全面系统地探讨跨学科的关联特征。基于此,本文运用社会网络分析的研究方法,从三个角度分别探测不同学科及主题在合作交互网络中的结构地位,对跨学科网络中的学科及主题进行影响力识别,以及探测学术群网络聚类特征。本研究对于拓展跨学科领域研究,以及对学者开展多学科合作、形成重大跨学科交叉团队提供有益借鉴。

1 原理及方法

为更好地探求生物医学领域不同学科主题的关联关系特征,本文基于复杂网络理论,主要运用主题识别、网络中心度分析及块模型分析方法,揭示该领域的跨学科网络结构特征、识别出关键学科及共同关注的研究主题。

1.1 主题识别

在某一特定研究领域,主题代表学科范围内相关文献的研究内容[10]。主题识别又被称为主题提取,通过对大量文本信息处理,帮助用户快速有效地获取关键内容[11]。词频-逆向文件频率值(TF-IDF)作为一种统计加权技术,常被用于信息检索提取及文本挖掘的运用[12]。TF是基于单一文档,统计在文档中某一词语的出现频率。IDF则是根据全部文档的统计分析,衡量词语的常见程度。TF-IDF计算公式如下:

(1)

其中,dj表示一篇文档,|D|是文档总数。nij代表词语在文档中的频次,nkj代表文档中所有词汇的频次。本文对主题词的提取,采用python的TF-IDF术语加权算法实现,来识别生物医学领域学科研究主题。其中,TF统计生物医学领域不同学科主题的频率,IDF衡量主题词的普遍重要性。

1.2 关联网络构建

基于社会网络分析,构建学科及主题之间的关联网络,研究学科主题的网络拓扑结构。社会网络分析使用量化方式描述节点之间关系,关注行动者之间的二元属性关系,并把关系表达为一种模式或规则,来反映社会结构,从而进行结构关系的量化[13]。它侧重于研究社会关系的结构和各种关系,实现对关系的测量及可视化。社会网络关系表达式如下:

(2)

其中,v和g分别为点集和边集,m和n分别为网络边数和节点数。本文跨学科关联结构网络中,节点表示不同的学科或主题。边则是节点间的连线,代表两个学科(或主题)间的合作关联。边的权重代表合作强度。

1.3 网络中心度

衡量节点在网络中的重要程度的指标是网络中心度,通过节点值的测量识别其在结构网络位置上的影响力[14]。根据度中心度和中介中心度指标探测节点的重要程度,测度主题在结构网络中的影响力。度中心性是测度节点重要性的最直接指标,反映与网络中其他节点直接联系的紧密程度。度中心性的值越大,表示在网络中的权利地位及影响就越大,能够有效影响网络中其他行动者[15]。度中心性Dc(i),公式表示为:

(3)

其中n表示网络中的节点总数,i表示某一节点。在学科主题网络中,某一学科主题的度中心度越大,表明其与其他主题之间存在直接交互关系越强,在网络中直接影响越大。

中介性可以评价某一节点在网络中的媒介作用,通过中介中心度测度,识别节点在网络结构中的间接影响力。节点i的中介中心性CC(i)公式为:

(4)

公式(4)中,n和dij分别表示节点数量和点i与点t之间的最短路径。中介中心性高的主题通常在该学科领域发展中承担桥梁和中介作用,也是连接不同研究方向的关键主题。

1.4 块模型分析

本文运用块模型分析方法对学科主题进行凝聚子群划分,并分析子群内部及子群间的关联关系。块模型是一种通过对行动者进行取值和分类的技术,来研究不同行动者的网络位置关系的分析方法[16],包括密度矩阵和相应的图像矩阵的构建。本文运用CONCOR算法迭代相关矩阵计算得到主题词块矩阵结构,从而实现学科子群的层次划分。在子群划分的基础上,通过像矩阵值,研究子群内部及彼此之间的关系模式,得出不同子群的层次结构地位。与传统聚类分析不同[17],块模型分析更适用网络关系的聚类,探讨聚类之间的关系。

2 实证分析

科研机构成员的跨学科合作,可以更好地促进科研创新发展。生物医学作为一个综合交叉研究领域,涵盖医学、生命科学和生物学等多个学科,具有明显的学科交叉特征。为了更好地探析该领域学者的跨学科合作现状,本文以生物医学科研机构为实证对象,探析领域内不同学科主题的网络关联关系特征。

2.1 数据获取

选取上海交通大学Bio-X研究院机构所有成员发表的论文为数据样本,因为该研究团队在生物医学跨学科研究领域具有较好的代表性。对WoSTM核心合集中的SSCI和SCI两个数据库进行检索,检索条件限定机构为“Shanghai Jiao Tong Univ,Bio X Inst”。为跟踪生物医学近十年的跨学科现状,检索时间限定为2011-2020年。将下载的文献去重、清洗,最终获取238篇有效数据,将获取得到的TI、AU、DE、WC等文献字段数据存储在MySQL数据库中。分别运用Python、Ucinet软件,进行主题提取、测算网络结构指标值,并进行网络可视化。

对238篇学者科研合作发文数据统计,得到近十年来生物医学领域学科类别分布共有57种,可能存在着关联关系。从学科发文量来看,获得了该领域中主要学科类别。对应的学科类别发文量和总发文量占比如图1(a、b)所示。从图中可以看出,遗传学与遗传排第一位,占总发文的18.75%。其次是神经科学(14.06%)和精神病学(13.67%)。根据“二八定律”在学科类别分布中占比超过百分之八十的学科类别有6个,除了遗传学与遗传、神经科学、精神病学外,还包括生物化学与分子生物学、多学科科学及药学。从所属学科大类来看,主要集中分布在医学、生物学及药学三个大学科。这表明了在学科交互合作网络中生物医学成员机构具有广泛的跨学科关联,但是存在核心交互学科。这与生物医学在神经科学和遗传学领域的实际地位和影响是一致的。

图1 生物医学成员机构WoS跨学科发文量(a)和其对应的占比(b)

2.2 整体关联网络构建

2.2.1 学科分类关联网络

Web of ScienceTM数据库中期刊论文被归并划分为一个或者多个学科类别。学者常常采用WoS学科类别来表征不同学科[18]。本文对每条记录提取文献的WoS学科分类,构建学科类别共现矩阵,得到生物医学WoS学科分类的结构网络关联图(图2)。在该图中节点和连线分别表示学科类别和学科类别之间的关联关系。节点大小代表网络中的核心边缘地位,节点越大表明在网络中的关联程度越大。可以看出,“Genetics & Heredity遗传学与遗传”、“Neurosciences神经科学”、“Biochemistry & Molecular Biology生物化学与分子生物学”、“Pharmacology & Pharmacy药学”、和“Cell Biology细胞生物学”处于网络中间位置,关联程度最大。处于最外层结构位置的学科分类数量最多,尤其是“Physics Applied应用物理学”、“Nanoscience & Nanotechnology纳米科学和纳米技术”、“Materials Science,Multidisciplinary材料科学多学科”三个学科类别之间独立形成关联网络,而不与学科相互关联。通过对学科网络结构位置分析,表明不同学科类别在结构关联网络中处于不同位置层次,越处于中间位置的,越与其他学科具有更多的关联关系。生物医学成员组织在网络中间的位置相对集中,交互关系更为密切,但是外围学科交互比较松散。这也反映了生物医学研究院最早是在在神经精神病学、人类遗传科学和生命科学的基础上建立起来的跨学科团队。生物化学、纳米科学、计算生物学及生命科学虽然关联性较小,也在丰富生物医学成员的结构,体现了生物医学跨学科发展的趋势。同时,它反映了生物医学融合生物化学、纳米技术及计算机科学多个学科领域的跨学科的特点。

图2 基于WoS学科分类的关联结构网络图

2.2.2 主题内容关联网络

主题作为文献内容的一个重要组成部分,通过分析可以获取某一主题研究领域的学者关注热点及发展趋势。本文运用python进行摘要文本主题词识别,最终得到22个高频主题。如图3所示,通过构建主题共现矩阵并可视化,得到学科主题交互关联结构网络图。主题节点“Schizophrenia精神分裂症”、“Major Depressive Disorder抑郁症”、“Case-Control Study病例对照研究”、“Single Nucleotide Polymorphisms单核苷酸多态性”处于网络结构核心位置,具有较多的关联关系。为了考察网络中各节点之间的整体关联程度,进一步测算整体网络密度。数值越接近1,代表成员间关联程度越紧密。主题网络密度结果为0.562,表明生物医学不同学科主题间的网络关联程度整体不强。图中比较可以看出,生物学和医学的主题关联强度最大,这也表明不同学科主题的关联性程度不同。

图3 基于主题内容的关联结构网络图

2.3 影响力识别

3.3.1 学科分类影响力识别

基于总被引频次对学科分类进行测度,识别得到高影响力的学科,结果见图4所示。可以看出,影响最大的是学科是“Cell Biology细胞生物学”,值为1263,占所有学科总被引频次的21.55%;其次是“Biochemistry Molecular Biology生物化学与分子生物学”总被引频次是958,占比为16.34%;“Oncology肿瘤学”总被引频次是640,占比为10.92%。

图4 基于被引频次的学科分类影响力识别

基于h指数对学科分类进行的测度,对交互学科影响力进行识别,结果见图5所示。可以看出“Genetics Heredity遗传学与遗传”h指数值明显最高17,影响最大。居于第二、三位的分别是,“Biochemistry Molecular Biology生物化学与分子生物学”、“Neurosciences神经科学”。同时发现学科的h-index与衡量学科影响的篇均被引次数趋势基本保持一致。在篇均被引统计分析中,细胞生物学值(151.41)明显高于其他学科,具有较大的影响。

图5 基于h指数的学科分类影响力识别

与传统的文献计量指标总被引频次相比,h指数可以更好地评估学术的数量与质量综合水平。图4、5比较,发现生物化学与分子生物学在总被引频次和h指数都具有较大的影响力。细胞生物学总被引值最高,但是h指数指标较低。遗传学与遗传h指数值较高,但是被引频次中排在第7位。

2.3.2 主题影响力识别

运用Ucinet对主题关联网络中的节点,进行中心性测量。点度中心度和中介中心度结果,如表1、2所示。表1可以看出“精神分裂症”、“抑郁症”及“病例对照研究”的点度中心度值居于前三位,分别为30、19和12,表明这三个主题在学科主题整个网络结构中,具有较大的直接影响力。与其他主题的直接关联关系较强,处于网络中的关键核心地位,是该领域学者研究的热点。特别是“精神分裂症”居于第一位,并且中心度值明显高于其它节点,说明该主题是生物医学领域不同学科共同关注的重点内容。表2中,“单核苷酸多态性”中介中心度值最高,值为64.00,其次是“精神分裂症”、“多囊卵巢综合征”,值分别为49.45、42.00。表明该三个主题在网络结构中发挥着较大的中介桥梁作用,具有较强的间接影响力。其他主题依赖它们的媒介作用来实现网络中的相互关联。尤其是前三位的中介中心度值明显高于其他节点,也表明了“单核苷酸多态性”、“精神分裂症”、及“多囊卵巢综合征”,目前在该研究领域中具有不可替代的桥梁关联作用。

表1 基于点度中心度的主题内容影响力识别

表2 基于中介中心度的主题内容影响力识别

2.4 主题块模型分析

运用块模型来分析生物医学领域不同学科主题之间的网络聚类关系。通过对学科主题网络进行结构分区,得到7个凝聚子群。将不同的主题群进行学科归属,形成四大学科群。结果如表3所示。从学科主题归类来看,医学-生物学-药学群在抑郁情感障碍及药理学形成集聚,该学科群最大。而医学-生物学、医学-数学学科群相对较小。

表3 学科主题块模型划分

如表4所示,对7个主题模块,进行模块内以及模块间的亲密关系及关联程度测度,得到密度矩阵和像矩阵值。可以看出,密度矩阵密度最大的两个模块是第5和第3模块,值分别是2.00、1.33,说明这两个模块在学科主题关联网络中内部关联程度最为紧密。从像矩阵结果,可以得到学科主题模块外部及内部间关联关系。根据主题模块内外之间的关联,构建主题模块关联图,如图6所示。可以看出,医学-生物学群中的第1、2模块、医学-生物学-药学群中的第3模块和医学-数学群中的第5模块存在模块内部的主题关联关系。同时,第1模块又与第3、4模块产生模块之间主题交互关系。第6、7模块关联关系为0。特别是第1主题模块的“精神分裂症”“遗传关联”,在模块内外都有交互关系,在网络交互结构中发挥着重要作用。

表4 密度矩阵和像矩阵

图6 跨学科主题模块关联关系图

块模型结果表明,不同学科之间的距离和密切关系形成了具有一定层次差异性的跨学科关联网络。在结构化的多学科协同网络中,学科及主题之间存在着一定的交互关系,但交互关系又分为不同的结构层次。同时,也表明主题领域机构学者之间开展的跨学科合作,其关系网络表现出差异性,存在明显的强弱差异。同一个结构层次内部的交互作用较强,而结构层次之间的交互作用较弱。

3 结论

本文基于社会网络和块模型分析,分别从WoS学科分类与主题两个维度,在交互网络拓扑结构特征、学科主题影响力及学科群聚类关系特征三个层面上,揭示了生物医学主题研究领域科研协同中的跨学科关联关系特征。主要研究结论如下:

(1)学科主题关联关系在网络结构上呈现亲近-疏远的差异特征。生物医学领域关联的学科范围较广,但整体交互关系较弱,一些学科处于孤立位置。从网络结构特征来看,核心学科和边缘学科分化严重。在学科分类网络中,遗传学与遗传、神经科学、药学、生物化学及细胞生物学处于网络结构核心位置,与其他学科类别有较多的关联特性。主题关联网络中的精神分裂症、抑郁症及单核苷酸多态性处于网络核心位置,是生物医学领域的研究热点。这与生物医学在神经科学和遗传学领域的实际地位和影响是一致的。

(2)交互关联的学科主题中,具有高影响力的学科及共同关注的研究主题。从学科类别的计量指标来看,生物化学与分子生物学、神经科学在该学术领域具有较大影响,成为主要学科交叉点。从学科主题的节点中心性指标来看,精神分裂症和单核苷酸多态,在关联网络中与其他主题直接关联关系最大,也发挥着重要的媒介影响作用,成为不同学科共同关注的热点。这些关键学科在科研合作中,占有和控制着绝大多数的科研资源。

(3)跨学科关联合作网络形成了不同的学科主题凝聚子群,关联关系表现出结构层次差异。基于块模型分析,对跨学科主题进行网络聚类,得到7个模块,进而形成医学-生物学、医学-生物学-药学、医学-数学以及医学-生物学-化学-物理学四个学科群。同时在模块内部以及模块之间形成了强弱不同的关联关系。不同学科关联网络中,较易在亲缘关系学科中形成团聚关联。

本文对于跨学科关联关系特征的研究,对于深入理解主题研究领域跨学科科研合作具有重要意义。从理论的角度,这在一定程度上丰富了跨学科理论研究。在实践上,为主题研究领域开展多学科科研协作,形成重大跨学科团队提供参考。科研人员开展积极有效的跨学科科研合作,要注重与相近学科开展合作。随着不同学科知识交互,衍生出新的学科知识增长点,从而提升科研创新效率。此外,需要提升政策在跨学科合作中的推动作用。由于学科知识界限的阻碍,一些边缘学科较难实现学科交互。可以通过重大联合交叉科研项目、联合资助等的激励政策,鼓励各个学科领域开展有效的跨学科科研合作,从而更好地实现科学研究上的突破。

猜你喜欢

生物医学跨学科关联
广西医科大学生物医学工程一流学科建设成效
蝾螈的皮肤受伤后可快速愈合
跨学科教学在高中生物课堂教学中的应用实践
应用型高校推进跨学科人才培养的路径探索
我校成功承办“生命科学与老龄化社会”跨学科论坛
跨学科前沿研究生课程的教学改革探索
“一带一路”递进,关联民生更紧
奇趣搭配
生物医学大数据的现状与发展趋势研究
智趣