交叉学科知识网络的结构特征研究
——以电子商务主题领域为例
2021-08-04李佳培张瀚水王宗豪
李佳培 张瀚水 王宗豪
(1.河北地质大学 管理学院,河北 石家庄 050031;2.河北地质大学 城市地质与工程学院,河北 石家庄 050031;3.河北地质大学 华信学院,河北 石家庄 050700)
交叉学科研究成为理解学科知识结构和演进方向的重要研究范式,主流科研的内在驱动从科学知识生产方式逐渐转变为建立以“应用问题”为向导的科学研究模式[1]。不同学科和相关领域之间的交叉、协作与融合,促进和推动了了交叉学科知识交流的发展[2]。知识更易于在学科边界之间的流动得益于交叉学科研究,交叉学科研究的本质是不同学科之间的知识相互扩散、渗透,使得交叉学科知识交流与日俱增,具体表现在知识输入和知识输出两个方面。
早年间Cronin和 Pearson[3]通过分析信息科学领域杰出学者的论文被引情况,发现信息科学在知识输出方面存在明显的弱势。紧接着Cowall和Jonard[4]借助贸易模型和网络分析法,发现网络结构形式明显影响知识网络在节点间的扩散和“交流”。近年来Zhuang[5]则基于Multi-Agent模型,通过对知识扩散和知识升级来描述知识积累的过程,发现网格数量和agent邻居数量都会影响知识积累速度。Yah Erjia[6]通过学科自主、知识输入/输出、科贸动力学、科贸影响这四个不同的维度来研究科学和社会科学中的知识转移,进一步揭示了不同科学和社会科学学科的渗透性和自给性,为科学决策提供有效信息支持。愈来愈多学者对交叉学科知识网络方面进行了研究,张莉娅、陈光等基于交叉学科知识网络对图书馆学、情报学、档案学三种同源学科的交叉融合程度进行揭示[7-8]。郝若扬等基于信息传播的视角,通过对知识流动环节中论文、期刊和学科间施引和被引关系的计算,探究了国人文社会科学各学科间的知识流动网络和学科交叉关系[9]。商宪丽在交叉学科主题共现关系基础上,构建了交叉学科多模主题网络,剖析了交叉学科多模主题网络知识组合模式[10],之后借助社会网络分析方法,在交叉学科内部和相关基础学科两个层次上构建交叉学科主题引用网络,分析研究交叉学科中跨学科知识传播的过程和规律[11]。操玉杰等以医学信息学为示例学科交叉领域进行演化阶段划分,进而从知识引入和知识产出两方面分析学科交叉度特征,研究知识产出的共词网络结构变化,深度揭示该学科交叉领域的不同演化阶段特征[12]。王思茗等基于领域知识图谱提取图书情报学领域中的学科交叉信息与地区信息,生成领域学科交叉网络与“学科-地区”关联网络,对领域知识中学科交叉的全貌和地区间差异进行分析[13]。并构建了涵盖156个学科方向的学科交叉网络,对知识领域内的学科交叉状态以及学科交叉对领域知识研究状况的影响进行分析[14]。国内学者邱均平[15-17]等则从交叉学科发文的视角下探讨了我国图书情报领域的交叉学科研究态势以及图书情报学与其他学科间的知识扩散的特征以及不同学科之间的知识扩散规律;王旻霞[18-19]等从中国引文数据库提取的相关数据作为数据源,通过对知识输入与输出视角下不同时间段的指标变化特点进行分析,探讨了图书情报学科的跨知识交流特征,从知识输入角度揭示了交叉学科知识交流网络的小世界性质,并存在非均衡性特点。张勤[20]通过研究发现国内知识管理领域学科间的知识交流较为顺畅,信息失真和曲解的现象不易发生。
综上众多学者都对交叉学科知识交流进行了不同程度的研究,但大多聚焦于图情领域的静态指标分析,对于电子商务主题领域方向的交叉学科知识交流网络的研究较少,对于这样一个应用性极强且发展迅速的专业,厘清其专业发展脉络和学科演进方向对于更好的指导生产实践具有重要的应用价值和理论意义。鉴于此,为了揭示电子商务主题领域内交叉学科知识网络的结构特征的情况,本文对该主题领域内交叉学科知识网络的结构进行分析与研究。
一、研究方法及数据
(一)研究方法
20世纪五六十年代出现社会网络分析法,其是社会学家根据图论、数学方法等展开的定量分析法[21],用以研究社会结构与社会关系[22]。社会网络分析是研究引证关系和引文网络的有力工具[23]4,并且是对社会网络的关系结构以及属性加以分析的一套规范和方法,用于探索知识交流过程中的重要节点和扩散路径,因此本文选用社会网络分析法来进行研究。
近年来社会网络分析方法发展迅速,其应用性很强,主要是指社会行动者及之间关系的集合,主要归纳为两种分析取向:关系取向和位置取向。其本质是通过网络中关系的分析,探讨网络的结构特征及属性特征为核心,网络的属性特征有两个方面:
a.个体属性包括:点度中心度、接近中心度;
b.整体属性包括:小世界效应、小团体研究、凝聚子群。
从交叉学科知识交流的概念中就可以知道,学科之间进行交流,行动者就是学科本身,而引用学科与被引用学科就是行动者之间的连线。因此本文进行构建的交叉学科知识交流网络的节点就是学科,引用学科与被引用学科就是其中的链接关系。
(二)研究数据
数据来源于CCD(中国引文数据库),CCD(中国引文数据库)是收录了中国学术期刊(光盘版)电子杂志社出版的所有源数据库产品的参考文献,涉及多类型文献资料,涵盖期刊、学术论文、会议论文、专利、报纸类等多方面学科。该数据库根据不同的专业类型划分为168个专题,现在就根据这168个专题进行交叉学科之间的研究,本文基于电子商务主题领域,检索了1979年至2020年4月,168个专题中关于电子商务的核心期刊141024篇,以研究电子商务主题领域内交叉学科知识交流网络。将以上筛选出的数据集导入 Gephi,构建原始引文网络图。
二、结果与分析
本研究分别通过分析电子商务主题领域内的交叉学科知识的整体网络、核心网络和交叉学科知识交流群落分布这两方面来揭示电子商务内的交叉学科网络的结构特征。电子商务主题领域内交叉学科知识交流整体网、核心网可以通过网络密度、平均出度、平均聚集系数等数据进行分析;交叉学科群落分布以及各学科之间的联系可以分析交叉学科知识网络各学科之间的结构特征。
(一)矩阵的构建
利用中国引文数据库检索的关于电子商务核心期刊数据构建了168×168的矩阵(见表1)。矩阵中的“行”学科是被引学科,“列”学科则是引用学科,行与列相交叉的格值则是“行”学科被引“列”学科的频次。因不考虑被自引的情况,所以矩阵的主对角线是空白的。将矩阵引进GEPHI软件中进行分析,在分析的过程中根据相应的要求运用相应的矩阵,同时进行可视化分析,并计算网络中相应的部分指标和数据,进而探究电子商务主题领域内交叉学科知交流的结构特征。
表1 邻接矩阵(局部)
(二)电子商务主题领域内交叉学科知识网络的结构特征
1.整体网络结构特征
在整体网(见图1)中,共有节点数168个,其中连线共有3805条,节点度越大,表明与该学科建立知识网络联系的节点越多,即在电子商务主题领域内的交叉学科知识结构中,该学科拥有较高的重要性。在整体网中,没有孤立无援的点,每个点之间或多或少的都存有连线,这也充分说明电子商务主题领域中每个学科之间都存在着知识交流,已经形成一个错综复杂的交叉学科知识交流复杂网络。
图1 电子商务主题领域内交叉学科知识交流整体网
从表2中看到整体网的网络密度为0.136,平均出度为22.649,这充分说明了电子商务主题领域中交叉学科知识交流网络的通畅性与频繁性,也说明了学科之间的交流是畅通无阻的。整体网络的平均聚集系数是0.464,平均路径长度是2.35,聚集系数相对较高,平均路径相对较短,说明交叉学科知识交流整体网络已经符合了显著的小世界的结构特征。但从出度的分布曲线拟合图中(见图2)得知,该整体网络的网络出度分布严格遵循着幂律分布规则,呈现“二八定律”,没有不明显的无标度的网络结构特征。因此整体网是一个具有小世界性质,并同时是SED的复杂网络。
图2 交叉学科知识交流整体网出度分布曲线拟合图
该网络的出度中心势最高为41.733%,中间中心势为3.92%,说明在电子商务主题领域内交叉学科中没有有较强的影响力的知识源学科节点,也不存在有对交叉学科之间知识交流有绝对性的控制权或者是桥梁型学科。
表2 电子商务领域内交叉学科知识交流整体网部分指标
(三)核心网络结构特征
构建的邻接矩阵中的168个学科之间知识交流总频次是232477次,其中最高的频次是17805次,最低的频次达到了1次,反映了电子商务主题领域中不同学科之间的知识交流是非均衡性的。为进一步研究电子商务主题领域内交叉学科知识网络结构特征,本文以在邻接矩阵中的知识交流频次的平均值(8.24)作为基准,保留大于或者等于8次的学科之间的链接关系,由此构建了电子商务主题领域内的交叉学科知识交流核心网(见图3),同时计算了其中一些数据指标(见表3)
图3 电子商务主题领域内交叉学科知识交流核心网络
表3 电子商务主题领域内交叉学科知识交流核心网的部分指标
交叉学科知识交流核心网络共有节点130个,连线有1194条,网络密度(0.071)和平均出度(9.817),但是网络的平均聚集系数(0.636)还是偏高,平均路径长度(2.526)较短,所以交叉学科知识交流核心网还是具备小世界的网络性质。并且网络的出度分布(见图4)也完全遵循幂律分布,仍呈现“二八定律”,没有无明显标识的网络特性,是一个具有小世界性质的SED复杂网络。
图4 核心网网络的出度分布曲线拟合图
由于核心网络的出度中心势的降低与中间中心势的提高,说明了核心网络中的学科的桥梁地位或者是枢纽地位得以提升。为了更加进一步的研究电子商务主题领域内交叉学科知识交流核心网络中的高影响力节点,我们对其前26个学科的中心度进行了计算与统计(见表4)。
表4 电子商务主题领域内交叉学科知识交流核心网络高影响力节点
注:表格中括号内的为度值
由表4可以看出,贸易经济(117)、计算机软件及计算机应用(97)、企业经济(87)、宏观经济与可持续发展(72)学科的出度中心度都高于50,出度中心度还是偏高,说明再这些学科在网络中的地位很高,是影响力卓越的知识性来源学科。还可以看出,贸易经济(3184.577)、计算机软件及计算机应用(1632.136)、工业经济(1492.039)、企业经济(1432.315)、农业经济(1306.309)等学科在核心网络中的中间中心势很高,这表明这些学科在考虑到有知识交流量的情况下对学科之间的知识交流有着很强的控制力,作为桥梁型或者枢纽型学科的地位更加突显。结合出度中心度与中间中心度这两项指标,27个学科中,贸易经济(117)、计算机软件及计算机应用(97)、企业经济(87)、宏观经济与可持续发展(72)等22个学科在出度中心度与中间中心度这两项指标中都位列前茅,充分说明了这22个学科在电子商务主题领域内交叉学科知识交流核心网络中具备核心学科的地位,对其影响巨大。
此外,对着其中都位列前茅的22个学科进行比较与研究发现,贸易经济、计算机软件及计算机应用、企业经济、宏观经济与可持续发展、工业经济、市场研究与信息等10个学科基本重合,这表明这10个学科在电子商务主题领域内交叉学科知识交流具有突出的地位且地位比较稳固。
(四)知识网络各群落的结构特征
为了进一步研究电子商务主题领域内的各学科知识交流群落的结构特征,以上文主题领域内交叉学科知识交流核心网络数据为基础,通过modularity模块化算法进行可视化处理,绘制交叉学科知识交流群落分布图,如图5所示。由核心网的中间中心势可以看出,电子商务主题领域内整个交叉学科知识交流网络已经分为若干个既互相独立又相互联系的学科间知识交流群落。图5中共130个节点,代表130篇论文;1194条有向边,表示1194次引用关系。利用Fruchterman-Reingold算法对引文网络进行布局,重力强度设置为1.0。其中节点及其标签文字尺寸与该节点被引频次呈现正比关系。借助社区探测算法进行模块性统计,解析度设置为1.0,统计得出模块化指数为0.118,生成群落分布图。
图5 交叉学科知识交流群落分布图
图中一个圆圈代表一个节点,圆点之间的连线代表代表两者之前存在着联系。不同颜色的节点代表不同的群落;节点的大小影响群落的大小,该节点影响的范围也不相同。表面该网络模块化结构较清晰,在电子商务主题领域交叉学科知识交流群落网中,一共划分出了6个分别以工业、经济和计算机类、金融、农林业、交通运输、文化为主题的知识群落。下文将着重分析这6个群落的特点及群落之间的关系。
(五)群落与群落中心节点分析
本文将每个群落中的知识节点按照连出度大小降序排序。根据学科之间交叉行为与关联程度划分出多个群落,同时在群落内部可能存在核心节点。我们将知识节点按照出度值大小降序排列。表5中列出了六个群落中心度最大的五个节点(群落4、6只有三个节点,已全部列出)。电子商务主题领域内交叉学科知识交流核心网络的六个群落中,群落0以工业为主,群落1以经济、计算机类为主;群落2以金融类为主;群落3以农林业为主;群落4以交通运输类为主;群落5 以文化为主;不同群落之间同样存在知识连线,群落的划分不根据传统学科分类进行划分,而是存在强关联的知识节点被归为同一集群,因此在知识群落中产生学科交叉。
表5 群落知识节点构成
在知识群落分布图中出现了连线密集的节点,存在群落核心节点甚至整个知识网络的核心节点。每个群落中连出度最大的节点为该群落的核心节点,分别为“工业经济”“贸易经济”“投资”“农业经济”“交通运输经济”“文化经济”。在数据集中最大出度值为117,最小出度值为1,说明知识节点有中心和边缘的区别。该核心节点与另外117个知识节点存在关联。筛选的得到出度为117的知识节点为“贸易经济”。在该引文网络中,每一条边都代表一次引用。而大多数知识节点的连出度数值较小,这些节点所处的位置相对边缘。根据“二八定律”选取最大80%以上的节点范围进行过滤,调整阈值为23进行过滤,认为出度大于23的节点为核心节点,将连出度在23以上的节点从群落分布图中提取,如图6所示,得到电子商务主题下的核心节点图。
图6 核心节点图
进行节点过滤后,保留了三个群落的部分知识节点,既电子商务主题的核心知识节点。群落0中的“工业经济”,其连出度为47;群落1中的“贸易经济、计算机软件及计算机应用”等节点,“贸易经济”连出度为117;群落3中的“农业经济”“市场研究与信息”,其出度值分别为28和34。其中群落1以“经济”“计算机类”为主的群落在筛选后仍保留12个知识节点,含有“贸易经济”“计算机软件及计算机应用”“自动化技术”“电信技术”等节点,这些节点的关系已经不再是按照传统学科的分类方法进行划分,其涵盖的主题更加广泛。而在核心分布图中并未出现群落2、4、5中的任何节点,说明这三个群落作为边缘群落被过滤。
综上,通过群落节点构成表和核心节点图得到以下结论,知识群落属于电子商务主题网络,而每个群落又都有属于自己的中心节点,分别为“工业经济”“贸易经济”“投资”“农业经济”“交通运输经济”“文化经济”,其中“贸易经济”知识节点甚至与每个知识群落都有较强的关联,该知识节点为整个知识网络的中心节点。群落2(金融)、群落4(交通运输)、群落5(文化)三个群落为边缘群落。由此可见,电子商务这一主题领域呢,交织着多种学科。这些交织的学科之间也存在着明显的主次之分。支撑学科为“贸易经济”,即电子商务与贸易经济是紧密相关、互为手段与目的的;而贸易经济又和其他诸如工业经济、农业经济、交通运输经济、文化经济而紧密相连且互为交叉和补充;电子商务主题的辅助学科则为金融、交通运输和文化,说明电子商务领域是依托这三个学科进行发展和生长的,虽为“边缘”,但实属“基础”。
三、结论
交叉学科研究有利于发现新的知识交流节点和扩散路径,本文通过中国引文CCD数据库检索的141024篇电子商务主题核心期刊,构建学科引用矩阵,生成了知识整体网络图,从知识输出角度对电子商务主题领域内,交叉学科知识网络的结构特征进行分析,运用社会网络分析方法、数理统计以及文献分析研究的方法,得到以引文出度的电子商务主题领域核心网络有以下特征:①交叉学科知识交流网络是具有小世界性质,并且无标度且并不显著的SED复杂网络。②电子商务主题领域内交叉学科知识交流网络中各学科的地位并不是均衡的,贸易经济、计算机软件及计算机应用等个学科在在电子商务主题领域内交叉学科知识交流具有突出的地位且地位比较稳固。③电子商务主题领域内的核心节点为“贸易经济”,并且知识群落有中心群落和边缘群落之分,群落1(经济、计算机类)为中心群落、群落2(金融)、群落4(交通运输)、群落5(文化)三个群落为边缘群落。通过以上研究,从中分析出电子商务学科中的核心主题,以及学科、群落关联规则。各学科知识在这些关联规则中形成交叉与融合,基础与支撑的局面。
在研究的过程中也存在一些不足。首先是数据样本的影响,本文从中国知网上查找关于电子商务主题领域的核心文献作为数据,数据量较小,不能够完善的分析电子商务主题领域内交叉学科知识交流网络特征;其次,分析不够完善,知识交流分为两个方面,一是知识输出,二是知识输入,它们代表的意义不同和分析结果不同,由于篇幅的限制,只从知识输出的角度对于电子商务主题领域内跨学科知识交流网络进行了分析,没有从知识输入的角度进行分析,下一步的工作将从知识流入流出动态的视角开展研究,以期发现更深层次的学科知识的交叉流动现象及规律。