APP下载

基于引用的潜在跨学科知识组合识别方法探究

2022-10-09杜德慧刘超

知识管理论坛 2022年4期
关键词:跨学科参考文献文献

杜德慧 刘超

上海大学图书情报档案系 上海 200444

1 引言

随着科学“微分化”的发展和研究问题复杂度的提高,单一学科的知识已无法满足人们解决问题的需要,从而导致学科间知识融合的程度逐渐加深,进程不断加快。科研人员通常需要打破不同学科的界限,跨越不同的研究领域,借助学科间的相互渗透促进知识创新[1]。与此同时,各门学科的迅速发展和研究工具的日益精巧,促使科学工作者或者使用一种方法将本学科知识应用于不同的研究领域,或者将各种方法应用于某个固定的学科领域[2]。在探究跨学科(Interdisciplinary)知识交流中,识别并判断未来可能的发展趋势才能更好地对跨学科研究的发展和规划提供建设性意见[3]。面对当前新兴技术浪潮的冲击,新文科建设要求突破传统文科的思维模式,强调学科发展中的继承与创新、交叉与融合,而在图书情报学的学科体系构建过程中也吸收借鉴了许多来自于其他学科的理论、方法等[4]。跨学科知识组合指融合潜力较高的本学科知识与其他学科知识,即由本学科主题或关键词所构成的知识与由其他学科主题或关键词所构成的知识通过某种关系得以关联所形成的具有研究价值、新颖性和发展潜力的知识组合。面对不同学科间知识融合需求的日益增长,亟需从数量庞大的科技文献中挖掘潜在跨学科知识组合。通过识别潜在跨学科知识组合能够有针对性地掌握其他学科可以与目标学科相结合的知识点,从而服务于目标学科的问题研究。

2 相关研究综述

1926年,美国哥伦比亚大学的R. S. Woodworth教授[5]在社会科学研究理事会的年会上首次提出“跨学科”的概念,强调跨学科是不同基础学科之间的交叉、渗透与融合。针对跨学科知识研究,学者们主要从跨学科领域知识发挥的作用、跨学科领域的发展模式与演化以及跨学科主题的结构特征与跨学科知识识别3个方面展开探究。

从跨学科角度探索领域知识在不同学科转移过程中发挥的作用,有助于明晰跨学科知识在促进成果产出与学科知识发展方面的影响力。E. Yan等[6]将知识贸易理论与施引网络相结合,通过计算学科主题类别间的贸易顺差额度探析了学科知识的贸易影响力。H. Eto[7]利用跨学科信息的输入和输出作用力,对纳米技术项目的成果产出行为进行测度。K. Karunan等[8]基于引文网络构建定量方法模型,评估不同学科间知识相互作用的强度、主导模式和相互贡献率。柯青等[9]通过分析图书情报学科的跨学科引用总体情况和时间演变态势,揭示该学科的主要知识来源与知识贡献推进效应。徐璐等[10]从输出强度、时效性和跨学科性3个维度,分析得出跨学科引用有助于拓宽知识输出的学科范围。上述相关研究主要从知识转移视角对跨学科知识的作用强度和知识贡献等特征进行定量分析,为后续探索跨学科相关研究奠定了基础,但缺乏对跨学科领域形成及其演化特点的分析,而探究跨学科领域的发展和演化有助于深入了解各学科相互作用的动态关系变化情况。

在跨学科发展过程中,各领域知识在不同发展阶段发挥的作用有所不同,因而有必要探析跨学科领域的发展模式与演化过程。跨学科研究通常经历潜伏期、萌芽期和成熟期3个阶段,各研究领域在不同时期扮演知识来源者、知识接收者、知识响应者和跨学科参与者等不同角色[11]。T. Chakraborty[12]提出施引文献多样性指数,结合参考文献多样性指标归纳出跨学科领域知识具有“吸收—内化—输出”的发展模式。吕冬晴等[13]通过聚类分析得到国内人文社会科学学科具有内聚型、收敛型、平衡型和开放型4种跨学科模式,以及低平、高平、剧烈波动和均衡波动4类演变态势。岳增慧等[14]从集中趋势、离散程度和分布形态描述学科知识扩散数量特征,运用社会网络分析法探析学科知识扩散中介性特征以及中间人角色特征。梁镇涛等[15]运用引文关系网络分析跨学科发展的模式,考察不同阶段各学科在跨学科领域中的关系结构与角色演变,并基于文献引证关系从微观层面揭示跨学科领域的演化路径。上述相关研究主要运用引文分析法,通过构建测度指标模型或引文关系网络探析跨学科领域的形成过程和发展模式,并从微观层面研究跨学科领域的动态演化以及发展路径。

随着跨学科研究的深入,仅仅围绕跨学科领域的发展模式和演化过程已经无法实现对跨学科知识本身的细粒度挖掘与探索,因此,一系列学者着手研究跨学科主题的结构及其特征,并探究跨学科相关知识的发现方法。L. Li等[16]提出一种主题相关分析法,从多个学科中提取共有和特有的主题潜在特征。S. Lafia等[17]基于加州大学Santa Barbara分校地球研究所的出版物和研究项目,构建模型并设计科学地图,揭示该研究院跨学科研究的潜在主题结构。李长玲等[18]针对情报学与计算机科学主要期刊的互引论文,通过分析两学科关键词共词矩阵的核心—边缘模型识别交叉研究主题。岳增慧等[19]运用高频词共现及高频词—学科共现网络,从学科交叉领域基础以及学科交叉关联基础两个方面,识别情报学和计算机跨学科应用这两个学科的热点研究主题和交叉研究主题。吴蕾等[20]使用改进的主题相关分析法,提取农学生殖生物学和兽医学两个学科的共同主题和各自的独立主题,结合相关性测度方法量化学科独立主题之间的关联性。李长玲和刘小慧等[21-22]分别运用闭合式、开放式非相关知识发现法,定义主题跨学科合作潜力指数并挖掘潜在跨学科合作主题。另外,也有学者基于引文分析法对跨学科相关知识的识别进行探究。张瑞等[23]从文献引用角度测量学科间的知识流动,抽取跨学科学术名词并判断其发展趋势。杜德慧等[24]基于引文关键词构建学科相关新颖性指数,以图书情报学为例探讨识别跨学科相关知识的方法。牌艳欣等[25]利用目标学科源文献、跨学科参考文献和跨学科引证文献,构建跨学科知识弱引文关联网络并识别跨学科相关知识组合。此外,李长玲等[26]基于学者博文的好友关系,构建目标学科知识节点与跨学科相关知识的弱关系网络,识别最佳跨学科相关知识对。

综上,挖掘跨学科研究主题以及相关知识可以为进一步探索跨学科知识的运用、发挥跨学科研究的潜在利用价值提供思路与参考。当前研究主要运用主题相关分析法、共现分析法、非相关知识发现理论和引文分析法对跨学科研究主题及相关知识进行挖掘,少有学者借助文献间的直接引用关系识别不同学科的潜在跨学科知识组合。因此,本研究借助引文分析法,从直接引用关系角度对潜在跨学科知识组合的识别方法进行探究,并挖掘融合可能性较大的潜在跨学科知识组合,以丰富有关跨学科知识融合发现的相关方法和途径。

3 引用关系下潜在跨学科知识组合识别

3.1 潜在跨学科知识组合识别路径分析

引文是学术成果间知识流动的载体,基于引用关系的知识发现方法能产生更多类型的关联实体,并能保持局部一致性[27]。关键词是标识文献内容的重要知识单元,是文章核心内容的浓缩和提炼,通过分析关键词所在跨学科参考文献的被引用路径可以揭示跨学科知识在目标学科文献中的被引用情况[28]。令学科A为目标学科,通过不同学科间文献的引用关系可以获取与目标学科具有较高融合潜力的跨学科相关知识。在目标学科节点文献集S(S={S1,S2,S,…,SN})的参考文献中,存在跨学科参考文献集IR(IR={IR1,IR2,IR3,…,IRN}),令节点文献关键词构成的集合为GK,GK中含有关键词Kp(p=1,2,…,x),令跨学科参考文献关键词构成的集合为GI,GI中含有关键词Iq(q=1,2,…,y)。GI对于节点文献集S来说属于知识输入方,所以可从中识别出对目标学科具有较高利用价值的跨学科知识。图1为引用关系下潜在跨学科知识组合的识别路径示意图。

如图1所示,跨学科参考文献关键词集GI内含有对于目标学科来说较为新颖的跨学科知识,这里运用作者前期研究成果IDN指数[24]从该引用关系中识别出较少或尚未应用于目标学科的类属于其他学科的相关知识。IDN指数的计算方法为跨学科参考文献关键词Iq在节点文献集S中的被引量与其所在节点文献数的乘积,除以目标学科中以Kp为主题发表的文档数。通过IDN指数计算能有效识别与目标学科相关性强且新颖度高的跨学科知识,根据Kp所在节点文献与Iq所属跨学科参考文献形成的引用关系,可将代表该类跨学科知识的Iq与其对应的代表本学科知识的Kp进行配对得到初始跨学科关键词组,之后通过融合潜力指标与灰色关联分析法计算筛选得到融合潜力较大的潜在跨学科知识组合。

图1 直接引用关系下潜在跨学科知识组合的识别路径

3.2 融合潜力评价指标构建

如上文所述,本文基于IDN指数得到与目标学科相关性强且新颖度高的跨学科知识,并通过引用关系匹配得到初始跨学科关键词组。为挖掘对于目标学科来说融合可能性较高且新颖性较强的潜在跨学科知识组合,笔者从目标学科节点文献关键词Kp与跨学科参考文献关键词Iq的引用关联性、Kp的学术研究价值度,以及Kp与Iq的潜在融合新颖性三方面衡量初始跨学科关键词组的融合潜力,从而为后续潜在跨学科知识组合的识别与筛选奠定基础。

(1)引用关联性。在直引关系中,Kp与Iq的关联性强度体现为Kp所在节点文献引用Iq所属跨学科参考文献(下文部分简称Kp引用Iq)的总频次M值的大小,M越大,表明Kp引用Iq的强度越大,Iq对于Kp来说的关联性越强,则它们产生融合的可能性越高。

(2)学术研究价值度。在引用关系中会产生许多针对性不强的跨学科知识组合,为此,需筛选出具有较高学术研究价值度的目标学科知识与跨学科相关知识进行匹配。目标学科节点文献关键词Kp在其学科中的学术研究价值度越高,对应的跨学科关键词与其结合所形成的潜在跨学科知识组合越有针对性。本研究从学术影响力及学术研究热度两方面衡量Kp的学术研究价值度。

俞立平教授提出的时间因子[29]根据发表时间的新旧赋予指标对象不同权重,修正了因论文出版时间远近所带来的引用时滞对评价结果的影响。本文引用该指标测度5年时间窗口内节点文献关键词Kp在目标学科中的学术影响力(TIF5),其计算公式如下:

公式(1)中,时间窗口r=5年,统计年份为t,Ct-d(d=1,2,3,4,5)表示节点文献关键词Kp在5年时间范围内距离统计年份t前d年的文献于统计年份t的被引频次,Et-d(d=1,2,3,4,5)表示节点文献关键词Kp在5年时间范围内距离统计年份t前d年的文献量。另外,为使Kp于某年的文献量为0时公式有意义,将分母中Et-d加1。公式(1)中关键词所属文献的发表时间越新,其权重越高。

主题词在目标学科中的文献数量是该主题词研究热度的直接体现,因此,本文利用目标学科中以节点文献关键词Kp为主题的年均文献量Va表示时间窗口r内Kp在目标学科中研究热度的整体水平,因本文的时间窗口限定为5年,则其计算公式如下:

令W1表示学术影响力TIF5的权重,W2表示学术研究热度Va的权重,则节点文献关键词Kp在目标学科中的学术研究价值度(Academic Research Value,ARV)的计算公式为:

(3)潜在融合新颖性。直接引用关系下目标学科节点文献关键词Kp与跨学科参考文献关键词Iq可能已经产生融合,体现在文献中便是两者存在共现关系。基于此,Kp与Iq在目标学科中的共现关系越强,表明它们结合所形成的知识新颖度越低,越不利于跨学科知识的创新性融合。令U表示在目标学科中以Kp与Iq共同作为主题的文献量,U值越小,表明两者的融合新颖度越高,则Kp与Iq在目标学科中的潜在融合新颖性(Degree of Potential Integration Novelty,PIN)计算公式为:

灰色关联分析法是综合定量评价研究中常用的方法之一,它具有计算简便、可靠性强和样本量要求少等优点。因此,本文运用灰色关联分析法对ARV指数、M值和PIN指数3个指标进行综合评价,从而筛选获得具有较高融合可能性的潜在跨学科知识组合。

4 实证研究

4.1 数据来源与预处理

本文以图书情报学作为目标学科,选择CSSCI作为节点文献集和参考文献集的来源数据库,获取图书情报学领域9种优质期刊(《情报学报》《情报资料工作》《情报理论与实践》《情报杂志》《图书情报工作》《图书情报知识》《情报科学》《图书与情报》《现代情报》)于2018年的载文题录信息和参考文献题名信息。去掉期刊载文中的“会议通知”“选题指南”等非学术型文章,最终得到2 168篇图书情报学科的有效节点文献,52 401篇参考文献。接下来从维普批量下载可获取的“参考文献—参考文献关键词”数据,并用CNKI数据库补充不完整的参考文献关键词数据,后借助关系型数据库MySQL匹配得到“节点文献集—参考文献集—参考文献关键词集”的关系数据。

4.2 初始跨学科关键词组匹配

本文运用《中国科技期刊引证报告(扩刊版)》的期刊—学科分类体系与VBA程序对参考文献进行学科分类,剔除图书情报与档案类后共得8 954条其他学科类别的中文期刊类参考文献,通过匹配最终得到“节点文献集S—节点文献关键词集GK—跨学科参考文献集IR—跨学科参考文献关键词集GI”的关系数据。

不同学科间交换的知识主要包括科学研究的方法、过程、思维方式和技术等[3],因而对于图书情报学科来说,其他学科领域的理论、方法、模型、算法等是更具有潜在利用价值的知识,其往往能促进学科之间的交叉和相互渗透。因此,本文运用自编程序结合人工判别,从跨学科参考文献关键词集GI中提取类属“理论”“方法”“模型”“算法”等及其同义词或近义词的跨学科节点文献关键词。以学科相关新颖性指数值大于等于2的跨学科参考文献关键词为样本,借助关系数据抽取与它们构成的初始跨学科关键词组。经过统计发现,初始跨学科关键词组中存在大量Kp引用Iq频次仅为1(M=1)的部分,说明它们的关联性很弱,融合潜能极小,故将此类数据过滤。经过上述步骤处理,得到的部分初始跨学科关键词组如表1所示:

表1 初始跨学科关键词组(部分)

4.3 潜在跨学科知识组合识别

统计Kp所在节点文献引用Iq所属跨学科参考文献的总频次M,结果如表2第3列所示。借助CNKI的专业检索平台,以CSSCI中图书情报与文献学的20种来源期刊作为检索范围,令时间窗口r=5年,统计距离t=2019年前d年的文献主题中含有Kp的文献量Et-d(d=1,2,3,4,5),结 果 见 表2第4-8列;统 计Et-d于统计年份t的被引频次Ct-d,结果见表2第9-13列。将表2第4-13列各数据代入公式(1)和公式(2),分别计算节点文献关键词Kp在目标学科中的学术影响力TIF5和研究热度整体水平Va,计算结果分别见表2第14和15列。运用熵权法对TIF5和Va进行赋权得到W1=19.66%、W2=80.34%,通过公式(3)与SPSSAU分析软件计算得到Kp在目标学科的学术研究价值度ARV指数的总得分,结果见表2第16列。统计CSSCI中图书情报与文献学的20种来源期刊在2019年将Kp与Iq共同作为主题的文献量U,如表2第17列所示。将U值代入公式(4)计算Kp与Iq在目标学科中的潜在融合新颖性PIN指数,如表2最后1列所示,计算结果保留两位小数。因篇幅限制,这里仅展示部分数据结果。

观察表2第1-2列可以发现,“数字人文—ACP方法”“大数据—ACP方法”和“情报体系—ACP方法”等对应的跨学科知识都是“ACP方法”。因此,本文运用灰色关联分析法对初始跨学科关键词组的ARV指数、M值和PIN指数3个指标进行综合评价,从而获取具有较高融合潜力的跨学科知识组合。其计算过程如下:

表2 初始跨学科关键词组各指标统计与计算结果(部分)

(1)根据初始跨学科关键词组的M值、ARV指数和PIN指数,构建原始指标矩阵,选取样本数据中这3个指标的最大值构成参考指标序列为:A0=(7, 0.86, 1)。

(3)由各指标数据和参考指标序列得到3个指标进行标准化后的序列矩阵,部分结果见表3第2-4列。

(4)计算各指标序列与参考指标序列对应元素的绝对差值,构成i个样本对象j个指标的差序列Δ0i(j),如表4第2-4列所示。由差序列Δ0i(j)得到最大差,即差序列中样本对象所有指标最大值的最大值,以及最小差,即差序列中样本对象所有指标最小值的最小值。令分辨系数 =0.5,将表3第2-4列数值代入公式(5),得到指标序列与参考序列对应元素的关联系数,其中,指标M的关联系数 1、ARV指数的关联系数 2和PIN指数的关联系数 3的部分计算结果见表4第5-7列。

表3 M、ARV指数和PIN指数标准化后的序列矩阵(部分)

表4 指标M、ARV指数、PIN指数的差序列及关联系数(部分)

(5)运 用 熵 权 法 对M值、ARV指 数和PIN指数进行赋权得到三者的权重分别为73.16%、22.16%、4.68%,将各指标权重与表4第5-7列各指标的关联系数代入公式(6),计算各初始跨学科关键词组的关联序Ri,计算结果保留4位小数。

根据关联序的大小,从每组具有相同跨学科参考文献关键词的初始跨学科关键词组中选择关联序最大的作为该组融合潜能最高的跨学科知识组合,部分结果如表5第2列所示,它们对应的关联序Ri值见表5第3列。

表5 直接引用关系下的潜在跨学科知识组合及其关联序Ri(部分)

观察表5可知,由样本数据集得到融合潜能最高的跨学科知识组合为:“因子分析—多准则妥协解排序法”(VIKOR)。因子分析是一种用于客观评价的定量分析方法,其在高校[30]、学者[31]、期刊[32-34]等的科技评价领域应用广泛,但因子分析仅选取特征根大于1的公共因子进行评价,会导致信息损失。多准则妥协解排序法的原理是确定正理想解和负理想解,并根据评价对象的评估值和理想解的接近程度进行优先排序[35]。多准则妥协解排序法能够同时考虑样本对象整体的最大化与个体差异的最小化,进而使评价结果更加合理[36]。因此,可以将多准则妥协解排序法与因子分析相结合,在充分利用样本整体数据的基础上得到更加真实、合理的评价结果。

此外,“引文分析—技术轨道”的融合潜能也较高。技术轨道(technology trajectory)也被称为技术轨迹,即技术发展的自然轨道,是隐含于技术范式中的、针对技术变化方向做出明确取舍所依据的技术演化路径,或是一组可能的技术发展方向[37-39]。在图书情报学领域,可以将技术轨道理论与引文主路径分析的SPC(search path count,搜索路径数)、SPLC(search path link count,搜索路径链接数)等算法相结合,借助技术轨道的连续性、有限性、系统性、多样性和排他性等特点,探究技术主题在知识交流、知识进化和知识突变等过程中的形成及演化。

5 结语

随着科技的发展和科学研究的不断深化,跨学科成为挣脱单一学科固定思维的方式之一,为解决科研问题注入了新鲜血液。本研究根据引用关系分析潜在跨学科知识组合的识别路径并构建融合潜力评价指标。在实证分析方面,借助图书情报学领域9种优质期刊的载文与参考文献、施引文献构建关系数据集,匹配得到初始跨学科关键词组,并利用灰色关联分析法和熵权法识别数据集中融合可能性较大的潜在跨学科知识组合。然而,作为潜在跨学科知识的探索性研究,本文仅以图书情报学为例进行实证分析,有关该方法在其他学科中的应用情况还有待完善。

猜你喜欢

跨学科参考文献文献
跨学科教学在高中生物课堂教学中的应用实践
初中历史跨学科主题学习活动的实践与思考
Hostile takeovers in China and Japan
应用型高校推进跨学科人才培养的路径探索
The Muted Lover and the Singing Poet:Ekphrasis and Gender in the Canzoniere*
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
Study on the physiological function and application of γ—aminobutyric acid and its receptors
商标跨类保护的跨学科解释