APP下载

新兴交叉学科知识元生存时间影响因素研究

2023-12-03张宇马亚雪李悦孙建军

图书与情报 2023年5期

张宇 马亚雪 李悦 孙建军

摘   要:探究新兴交叉学科知识元的生存特征及影响因素,有助于从微观层面揭示新兴交叉学科的形成与演进过程,提升对新兴交叉学科发展规律的科学认识。首先,构建多维测度指标量化新兴交叉学科知识元的学科来源和学科影响力属性;其次,采用Kaplan-Meier法构建新兴交叉学科知识元的生存曲线并剖析不同屬性知识元生存特征差异;最后,利用Cox比例风险模型探究学科来源和学科影响力对知识元生存时间的影响机制。以医学信息学为例开展实证分析后发现,医学信息学知识元生存曲线呈现先陡降后缓降的趋势,平均生存时间为4.41年。医学信息学新产生的知识元生存时间显著低于原始学科归属为四个关联学科的知识元,关联学科中计算机科学的知识元在医学信息学中的生存风险最高。学科来源复杂度、新兴交叉学科使用频次和学科地位、关联学科热度均与知识元生存时间存在正相关关系。相较于关联学科热度,新兴交叉学科使用频次和新兴交叉学科地位对知识元生存时间影响程度更高。

关键词:新兴交叉学科;知识元;生存分析;学科来源;学科影响力

中图分类号:G353.1   文献标识码:A   DOI:10.11968/tsyqb.1003-6938.2023066

Research on Factors Influencing the Survival Time of Emerging Interdisciplinary Knowledge Elements

Abstract Focusing on exploring the survival characteristics and influencing factors of emerging interdisciplinary knowledge elements, this study helps reveal the formation and evolution process of emerging interdisciplinary fields from a micro perspective, thus enhancing the scientific understanding of interdisciplinary development laws. Firstly, we construct a multidimensional index system, with which the disciplinary source and disciplinary influence attributes of emerging interdisciplinary knowledge elements are quantified. Then, we employ Kaplan-Meier method for the construction of survival curve and to analyze the differences in survival characteristics of knowledge elements with different attributes. Finally, the Cox regression is used to explore the effects on mechanism of survival time. Taking medical informatics as an example, the empirical analysis shows that the survival curve of medical informatics knowledge elements experiences a rapid decline in the first year and then a slow decline, with an average survival time of 4.41 years. The survival time of newly emerging knowledge elements in medical informatics is significantly lower than that of related disciplines. Among the related disciplines, the knowledge elements of computer science have the highest survival risk. The complexity of disciplinary source, the frequency of use and status of emerging interdisciplinary fields, and the popularity of related disciplines are all positively correlated with the survival time of knowledge elements. Compared with the popularity of related disciplines, the frequency of use and the status of emerging interdisciplinary fields have a higher degree of influence on the survival time of knowledge elements.

Key words emerging interdisciplinary fields; knowledge elements; survival analysis; disciplinary source; disciplinary influence

大科学时代背景下,学科边界逐渐模糊,单一学科的研究范式与思维模式已经难以支撑重大科学问题的解决与创新发现[1]。多学科交叉创新成为促进科学发展的重要力量[2],并逐步推动新兴交叉学科的产生[3]。多学科知识的不断交互、重组与创新推动新兴交叉学科的形成与发展[4]。知识元作为表达特定知识的最小内容单元[5],具备表示客观实在和反映事物认知的双重属性,其动态变化过程可用于展现新兴交叉学科的形成与发展过程[6]。具体来说,多学科知识元从原始学科知识体系中游离出来,通过交汇、重组、融合产生新的学科增长点,进而推动新知识元的出现,并在原始学科知识元与新知识元的交互过程中推进新兴交叉学科的创新与发展[7]。探究新兴交叉学科中不同属性知识元的生存特征及其影响因素,有助于从微观层面揭示新兴交叉学科的形成与演进过程,提升对新兴交叉学科发展规律的科学认识,为推动我国新兴交叉学科发展与创新提供理论支撑。

生存时间是衡量知识元生存特征的重要指标[8]。现有研究从知识元价值、语义功能等视角,剖析知识元在信息资源管理[9]、计算机[10]等学科中的生存特征及其影响因素,旨在识别领域热点主题和技术方法,从而揭示知识元所属学科的研究前沿和主题演化趋势[11]。研究发现不同学科知识元的生存时间存在显著差异[9-10];同时,知识元自身价值、承载知识元的文献作者规模和引文特征、以及期刊等级与学科归属等因素也被证实会对知识元生存时间产生影响[12]。然而,鲜有研究聚焦学科交叉创新背景下新兴交叉学科的知识元生存特征及其影响因素。

新兴交叉学科是学科交叉领域知识体系化的结果[13]。随着新兴交叉学科逐渐形成独立的知识体系,其与原始学科之间的学科分化不断加剧,使得不同学科来源的知识元与新学科创新发展的适配能力产生差异,进而在新兴交叉学科中表现出不同的生存特征[14]。如一些学科的知识元难以满足新学科发展而逐步消失,另一些则由于其原始学科的理论方法体系与新学科重叠较高而获得更长的生存时间;同样,新产生的知识元也会随着新兴交叉学科的发展呈现出不同的生存特征。除学科来源外,知识元的学科影响力也会对新兴交叉学科中不同属性知识元的生存特征产生影响。研究发现知识元的学科影响力与其在知识传播过程中的知识输出能力呈正相关[15],学科影响力较高的知识元更有可能实现跨学科传播;同时,影响力越高代表知识元的重要性越强[16],可能导致其具有更长的生存时间。

鉴于此,本研究聚焦新兴交叉学科知识元的学科来源和学科影响力对其生存时间的影响。首先,构建多维测度指标量化新兴学科知識元的学科来源和学科影响力属性;其次,采用Kaplan-Meier法构建新兴学科知识元的生存曲线并剖析不同属性知识元生存特征差异;最后,利用Cox比例风险模型探究学科来源和学科影响力对知识元生存时间的影响机制。研究以医学信息学为例开展实证分析,主要考虑到医学信息学是融合多学科门类并被广泛研究的新兴交叉学科[17]。选择该领域作为研究对象兼顾多学科交叉的研究背景和丰富的研究数据。

1   相关工作

生存分析最早出现于生物医学领域[18]。相关研究以罹患癌症的病患作为研究对象,采用寿命表法、Kaplan-Meier法和Cox比例风险模型等方法,探究治疗方案的有效性和术后生存效果[19]。近年来,生存分析方法也被用于发掘影响劳动力流动[20]、企业进出口持续时间[21]、网络舆情演化[22]等多类型研究对象的关键因素及其作用机制。

信息资源管理领域中,生存分析方法主要用于探究学者的成长路径[23]、科技文献传播规律[24]、知识元的生存特征[12]等。以学者为对象的生存分析,集中于探究学术人才职业发展的影响因素,研究发现教育背景、学科、年龄等因素均会对跻身领军人才造成影响[25]。此外,也有研究利用生存分析方法剖析人才流动的驱动因素[26]和荣誉奖项的授予偏好[27]。与传统的履历研究法等相对静态的方法相比,基于生存分析方法的学者研究能够避免大量删失数据造成的结果偏差,并可以通过生存函数来刻画研究对象在每个时点的生存效果,从而动态地反映学者成长路径和影响机制[28]。

以科技文献为对象的生存分析可细分为科学论文生存分析和专利文献生存分析两类。其中,科学论文生存分析主要通过构建论文被引生存率和老化风险率曲线,剖析论文被引趋势和老化风险率的影响因素[24,29]。如朱世琴和蒋辛未对九个学科期刊2000年-2014年引文数据进行生存分析后发现,社会学、哲学、心理学论文老化风险率较低,并且引文高峰出现越早对应的论文老化风险率越高[29]。专利文献生存分析则贯穿专利生命周期始终,旨在发掘专利审查周期和专利存续的影响因素[30-31]。欧桂燕等对中国人工智能领域专利审查周期的影响因素进行生存分析,发现专利引文数增加会缩短专利审查周期,同时个人申请相较于高校及科研机构、机关团体的审查周期会更长[30]。宋爽和陈向东则通过Cox模型分析中美日三国战略新兴产业专利的生存影响因素,结果显示区域技术优势可以延长专利存续时间并提升专利价值[31]。

以知识元为对象的生存分析,主要关注以关键词或主题词等形式存在的知识元的生存时间影响机制[10]。与生物医学领域的生存分析有所区别,知识元存在“重生”现象,即消失后仍然可能被重新使用,因此知识元生存分析只考虑观察期内知识元生存结局[9]。如刘智锋等从语义功能的角度将关键词分为问题类和方法类,探究关键词所在论文特征对其生存时间的影响,结果表明论文被引频次和下载次数与两类关键词生存时间均为正相关,而期刊等级、是否基金资助、作者合作规模和参考文献数四个因素只与方法类关键词的生存时间显著相关[12]。

综上所述,目前生存分析方法已被广泛应用于探究学者、科技文献和知识元的生存特征及其影响因素。以知识元为对象的生存分析研究更多关注相对成熟的学科领域,缺乏对学科交叉创新背景下新兴交叉学科知识元生存时间影响因素的探索。为此,本研究聚焦新兴交叉学科知识元生存特征分析,从知识元的学科来源和学科影响力两个角度,挖掘新兴交叉学科知识元生存时间的影响因素。

2   研究设计

知识元是学科知识结构的基本单元[32],能够表征学科内特定的科学内涵[33]。作者关键词可以相对全面地表示科学论文的内容,是研究科学领域知识结构的有效媒介[34],因而科学论文的作者关键词常被用于代理学科知识元[35]。本研究以新兴交叉学科科学论文的作者关键词作为知识元,从学科来源和学科影响力两个方面测度新兴交叉学科知识元属性,进而探究不同属性知识元生存特征差异,剖析学科来源和学科影响力对知识元生存时间的影响机制(研究框架见图1)。具体研究步骤如下:

(1)检索目标新兴交叉学科及其关联学科的科学论文,采集论文的题录信息并对数据进行预处理。其中,关联学科是指与新兴交叉学科存在内容关联和知识交叉的学科[36]。

(2)从学科来源和学科影响力两个视角,提出原始学科归属、学科来源复杂度、新兴交叉学科使用频次、新兴交叉学科地位以及关联学科热度五个测度指标,并计算新兴交叉学科知识元的上述属性。

(3)采用Kaplan-Meier法构建新兴交叉学科知识元生存曲线,比较分析不同属性知识元生存特征差异。

(4)引入Cox比例风险模型探究新兴交叉学科知识元的学科来源和学科影响力对其生存时间的影响机制。

2.1    知识元属性测度方法

2.1.1   知识元生存时间

知识元生存时间是知识元由起始观察时间到观察期内最后一次出现的时间[10],由于知识元存在“重生”现象,因此生存时间(T)的计算需要考虑知识元在观察期内的“重生”时间,具体计算方法[9]如式(1)所示:

其中,t1为观察期内知识元最后一次出現的时间,t0为起始观察时间,观察期通常设置为10年[9-10]。

2.1.2   学科来源

学科来源是指知识元的学科归属,本研究从原始学科归属和学科来源复杂度两个方面对学科来源进行测度,前者用于表征知识元的学科起源,后者反映知识元跨学科程度。

(1)原始学科归属

现有研究主要通过知识元在不同学科出现占比确定知识元的学科归属[37],但是知识元的学科起源并不受知识元流动导致的学科分布差异的影响。科学论文作为新的科学研究成果或创新知识的科学记录,可以反映学科知识的起源与发展脉络[38]。因此,本研究将包含某一知识元的科学论文按其发表时间进行排序,发表时间最早的科学论文的学科类别作为知识元的原始学科归属,发表时间作为该知识元的首次出现时间,当发表时间相同时则根据论文接收时间人工判断确定知识元的原始学科归属。

(2)学科来源复杂度

学科来源复杂度越高表明知识元跨学科适应能力越强。研究在学科交叉综合测度指标Rao-Stirling指标[39]和2DS指标[40]的基础上,将原公式中的“参考文献”延伸为“知识元”,提出知识元学科来源复杂度(SC)测度指标,如式(2)所示:

其中,dij为学科i和学科j之间的学科距离,该值使用JCR 2019的229个WoS Category学科距离数据[40],Pi表示知识元a在学科i中出现频次与在所有学科中出现频次之比。

2.1.3   学科影响力

学科影响力代表知识元在学科内部的重要程度及其在传播过程中的知识输出能力[15]。研究从知识元在新兴交叉学科中的使用频次和学科地位,以及其在关联学科中的热度三个方面衡量新兴交叉学科知识元的学科影响力。

(1)新兴交叉学科使用频次

知识元的新兴交叉学科使用频次(FU)通过其在新兴交叉学科内部出现的总频次进行测度,如式(3)所示:

其中,a代表知识元,T代表新兴交叉学科,ST为新兴交叉学科包含目标知识元的论文数量。

(2)新兴交叉学科地位

知识元的新兴交叉学科地位由其在知识网络中的位置特征衡量[41],可通过点度中心度、中介中心度和PageRank等指标进行测度。实验发现上述三个指标存在强正相关关系,研究选择点度中心度作为知识元新兴交叉学科地位(DP)的测度指标,如式(4)所示:

其中,da是指与知识元a共现的知识元数量。

(3)关联学科热度

关联学科热度代表知识元在与新兴交叉学科具有内容交叉关系的学科中的使用频次。科研活动中的研究热度往往以“被引量”等指标来衡量[42]。引证行为本质上可视为对被引对象的使用行为[43]。为此,本文利用在关联学科中的使用频次反映其关联学科热度(DH)。具体计算如式(5)所示:

其中,N为关联学科数量,a代表知识元,O代表关联学科,SO为关联学科包含目标知识元的论文数量。

2.2    生存分析过程

研究采用Kaplan-Meier法构建新兴交叉学科知识元的生存曲线,并剖析不同属性知识元的生存特征差异,在此基础上利用Cox比例风险模型探究知识元属性对其生存时间的影响机制,具体过程如下:

首先,将学科来源和学科影响力视角下的原始学科归属、学科来源复杂度、新兴交叉学科使用频次、新兴交叉学科地位和关联学科热度等五个属性按照相应的阀值进行分组;其次,采用Kaplan-Meier法分别构建五个属性下的知识元生存曲线,探究不同属性新兴交叉学科知识元的生存特征差异;最后,利用Cox比例风险模型同时对五个属性进行分析,剖析每个属性对新兴交叉学科知识元生存时间的影响机制。

3   实证研究

3.1    数据采集

医学信息学(Medical Informatics,MI)起源于20世纪70年代,是在医学(MED)、计算机科学(CS)、卫生保健学(HC)、统计学(STAT)四个主要关联学科的基础上发展起来的新兴交叉学科[17]。本研究选取医学信息学作为新兴交叉学科的代表开展实证分析。在Web of Science核心合集中以“WoS Category=学科名”为检索式,检索发表于1900年-2019年、类型为Article的科学论文,获取相关论文的题录信息。剔除缺少作者关键词字段的论文后,得到五个学科论文数(见图2(a))。其中,医学信息学由于发展起步较晚,论文数少于四个关联学科,为43,300篇。四个关联学科中医学论文数最多,卫生保健学最少。由于论文作者关键词大量缺失,导致1990年以前的数据分布较为稀疏,因此只考虑1990年-2019年间论文随时间分布情况,可得出五个学科的论文时间分布(见图2(b))。其中,各学科论文数整体上保持逐年增长的趋势。五个学科在2005年以前论文增长速度相对稳定,除统计学外其他四个学科论文数在2005年以后迅速增加,论文数在15年间增长近三倍。

对采集到的作者关键词进行词干提取、词形还原等预处理,统计得到作者关键词的数量分布(见图2(c))。其中,五个学科的篇均关键词数为4.737个,医学信息学篇均关键词数最多,为5.007个。进一步统计各学科关键词数在1990年-2019年间随时间的变化情况(见图2(d))可以发现,医学、计算机科学、卫生保健学和医学信息学的关键词数呈现逐年增长的趋势,而统计学则相对趋于稳定。

3.2    知识元生存特征差异分析

知识元生存分析常用的观察期为10年。从图2(d)中可以看出2006年开始关键词数出现明显的增长,由于起始观察时间之前需要有足够年份的数据确定知识元的学科来源和学科影响力,起始观察时间之后需要预留10年观察期,为避免选取只选取某一年造成的偶然性,本研究在综合考虑数据量和数据鲁棒性的基础上选取2007年-2009年医学信息学出现的作者关键词整体作为新兴交叉学科知识元,去重后共得到11798个知识元。探究上述知识元在后续10年的生存特征,对应的观察期分别为2008年-2017年、2009年-2018年、2010年-2019年。

构建新兴交叉学科知识元的生存函数和风险函数(见图3)。知识元在观察期第一年生存函数降低较快,对应的风险函数急剧上升,之后生存函数和风险函数趋势都相对平缓,平均生存时间为4.41年,数据删失率约为21.2%,说明大部分知识元在观察期内出现一次就迅速消失,仅有约五分之一的知识元能够适应新兴交叉学科的创新发展需要。

3.2.1   學科来源视角下知识元生存特征

(1)原始学科归属

分析医学信息学知识元的原始学科归属分布(见图4)可以发现:超三成的知识元原始学科归属为医学信息学,表明新产生的知识元在医学信息学知识体系中占主导地位。关联学科中医学和卫生保健学的知识元合计占比约40%,是医学信息学重要的知识来源。

采用Kaplan-Meier法构建知识元生存曲线,结果显示不同原始学科归属的知识元生存时间存在显著差异(见图5)。原始学科归属为医学的知识元生存时间要显著高于其他学科,在观察期结束仍保持30%左右的生存率,而医学信息学知识元在观察期的第一年生存率就降到25%左右,整体生存时间显著低于其他四个学科。Log Rank和Breslow检验结果显著性为0.000。

(2)学科来源复杂度

分析医学信息学与其关联学科之间的学科距离(见图6)发现:医学信息学与卫生保健学和医学的距离更近,与统计学和计算机学科的距离较远。关联学科之间除医学与卫生保健学距离相近,其他关联学科间的距离都较远,在一定程度上也表明医学信息学的学科知识来源广泛。

根据式(2)和学科距离数据计算得到知识元学科来源复杂度分布(见图7)。可以发现绝大多数知识元的学科来源复杂度在0到0.6之间,呈现先升高、后波动、再降低的变化趋势,整体分布呈“M”型且较为分散。部分仅出现于新兴交叉学科的知识元对应的学科来源复杂度为0。

考虑到学科来源复杂度在0.15-0.2和0.35-0.4两个区间内出现峰值,按照0.16和0.36的阀值将知识元近似等分为学科来源复杂度较低、中等和较高的三组(见表1和图8),学科来源复杂度越高对应的知识元平均生存时间越长,说明知识元的跨学科适配能力会对生存时间造成显著影响。学科来源复杂度在(0.36,1]区间的知识元平均生存时间为5.43年,大于学科来源复杂度中等的4.48年和学科来源复杂度较低的3.56年。Log Rank和Breslow检验结果显著。

3.2.2   学科影响力视角下知识元生存特征

(1)新兴交叉学科使用频次

统计在医学信息学内部知识元的使用频次(见图9)可知:新兴交叉学科使用频次总体呈下降趋势,知识元在观察期内平均使用频次为6.41次,大部分集中于0次-10次区间内,使用频次较高的知识元仅占总数的极少部分,使用频次最大值为772次。

根据帕累托法则将新兴交叉学科使用频次分为低频和高频两类,对应的使用频次分别为0次-6次和7次-772次。对照其生存函数(见图10)发现,低频知识元在观察期的第一年生存率就降至40%以下,而高频知识元在观察期的最后一年仍有约75%的生存率,可以看出新兴交叉学科使用频次会显著影响知识元的生存时间,新兴交叉学科使用频次越高,对应的知识元生存时间越长。

(1)新兴交叉学科地位

通过知识元共现情况计算得到知识元的新兴交叉学科地位(具体分布情况见图11)。呈现先上升再下降趋势,峰值出现在6附近,说明大部分知识元仅出现一次且只与其所在论文的其他知识元存在共现关系。新兴交叉学科地位在30之后曲线逐渐趋于平缓,仅有约四分之一的知识元在知识网络中与超过30个节点共现。为此,以6和30为分界将新兴交叉学科地位划分为较低、中等和较高三类。

从不同新兴交叉学科地位的知识元生存曲线(见图12)可以看出,学科地位较低的知识元在观察期的第一年生存概率就降到5%以下,这些知识元通常仅在新兴交叉学科中“昙花一现”。学科地位较高的知识元则在观察期内保持60%以上的生存率,Log Rank和Breslow检验结果均为0.000,这是因为学科地位较高的知识元与更多知识元存在共现关系,而知识网络中的共现会促进知识元之间的交互融合与协同创新,从而显著提升知识元的生存时间。

(3)关联学科热度

从知识元的关联学科热度分布(见图13)来看,关联学科热度整体呈下降趋势。其中,关联学科热度在0-5之间快速下降,然后在5-40之间下降幅度趋缓,在40之后逐渐保持稳定,说明知识元在关联学科中的使用频次都不高且服从幂律分布。

研究根据关联学科热度的分布情况划分为“关联学科热度>40”“5<关联学科热度≤40”“关联学科热度≤5”三类,并得到对应的生存曲线(见图14)。知识元生存时间按照上述顺序递减,且后两者之间的差异大于前两者的差异。

3.3    知识元生存时间影响机制分析

根据不同属性知识元生存特征分析结果发现,学科来源和学科影响力都会不同程度影响知识元生存时间,采用Cox比例风险模型进一步探究学科来源和学科影响力对新兴交叉学科知识元生存时间的影响机制。对照知识元生存影响因素分类标准(见表2),每组分类变量均以第一个取值为参照。

计算Cox比例风险模型回归结果(见表3)可得知,相较于原始学科归属为医学信息学的知识元,原始学科归属_CS的相关性系数为正值,这表明原始学科归属为计算机科学会增加知识元的生存风险,减少知识元的生存时间,原始归属学科为医学、卫生保健学、统计学则对知识元生存时间的影响并不显著。计算机科学作为学科交叉过程中的方法论学科,其支配新兴交叉学科工具使用和技术应用[44],技术工具的更迭势必会导致知识元生存时间的不确定性。学科来源复杂度较高和中等的知识元生存风险分别为学科来源复杂度较低知识元的0.883倍和0.877倍,值得注意的是,生存风险最低的是学科来源复杂度中等的知识元,造成此结果的原因可能是学科来源复杂度较低的知识元难以流动到关联学科,而学科来源复杂度较高的知识元往往已经被关联学科普遍接受和使用,创新性逐渐降低的同时使用频次也慢慢减少,从而体现为更短的生存时间。

同样的,学科影响力也显著影响知识元生存时间,知识元的生存风险随新兴交叉学科使用频次、新兴交叉学科地位与关联学科热度的增加而降低。新兴交叉学科使用频次的Exp(B)为0.294,表明新兴交叉学科使用频次较高的知识元生存风险是使用频次较低知识元的0.294倍。新兴交叉学科地位中等和较高的回归系数分别为-0.986和-1.593,表明新兴交叉学科地位是知识元生存时间的重要因素,知识元的新兴交叉学科地位越高,对应的平均生存时间越长。关联学科热度中等和较高的Exp(B)分别为0.777和0.549,表明关联学科热度中等和较高的知识元生存风险相比关联学科热度较低的知识元降低22.3%和45.1%,即关联学科热度较高的知识元在新兴交叉学科普遍具有更长的生存时间。

4   研究结论与展望

本研究以医学信息学及其关联学科为例探究新兴交叉学科知识元生存特征及其影响机制,运用Kaplan-Meier法分析不同属性知识元的生存特征差异,在此基础上采用Cox比例风险模型从学科来源和学科影响力两个视角探究新兴交叉学科知识元的生存时间影响机制。得到以下发现:

(1)从知识元属性来看,学科来源和学科影响力都会对新兴交叉学科知识元生存时间造成不同程度的影响,学科来源表征知识元的学科起源和跨学科程度,而学科影响力反映知识元在知识网络中的知识输出能力,前者是对知识元自身属性的刻画,后者则从外部视角描述知识元跨学科传播的可能性,且后者对于知识元生存时间的影响大于前者的影响。

(2)研究以医学信息学知识元作为对象,但是由于医学信息学科学范式仍在不断地发展完善,加剧了新知识元的出现与消失,导致医学信息学的知识元生存时间显著低于知识结构更为成熟的关联学科。

(3)考虑到知识元的学科归属对于生存时间的影响较弱,而选取医学信息学作为代表是基于其丰富的多学科交叉数据,因此研究结论可以推广到一般性的交叉学科。

本研究也存在一些不足,在进行关键词匹配时,仅考虑了词形上的一致,没有考虑在学科交叉过程中跨学科导致的语义漂移现象,未能从语义和语义功能上对知识元进行更加有效的区分。后续将在考虑跨学科语义的基础上,识别知识元在学科交叉过程中的流动情况,实现学科交叉点的识别与生存预测。

参考文献:

[1]  Wagner C S,Roessner J D,Bobb K,et al.Approaches to understanding and measuring interdisciplinary scientific research(IDR):A review of the literature[J].Journal of Informetrics,2011,5(1):14-26.

[2]  張琳,孙蓓蓓,黄颖.交叉科学研究:内涵、测度与影响[J].科研管理,2020,41(7):279-288.

[3]  韩启德.学科交叉与现代科学范式转移——在全国首届前沿交叉学科论坛暨前沿交叉研究院联席会上的讲话[J].大学与学科,2021,2(1):1-4.

[4]  文庭孝,罗贤春,刘晓英,等.知识单元研究述评[J].中国图书馆学报,2011,37(5):75-86.

[5]  索传军.知识转移视角下的学术论文老化与创新研究[J].图书情报工作,2014,58(5):5-12.

[6]  Zhuge H.Semantics Resource and Grid[J].Future Generation Computer Systems,2004,20(1):1-5.

[7]  戎军涛,李兰.知识元的本质、结构与运动机制研究[J].情报理论与实践,2020,43(1):42-46,41.

[8]  彭非,王伟.生存分析[M].北京:中国人民大学出版社,2004.

[9]  Peset F,Garzón-Farinós F,González L,et al.Survival analysis of author keywords:An application to the library and information sciences area[J].Journal of the Association for Information Science and Technology,2020,71:462-473.

[10]  刘智锋,李信.作者关键词生存分析——以国内图情领域为例[J].图书馆杂志,2020,39(7):48-57.

[11]  孙佳佳,李雅静.基于关键词价值细分的高价值热点主题识别方法研究[J].情报学报,2022,41(2):118-129.

[12]  刘智锋,马永强,杨金庆.词汇功能视角下关键词生存时间影响因素研究[J].现代情报,2023,43(1):151-162.

[13]  王传毅,李祎.多样性和凝聚性:国内高校自主设置交叉学科的结构特征[J].大学教育科学,2023(1):35-47.

[14]  朱小平,张家军.论我国交叉学科建设的规训隐忧及消解路径[J].高校教育管理,2022,16(5):52-63,72.

[15]  李樵.外部引用视角下的中国图书情报学知识影响力研究[J].中国图书馆学报,2019,45(6):65-83.

[16]  张玲玲,张宇娥,杜丽.国家社科基金项目成果视角下图情领域知识扩散研究[J].图书馆工作与研究,2017,(10):60-66.

[17]  操玉杰,梁镇涛,毛进.知识模因视角下跨学科研究领域的学科结构分析[J].图书馆论坛,2019,39(7):84-90.

[18]  Singer J D,Willett J B.Its About Time:Using Discrete-Time Survival Analysis to Study Duration and the Timing of Events[J].J Educ Stat,1993(18):155-195.

[19]  王学敏,张维红,杜伟娇,等.阿帕替尼用于一线治疗进展后晚期非鳞非小细胞肺癌的疗效和生存分析[J].中国肺癌杂志,2017,20(11):761-768.

[20]  张世伟,赵亮.农村劳动力流动的影响因素分析——基于生存分析的视角[J].中国人口·资源与环境,2009,19(4):101-106.

[21]  陈勇兵,钱意,张相文.中国进口持续时间及其决定因素[J].统计研究,2013,30(2):49-57.

[22]  陈瓂浩,李纲.突发社会安全事件网络舆情演化的生存分析——基于70起重大社会安全事件的分析[J].情报杂志,2016,35(4):70-74.

[23]  张建卫,王健,周洁,等.高校高层次领军人才成长的实证研究[J].科学学研究,2019,37(2):235-244.

[24]  张中文,徐天和,董秀芬,等.学术期刊论文生存被引次数的定义与应用[J].编辑学报,2015,27(4):316-319.

[25]  瞿群臻,高思玉,汪鹏飞,等.基于生存分析视角的战略科学家成长路径研究[J].中国科技论坛,2022(7):157-166.

[26]  孙玉涛,张帅.海外青年学术人才引进政策效应分析——以“青年千人计划”项目为例[J].科学学研究,2017,35(4):511-519.

[27]  孙玉涛,陈灵芝.诺奖候选人学术影响、提名人身份与获奖概率[J].科学学研究,2019,37(9):1550-1557.

[28]  张建卫,李海红,乔红,等.生存分析视角下杰出青年科技人才的成长路径研究[J].中国科技论坛,2020,287(3):158-165.

[29]  朱世琴,蒋辛未.基于CSSCI的人文社科期刊文献老化风险率研究[J].情报学报,2017,36(10):1031-1037.

[30]  欧桂燕,庞娜,吴江.专利审查周期影响因素研究——以中国人工智能领域为例[J].数据分析与知识发现,2022,6(8):20-30.

[31]  宋爽,陈向东.区域技术差异对专利价值的影响[J].科研管理,2016,37(9):68-77.

[32]  索传军,盖双双.知识元的内涵、结构与描述模型研究[J].中国图书馆学报,2018,44(4):54-72.

[33]  孙震,冷伏海,张晋辉.基于知识元的科学计量方法及其实证研究[J].图书情报工作,2017,61(23):89-99.

[34]  Zhang J,Yu Q,Zheng F,et al.Comparing keywords plus of WOS and author keywords:A case study of patient adherence research[J].Journal of the Association for Information Science and Technology,2016,67(4),967-972.

[35]  王康,陈悦,苏成,等.多维视角下科学主题演化分析框架[J].情报学报,2021,40(3):297-307.

[36]  王昊,苏新宁.基于CSSCI本体的学科关联分析[J].现代图书情报技术,2010,198(10):10-16.

[37]  杨贺,杨奕虹,李宁.关键词-分类号关联词表构建[J].现代图书情报技术,2013,(Z1):107-113.

[38]  楼雯,蔡蓁.科学论文评价的涵义与方式研究综述[J].情报杂志,2021,40(5):171-177.

[39]  Stirling A.A general framework for analysing diversity in science,technology and society[J].Journal of the Royal Society Interface,2007,4(15):707-719.

[40]  Lin Zhang,Loet Leydesdorff.The Scientometric Measurement of Interdisciplinarity and Diversity in the Research Portfolios of Chinese Universities[J].Journal of Data and Information Science,2021,6(4):13-35.

[41]  林波,薛惠锋,苗治平.网络组织知识获取模型及其仿真分析[J].情报杂志,2009,28(11):150-155.

[42]  荣国阳,李长玲,范晴晴,等.主题热度加速度指数——学科研究热点识别新方法[J].图书情报工作,2021,65(20):59-67.

[43]  Liu Y,Rafols I,Rousseau R.A framework for knowledge integration and diffusion[J].Journal of documentation,2012,68 (1) :31-44.

[44]  马费成,张帅.我国图书情报领域新兴交叉学科发展探析[J].中国图书馆学报,2023,49(2):4-14.

作者简介:张宇,男,南京大学信息管理学院硕士研究生,研究方向:知识组织与管理;马亚雪,女,南京大学信息管理學院博士后,研究方向:科技创新;李悦,女,南京大学信息管理学院硕士研究生,研究方向:科学计量;孙建军,男,南京大学信息管理学院教授,博士生导师,研究方向:信息资源管理。