APP下载

基于引用内容分析的学者知识扩散特征研究

2024-04-14肖梓培刘萍

现代情报 2024年4期

肖梓培 刘萍

关键词:知识扩散:引用内容分析:刘则渊:多维分析

知识扩散是知识主体通过正式或非正式的传播渠道,使知识传递至接收者,以实现知识共享的过程。在正式传播渠道中,多以学术文献为传播媒介,将创造主体的学术思想和研究经验传递给学习主体,以促进知识的流通、利用与创新。近年来,对知识扩散的研究吸引了来自情报学、科学学、管理学等领域众多学者的关注,成为学术界研究的热点议题之一。目前,关于知识扩散的研究多以物理层次的文献单元为粒度,采用数理统计分析、网络分析等方法来揭示学科间宏观知识流动特征,未能深入到认知层次的知识单元,无法回答什么样的知识扩散出去的问题。另外,知识扩散是学者创新知识被他人吸收、利用和再创造的过程,识别学者学术思想对其他学者知识创新的贡献能弥补以发文量和被引量为主的学者学术评价弊端。因此,本文从学者视角来研究知识扩散现象,基于引用内容和功能分析,多维度刻画学者知识扩散特征,以提高对学者知识贡献的评价。

本文选择刘则渊教授为研究对象。刘则渊教授是我国科学研究的开创者之一,是发展战略学、技术哲学、知识计量学等方面的集大成者。刘则渊教授的学术思想和研究经验通过其撰写的学术论文扩散至不同学科的科研学者,这些学者通过文献引证的形式实现了对刘则渊教授创生知识的吸收与利用。本文兼顾知识扩散的外部特征与内容特征两个层面,探究刘则渊教授知识扩散的学科特征、知识单元特征,以及主题思想特征。该研究从微观视角丰富了科学知识扩散的研究方法,同时对于揭示学者知识影响力也有着重要的意义。

1相关研究

1.1基于引文计量的知识扩散研究

科学文献间的学术知识扩散可以通过引文的方式来追踪,通过引文计量方法探测学术知识对外扩散的脉络。HoMHC等学者构建了一个专利引文网络来探索国家间的知识扩散。Yan E使用Sco-pus索引的期刊和论文集的引文数据集,考察了动态学科知识的产生和传播模式。赵星等以CNKI收录的2001-2010年我国82个文科领域的引证关系为基础数据,探析了相关引文网络的结构及其映射的知识扩散状况。谭春辉等以CSSCI收录的2016-2020年23个人文社科450本期刊的论文引用关系为数据源,构建知识流动的有向加权网络,从个体引文网络的直接知识流动和整体引文网络间接知识流动人手,综合全面地探讨各学科的知识流动情况。岳增慧等构建了社会网络领域文献引证网络,对该领域学科知识扩散计量特征(数量特征、分布特征)以及中介关系特征进行多维探测。TsayM对1998-2010年4种重要的情报学期刊文献的被引学科和主题进行了分析,发现情报学领域内部引用最多,情报学在领域知识输出方面的作用相对较小。Si L等针对2000-2019年WOS收录的图情领域高被引论文进行引文分析,探究其对其他学科的知识扩散和影响。研究发现,图情高被引论文在医学、计算机科学、管理学和教育学领域具有相对较高的知识输出潜力。

除了基于期刊引证关系的学科知识扩散计量研究外,也有部分学者开展了基于作者引证关系的知识扩散计量研究。邱均平等筛选了科学计量学领域内94位核心作者,通过引证关系分析作者之间的知识扩散特征,识别出了核心知识发出者、知识传播者,以及知识接收者。赵蓉英等选取了知识管理领域176位发文大于3篇的作者构建了作者引证网络,并定义了作者知识扩散广度和作者知识扩散深度两个指标,用以测量作者知识扩散贡献程度。逢顺欣在作者一期刊引证关系的基础上,综合考虑了作者引证文献期刊数量和引用次数,设计新的知识扩散指数KDI,测评了情报学44位高产作者在学科领域发展中的知识扩散水平和学术影响力。

1.2基于引文内容的知识扩散研究

引文内容分析法通过对引文的句法和语义两个层面的解读,来拓展传统的引文计量分析的研究维度,以更全面的视角解释每一条引文的价值。当前已有少部分学者通过引文内容分析的方法来进行知识扩散的研究,例如张艺蔓等构建原始文献集和施引文献集,通过LDA模型提取文献集的主题,重点分析了信息科学、计算机科学与医学之间的知识扩散的主题内容:李樵利用引文分析方法,从学科、主题等角度对1978-2018年中国图书情报学的知识输出进行多维分析,通过被引文献的关键词聚类,识别出图书情报学知识输出主要集中于文献计量、引文分析、共词分析等主题。WangF等利用引文追踪技术接受模型(TAM)的知识扩散情况,描述了TAM的跨学科扩散路径,并基于引文内容对该理论的发展模式进行了分类:MaoJ等研究了医学信息学与4个相关学科之间的知识扩散关系,并引入了知识模型作为计量的知识单元,从内容的角度量化了知识扩散的特征。

综合上述已有研究,在取得成绩的同时,也存在一些不足之处:①基于引文计量的方法仅通过被引数量和文献外部特征来体现宏观层面(如学科间)知识扩散的状态,无法探究具体的知识扩散内容;②基于引文内容的方法大多停留在引文的主题抽取阶段,较少将引用的内容分析与功能分析相结合。本研究将知识扩散研究深入到微观层面,从学科领域、知识单元、主题思想3个方面探究刘则渊教授知识扩散特征,重点研究问题如下:

1)在学科领域层面,刘则渊教授论文的知识扩散至哪些学科?有何差异?

2)在知识单元层面,扩散的知识单元有哪些,分别是什么类型的知识?

3)在主題思想层面,刘则渊教授的学术思想对不同学科学者产生了怎样影响?

2研究设计

本研究旨在推进学者知识扩散特征研究从宏观的知识流动现象深入至微观的知识流动内容探究,包含学科、知识与主题3个维度:①在学科特征维度,要回答的是包含学者学术思想的研究成果引起了哪些学科学者的关注,进而被他们吸收利用。影响的学科越多,代表该学者的学术影响力越广泛。针对学科层面的知识扩散特征是通过引证文献所属期刊所对应的学科来识别的,学科层面的知识扩散识别的是知识扩散的外部特征:②在知识单元维度,需要识别的是什么知识在扩散,包括具体的知识单元和知识类型。通过对学者的引证文献进行引用内容分析,抽取引证句的知识单元并划分知识类型,来识别通过该学者扩散的知识单元特征。其中,知识单元抽取偏向语法层次,知识类型的标注偏向语义层次;③在主题思想维度,首先识别学者的核心研究主题,并通过引用内容与功能分析探究其学术思想对其他学科学者产生了怎样的影响。其中,主题的识别属于语义层次,知识的吸收利用属于语用层次。整体研究框架如图1所示。

2.1数据来源

在WOS、Scopus数据库上检索刘则渊教授的论文,发现搜集到的英文学术期刊论文較少,只有12篇,且刘则渊教授均不是第一作者,因此,本研究以刘则渊教授的中文学术论文为研究数据。在中国知网、万方数据库中检索刘则渊教授作为第一作者的学术论文,合并去重后得到刘则渊教授发表的学术期刊论文105篇(发文的年代分布如图2所示),获取105篇论文及其引证文献构建本研究的原始论文集和施引文献集。

2.2研究方法

2.2.1引证期刊分析

为探究学者知识扩散的学科特征,采用引证期刊文献学科分类的方法。学术期刊论文所属学科的分类方法主要有两种,一种是根据论文提交的期刊在数据库中的学科分类来确定该论文的学科分类:还有一种是根据论文作者的研究方向、学术背景等判断论文所属的学科领域。前者在学术研究中被使用得最多,本研究也参照相同的方法。本文以中国知网的期刊学科分类为标准,对引证论文进行学科分类。如果某期刊归属两个学科分类,则根据论文内容选取更匹配的学科。通过统计学者论文的引证文献学科分布得到学者知识扩散的学科特征。

2.2.2引用内容分析

为探究学者知识扩散的知识单元特征,需要对引用内容进行分析以识别扩散的知识单元及知识类型。首先通过引证文献的引证句子来提取知识单元,具体步骤如下:根据引证文献集的引文记录抽取引文内容,获取中国知网提供的HTML格式的论文全文,参考张汝昊等提出的方法,对于引证文献集中的每一篇论文,在CNKI的HTML格式全文中通过class值为“sup”的标签对其引文句进行定位,并以定位的引用标签为准,向左和向右各提取一句话,即引文内容包括引用标签的句子和引用标签的前一句和后一句。获取引文内容数据集后,利用Python的Jieba库实现对引文内容的中文分词,为了得到更好的分词结果,在分词之前添加和调整自定义词典,并在分词中去掉停用词等无效词汇。最终得到引文内容的分词词汇。对于每条引文记录,将提取出的分词词汇与该引文记录的参考文献标题、摘要和关键词作对照,最终识别出在原始文献标题、摘要和关键词中出现过的词汇,这些词汇就是学者向外扩散的知识单元。

完整识别并整理学者向外扩散的知识单元后,需要进一步对这些知识单元进行分类。参考温有奎等、毕崇武等、Wang S等学者提出的分类框架,并考虑本研究的具体目标,制定了知识单元的分类框架,包含3种类型的知识单元,分别是概念类、理论类和方法技术类知识单元。如表1所示,列出了每个知识类型的描述及对应的实例。根据表1的分类框架,由两名具有图书情报学科背景的研究者对识别出的知识单元进行分类标注,分类不一致时通过讨论达成一致,最终得到学者知识扩散的类型分布。

2.2.3引用功能分析

在学者知识扩散内部特征方面,在引用知识单元的抽取和分类基础上,进一步探究哪些主题思想扩散至不同学科,并且被怎样吸收利用。首先是主题的识别,不同的知识单元语义上是有关联的。知识单元除了按照知识类型划分外,还需要按照语义关联进行聚类。本研究基于作者文献所包含的关键词共现关系构建词汇共现网络,通过主题聚类探析关键词之间的语义联系,进而识别知识单元所属的主题。为揭示主题思想在不同学科得到怎样的应用与发展,需要进行引用功能分析,即分析引证文献和被引文献在研究方法或学术思想上的联系。高质量的知识流动体现在知识的增值,即学者的学术思想给其他学者带来启迪,使得其他学者在解决问题过程中有创新知识的产生。在本文中,将学者学术思想在扩散过程中的传承与发展称为“语用层面的知识扩散特征”,这是一项极为重要但常被忽略的研究内容,很难自动识别。本研究通过人工阅读引证文献,定性分析学者的学术思想如何影响不同领域的学者,促进新一轮的知识创新。

3学者知识扩散的特征分析

3.1学者知识扩散的学科特征

在中国知网、万方数据库中搜集刘则渊教授作为第一作者发表的105篇学术论文及引证文献,共得到引证文献850篇,具有完整引文内容的引文记录789条。从引文分析的视角来看,引证文献的学科多样性可以从一定程度上反映刘则渊教授知识扩散的学科多样性。数据统计表明,刘则渊教授的学术成果影响高到82个学科,占到CNKI学科总数的46%,学科覆盖面的广泛体现了刘则渊教授较强的学术影响力。表2展示了引证论文最多的10个学科,这10个学科引用总次数占比超过总体引用数的70%。从表中可以看出,科学研究管理和图书情报与数字图书馆这两个学科领域引用次数最多,引用次数占比达到46.51%。体育学科排名靠前,是因为科学知识图谱不仅丰富了体育学科的研究方法,也完善了我国竞技体育、学校体育和大众体育领域的理论性研究,因而在该学科领域得到了广泛的推广和应用。

3.2学者知识扩散中的知识类型特征

根据2.2的研究方法,共识别出知识扩散中的知识单元872个,去重后得到不同的知识单元98个,其中概念类知识单元25个,理论类知识单元23个,方法技术类知识单元50个,各类别知识单元的数量分布如表3所示。从表中可以看出,方法技术类知识占比最高,达到了51.02%,其次是概念类知识,占比25.51%,最后是理论类,占比为23.47%。

进一步统计流入各学科的知识单元类型及知识数量,得到结果如表4所示。从表4中看到,扩散至科学研究管理领域的不重复的知识单元数量最多(53个),其次是图书情报与数字图书馆领域(47个),扩散至科学研究管理领域和图书情报与数字图书馆领域的不重复的知识单元占比分别是54.08%和47.96%,即这两个学科吸收了知识扩散中近一半的知识量,从知识计量的角度再次证明了这两个学科受刘则渊教授的学术研究影响较大。同时,观察表4可得,扩散至经济与管理综合领域的知识单元数量(21个)大于扩散至高等教育领域的知识单元数量(16个),这与表2中按学科引用次数排列的顺序并不相同,即刘则渊教授的论文虽然被高等教育和经济与管理综合这两个学科领域引用的次数均为28次,但是流入高等教育领域的知识单元重复率较高,没有流入经济与管理综合领域的知识范围广。从扩散的知识类别来看,概念和方法技术类知识的传播多于理论类知识。

3.3学者知识扩散的知识单元特征

在识别出的不重复98个知识单元中,各知识单元被引频率是不同的。表5列出了在引证文献中出现大于等于10次的10个知识单元。其中知识图谱是排在首位,引用次数达到103次,扩散至38个不同的学科,影响的学科范围最广。整体而言,高频出现的知识单元大部分与知识计量学有关,有些是知识计量学领域的基础概念,如知识单元;有些是知识计量学领域的研究方法/工具,如知识图谱、CiteSpace等。刘则渊教授率先在我国提出“知识计量学”的概念,并逐渐完善了知识计量学的研究框架、理论基础和方法体系,这些知识计量学领域的知识扩散至图书情报与数字图书馆、经济与管理综合等30多个学科,从侧面反映出知识计量学研究的影响力。

从知识单元视角看,发现扩散至各学科的知识单元并不相同,存在知识属性和知识内容上的差异。表6列举了扩散至图书情报与数字图书馆和经济与管理综合这两个学科的部分知识单元,对比扩散至这两个学科的知识单元,可以发现存在一些共性:一是以知识计量学为核心的相关概念、理论和方法对这两个学科都产生了重要影响,例如刘则渊教授重新定义了知识单元的概念,拓展了其内涵和外延,而学术概念是学科研究的基础,一个明确的、共同的概念定义能够避免研究方向的模糊或偏差,提高研究成果的科學性、严谨性和可靠性。知识单元的概念界定为图情领域开展以知识单元为单位的知识计量和经管领域探究以知识单元为基础的知识经济发展提供了研究支撑。二是知识图谱方法工具都被这两个学科所借鉴,这可以看出知识图谱研究方法具有一定的普适性,可以帮助解决不同学科领域的研究热点及前沿可视化分析。

表6也提示扩散到图情和经管两个学科的知识差异。例如,SIBW概念只影响到图情学科,SIBW是指科学计量学、信息计量学、文献计量学、网络计量学的四计学概念,刘则渊教授详细介绍了SIBW学科的形成过程、相互关系和研究前沿,对图情领域的学科建设产生了重要影响。而产业生态化的概念只影响到经管学科,刘则渊教授在1994年指出,产业生态化就是将产业活动纳入大生态系统,以实现人一社会一自然三者的可持续发展。产业生态化的概念帮助经管学界认识到应当转变经济发展方式,降低资源消耗,走产业生态化道路。同时,虽然知识经济的概念对两个学科都有影响,但是图情领域一般将目光放在知识价值的创造,而经管领域一般研究采取哪些措施来发展知识经济。

在方法技术层面,除两个学科都借鉴了知识图谱方法外,影响图情学科的研究方法一般与科学计量有关,例如共现分析,图情领域的很多学者采用共现矩阵探究学科主题演化。而影响经管领域的研究方法会更偏向数理经济方面,例如刘则渊教授建立的生态城市相关评价指标只影响到了经管领域,该指标体系被用于探讨经济、社会和自然相统一的复合生态化城市建设,有利于可持续经济的发展。

3.4学者知识扩散的主题思想特征

为进一步探究刘则渊教授在主题思想维度的知识扩散特征,本文对刘则渊教授学术论文的关键词进行了聚类分析。基于作者关键词的共现关系,利用VOSviewer可视化工具,对刘则渊教授论文集做主题聚类,结果如图3所示。可以发现,刘则渊教授的研究主要围绕5个主题展开,参考陈悦等、李江波等学者对刘则渊重要学术思想的研究,标注了5个主题的描述标签,并将抽取的知识单元对应于5大研究主题,如表7所示。

为回答本文第三个研究问题“在主题思想层面,刘则渊教授的学术思想对不同学科学者产生了怎样影响”,即从“语用层面”探究学者的知识扩散特征,选择刘则渊教授在五大主题的高被引文献,人工阅读这些引证文献摘要以及正文,以探究不同学科学者对刘则渊教授学术思想的传承与发展,以下作分别阐释。

1)科学学学科建设相关理论体系

刘则渊教授基于对中外科学学进展的分析,构建了新世纪科学学理论体系的基本框架。该理论体系由三维结构组成,分别是科学、技术、创新及其关系的对象维,科学学分支学科与相邻学科的学科维,以及科学学的理论、应用、方法3个研究层次的研究维。该理论体系从整体上为研究科学技术活动提供了分析的思路与框架。该主题下高被引文献为《科学学理论体系建构的思考一基于科学计量学的中外科学学进展研究报告》,该论文被引用129次。通过人工阅读该论文的引证文献,发现“科学学学科建设相关理论体系”在8个学科得到了传承与发展。如在图情领域,邱均平等参考刘则渊教授提出的“科学计量学是科学学的分支学科”这一论断,对科学计量学的学科属性进行界定;在经管领域,李海波等以科学学理论体系作为科技发展决策支持平台运行的理论基础,并在科学学理论的支持下界定该平台的运行要素,为科技发展决策支持平台的设计提供了重要借鉴,促进了决策支持平台的创新建设。在出版领域,梁永霞等提出,科技期刊源于科学技术的发展,又反过来支持了科学技术的进步,因此应从科技发展规律中寻找科技期刊办刊的基本原理。科技期刊编辑应了解科学学知识,提高科学学素养,发挥期刊在国家创新体系建设中的作用。

2)哲学一数学一科学一技术一经济大周期转化规律

刘则渊教授通过历史大尺度统计分析,定量考察了世界哲学高潮转移现象,发现了哲学一数学一科学一技术一经济大周期转化规律,指出哲学对科学发展具有极其深远的影响。该主题下高被引文献为《近代世界哲学高潮和科学中心关系的历史考察》,该论文被引用69次。通过对引证文献的分析发现,该主题知识扩散至12个不同的学科。如在情报学领域,受哲学与科学关系的研究启发,卢泰宏提出了可以探究情报利用率与世界科学中心兴起之间的关系,为研究情报利用与社会科学发展之间的相互作用提供了创新思路:在哲学领域,张云龙等考察了近代以来五大“科学中心”的生成与发展及其相应的哲学思想,进一步揭示了科学发展与哲学观念之间的内在关联,为新时代中国努力成为世界主要科学中心和创新高地提供历史借鉴与启示。在科学学领域,陈悦等为进一步揭示科学技术和经济发展间相互作用的规律,对我国科学、技术和经济产出三者间的动态关系进行模型分析,发现“科学一技术”交互效应是存在的,并且对经济产出具有重要推动作用。

3)知识活动系统理论体系

刘则渊教授在马克思社会再生产理论的基础上提出了人类知识活动系统理论。他指出,社会再生产大系统是建立在知识的生产、传播、应用等知识活动系统上的物质再生产(经济系统)、知识再生产(科技系统)和智力再生产(教育系统)的统一体。刘则渊教授从知识活动系统的全息性分析了大学基本职能和大学知识活动系统,提出了高校知识战略发展模式。该主题下高被引文献为《知识活动系统与大学知识管理》,该论文被引用71次。通过对引证文献的分析发现,该主题知识扩散至9个不同的学科。在高等教育领域,朱铁壁等参考知识活动系统理论,以知识生产和知识类型为基础参照维度,提出了一组新的高校分类标准:姜春林借鉴大学知识管理相关的思想,在知识活动系统理论的基础上设计出了具有一定创新性的知识能力测度指标系统:在管理领域,宁烨等探讨了知识能力的构成要素,构建了知识能力的三维测量模型。

4)新巴斯德象限理论体系

刘则渊教授在钱学森技术科学思想的基础上,把科学研究象限模型的巴斯德象限变换为科技象限模型的新巴斯德象限,为高科技产业发展战略和政策提供了理论基石。该主题下高被引文献为《新巴斯德象限:高科技政策的新范式》,该论文被引用109次。通过对引证文献的分析发现,该主题知识扩散至11个不同的学科。在管理领域,宁凌等结合新巴斯德象限所表现出的科学、技术之间相互作用、相互转化的关系,从“技术识别一技术研发一技术应用”的基本范式中凝练出海洋高新技术产业创新突破的演进路径,并构建指标体系分析了沿海高新产业技术创新效率:在教育领域,魏春艳等将新巴斯德象限理论引入高等教育领域,将其作为产教融合的理论基础,促进了产教融合在社会实践层面的创新性研究;在图情领域,齐燕基于新巴斯德象限理论开展专利引文分析,设计了新指标和方法来反映科技关联的特征与规律。

5)知识计量与知识图谱方法论

刘则渊教授是知识计量学的主要开创者。他在知识计量学的概念解析、方法范式等方面作出了突出贡献。他重新定义了知识计量学中属于知识领域的知识单元概念,率先在国内命名并引进“科学知识图谱”这一可视化研究方法,开创了以科学知识图谱为核心的可视化研究新范式,变革了知识计量学的研究路径。该主题下,以刘则渊教授为第一作者的高被引文献为《关于知识计量学研究的方法论思考》以及《30年中国科学学历程的知识图谱展现——为(科学学与科学技术管理)杂志创刊30周年而作》,这两篇论文分别被引用49和42次。通过对引证文献的分析发现,该主题知识扩散至54个不同的学科。一方面,知识图谱已被广泛应用于各学科/领域的研究热点和发展脉络的识别;另一方面,学者们也在持续探索知识计量的新方法。如毕崇武等提出从引文内容分析视角开展知识计量研究的主要设想和实现路径:孙晓玲等探讨将表示学习引入到知识计量中,对知识进行语义向量表示,扩充语义层面的知识内容计量;孙震等针对知识图谱计量对象局限于主题词、关键词等反映文献外在特征,未能深入到文献蕴含的内在知识层面的不足,提出了直接对文献内容知识本身进行计量分析的新型科学计量范式,以解决文献中隐性知识的计量难题。

4结论

不同于物质资本,知识只有流动才有价值,并且在流动中不断深化与增值。以往对知识扩散的研究,更多关注学科间整体的知识流动,忽略了从学者视角对知识贡献的描述、度量以及评价。本文深入剖析知识单元粒度,研究学者知识扩散特征,从学科领域、知识单元特征、主题思想3个维度探究学者在知识扩散中的学术贡献。本文搜集刘则渊教授作为第一作者发表的105篇期刊论文及其引证文献,通过引用内容和功能分析对刘则渊教授知识扩散特征进行了深入探究,得出了以下结论:

1)在学科领域维度,刘则渊教授的學术成果影响了82个学科,占到CNKI学科总数的46%,展现了刘则渊教授广泛的学术影响力。其中,图书情报与数字图书馆、科学研究管理、经济与管理综合这3个学科是重要的知识接收学科。

2)在知识单元维度,识别出不重复知识单元共98个,其中概念类知识单元25个,理论类知识单元23个,方法技术类知识单元50个。其中,概念和方法技术类知识单元传播多于理论类知识。

3)在主题思想维度,刘则渊教授的学术思想围绕五大主题,其中“知识计量与知识图谱方法论”这一思想被54门学科接纳和应用。其他4个主题的学术思想分别扩散至8~12个学科,被科研管理、高等教育、图书情报等学科学者吸收利用与创新,促进了各学科的学术发展。

这种多维度的学者知识扩散研究,绘制了学科特征、知识单元特征、主题思想特征的全景图,解决了以往知识扩散研究侧重于外部特征的问题,使得语法层面的知识单元提取、语义层面的主题识别和语用层面的知识利用整合起来,有助于全方位揭示学者对不同学科知识发展的作用,为评价学者知识影响力提供了方向。