APP下载

基于“反事实”思想测度学术期刊对知识系统信息熵变化的贡献

2022-07-30

情报学报 2022年7期
关键词:信息熵学术期刊论文

马 峥

(1. 中国科学技术信息研究所,北京 100038;2. 南京大学信息管理学院,南京 210023)

1 引 言

学术期刊是记录科学研究人员创新性科研成果的主要载体,针对学术期刊设计合理、科学和准确的评价方法具有非常重要的研究意义和实践意义[1]。在早期,对学术期刊的评价主要还是依靠同行评议的方式。目前,学术期刊的评价方法越来越偏重于定量方法,主要分为基于传统计量学和替代计量学两种方式。

在早期学术期刊品种总体数量比较少,在各个学科中分布的数量也不多,因此对学术期刊评价的需求和必要性相对较弱。各个领域科学家对相关期刊的情况比较了解,且期刊出版活动和发展变化的节奏相对较慢,期刊所发表的文献数量也相对较少,所以当科学家评价和择优选择适合发表论文的期刊时,有可能实现对同学科或同类型期刊的遍历,因而采取同行评议的方式,就是可以实现最高效率、最准确结果的最优选择。目前,同行评议仍是很多期刊评价活动中不可缺失的组成部分[2-3]。随着全球社会经济的发展,工业革命引领下出版行业和传播行业的繁荣,以及以信息科学技术为代表的科技研究活动日新月异的进步,学术期刊种类以及所承载的文献量急剧增长,同行评议制度的适用性受到了不断的冲击,任何科学家都难以对学科领域的所有期刊情况和所有发表论文有全面和深入的了解,也难以完全客观地对众多学术期刊的学术质量和影响力水平都有准确认知[4],以及从中筛选出学术影响力大、知识传播效率高的高质量期刊。同行评议评价方式所暴露的方方面面的问题在学科评价领域也都逐渐有所体现[5]。例如,同行评议专家的主观性问题、随意性问题、意见过于分散的问题、出于个人及小团体利益的考虑而产生的学术道德与诚信问题,等等[6]。

随着文献数量的累计和文献学研究的发展,对学术期刊评价方法的研究主要继承了文献学[7]研究思路。钱荣贵[8]、邱均平等[9]和赖茂生等[10]对期刊评价活动源起的时间分别进行了研究,普遍认为20世纪30 年代开始,随着工业技术发展和学术传播活动的快速兴起,学术文献的体量和总品种数量快速提升,需要通过评价从中筛选出应当优先使用的重要期刊,于是欧洲开始出现了对期刊的评价活动和方法探索。1934 年,布拉德福归纳了“文献离散定律”,发现各学科都存在“核心区”期刊刊载本学科绝大部分主要文献的现象。学术期刊评价理论起源于布拉德福定律对学术期刊分层的定义。20 世纪60 年代,美国著名的情报学家尤金·加菲尔德探究建立引文分析体系,逐步构建了系列引文数据库,并在实践中不断扩展应用范围,衍生新的分析体系和方法,形成了广泛的影响。经过长期以来的研究和实践,国内外围绕科技学术期刊评价逐渐形成了应用广泛的、基于科学计量学指标的评价方法和指标体系[11]。典型的研究成果包括1955 年加菲尔德发明的“影响因子”[12],2005 年美国物理学家乔治·赫施发明的“h 指数”[13]等。应用基于引文分析的传统计量学指标也存在显著问题[14]。例如,基于引文分析理论的传统科学计量指标评价所需后置时间较长,通常需要数年才能相对完整地评价期刊学术影响力,不能及时体现期刊学术影响力的变化;传统科学计量指标的评价数据来源主要偏重期刊论文等文献形式,没有统筹考虑被评价期刊在学术交流、产业发展、学科建设、人才培养等方面所发挥的作用和取得的影响;引文分析的基础假设是:引用反映出学术成果产生了积极效果,但是现实中引文动机比较多样化[15],引用某篇论文未必就说明引用者认可那篇论文[16]。

2010 年10 月,J. Priem 和D.Taraborelli 等学者共同发表了Altmetrics:A manifesto宣言,提出替代计量学(Altmetrics)的概念[17]。其主要进步在于跳出了以文献统计为中心的传统科学计量学1.0 时代,跨入以社交媒体内容分析所产生的数据和网络资源标签化结构等Web 2.0 技术为中心的2.0 时代[18],能够更快、更全面、更有效地反映被评价对象的影响力。基于社交媒体数据统计出评价对象的网络活动数据(下载量[19],自媒体发表学术内容的引用行为、浏览行为、点击次数、评论内容、推荐数、点赞数、转发次数等[20]),可以研制形成新型的计量指标[21-22]。普遍认为,科学有效地应用替代计量学能够实现更加全面的影响力评价[23-25]。在评价导向上,替代计量学指标方法在评价方面的应用将会促进在互联网上开展更丰富多彩、更高效快捷的科学交流[26],并能推动衍生出一系列完善和优化现有信息组织与信息发现的新方法、新工具、新机制[27-28]。替代计量学目前很难完全取代传统科学计量学评价方法[29],但是科学界和出版传播界普遍看好未来替代计量学指标在学术成果评价和期刊影响力评价方面的潜在重要作用[30]。但是,替代计量指标应用于科技期刊评价存在一个显著的挑战,就是如何避免人为干扰指标[31]。与之相关的问题还包括替代计量指标的数据严谨性和数据一致性问题[32]。另一个受到关注的问题是如何认定广域分散的动态数据源是科学可靠的,统计分析结果是科学可重复的[33]。

学术期刊的核心功能是分享科学家的研究认知和创新技术突破[34],是学术信息的有序和有效传播途径[35]。从情报学角度看,学术期刊的识别、监测、评价和管理等问题可以归结为学术信息集合的静态和动态的定量测度问题[36]。信息熵方法正是解决信息度量问题的经典理论方法。深入信息熵理论层面对期刊学术传播规律展开研究,是从本质上认识学术期刊,探索学术期刊在科学发展和知识传播中发挥的作用和实现机理,对于情报学、信息传播研究、学术出版研究和科技成果研究具有重要理论意义。

本研究假设,科技学术期刊的作用之一是减少科学认识中的不确定因素。科学认识中的不确定因素减少的过程是知识系统的熵减的过程。学术期刊出版过程的根本目的是通过对科学发现和技术创新成果的传播推广,使人们更加准确地认知科学问题和规律。通过定量方法,测度学术出版前后知识系统的信息熵变化量,研制测度科技学术期刊贡献的评价方法。

在经典信息论中,对信息量的测度不考虑消息的内容重要性或内在意义。信息量的多少和信息的重要性没有必然的联系,经典信息熵只是在数量层面计算出一个数值,并非直接表示该信息的重要性。某期刊为知识系统的信息熵引入了多少负熵,反映了该期刊为学科发展做出多少贡献。在本研究中,拟基于“反事实”思想,通过对计算信息熵的“事实量”和“反事实量”之间的差距,解决对信息效用的测度问题。

“反事实”研究思想是提出反事实的假定,设定与事实相反的条件,根据反事实推理形成的结果,判断反事实条件变化与结果之间的因果关系。在面对繁杂评价相关因素的情况下,传统因果分析是往往假定研究者已经控制了解释因变量的重要因素,并且没有遗漏重要自变项;但是研究所处的情况和变量经常无法满足这一假定,或者所观察的对象并非随机发生的,因而经常会产生内生性或样本选择偏误的问题,造成因果分析的不准确和偏差,甚至是错误。反事实分析的优点是能明确地找出传统回归分析无法充分掌握的不同样本群在基准线上的差异或因果效果的异质性,进而进行准确的因果分析[37]。

2 数 据

2.1 样 本

本研究采用万方数据资源系统期刊数据库2016—2019 年所收录的全部期刊论文和引文数据作为主要统计数据来源。考虑到我国开展学术期刊评价的需求,被评价期刊大都是中文期刊,因此,采用国内中文文献为主的数据库更能保证评价结果的可靠性。该数据库系统覆盖了我国出版的绝大多数学术期刊,其中包括原国家新闻出版广电总局2014 年认定的3713 种科技类学术期刊。

原国家新闻出版广电总局采用各主管单位初审上报、总局审定的方式,认定了第一批学术期刊名单。本研究用于实证的样本采用其中归属于科技类的3713 种学术期刊。

2.2 学科分类体系

参照《中国科技期刊引证报告(核心版)》《中华人民共和国国家标准学科分类与代码(GB/T 13745—2009)》《中国图书资料分类法(第四版)》,设定112 个学科类别。学科类别的划分考虑到各个学科的隶属关系和出版物的规模,分为自然科学综合、理学、农学、医学、工程技术、管理等6 大部分。其中第1 部分“自然科学综合”类是指报道综合性内容(发表多学科的研究论文)的期刊。由于这部分期刊品种很多,其中大学学报数量尤其多,为此再细分为3 个类别。其余5 大部分按照学科属性进行划分。

2.3 各学科高频词统计

布拉德福定律指出,大部分学术成果文献向少量重要期刊聚集。在各个学科中,少量核心区期刊就能集中刊载本学科主要科研成就。为了提高工作效率,同时也为了减少一般性期刊中大量低水平论文的干扰,本研究采用中国科学技术信息研究所研制的中国科技论文与引文数据库(China Scientific and Technical Papers and Citations Database, CST‐PCD)2016 年收录的论文统计高频词。

CSTPCD 2016 收录中国科技核心期刊2008 种,大约占我国科技期刊总数的1/3。核心期刊所报道的研究活动是各个学科的主流研究领域,覆盖的作者群体和研究选题能比较集中地反映各个学科的核心科研活动,因而避免了被统计中的噪音数据过度干扰。

CSTPCD 2016 收录56.49 万篇论文,使用关键词149.40 万个、414.83 万次,平均每篇论文使用7.3个关键词,中文词和英文词计为2 个不同关键词,以此为基础计算各个学科使用频次列在前1%的高频关键词。

3 由期刊论文构成的知识系统的概念

3.1 学术传播的系统属性

对学术期刊传播的特点和属性进行系统思考和重新梳理,可以认为科技学术期刊具备如下特征,且符合一个系统的特性。

(1)总体大于部分之和[38]。我国科技期刊作为一个整体,不是几千种科技期刊的简单加和。这些科技期刊和对科技期刊的管理机制、评价、投入等诸多相关内容以及它们之间的联系,共同构成了科技期刊这一总体系统。对科技期刊的研究和管理,有必要从总体上进行考虑[39]。

(2)多重目标,多重发展路径。科技期刊的发展目标不仅是记载、传播和积累科技信息、科技理念、科技知识,成为展示科技进步的窗口,同时也应成为科技人员进行科技成果传播和学术交流的平台。科技期刊反映了一国科技发展的现状和水平,承担着促进科学创新的公共社会责任[40]。科技期刊是科学活动中的纽带和桥梁,因此,科技活动中的科学研究、科技管理政策、科技出版管理体制等多方面的相关因素都会对科技期刊发展和变化产生影响;而这些因素在不同时期的不同组合,也意味着多种发展道路和结果。选择最优方案正是系统思考支持决策的最终目的。

(3)因果互动和内部反馈。从内部而言,科技期刊的政策法规、体制、人员、产业、评价等子系统和更多相关因素之间,还有单个期刊之间,并不是简单的单向因果关系,而是相互影响,互为因果。贝塔朗菲是现代系统研究的开创者,他对系统的定义就是相互作用的多元素的复合体[41]。科技期刊正是这样的一个复杂系统。

(4)封闭和开放的统一。科技期刊在科学事业发展的大环境中,是一个相对独立的系统。但是这个独立系统并非一个完全孤立的封闭体。科技期刊系统与外界环境之间的物质、能量和信息的交换是其自身发展和发挥功能的机理,而且这种交换在一定的条件下会形成相对稳定的状态,即科技期刊系统兼备封闭性和开放性。

3.2 知识系统不确定性的构成

本研究定义的知识系统是,在确定的边界内,基于一定的知识载体,汇集人类对客观世界的显性认知,同时存在相同和不同的研究观点,并且随着时间转移会出现观点的变化、增加和消失。这种观点的构成和变化看作知识系统的不确定性。知识系统的不确定性可以分解为静态层面的不确定性和动态层面的不确定性(图1)。

图1 期刊论文构建的知识系统的不确定性分解

1)分布状态不确定性(静态层面)

分布状态不确定性主要从静态层面反映一个知识系统对学术知识内容的结论、研究关注点的趋向性等绝对指标量分布是否显著呈现出集中或分散的态势。在一个系统内,经过一段时间后,对知识观点、研究热点、主流发展方向的判断越一致、越集中,则这个知识系统对学术问题的认识越清晰一致,即人类对客观世界的认识越趋于完整正确。反之,一个系统内对知识的探索和理解更加多样,且不同方向和结论的正确可能性(正确概率)彼此差别不大,则说明人类对相关问题的认识还处于不确定、不清晰、不一致的状态。

针对学术期刊论文所构建的知识系统之静态不确定性的表述可以继续分解成3 个子系统。

A1. 规模度:指学术期刊传播文献的容量。学术期刊作为发布和交流平台,在保证质量和效率的前提下,应该尽量多地发表体现科学发现和技术创新成果的论文。

A2. 广泛性:指期刊学术影响的扩张能力。学术期刊所发表传播的内容是科研论文,需要有足够的读者群空间,才能实现高效率的成果传播功能和活跃的学术交流功能。

A3. 可持续性:主要指基金支持论文的数量和比例,以此来体现期刊论文与科技投入的匹配程度。

2)关系状态不确定性(动态层面)

关系状态不确定性主要从动态层面反映一个知识系统关于学术知识节点结构、节点之间的相互作用、不同节点之间的关系类指标是否显著呈现集中还是分散的状态[42-43]。在一个系统内,不同的节点层次上(如作者、期刊、关键词、单篇论文),知识之间的联系形成了节点网络。基于节点网络所表达的知识节点与相关节点之间的联系,可以反映整个知识系统的相对集中性。与绝对集中性的含义相同的是,人们对知识观点、研究热点、主流发展方向的判断越一致、越集中,说明这个知识系统中对学术问题的认识越清晰一致,即人类对客观世界的认识越趋于完整正确。反之,一个系统对知识的探索和理解更加多样,且不同方向和结论的正确可能性(正确概率)彼此差别不大,则说明人类对该问题的认识还处于不确定、不清晰、不一致的状态。

针对学术期刊论文所构建的知识系统之相对集中性层面对系统不确定性的表述可以继续分解成4个子系统。

B1. 开放度:指期刊论文稿源组织的合理性和开放程度。稿源渠道建设是学术期刊建设的重要组成部分。广泛充分的高水平稿源是期刊发挥自身功能的基本保障。如果稿源范围过于有限,或者过于集中,会降低学术期刊的交流活力。

B2. 合作性:指期刊发表合著论文(包括国家层面、机构层面合作研究所形成论文)的能力[44]。合作研究往往能实现优势互补,产出高水平研究成果。特别是近年来逐渐增多的大规模多边合作产出的“大科学”论文成果,往往是全世界均可受益的关键成果[45]。

B3. 竞争力:指给定期刊与同学科或同类型的其他期刊竞争取得比较优势的能力。学术期刊大都具有显著的公益性色彩,但学术出版活动同时也是一种商业行为。在竞争中发展壮大是每个学术期刊不能逃避的任务。

B4. 影响力:指期刊发表的论文成果对其他相关学术研究活动的借鉴价值或争鸣价值,主要通过引文来测度。期刊论文被引用可以看作论文产生学术影响的典型表现。

3.3 知识系统信息熵的定义

正是因为学科发展和传播具有显著的系统属性,所以可以把一个学科领域发表在学术期刊上的论文集合作为一个相对独立的系统进行研究。在本研究中,知识系统信息熵定义如下:在期刊研究论文所构成的封闭和孤立的知识系统中,将对特定科学问题的认识和判断的不确定性状态的测度量,定义为该知识系统的信息熵。

对于信息熵的测度,可操作性较强的方法是通过构建数学模型来组织和描述反映知识熵的各项指标[46]。

4 用关键词集合测度知识系统的信息熵

4.1 以高频关键词集合作为各个期刊所在学科领域的学科发展选项集合

本研究使用各个学科的高频关键词集合来定义各个学科发展的可能选项。本研究构建的模型在应用于各个学科领域的期刊评价实践时,每一个学科领域可能包含的研究方向的数量是不同的,即根据每个学科的规模和特点不同,存在不同的学科发展可能选项(变量)数量。

关键词是表述论文所涉及的选题、解题、技术方法、研究对象、创新观点、应用价值等内容的若干词语。按照期刊出版相关标准,学术论文都会著录关键词。关键词具备规范性和通用性的特征[47]。通常关键词会优先选用叙词,也就是从自然语言词汇中优先选出来语义相关、族性相关的科学术语。自由词也可当作关键词,但需要优先使用出自词表或广泛应用的参考书、工具书的词汇[48]。

论文的关键词可以体现选题方向、研究方法或主要发现。在大数据技术基础上,对关键词的研究能够实现对知识结构和领域发展的直观理解。通过分析关键词的数量关系之演化情况,还能发现和监测学科热点[49]。

在同一时间窗口内,将某学科全部期刊论文的关键词按词频从大到小排序,处于前1%的关键词组成高频关键词集合。该集合所反映的研究主题代表了特定时段内该学科的研究热点。实践中,不宜用过长的时间范围统计高频词,以免研究热点转移造成统计误差。研究热点的转移速度与各个学科演进发展的节奏相对应,但是考虑到可操作性,时间窗口也不宜过窄(比如,按季度或月份获取数据)[50]。本研究采用高频关键词作为变量,而没有使用全部关键词作为变量,主要原因是高频词具备代表性,其范围和结构的变化情况可以比较充分地反映学科发展变化的整体情况,使用全部关键词反而有可能造成过多噪音数据的混入。因此,从可行性角度,经过测试比较,1%高频词的标准兼备科学性和可操作性。

本研究采用CSTPCD 2016 收录的论文统计高频词。

4.2 构造指标矩阵

对于一个学科领域的发展来说,随着时间的推移,通过学术传播发挥知识积累和交流功能,人类对科学规律和发展方向的认知会逐步清晰。如果假设一个学科领域中某一个未知知识点存在n个预设可能选项,那么在早期,n个预设选项的不确定性会相对较显著,即人们的知识认知较混乱;在后期,n个预设选项的不确定性会相对减弱,即人们的知识认知逐渐清晰。这一过程,就是有效信息加入学科知识系统(引入负熵)的过程。

在信息熵理论框架下,我们可以把n个预设可能选项看作随机选项,用m个指标来描述每一个预设选项的明确性,即表达每一个选项的概率Pi。

根据本研究提出的假设来推断,在这个学科系统中,随着知识信息的注入,不同预设选项成为主流研究方向的可能性的概率在变化。由于这个领域的未来方向会逐渐清晰,不确定性会降低,所以这个学科知识系统的信息熵状态数值应该有所下降。

由此,可以构建指标矩阵:

其中,n表示n个学科方向;m表示m个测度指标。设i=1,2,…,n,j=1,2,…,m,则fij为第i个学科方向上的第j个指标的数值。

4.3 计算知识系统信息熵指标选择

根据俞立平等[51]研究归纳,一般常用的指标筛选方法包括基于粗糙集理论的遴选、领域内专家调研评议法、应用相关系数法和变异系数法等;尽管在指标筛选方面尚未形成统一通用的方法,但是专家评议在指标筛选中所起到的作用仍然是不可替代的。刘丽莉[52]研究提出选取指标的原则是目的明确、覆盖全面、切实可行。因此在本研究中,采用专家评议方法选择指标。

指标选择过程中,主要考虑本研究需要表现不同发展方向的研究体量、广泛性、活跃度、增长能力等方面的因素,结合指标的科学性、可获取性,经过多次调整和实验,结合同行专家的调研咨询意见,最终确定选取了7 项指标作为期刊评价准则与计算知识系统信息熵的指标,如表1 所示。

表1 期刊评价准则与计算知识系统信息熵指标对应表

(1)发表论文数量:5 年时间窗口发表论文数量。选用5 年是为了减少数据跳跃所造成的误差。

(2)文献分布广泛性:文献计量学发现,出版物的秩频分布存在负幂函数关系[53-54]。在本研究中,我们交换频率与份额,二者关系表达公式为

其中,在某领域中,y表示各个国家发表论文的数量;x表示各个国家论文数量的排名。对于一个领域,a通常是恒定的。如果a的数值在一个学科方向中较低,则意味着这个学科方向中,很少的国家集中发表了较高比例的论文,文献分布广泛性较弱;反之,则可认为这个学科文献分布广泛性较强。

(3)基金论文数量:1 年时间窗口有基金项目资助的论文数。一些文献计量学家发现,科技投入与科技产出之间是存在一定关联性的[55];然而由于科技成果的滞后性,二者又不是简单的线性相关关系。通常来说,如果某一地区发表论文数量比另一地区多,那就意味着该地区投入的资源和设施比其他地区更多[56]。

(4)篇均机构数:1 年时间窗口内论文作者所属机构数的平均值。

(5)国际合著论文比:1 年时间窗口内国际合著论文所占的百分比。

(6)论文份额增长率:论文数量份额相对前一年度增长的百分比。

(7)篇均论文被引用次数:5 年时间窗口内论文篇均被引用次数。篇均被引用指标是分年度统计和计算的,即各年度发表论文篇均被引用次数虽然存在累计性差异,但是经过分年度标准化后,得到的数值是具有可比性的。

4.4 标准化处理

由于不同指标的量纲、极值等存在显著差异,必须要对指标矩阵进行标准化转化,形成标准化矩阵A:

其中,设i=1,2,…,n,j=1,2,…,m,则aij∈[0,1]。标准化公式为

其中,min{f1j,…,fij,…,fnj}表示j指标项上,n个选项的fij的最小值;max{f1j,…,fij,…,fnj}表示j指标项上,n个选项的fij的最大值。

4.5 知识系统信息熵数值的计算

本研究对于孤立系统各个单项指标的信息熵计算公式为

其中,i= 1,2,…,n;j= 1,2,…,m。

通过计算,可以得出m个预设可能选项各自的信息熵状态值,则整个知识系统的信息熵就是m个子系统的信息熵之和:

由于Hi的数值分布范围是[0,1],所以H的数值分布范围是[0,n]。H= 0,表示系统绝对有序,即所有子系统都是只有一个选项,且同一个选项的实现概率是100%,其他为0;H=n,表示系统绝对无序,即所有子系统的所有选项概率都完全相同。

H的数值大小可以看作一个孤立系统的信息量和不确定性的体现。例如,在某个研究领域中,当人类对客观世界的认识存在两种或更多种不同观点,或者尚不知道某学科未来发展走向,只是可以预判几种可能选项时,可以认为,初期各个选项实现的可能性比较接近,不确定性较强。随着科学研究活动的积累,发展趋向必然是可能选项越来越少,不确定性越来越小;还可以认为,其中某一部分可能选项的实现概率持续增加,另一部分可能选项的实现概率持续减少,即不确定性也在减少。不确定性减少意味着知识系统所表达的信息在减少,也可以看作不确定性大的事物逐渐得到了确定,即通过科学研究成果的传播,人类实现了对客观世界的更多认知。

5 基于反事实思路测度被评价期刊贡献的负熵

5.1 计算每个学科领域所对应知识信息的信息熵的事实量H(X)

本研究以各学科高频关键词(出现频次排名在前1%)作为相应学科的发展方向。

按照本研究设计的计算模型,各个学科的潜在发展方向就是学科高频词集合所反映的方向。统计得到学科内n个高频关键词就是n个潜在学科方向。

每个学科方向的数据子集的产生方式是,用关键词作为检索词在万方数据中检索,检索策略为单词检索(各关键词之间是“或”的关系)。

信息熵的计算指标仍为发表论文数量、文献分布广泛性、基金论文数量、篇均机构数、国际合著论文比、论文份额增长率、篇均论文被引用次数等7 个指标。利用从万方数据中检索得到的子数据集合,对上述指标进行统计计算。

这样,每个学科可以构建形成n×m的指标矩阵。其中n是潜在学科方向数量,即高频关键词数量;m= 7,即计算指标数量。参照矩阵A构建指标矩阵F。

根据本研究提出的假设推断,在这个学科系统中,随着知识信息的注入,不同预设选项成为主流研究方向的概率在变化。由于未来研究方向会逐渐清晰,不确定性会降低,所以在这个学科知识系统中,知识系统的信息熵数值应该有所下降。

5.2 计算每个学科领域所对应知识信息的信息熵的反事实量H(X)′

对于特定的被评价期刊,计算在其对应的学科体系中,被评价期刊缺位情况下知识系统信息熵的反事实量H(X)′。

在期刊评价活动中,假设该期刊不在对应的学科中,即将被评价期刊从相应的期刊论文构成的真实知识系统中移除,其论文量、参考文献(即引文)都不列入统计范围。在这个新的虚拟的知识系统中,重新计算7 个指标:发表论文数量、文献分布广泛性、基金论文数量、篇均机构数、国际合著论文比、论文份额增长率、篇均论文被引用次数;并根据计算结果,计算被评价期刊缺位情况下知识系统的信息熵反事实量H(X)′。

5.3 计算事实量与反事实量的差距

对于特定的被评价期刊,通过对比该刊所属学科的知识系统信息熵的事实量H(X)与被评价期刊缺位情况下的知识系统的信息熵反事实量H(X)′之间的数值变化,反映被评价期刊对知识系统信息熵降低的贡献,也就是被评价学术期刊对知识系统所贡献的负熵,如图2 所示。

图2 基于信息熵的学术期刊评价思路

采用知识系统信息熵的事实量H(X)与被评价期刊缺位情况下知识系统信息熵的反事实量H(X)′之间的差值ΔH,即学术期刊为系统所提供的负熵,测度该期刊的学术贡献:

其中,p代表第p个学科,数值范围是[1, 112];q代表p学科全部期刊中的第q种。

6 实证结果

6.1 2016年各学科高频词统计

CSTPCD 2016 收录56.49 万篇论文,使用了关键词149.40 万个、414.83 万次,平均每篇论文使用7.3 个关键词。考虑到兼容中文期刊和英文期刊,将关键词的中文写法和英文写法计为2个不同关键词。

计算各个学科使用频次列在前1%的高频关键词。以感染性疾病学、传染病学为例,2016 年CSTPCD 收录了8 种期刊,发表了1093 篇论文,共使用4349 个关键词,使用7876 次。将这4349 个关键词按出现频次排序,排在前1%的关键词有44 个(4349 个的1%),组成了该学科的高频关键词集合。各个学科高频词数量如表2 所示。

6.2 2016年各知识系统信息熵的测度

计算各学科领域由期刊论文所构成的知识系统的信息熵事实量。经过构造指标矩阵、标准化处理,112 个学科中的每一个都可以看作孤立知识系统。完成各个学科知识系统信息熵的计算,结果如表2 所示。

表2 2016年期刊学科分类及相关指标

续表

续表

从图3 所示的112 个学科的核心期刊数量和知识系统信息熵的分布情况可以看出,学科内期刊数量的多少与该知识系统信息熵数值的相关性不是非常明显。计算二者之间的线性相关系数可以得到R2= 0.7312,也可以看出其不具备显著相关性。

图3 112个学科的核心期刊数量和知识系统信息熵的分布情况

6.3 2016年被评价期刊对知识系统的贡献

以天文学为例,该学科6 种被评价期刊对知识系统的贡献的计算结果如表3 所示。

表3 2016年天文学学科(k)期刊对知识系统的信息熵的影响

6.4 2016—2019年各知识系统信息熵的变化

采用与6.3 节相同的方法,并且采用2016 年遴选得到的高频关键词列表,在其后的2017—2018 年数据库中进行知识系统信息熵数值的运算,可以得到各个知识系统信息熵数值变化的量,如表4 所示。

从表4 所示的2016—2019 年各个学科知识系统信息熵的变化情况来看,大部分学科的信息熵数值呈现明显的减少趋势。比较2016 年和2019 年数值的变化幅度,如图4 所示,可以发现在全部112 个学科类别中,4 年之间信息熵变化方向为增加的只有11 个,占比约为9.8%;其余超过90%的学科都是向信息熵减少的方向变化。由于各个学科之间知识系统信息熵的数值比较无明显意义,因此,尽管图4 所示分布状态有类似于正态分布的形式,但本研究数据并不支持知识系统信息熵符合随机分布。

图4 112个学科的知识系统信息熵2016—2019年变化幅度的分布情况

表4 2016—2019年各学科(知识系统)信息熵变化

续表

续表

7 结 论

(1)通过计算知识系统信息熵的事实量和被评价期刊缺位时知识系统信息熵的反事实量的差值ΔH,能够体现被评价期刊对知识系统信息熵变化的贡献。但是由于本研究中,以每个学科高频词为检索词得到的论文集合构成的知识系统是相互独立的系统,所以不同系统的H状态值之间不具备直接可比性,状态值变化量ΔH之间也不具备直接可比性,不过每个系统ΔH的方向是可以比较的,它反映期刊对系统做出的是正贡献还是负贡献。从统计数据看,在3713 种期刊中有3578 种期刊(96.4%)的ΔH为正值,这表明绝大部分学术期刊对降低其所属知识系统的混乱程度是有所贡献的,也就是说,期刊学术出版活动发挥了其必要功能。按照信息熵理论,一个孤立系统中引入的信息量应是非负的,即最极端现象是期刊为系统贡献的信息量为零,期刊为系统的贡献不应出现负值。但是在本研究中,部分期刊对所属知识系统的贡献ΔH为负值,这也许说明,这部分期刊发表了一些对学科发展和凝聚共识有负面作用的文章,增加了系统的混乱程度。

(2)几乎所有的学科中,都可以发现少数几个期刊对系统的贡献程度ΔH相比于其他期刊来说要显著高出许多,而绝大多数期刊的ΔH数值处于非常接近0 的水平。也就是说,在学科内,众多期刊对知识系统的信息熵的贡献数值分布呈现出贡献较大的期刊数量较少、分布曲线长尾明显的分布规律。这表明在学科当中,只有很少一部分期刊能够充分发挥学术期刊的核心功能,为减少科学认识中的不确定因素做出相对显著的贡献;同时,较多期刊对减少本学科认识不确定性的作用十分有限。这一规律与布拉德福定律非常吻合,即各个学科都存在少数重要的核心区期刊。本研究发现,能为本学科知识系统做出较大贡献的期刊也是数量较少的,它们是另一种含义上的“核心期刊”,但是尚未定量描述高贡献期刊与低贡献期刊之间的数量关系。

(3)就学科间的差异来看,期刊数量规模和所对应知识系统的信息熵变化没有明显的相关性。也就是说,一个学科的期刊品种的数量与该学科的个体期刊对知识系统信息熵变化贡献的大小没有直接关系。一个期刊对学科发展的贡献,主要取决于自身建设水平、发掘组织优质稿源的能力和精准高效的传播能力,与其他竞争对手期刊的数量多寡关系不大。与此同时,可以观察到综合性期刊的类别,包括自然科学综合类、自然科学综合大学学报类、自然科学师范大学学报类等,相对于其他专业类别,其2016—2019 年知识系统信息熵的变化幅度整体比较小,分别是-2.86、-1.41、1.58;其原因可能是综合性期刊中发表的论文几乎覆盖全部学科领域,因此其体现学科发展变化的功能性较弱。

(4)大部分样本期刊ΔH为正值,但还有41 种(1.1%)期刊ΔH为负数,94 种(2.5%)期刊ΔH为0。当ΔH为0 或接近于0 的时候,可以看作这一部分期刊对学科发展的贡献极小。由于本研究计算方法是基于关键词统计,一些关注内容与学科主题关系较远的期刊,关键词与学科高频词无叠加,因此出现了贡献值为0 的情况。当ΔH为负数的时候,还有可能是期刊的学科分类属性不够明确,如果将该刊分到A 类,也许ΔH为正,若分到B 类,ΔH就是负数。另一种可能是,期刊刊载内容过于广泛,分布在多个学科当中。这样,它对任何一个学科的贡献都不会大。从统计数据来看,综合性较显著的学科分类中,期刊的ΔH都比较低。

(5)从2016—2019 年各个学科知识系统信息熵的变化情况来看,在采用与2016 年同一组高频关键词的情况下,在时序系列的概念上是前后可比的。也就是说,都采用2016 年出现的高频关键词集合作为变量,测算同一知识领域的系统信息熵变化。从图4 的数值关系可以看到,大部分学科的信息熵数值呈现明显的减少趋势。特别是对比2016 年和2019 年的各个知识领域的信息熵,可以发现在全部112 个学科类别中,4 年之间信息熵变化方向为增加的只有11 个,占比为9.8%;其余90%以上的学科都是向信息熵减少的方向变化。这意味着绝大多数学科的知识不确定性在逐步减小,也就是固定范围学科发展主题方向逐渐聚焦和清晰,这符合对一般学科发展规律的认知。这一变化过程中,各个期刊所发挥的作用有所差别,也就是各个期刊贡献大小有所差别。

8 讨 论

科学领域的学术活动发展过程中,学术成果的传播可以增加人类的知识积累,科研人员在扩充知识储备的同时,进一步明晰知识点之间的逻辑、结构,从而实现对客观世界更明确的认知。这一过程是信息熵减少的过程,是认知中的不确定性、复杂性减少的过程,也是人类知识系统性、全面性、逻辑性发展的过程。在这个过程中,学术期刊发挥着重要的作用。对大部分学科领域,特别是基础研究领域,绝大多数的研究成果和认识是通过学术期刊来实现评价、加工、记载、传播和交流的。学术期刊的评价应该首先是对学术期刊应具备的核心功能的评价,也就是对学术期刊在学科发展中的价值的评价。

在本研究中,从信息熵的视角进行学术期刊的评价,就是观察学术期刊是否通过自身组稿、审稿、编稿、发稿、传播等环节的高效率工作,甄选和供给有学术意义的研究成果,能否对学科的发展提供支撑,逐渐凝聚科学问题。换句话说,就是评价一个期刊能否通过学术传播工作,减少一点学科体系的信息熵。

本研究假设被评价期刊不在系统内进而观察系统变化的思路可以归为“反事实”分析方法,即提出反事实的假定,设定与事实相反的条件,再去确定因果关系。

通过建立数学模型的方式,实现对学科系统信息熵的测定,这是一个宏观层面的研究探索;如果将这一方法体系应用到中观层面,就是对学术期刊出版能力和学科贡献的评价;如果将这一方法体系应用到微观层面,就是对单篇学术论文的评价。通过测度相关指标,发现哪些单篇论文对科学进步产生了重要影响。这些成果显著地提高了人类认识自然的水平,显著地降低了学科系统的信息熵。

对于期刊评价来说,识别、发现这样的关键性成果既是对期刊优秀稿件组稿能力的认定,也为期刊扩展组稿工作渠道提供了有效工具[57]。在信息熵视角下,将学术期刊的评价管理建设工作与单篇论文的评价、优秀作者和团队的识别工作结合起来,有助于扭转当前较为严重的“以刊评文”的不当评价导向,也可以在一定程度上对当前广泛存在的“滥用影响因子”的情况进行纠偏[58]。

猜你喜欢

信息熵学术期刊论文
基于信息熵可信度的测试点选择方法研究
学术期刊引证指标
学术期刊引证指标
基于信息熵的实验教学量化研究
河海大学学术期刊创办百年
一种基于信息熵的雷达动态自适应选择跟踪方法
基于信息熵的IITFN多属性决策方法
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登