基于学术迹的湖南省高校学科学术影响力评价研究
——以数学学科为例
2022-03-30徐义涛文庭孝
徐义涛 文庭孝
中南大学生命科学学院医药信息系 长沙 410013
引言
学术影响力评价一直是科研管理界和学术界的热点研究,特别是在大科学时代和纷繁复杂的学术体系与学术环境下,全面客观地对各学术主客体的学术影响力进行评价显得尤为重要。经过多年发展,学术影响力评价指标体系围绕发文量与引文量两个基础指标大体可以分为三类[1]:第一类是基于均值测度的评价指标,以影响因子IF与皇冠指数CI为代表;第二类是基于高影响特征测度的评价指标,以h指数及类h指数为代表;第三类是基于整体综合测度的评价指标,以叶鹰教授等提出来的学术迹指标为代表。
学科评价是学术评价重要组成部分,即利用相关学术信息对学科发展的阶段、现状、水平、前景和学科结构及学科之间的相关度等进行评价。科学的学科评价能客观的反映科研人员和科研机构的学术影响力,既有利于激发科研人员的创新内生动力,多出高水平成果,同时又有利于科研管理决策部门制定合理的科研绩效评价措施,充分调动科研人员积极性[2]。
类似于学术影响力评价,学科评价方法有3类:定性方法、定量方法、定性与定量方法相结合。传统学科评价方法包括定量方法、定性方法,其中定量方法中的文献计量法使用最广泛,主要是引文分析法、内容分析法、聚类分析法等[3]。目前国内外已经形成一些认可度较高的主流学科评价体系,例如英国教育组织发布的世界大学学科排名(简称 QS)、泰晤士高等教育世界大学排名(简称THE)、美国《美国新闻与世界报道》发布的 U.S.News排名体系(简称U.S.News),以及国内两大“双一流”建设下高校学科评价指标体系——上海软科发布的世界一流学科排名和教育部学位与研究生教育发展中心发布的全国第四轮学科评估体系等[4],同时也有学者采取SCI、CSSCI、ESI、JCR等数据库对高校学科进行评估。
当前,各类排行榜发布的学科排名具有设计学科领域广、客观评价与主观评价相结合等优点,但同时存在忽略学科发展特点和高校发展理念的问题、评价主体以英文为主,对非英语国家不占优势、无法对所有的高校学科进行评价等缺陷[5]。在当前“破五维”的评价背景下,构建科学、高效、公平的评价体系成为学术界的研究热点,目前大多研究主要通过评价体系计算综合得分给出学科排名,鲜见有关学科差距的具体原因的分析,难以对高校学科建设与发展起到实质性的指导作用[6]。
在学科评价方面,文献计量方法则可以提供学科领域组织性、结构性较强的描述数据,弥补定性评价在内容上的局限,保证评价的客观性与公正性。另外,文献计量方法在成本和效率方面也存在优越性[3]。尤其是学术迹方法,不仅能从宏观的角度评价高校学科的学术影响力,还能通过学术矩阵从微观的角度分析高校间学科差距的具体原因,为学科的发展提供决策依据。
因此,本文以湖南省10所高校的数学学科为例,选取文献计量学中的学术迹方法,通过对学术迹及学术矩阵的分析,以期全面、客观地评价湖南省高校数学学科的学术影响力。
1 研究方法
学术迹(Academic Trace)是由叶鹰、Leydesdorff等[7]学者基于h指数以及I3指标所提出的一种新型学术测度指标。学术迹突破了原有的以影响因子等为代表的第一类均值测度指标存在的逻辑缺陷,同时克服了第二类高影响特征测度指标存在的不足,由此形成了一种整合发文和引文的第三类整体综合测度指标[8]。这一方法能够满足新的综合性学术影响力评价需求。
学术迹是学术矩阵(Academic Matrices)的迹,而学术矩阵是引文曲线按文章的被引量排布构成的三阶矩阵[9]。若将学术主体所发文章的被引次数排序,可以得到其引文分布图如图1所示,再通过h指数将发文分布为h核、h尾以及零被引论文三个区间[8],该三个区间的发文量可以分别用PC、Pt、Pz来表示,发文总量可以表示为P=PC+Pt+Pz。与发文量分布相对应,学术主体引文量也对应划分为三个区域[7],分别是h域、e域和t域,引文数量可表示为CC、Ct、Ce。将发文与引文结合起来看[10],h核在引文分布中体现为h域以及e域,并且e域的单篇文章文章被引频次高于h域。通常将t域内的文章看作是低被引论文,h域内的文章看作是高被引论文,e域内的文章看作是超高被引论文。在此基础上[10]再定义独立向量X,用X1、X2、X3分别来代表h核、h尾和零被引区间的发文分布,如下公式所示;再定义独立向量Y,并用Y1、Y2、Y3来表示h域、t域以及e域的引文分布。
图1 发文量与被引量的排序分布
利用发文向量X以及引文向量Y来构造引文和发文的差值向量Z:
再由差值向量Z构成学术矩阵V:
在该学术矩阵中,(X1,Y1)和(X2,Y2)分别表示h核以及h尾的学术积累量。
根据矩阵的迹的概念可知,学术矩阵V的学术迹T等于X1、Y2、Z3的数值之和:
通过数据转化关系,在学术迹计算过程中实际需要获取的数值有:总发文量P,总被引量C、h核发文量PC、h核论文被引量Ch、零被引发文量PZ,以上数值经过相关处理都可以在CNKI等学术数据库中得到[11]。
作为综合反映学术发文和引文分布特征的数学方法,总体来说学术迹兼顾了学术主体的发文与引文情况,拓展了学术评价的研究和应用领域,既可用于对国家、大学、研究团体、单个学者等各种学术主体的评价,也可用于对期刊、论著、专利、特定主题研究等各类学术客体的评价,具备较广的应用范围。
2 实证研究
2.1 研究对象与数据来源
本文以湖南省10所高校的数学学科为研究对象,包括中南大学、湖南大学、湘潭大学、湖南师范大学、国防科技大学、长沙理工大学、湖南科技大学、湖南农业大学、南华大学、湖南工商大学。以上10所高校均开设有数学学科,其中中南大学、湖南大学、湘潭大学、国防科技大学、湖南师范大学等在教育部第四轮数学学科评估中均取得了B或B以上的成绩,中南大学数学学科入选了教育部一流建设学科名单。这十所高校中有“985”、“211”工程高校,也有普通本科高校,办学层次上存在梯度性差异,故以这10所高校为研究对象具有较好的参考对比意义。
数据方面,笔者从CNKI数据中采集了这10所高校2010—2019年数学学科的五个基本独立参数P,PZ,h,C,Ch,以此来计算它们的学术迹及学术矩阵。数学学科文献的界定主要由CNKI高级检索中的文献分类功能来实现,并在此基础上结合学科分类号进行论文检索、筛选。
2.2 计算学术迹
经计算后的各指标数值如表1所示。
表1 湖南省10所高校数学学科学各指标数据
3 结果分析
3.1 学术迹聚类分析
由表2可以看出,本文选取的10所高校数学学科的学术迹表现大致可以分为三档:第一档是中南大学与湖南大学;第二档是长沙理工大学、国防科技大学、湖南师范大学、湘潭大学;第三档是湖南科技大学、湖南农业大学、湖南工商大学、南华大学。
表2 K-means聚类结果
3.2 学科学术迹变化趋势分析
为探究学术迹随时间变化的趋势,将所选取的10所高校数学学科在2010—2019年发表的论文分为三个时间窗口T1(2019年)、T2(2015—2019)、T3(2010—2019),分别计算其学术迹,结果如图2所示。
由图2可知,在T1时间窗口,10所高校数学学科的学术迹基本处于同一水平,且均大于0,说明这10所高校的数学学科论文在发表的第一年就在该领域做出了学术贡献,产生了学术影响力,这体现了论文的质量。在T2时刻差距开始显现,中南大学与湖南大学的学术迹逐渐与其余高校拉开差距;到达T3时刻,差距逐渐拉大,中南大学与湖南大学的优势明显,这体现了这两所高校在数学学科建设上所取得的成效。
由图2可以看出,每一所高校的数学学科学术迹都会随时间的推移而增加,这说明了学术影响力的产生需要经过一段时间的积累,并非一蹴而就,且不同学校的增加速度有所不同。
图2 学术迹变化趋势
3.3 学术迹与学术矩阵分析
从10所高校数学学科的学术迹与学术矩阵出发,从微观角度探究影响学术迹变化的因素,10所高校不同时间段的学术矩阵如表3所示。
表3 湖南省10所高校的学术矩阵
结合学术迹与学术矩阵的定义,从高被引论文、低被引论文、零被引论文以及超高被引论文几个方面来对学术矩阵的动态趋势进行分析。
(1)高被引论文分析
高被引论文(被引频次C≥h)的情况主要由h核内的论文反映,对应高校学科的核心论文,主要体现在学术矩阵中(X1,Y1)的测度上。经过观察可知,10所高校数学学科的X1,Y1的值均随着时间的推移而增大,这说明随着时间的累积,其发表的论文进入h核的数量在不断增大,且进入h核的论文的被引次数也在不断增加,学术贡献不断扩大,学术绩效呈现良性发展,这与学校的具体发文情况相符。
仅从h核论文发文量测度X1来看,T1时期X1值较高的高校有湖南大学、国防科技大学、湘潭大学、南华大学,均超过了1。而在T3时刻,X1值处于1~3区间内的高校有8所,且差值并不大,这说明这10所高校进入h核的论文数量接近。从h核论文引文测度Y1来看,T1时刻湖南大学、国防科技大学、湘潭大学、湖南科技大学、南华大学具备相对较高的Y1,到了T3时刻,湖南大学、中南大学、长沙理工大学、国防科技大学的Y1值排名前列,且与其余高校拉开了较大的差距。这说明以上4所高校h核中的论文影响力较高,这可能是这些高校的发文中开创性研究所占据的比例较高,而这一类论文往往需要一段时间的探索和验证才能被学术界关注,从而获得较高的影响力。
(2)低被引论文分析
低被引论文(0<被引频次≤h)的情况主要由h尾区域内的论文反映,对应高校学科的潜力论文,主要体现在学术矩阵(X2,Y2)的测度上。总体而言,10所高校数学学科的X2,Y2的值均随时间的推移而增大,这说明随着时间的累积,其发表论文进入h尾区域的数量在不断扩大,该区域的论文学术影响力逐渐得到体现。
在T1时刻,只有湖南大学的Y2超过了10,且远远领先其余9所高校。在T3时刻,中南大学、湖南大学、长沙理工大学三所高校的Y2值排明靠前,且与其余7所高校拉开了较大的差距。这说明这三所高校随着时间的推移,进入h尾区域论文比例与数量较高,产生了较大的学术影响力。这与这四所高校具备较高的发文量有密切的关系,中南大学、湖南大学、长沙理工大学的发文量分别为690篇、519篇、358篇,较高的发文量导致了较高的h尾区域论文数量,较高的学术潜力带来了较高的学术影响力。
(3)零被引论文与超高被引论文分析
超被引(被引频次>h)的主要由e域内的论文反映,同样对应学科的核心论文,体现在Y3的测度上,零被引论文体现在X3的测度上,且Y3- X3= Z3。值得注意的是,10所高校在T1、T2、T3时刻的零被引论文数量均为0,这使得该10所高校在任一时刻的X3的值为0。所以测度Z3仅由超被引测度Y3决定,无需考虑零被引论文所造成的负面学术影响。
总体而言,10所高校数学学科的Y3值同样随时间的推移而增加,这说明随着时间的累积,论文开始从h域进入e域。从三个时刻的Y3来看,湖南大学、中南大学、国防科技大学、湖南师范大学四所高校的超引论文较多,产生较高的学术影响力。中南大学2013年发表的关于城市群生态效率研究的论文被引次数达到了328次,湖南大学2011年发表的关于城乡收入差距的影响机理的论文被引次数达到了335次,国防科技大学2011年发表的关于复杂网络社团发现算法研究的论文被引次数达到了180次,湖南师范大学2011年发表的关于土地整理项目绩效评价方法研究的论文被引次数为71次。
(4)综合测度分析
观察表3可知,从学术迹的所有指标来看,在决定学术迹的三个指标X1、Y2、Z3中,Y2的值远远大于X1与Z3的值,并且相差一个数量级。由此可见,每所高校所发表的论文中,进入h尾区域的比例最高,这是产生学术影响力最主要、直接的来源。其次是Z3,最后是X1。
考虑到这10所高校均不存在零被引论文,这意味着在维持现有论文质量的基础上,这10所高校所新发表的每一篇论文都会进入h尾区域,从而提升Y2的值,进而有效提升学术迹的值,且超被引论文数量增加也可以通过提升Z3的值来提升学术迹表现,这为高校提升该学科的学术影响力提供了实际可行的方法。
4 结语
本文以学术迹为评价指标,以CNKI数据库为数据来源,计算了湖南省十所高校的数学学科学术迹、学术矩阵,发现如下:
(1)本文所选取的湖南省10所高校数学学科在学术迹方面存在差异,从整体上来看可以分为三档:第一档是中南大学、湖南大学,学术迹大于2000;第二档是长沙理工大学、国防科技大学、湖南师范大学、湘潭大学,学术迹在500~1100之间;第三档是湖南科技大学、湖南农业大学、湖南工商大学、南华大学,学术迹在500以内。同时学科学术影响力的展现需要一定的时间的积累,并非一蹴而就。
(2)学术迹相较于基于h指数、影响因子等传统单维度学术评价指标具有更好的评价效果,能较全面地评估高校某学科的学术影响力,高校可通过提升学术迹表现来较为精准地提升其学科学术影响力。
(3)在学术迹的诸多影响因素中,h尾以及e域的论文数量与比例最为关键,高校可以通过提升学术迹表现来实现学术影响力的提升。可以采取的措施如下:①在维持现有发文质量的基础上,增加教师与学生在数学学科领域的发文量,这将有效提升h尾论文的学术影响力。②引进具有高影响力的学者,增加超被引论文的数量,这也将直接提升该学科的学术影响力。
本文采取的学术迹评价指标能够更加客观、全面的对高校学科进行评估,能够为高校的学科发展提供指导性作用。但在研究过程受各种条件和因素的制约,仍然具有一定的局限性,如数据选取、学科选取等较为单一,以学术迹为主体的高校学科影响力综合评价体系的可信度还需要深入探究。未来的研究方向中,使用学术迹评估学术热点与学术前沿是值得探索的方向。