大数据视角下学术期刊核心作者群的测评
——以《图书馆杂志》为例
2016-10-18孔红蕊
孔红蕊
南阳医专图书馆,河南南阳 473000
大数据视角下学术期刊核心作者群的测评
——以《图书馆杂志》为例
孔红蕊
南阳医专图书馆,河南南阳473000
利用《中国学术期刊(网络版)》,采用综合指数法对《图书馆杂志》核心作者进行测评,进而揭示《图书馆杂志》核心作者队伍的特征。
大数据;图书馆杂志;核心作者
1 检索策略的制定
选择《中国学术期刊(网络版)》(CAJ-N)数据库作为本文统计数据的来源。选择“刊名”字段,输入检索式“刊名=图书馆杂志”,“精确匹配”,时间限制在“2006-2015年”。依据检索条件,CAJ-N数据库提供的检索结果为3 076条数据,将得到的题录数据从CAJ-N全部下载并导入到NoteExpress文献管理软件,通过查重和对不符合研究的题录数据进行清洗(剔除323条),最终得到2 753条题录数据。
2 遴选核心作者候选人
目前,在核心作者研究的评价方面,学术界尚未建立学科领域核心作者的统一标准。由于采用的标准不同,诸多研究结果或多或少存在商榷之处。早期的研究往往只考虑单一指标,如作者的发文量、被引频次、H指数等。通过对大量核心作者测评的文献的梳理,综合吸收具有一定实际意义的研究结果,笔者总结出核心作者理应包含两大显著特征:较高的发文量和被引频次,二者不能顾此失彼。为此,本文同时选择既能反映作者科研生产力的学术论文发文量指标又能反映作者成果影响力的论文被引频次指标分别考察作者学术地位的不可替代性及作者影响力的大小。学术论文发表数量大,反映作者在科研生产力方面具有较强科研创造能力,这是衡量具备核心作者的“先天条件”。论文被引用,说明该论文对他人的研究起到了帮助作用,该论文成果对社会或经济带来了一定的学术效益,这是衡量具备核心作者的“后天条件”。2个条件的具备,则评选出的“核心作者”可以称得上具有一定的权威性和说服力。
2.1从发文量角度遴选核心作者候选人
遴选依据是文献计量学中美国著名的科学史学家普赖斯(PRICED)在1969年发表的《小科学,大科学》一书中提出的普赖斯定律,定律计算公式为:(m为发文量较高的临界点,n是所统计的作者中最大发文量的篇数)。2006—2015年《图书馆杂志》发文量最多的作者是黄国彬(16篇)。依据普赖斯公式:,根据取整原则得,m=3,也就是说发表3篇及以上论文的作者被确定为核心作者的候选人,共计275位。
2.2从论文被引频次角度遴选核心作者候选人
分别计算出275位作者在2006-2015年间发表的全部论文的被引频次之和。经过统计得到,论文被引频次之和最大的作者是郭晶,总被引频次为218次,借鉴普赖斯定律测定出核心作者候选人的最低总被引频次分界点为:,由取整原则,m=12,也就是说论文总被引频次在12次及以上的作者被确定为核心作者的候选人。对符合最低发文量和最低总被引频次两个指标的作者进行比对查重后,最终确定的核心作者候选人共计174位。
3 基于综合指数法的核心作者的测评
运用综合指数法测定核心作者共分4步来完成:第一步,计算平均指数。借鉴普赖斯定律遴选出核心作者候选人,运用综合指数法对核心作者候选人的综合学术水平值进行精确计算时须考虑两个指数(发文平均指数和被引平均指数);第二步,确定权重值。对发文平均指数和被引平均指数赋予权重值;第三步,设定阀值。对测算出的核心作者候选人的综合指数值的阀值进行设定,凡是大于该阀值的候选人才能被确定为核心作者,反之则相反;第四步,对核心作者进行排序。在确定的核心作者群中,按照每一位核心作者综合指数值的大小由高到低进行排名。
3.1发文平均指数和被引平均指数
1)发文平均指数。发文平均指数(X),定义表述为“所有核心作者候选人的发文平均值”。2006-2015年《图书馆杂志》174位核心作者候选人发文量共计802篇,因此,发文平均指数为4.61。
2)被引平均指数。被引平均指数(Y),定义表述为“所有核心作者候选人的被引平均值”。2006-2015年《图书馆杂志》174位核心作者候选人发表的论文共被引频次为7 507次,因此,被引平均指数为43.14。
3.2发文指数和被引指数的权重值的确定
以往研究者对作者生产力评价的关注远高于其影响力评价,将发文量和被引频次2个指标权重设为0.7和0.3,或0.6和0.4,这种权重的设置只注重了学术成果的“量”的累积,而忽视了“质”的评估。通常情况下,作者的发文量和其被引频次相关性较差[1]。利用相关函数得到174位核心作者候选人的发文量和被引频次之间的相关关系函数图象(如图1)。计算得R=0.50596443,根据统计学知识,174位核心作者候选人的发文量和被引频次之间呈中度相关(0.4<R<0.6)。因此,在运用发文量和被引量两个指标对核心作者进行测评时应同时考虑作者的论文数量和质量,赋予两者同样重要的评价程度。为此,本文将发文数量和被引频次权重值分别定为0.5和0.5。
3.3综合指数阀值的设定
表1 综合指数法测定的核心作者
综合指数值越大,说明作者的学术水平越高,对《图书馆杂志》所做的贡献和努力也就越大。运用综合指数法计算公式(公式1)精准得出每一位核心作者候选人的综合学术水平值。对测算出的核心作者候选人的综合指数值的阀值进行设定,凡是大于该阀值的候选人才能被确定为核心作者,反之则相反;此处的阀值也称综合指数的平均值,由公式1计算得到本文的阀值计算结果为100。也即是当某一候选核心作者的综合指数高于100则可标记为核心作者。本文最终确定的核心作者共有61位。结果见表1。
4 核心作者的分析及其研究结论
4.1核心作者队伍已初具规模,但核心作者群尚未形成
2006—2015年《图书馆杂志》已建成了一支高水平的科研队伍,一些在图书情报界有着非常重要影响力的核心作者(如吴建中、王世伟、王知津、徐雁、郑建明、侯汉清、王子舟、姜爱蓉、肖希明)对《图书馆杂志》研究水平的推动和发展做出了杰出的贡献。然而,61位核心作者约占核心作者候选人总数的1.52%,61位核心作者共发表论文388篇,占全部论文总数的14.09%,这一结果远远未达到普赖斯定律的理论值(50%),这在一定程度上说明《图书馆杂志》核心作者群尚未形成。
4.2核心作者的所属机构或地区具有“地域性”特征
由研究统计得知,61位核心作者所属地区主要集中在上海(20人)、北京(15人)、南京(12人);核心作者研究机构排在前3位的是上海交通大学图书馆(7人)、南京大学信息管理学院(6人)、复旦大学图书馆(4人)。从作者机构或地区来看,《图书馆杂志》拥有的核心作者具有很明显的“地域性”。
4.3核心作者的发文量与被引频次分布呈现无相关关系
文章对最终测定的38位核心作者的发文量和总被引频次之间的关联程度进行统计分析,得到相关函数Y=3.499X+55.56(R2=0.058)。根据相关函数计算公式,得到R=0.24083189(R∈(0.0-0.3)区间),由此推出,38位核心作者的发文量与被引频次之间是呈低度相关的。进一步说明了测评核心作者单单依靠发文量指标是不科学的,必须结合发文量和被引频次2个指标同时满足一定条件的情况才能得出相对比较科学的研究结果。
[1]李宗红.利用综合指数测评期刊的核心著者——以《中国科技期刊研究》为例[J].中国科技期刊研究,2008,19(1):54-56.
G2
A
1674-6708(2016)166-0039-02
本文为2015年南阳市科技局软科学项目“科学计量学视角下南阳市高校哲学社会科学高水平人才测评研究”(2015RKX24)和2016年度南阳医专校级课题“文献计量学视角下我校科研成果的创新分布研究”(2016NYYZ011)的研究成果之一。
孔红蕊,南阳医专图书馆。