合作网络和知识网络对我国体育教育训练学文章被引量的影响
2021-09-29王越,黄谦,李宁,张彬
王 越,黄 谦,李 宁,张 彬
1 引言
科研文章被引量是一篇文章的方法、思想等内容在后续研究中被正式使用的次数[1-2],常被用来评估一篇文章的影响力[3-4]。而科研文章作为科学研究成果的最终表现形式,其影响力可以反映该研究在某些领域的有用程度[5-7],一篇文章的被引量越高,表明该文章的研究结论被认可的程度越高,对其他学者开展后续研究的借鉴和参考意义也就越大。有研究表明,科研文章引用量之间的差异很明显,几乎20%的文章没有被引用过,但有些文章的引用量却高达数千次[8-9]。这就引起了学术界的思考,影响文章被引量的主要因素究竟是什么?
以往的研究结合了不同的框架、观点和方法对影响文章被引量的因素进行探讨。如Bornmann等[10]发现,学者们引用一篇文章不仅是承认其学术重要性,有时也存在一些非学术原因;Tahamtan等[11]总结了与文章引用相关的因素,即摘要等文章相关因素、影响因子等期刊相关因素、作者数量等作者相关因素;而Abbasi等[12]则意识到社会网络在研究科研文章被引量中的重要性。
社会网络是由许多节点构成的一种社会结构,节点通常是指个人或组织等社会结构中的基本单元,社会网络代表各种社会关系,经由这些社会关系,把各个节点组织串连起来。科研合作网络作为一种典型的社会网络,在研究文章被引量影响因素时也受到了广泛的关注[13-14]。作者在合作网络中所处的位置能够在他们利用网络中各种不同的资源时发挥着重要作用,从而显著影响其文章的被引量[15-16],如Li等[17]发现作者中心性对其引文数量有正向影响,Abbasi等[18]发现作者的度中心性和结构洞对其基于引文的绩效有正向影响。与合作网络类似,知识网络也是一种典型的社会网络,且知识网络与科研文章的撰写息息相关。知识网络是由科学的知识元素组合而成的网络,这些科学知识元素可以表示知识领域的维度和类别,如专利通常被分为几类以区分其技术特征,并且不同的专利类别代表着不同的知识元素[19]。目前的文献计量学研究表明,科研文章的关键词表征了文章主要涉及的知识领域,因此,关键词可以被认为是科研文章知识元素的代表,如Su等[20]、Assefa等[21]、Yang等[22]使用关键词来描绘知识结构图,Chen[23]使用关键词以探测知识热点,Xie等[24]通过关键词做研究趋势分析。因此,研究常使用关键词作为知识网络的基本单元,从而建立一个知识网络。文章通过关键词的共同出现,与之前文章建立联系。随着时间的推移,这些知识元素交织在一起并形成了一个记录组合或共现历史的网络。在科学研究的不断生产、发展和创新的过程中,知识元素也在不断地生产、组合或重新组合[25]。在这种创新过程中,知识元素相互形成联系或形成组合关系,并最终促进知识网络的形成和发展。本研究假设知识网络中知识元素的位置属性会影响知识元素的组合机会和效率,如一个处于中心位置的知识元素因为拥有更多的元素耦合内容和经验,所以更容易被检索到,也更容易与其他元素进行组合产生新颖的概念。因此,知识元素的位置属性可能会影响涉及这些元素文章的被引。此外,作为知识元素代表的关键词如果在一段时间内众多文章中反复出现,则说明这个知识元素是该领域的研究热点,那么研究热点的文章仍然会存在较高的引用量吗?本研究希望通过分析知识网络对文章引用量的影响,探究文章被引的影响因素。
体育教育训练学作为一门既包含社会科学层面,又包含自然科学层面的学科,其研究的深入和推进也离不开文章引用量研究带来的参考意义,并且同一作者的不同文章会有不同的引用量,因此需要从文章层面对文章引用量进行具体的分析,然而大多数研究基于作者层面、机构层面或期刊层面分析引用量。所以,为拓宽我国体育教育训练学研究的视角和思路,本研究基于体育教育训练学的文章层面,考虑到每一篇文章作者或关键词的平均水平,分别建立合作网络和知识网络,研究文章的度中心性和结构洞对文章被引量的影响;同时,从关键词组成的知识网络出发,探究研究热点与被引量之间的关系,从而探讨体育教育训练学未来的研究趋势。本研究不仅为后续学者们如何更科学地提升科学研究质量、提高文章被引量提供理论参考,也为未来更科学全面地预测学者文章的被引量、评估学者的科研绩效提供理论依据。
2 理论背景与研究假设
合作网络和知识网络是社会网络分析的重要内容,也是科学研究中的常用方法。每个节点在网络中的特征各不相同,其获取网络中新信息的机会也不同。对合作网络和知识网络中节点网络特征进行分析,是社会网络分析方法应用并取得高质量成果的关键。本研究主要选取度中心性和结构洞2个网络特征指标进行研究。度中心性是指在一个拥有N个节点的网络中,节点i与其他N-1个节点直接联系的总数,一个节点的度中心性越高,那么这个节点就与越多的节点有联系,该节点在网络中就越重要。结构洞是指在网络中如果一个节点与2个相互不直接联系的节点都有直接联系,那么这个节点就占据了一个结构洞位置。结构洞是节点在网络中的一个关键属性,通过占据结构洞位置,节点可以高效获得非冗余信息。本研究选取度中心性和结构洞2个网络特征指标的主要原因:一方面,随着科学研究的不断深入,更多学者更偏好对网络特征中的局部指标进行研究,而度中心性和结构洞不仅是社会网络分析中常用的经典指标,也是网络特征局部指标[26];另一方面,若加入其他自变量如中介中心性、接近中心性等,在建立模型并分析自变量对因变量的联合效应时,可能产生抑制效应,从而使回归系数产生偏差[18]。
2.1 合作网络
本研究中的合作网络是指科研合作网络,其中每一个节点代表一位作者,节点之间相互连接表示2位作者在之前的文章中有过合作关系。
2.1.1 合作网络中文章的度中心性对其被引量的影响
如果一位作者度中心性较高,说明其占据了合作网络的中心位置,那么这位作者会与很多作者相连接,即与很多作者在之前的文章中有过合作关系,那么他就有更多的机会获取更多的信息和资源[15]。作者通过这些外部的信息和资源,不仅可能在科研过程中获得新的观点或想法,还能作为信息传递的中介进行资源整合,同时,通过与更多不同作者进行思想交流,一定程度上也可以开拓其理论视野,这对提升作者的研究质量大有裨益,这些均使得他们更有可能产出极具影响力的科研成果[27]。同时,作者的度中心性越高,在合作网络中其与其他作者的合作便越频繁,这势必会提升其知名度、增益结构性社会资本,其成果也能得到更多的关注,进而获得更多的引用。在作者层面的合作网络中,作者的度中心性与其引用表现呈正相关。Abbasi等[18]研究发现,作者的度中心性与其基于文章被引量构建的g指数呈正相关;郝治翰等[28]通过对2000—2018年Science的14 913篇学术文章的研究发现,在作者层面的科研合作网络中,作者的度中心性与其文章被引量呈正相关。因此,提出假设H1a:合作网络中文章的度中心性与其被引量呈正相关。
2.1.2 合作网络中文章的结构洞对其被引量的影响
如果一位作者与合作网络中2位不直接相连的作者都有直接联系,那么这位作者便占据了结构洞位置,如有A、B、C 3位作者,B与C没有联系,A与B、C均有联系,则A将没有直接联系的B、C联系了起来,那么A就占据了结构洞位置。结构洞是衡量合作网络中与某作者有合作关系的作者间相互联系程度的指标。当作者占据的结构洞越多,也越容易获得控制优势[29],即占据结构洞位置的作者更有可能获得潜在机会控制非连接作者之间的信息流动[30]。而且,结构洞是网络中异质性信息流动的枢纽,通过结构洞建立的连接是非冗余连接,占据结构洞位置的作者可以获得大量的非冗余信息,通过这些非冗余信息,作者更有可能提升其研究质量从而获得更多的文章被引量。因此,提出假设H1b:合作网络中文章的结构洞与其被引量呈正相关。
2.2 知识网络
本研究中的知识网络是指由文章的关键词作为知识元素构成的网络,其中每一个节点代表一个关键词,节点之间相互连接表示该关键词出现在以前的研究中。
2.2.1 知识网络中文章的度中心性对其被引量的影响
知识元素在知识网络中的度中心性说明了该知识元素在以前研究中与其他知识元素组合的程度。知识元素之间相互结合并构成了一个庞大的知识系统[31]。随着知识元素度中心性的增加,其与其他知识元素组合的机会也在增加,主要有2个原因:一是,知识元素度中心性越高,说明该知识元素已经与更多的知识元素有过组合,即它是一个涉及范围更广泛、适用性更好的知识元素,这也会促使作者在后续研究中围绕这个知识元素进行更加深入的探讨[32];二是,知识元素的度中心性较高,就能给作者提供更多关于这个知识元素组合的范例,启发他们从不同的思路和角度开展创新性研究。因此,该知识元素的相关文章被引量也会随着这个知识元素的相关研究继续开展而提升。但是,当知识元素的度中心性提升至一定程度时,知识元素的组合机会反而可能会降低,即当知识元素被过度组合时,该组合的价值便会降低,可能会使最终的科研成果创新性不足,后续研究对该知识元素相关文章的引用量也会降低。因此,提出假设H2a:知识网络中文章的度中心性与其被引量呈倒U型关系。
2.2.2 知识网络中文章的结构洞对其被引量的影响
与合作网络中结构洞类似,如果一个知识元素与知识网络中2个不直接相连的知识元素有直接联系,那么该知识元素便占据了结构洞位置,对知识的搜索更多是学科内部搜索或者相关搜索[33],因此通过处于结构洞位置的知识元素,可以使没有直接联系的2个知识元素有更多的组合机会[34]。如果一个知识元素占据的结构洞越多,那么对作者而言可以通过该知识元素发现更多非冗余的相关知识元素,并可以发现更多从未出现过的知识元素组合,包含该知识元素的文章也将会得到更多的引用量。因此,提出假设H2b:知识网络中文章结构洞与其被引量呈正相关。
2.2.3 研究热点与文章被引量的关系
研究热点是指在某一段时间内,有大量的科研文章都在探讨的科学问题或主题,在一定程度上代表了学科的研究重点和未来发展方向。对某学科或某研究领域的研究热点分析,不仅是科研活动中探明知识基础、发掘前沿趋势的重要依据,也有助于帮助研究人员集中优势,研究具有发展潜力的方向。文章被引量如果较高,可以在一定程度上说明该文章受到其他作者的大量关注和认可,并且对于其研究也能够提供有效的帮助。目前已有相关研究提出利用高被引文章以识别研究热点的可行性。邱均平等[35]认为高被引文献可以客观反映出学科的研究动态和关注热点,因此可以通过高被引文献有效识别学科的研究热点。莫富传等[36]论证了高被引文章识别学科研究热点的可行性、有效性和实用性。基于此,可以认为,如果一篇文章包含了一段时期的研究热点问题或主题,那么这篇文章会收获相对较高的引用量。因此,提出假设H2c:研究热点与被引量呈正相关。
3 研究方法
3.1 数据来源
本研究所有数据均来源于《中文社会科学引文索引》(CSSCI)数据库,在高级检索中的“期刊”栏分别输入 《北京体育大学学报》、《上海体育学院学报》、《首都体育学院学报》、《山东体育学院学报》、《成都体育学院学报》、《天津体育学院学报》、《西安体育学院学报》、《武汉体育学院学报》、《沈阳体育学院学报》、《广州体育学院学报》、《南京体育学院学报》(社会科学版)、《中国体育科技》、《体育文化导刊》、《体育学刊》、《体育与科学》、《体育科学》16种体育类核心期刊名称,学科类型设置为“体育学”,二级学科类型设置为“体育教育训练学”,由于文章平均需要5年的时间才能稳定地被引用[35],因此发表时间限定为2000—2015年,可以使所有文章均被充分引用。最终摘录保存所有文献名称、作者、关键词、发表时间、被引次数等信息,得到8 948条原始数据。
3.2 变量选择与测量
3.2.1 因变量
本研究的因变量是样本中所有文章的归一化被引量。文章归一化被引量的计算借鉴Cannella等[37]在2016年提出的方法,首先用某篇文章的被引量减去同年发表的所有体育教育训练学文章的平均被引量,然后再除以同年发表的所有体育教育训练学文章被引量的标准差,最后得到该篇文章的归一化被引量。该方法可以消除文章由于在不同年份发表而产生的引用偏差。公式如下所示。
3.2.2 自变量
本研究的自变量是基于样本中所有文章构建的合作网络与知识网络中的度中心性和结构洞。
3.2.2.1 构建合作网络与知识网络
本研究中的合作网络与知识网络是基于2000—2015年我国体育教育训练学文章构建的,是典型的社会网络。合作网络是指科研合作网络,其中每一个节点代表一位作者,节点之间的边表示2位作者在之前文章中有过合作关系。知识网络是指由文章的关键词作为知识元素构成的网络,其中每一个节点代表一个关键词,节点之间的边表示关键词曾共同出现在之前的研究中。本研究的合作网络与知识网络均通过Python软件构建。
3.2.2.2 度中心性与结构洞的测量
本研究的自变量度中心性和结构洞有2组,合作网络中文章的度中心性和结构洞与知识网络中文章的度中心性和结构洞,无论在合作网络还是知识网络中,本研究所探讨的度中心性和结构洞均是在文章层面上的指标。具体度中心性和结构洞的计算均通过Python软件计算得出,具体计算方法如下。
(1)度中心性的计算
首先计算出与该节点在网络中有直接联系的节点的数量得到该节点的度中心性,然后进行标准化处理,用度中心性除以该网络中剩余节点的数量,得到标准化度中心性,公式如下所示。
(2)结构洞的计算
根据Lazega等[30]、Burt[38]提出的方法,首先计算出节点的约束Ci,它可以描述一个节点受到邻接节点约束的程度,然后用2减去节点的约束Ci便得到其结构洞,公式如下所示。
式中i表示目标点,pij表示与点i相连接的点j占与i点相连接点的总数量的比例,例如点i与包括点j在内的5个点相连接,则pij的值为1/5。k是与点i、点j同时有连接的点,如果与点i相连接的节点越多,pij和pik的值越小,则Ci也越小。同样,如果与点k相连接的节点越多,则pkj的值也越小,点k对点Ci的影响也越小。
3.2.2.3 文章层面的度中心性与结构洞
本研究中分析的基本单元是文章层面的度中心性和结构洞,由于一篇文章会有多位作者和多个知识元素,所以需要将合作网络和知识网络中节点的度中心性和结构洞平均到文章。例如一篇文章有3位作者,他们的度分别为1.2、1.3、1.4,则这篇文章在合作网络中的度中心性为(1.2+1.3+1.4)/3=1.3。合作网络中的度中心性和结构洞与知识网络中的度中心性和结构洞同理。
4 统计与回归分析
4.1 描述性统计
在合作网络中,如果作者的度中心性为0,表明该作者并未与其他作者有过合作关系,因此可以将度中心性为0的作者剔除合作网络,经处理,合作网络节点数最终为7 402。表1列出了合作网络中各变量的均值、中位数、标准差、最小值和最大值。而在知识网络中,不存在度中心性为0的知识元素,因此知识网络节点数为8 948。表2列出了知识网络中各变量的均值、中位数、标准差、最小值和最大值。
表1 合作网络各变量描述性统计Table1 Descriptive statistics of variables in cooperative networks
表2 知识网络各变量描述性统计Table2 Descriptive statistics of variables in knowledge networks
由表1、表2可以发现,合作网络中的度中心性与知识网络中的度中心性有较大差异,合作网络中文章的度中心性均值为0.001,标准差为0.001,最大值为0.008;而知识网络中文章的度中心性均值为0.008,标准差为0.008,最大值为0.055。而合作网络中的结构洞与知识网络中的结构洞差异较小,合作网络中文章的结构洞均值为1.461,标准差为0.282,最小值为0.875,最大值为1.969;知识网络中文章的结构洞均值为1.769,标准差为0.199,最小值为0.875,最大值为1.993。由于做了归一化处理,故文章被引量在合作网络与知识网络中均值均为0。
4.2 回归分析
4.2.1 合作网络
4.2.1.1 度中心性作为自变量
为了验证合作网络中度中心性与文章被引量是否存在非线性关系,故在回归中加入二次项,通过stata做回归分析,结果如表3。
表3 合作网络度中心性二次项回归结果Table3 Quadratic regression results of degree centrality in cooperative networks
通过表3可以看出度中心性的二次项P值为0.714>0.05,二次项回归结果不显著,故度中心性与文章被引量在合作网络中不存在U型或倒U型关系。为了验证是否存在线性关系,对其进行一元线性回归,结果如表4。
表4 合作网络度中心性一元线性回归结果Table4 Unary linear regression results of degree centrality in cooperative networks
通过表4可以看出度中心性的P值为0<0.01,一元线性回归结果显著,且系数为137.071>0,说明度与文章被引量呈显著正相关,这也验证了假设H1a,即合作网络中文章的度中心性与其被引量呈正相关。
4.2.1.2 结构洞作为自变量
为了验证合作网络中结构洞与文章被引量是否存在非线性关系,故在回归中加入二次项,通过stata做回归分析,结果如表5。
表5 合作网络结构洞二次项回归结果Table5 Quadratic regression results of structural holes in cooperative networks
通过表5可以看出结构洞的二次项P值为0.038<0.05,二次项回归结果显著,且二次项系数为0.302>0,初步判定其为U型关系。对其进行Utest检验,进一步验证其关系,结果如表6。
通过表6可以看出,极值点在[0.875,1.969],Utest检验P值为0.460>0.05,不能在5%的统计水平上拒绝原假设。为了验证是否存在线性关系,对其进行一元线性回归,结果如表7。
表6 合作网络结构洞Utest检验结果Table6 Utest results of structural holes in cooperative networks
表7 合作网络结构洞一元线性回归结果Table7 Unary linear regression results of structural holes in cooperative networks
通过表7可以看出结构洞的P值为0<0.01,一元线性回归结果显著,且系数为0.304>0,说明结构洞与文章被引量呈显著正相关,这也验证了假设H1b,即合作网络中文章的结构洞与其被引量呈正相关。
4.2.2 知识网络
4.2.2.1 度中心性作为自变量
为了验证知识网络中度中心性与文章被引量是否存在非线性关系,故在回归中加入二次项,通过stata做回归分析,结果如表8。
表8 知识网络度中心性二次项回归结果Table8 Quadratic regression results of degree centrality in knowledge networks
通过表8可以看出度中心性的二次项P值为0<0.01,二次项回归结果显著,且二次项系数为-376.056<0,初步判定其为倒U型关系。对其进行Utest检验,进一步验证其关系,结果如表9。
通过表9可以看出,极值点在[0,0.055],Utest检验P值为0.005 59<0.01,检验显著。同时,结果中斜率由19.297到-21.739,这与二次项回归初步判定其为倒U型关系的结果一致。因而可以认为存在倒U型关系,这也验证了假设H2a,即知识网络中文章的度中心性与其被引量呈倒U型关系。
表9 知识网络度中心性Utest检验结果Table9 Utest results of degree centrality in knowledge networks
4.2.2.2 结构洞作为自变量
为了验证知识网络中结构洞与文章被引量是否存在非线性关系,故在回归中加入二次项,通过stata做回归分析,结果如表10。
表10 知识网络结构洞二次项回归结果Table10 Quadratic regression results of structural holes in knowledge networks
通过表10可以看出结构洞的二次项P值为0<0.01,二次项回归结果显著,且二次项系数为0.997>0,初步判定其为U型关系。对其进行Utest检验,进一步验证其关系,结果如表11。
表11 知识网络结构洞Utest检验结果Table11 Utest results of structural holes in knowledge networks
通过表11可以看出,极值点在[0.875,1.993],Utest检验P值为0.000 096<0.01,检验显著。同时,结果中斜率区间内由-0.878到1.353,这与二次项回归初步判定其为U型关系的结果一致。因而可以认为其存在U型关系。该回归结果与本研究提出的研究假设不符,因此假设H2b未得到支持。
4.2.2.3 研究热点与被引量的关系
本研究根据词频分析法,利用关键词词频确定我国体育教育训练学研究热点。词频分析法是指利用能够揭示或表达文章核心内容的关键词在特定研究领域文章中出现的频次来确定该领域研究热点的文献计量方法。由于关键词数量较多,故选取我国体育教育训练学文章关键词词频统计排名前15的关键词(图1)。
图1 我国体育教育训练学文章关键词词频统计Figure1 Keyword frequency statistics of articles on physical education and training in China
由图1可以发现,排名前15的关键词词频都超过了200次,其中词频最高的为“学校体育”,接近800次。总体而言,关键词词频排名前15的关键词大体分为3种:一是“学校体育”“体育教学”“体育教育”“体育课程”“高校”“大学生”“普通高校”“体育教师”“高校体育”等,这些都是我国学校体育的一部分;二是“运动员”“运动训练”“竞技体育”,这些也是国家一直强调重视的竞技体育的一部分;最后是“足球”“篮球”“乒乓球”,这些项目在我国都有很广泛的群众基础,不仅是我国开展群众体育和全民健身的重要组成部分,也是竞技体育中受到关注度较高的项目。从这些研究热点关键词可以发现,研究热点与我国的现实情况也十分契合。习近平总书记于2020年提出,要加强学校体育工作,推动青少年文化学习和体育锻炼协调发展,要创新竞技体育人才培养、选拔、激励保障机制和国家队管理体制,要紧紧围绕满足人民群众需求,构建更高水平的全民健身公共服务体系。
那么这些研究热点的文章被引量是否也相对较高呢?为了验证研究热点与被引量的关系,对其进行一元线性回归,结果如表12。
通过表12可以看出,P值为0.07>0.05,回归结果不显著,不能在5%的统计水平上拒绝原假设。该回归结果与本研究提出的研究假设不符,即研究热点与被引量不存在正相关关系,因此假设H2c未得到支持。
表12 研究热点与被引量关系一元线性回归结果Table12 Unary linear regression results of the relationship between research hotspots and citations
5 研究结论
本研究利用2000—2015年我国体育教育训练学文章数据,构建了作者合作网络与关键词知识网络,从2个角度研究了文章网络结构特征与其被引量的关系,研究结论如下。
5.1 在合作网络中,文章的度中心性与其被引量呈正相关,即随着文章所有作者的平均度中心性的提高,文章被引量也随之提高。
5.2 在合作网络中,文章的结构洞与其被引量呈正相关,即随着文章所有作者的平均结构洞的提高,文章被引量也随之提高。
5.3 在知识网络中,文章的度中心性与其被引量呈倒U型关系,即随着文章所有关键词的平均度中心性的提高,文章的被引量先是随之提高,当达到一定的程度后呈减小的趋势。
5.4 在知识网络中,文章的结构洞与其被引量不存在正相关关系,即研究热点与被引量不存在正相关关系。
6 研究启示与研究局限
6.1 研究启示
本研究以《中文社会科学引文索引》(CSSCI)数据库中16种体育类核心期刊的体育教育训练学文献为研究对象,通过对社会网络特征进行分析,丰富了体育教育训练学领域文章视角下合作网络和知识网络以及文章被引的研究,揭示了合作网络和知识网络对体育教育训练学领域文章被引量的影响。通过研究可以发现,目前,我国体育教育训练学大部分科研人员已经放弃了原有的单兵作战模式,合作研究已经成为了一种趋势。通过合作,体育科研人员不仅可以共享科研设备、降低科研成本、提高科研效率,也可以使信息资源有效流通,这有利于启发新的研究思路与方法并应用于体育教育训练学的研究之中。总体而言,随着现代科学呈现出诸多新的特点,单兵作战已经不能满足现代科学研究的需要,学者们在科学研究过程中应寻求与更多学者进行合作,且尽可能选择度中心性与结构洞较高的合作者,这都有利于提升文章的被引量、提高科研影响力。同时,对度中心性适中的知识元素进行研究,会使得文章的知识元素在利用率较高的同时有一定的创新性,也有利于提高文章的被引量。由于被引量较高文章反映的是一篇文章被引次数长期累计的结果,而研究热点更多关注的是短期的变化和受关注度,且由于研究频次较高,研究人员水平参差不齐,研究热点相关的成果也不一定会获得较高的被引量。
6.2 研究局限
本研究也存在一定的局限性。一方面,对合作网络中的作者与知识网络中的关键词并没有赋予一定的权重,且作者对每篇文章的贡献程度以及关键词在文章中的重要程度未予以区分,该问题应如何解决在学术界也尚未达成统一,在后续研究中有待于进一步完善。另一方面,知识网络中文章的结构洞与被引量的关系及产生的原因有待于在后续研究中进行探讨。