APP下载

基于CiteSpace 的研发效率的研究热点及演变趋势可视化分析

2021-08-13纪国涛方诗月

科技和产业 2021年7期
关键词:发文热点聚类

纪国涛,方诗月

(沈阳理工大学经济管理学院,沈阳 110159)

熊彼特认为研究与开发是企业能够长期发展并获得利润的主要因素,企业的研发能力越强,研发积极性越高,其发展就会越迅速,才能够在日益激烈的竞争市场中获得更高的利润。自从改革开放以来,中国的经济取得了巨大的成就,企业也随之不断地发展壮大。Rawlins 首次提出了研发效率的概念,广泛地引起了学术界的关注,他利用随机前沿模型研究如何提高农场的技术和效率[1]。国内学者首次提出研发效率是在1993 年,杨洪波等提出中兴通讯通过搭建技术平台来提高其研发效率,从而增强企业的竞争力。自此以后,更多的学者针对研发效率存在的研发创新能力不足,资源配置结构不合理,利用率不高等问题进行研究[2]。21 世纪以来,国家不断发展科技创新转化为经济发展动力,经济发展的模式也发生了新的转变,由传统的劳动力和资源驱动模式转变为创新引领模式。区域、行业和企业的创新能力高低主要体现为研发效率的大小。为客观地探索研发效率的发展现状,明确研发效率的发展方向,本文基于文献知识图谱致力于实现热点关键词、聚类关键词、文献总量发表趋势、核心机构和作者发文量、突现词演进等研究,把握研发效率的现状,提炼当下研究热点,厘清未来演进趋势。

1 研发效率的研究热点与聚类分析

1.1 热点关键词研究

关键词是论文中精炼的主题词,通过对关键词分析可以快速分析出文章主题,关键词在文章中出现的频次越高,说明该关键词越和主题相关,而某一领域的关键词频率越高,越能代表该领域的研究热点。通过对不同时期的关键词进行分析,可以了解该领域研究热点的动态变化。

本节基于关键词的共现网络来分析研发效率的热点。在中国知网上共检索出以“研发效率”为关键词的学术期刊782 篇,通过人工剔除掉与研究主题不契合的文献,得到样本605 篇。将605 篇学术期刊作为数据源导入到CiteSpace 5.6.R1。设置时间分割为2003—2018 年(以研发效率为主题搜索,中国知网显示的最早收录的文献在2003 年),每个分区的值为1,设置“关键词”为节点的类型,选取每个时间分区中的前50 个高频关键词。将意义相同的关键词进行合并。得到关键词可视化图谱,如图1 所示,节点越大,说明其研究频次越高,热度越大。关键词在图中的结构比较紧密,研究比较集中。

图1 关键词可视化图谱

根据Donohue[3]的高频词分布定律公式:T=得出高频词为34,但通过CiteSpace 中运行的结果显示,在样本中满足条件的高频词只有2 个,并不能完全显示研发效率的内部结构和研究趋势。因此选取频数大于10 的高频词进行汇总,见表1。研发效率领域的研究重心按照频次由高到低主要集中于“研发效率”“研发创新”“数据包络分析”“影响因素”等。中介中心性的数值大于0.1 表明关键词之间发挥着中介的衔接作用,完善关键词之间的逻辑关系[4]。其中“研发效率”“研发创新”“数据包络分析”“影响因素”“创新效率”“效 率”“随机前沿分析”“malmquist 指数”“研发投入”等起着联接关键词的作用,结合频数大于10、中心度大于0.1 的前4 个关键词进行研究。

表1 高频关键词

1)研发效率(中心度0.63,频次195)。研发效率是关键词中出现频次最高的,研发效率是能够衡量研发投入转化为研发产出的技术效率的表现[5]。研究范围包括区域层面、行业层面和企业层面。从区域层面来看,多数学者沿用Griliches 的思路,将每一个省份都浓缩为具有资金和人员的生产部门,并通过对实际产出和潜在产出相比较,来判断技术是否有效[6]。从行业和企业层面来看,主要为对研发效率的测算及其影响因素的研究。

2)研发创新(中心度0.48,频数101)。研发创新和研发效率有着密切的关联,而技术来源的方式不同对研发创新全要素生产率也有不同的影响。学者们呈现出不同的观点,冯志军等[7]发现国外技术引进相比于国内的技术引进更能促进研发创新全要素生产率的增长;而李小平[8]则认为国外技术引进只对研发创新全要素生产率中的技术进步具有促进作用。区域、行业,不同规模、性质的企业如何提高研发创新是研发效率研究的热点。

3)数据包络分析(中心度0.3,频次62)。效率的评价方法有层次分析法、因子分析法、熵权法、数据包络模型分析和随机前沿模型分析等。数据包络模型是一种非参数评价方法,且适用于决策单元具有多个投入和产出指标,并且不受量纲的影响。样本中大多采用数据包络模型来分析企业的研发效率。

4)影响因素(中心度0.22,频次33)。研发效率影响因素主要包括企业规模、市场竞争、机制体制、企业性质、技术差距、技术研发等,哪些因素影响研发效率的频次?哪些因素对研发效率的影响起着关键性的作用?对影响因素的研究经历了从理论研究到实证研究,从静态研究过渡到动态研究的过程。

1.2 关键词聚类研究

关键词聚类是各个节点的汇总,分析能够用来反映各个关键词之间联系的紧密程度。节点的大小能够反映文献被引频次和关键词出现的频次。通过对数据进行关键词聚类,共产生98 个节点,168 条连线,模块值Q值为0.518 2,大于0.3,说明聚类结构是显著的,平均轮廓值S值为0.515 2,说明此聚类是合理的。CiteSpace 能够显示出3 种测算结果,其中LLR(对数似然率)测算结果相较于其他两种会反映出真实的情况,同时具有更高的质量,如图2 所示。不同算法的核心聚类集见表2。得到7 个聚类和各个聚类之间的轮廓值。轮廓值能够反映聚类网络内部各节点之间的联系程度,轮廓值越大,节点之间的联系程度越高。通过对聚类进行分析,得出研发效率的主要研究主题。其中平均发表年份越晚,越能体现出研发效率的前沿热点。从整体上看,发表年份主要集中在2011、2012、2013 年,其中聚类平均发表年在2013 年的最多,表明这几年是研发效率的稳固发展期。按照轮廓值排名前4 的进行分析如下:

表2 核心集中基于不同算法的主要聚类概况

图2 关键词聚类可视化图谱

1)聚类#0 的标题为技术创新效率,轮廓值为0.911,平均年为2013 年,包含价值链、信息系统、项目管理、研发等子聚类。信息系统是指通过利用网络技术的优势,通过对数据汇总与分析,来为企业的发展服务。信息系统能够辅助企业决策层进行项目管理,多数学者认为应建立与时俱进的思维,充分利用信息系统的优势,来提升企业的研发能力。

2)聚类#1 的标题为合成控制法,轮廓值为0.9,平均发表年为2013 年,包含对外直接投资、产品研发、创新能力、高新技术企业等子聚类。国内学者对技术创新的研究既包括技术创新理论的内涵,也包括从模仿式创新到突破式创新转变分析,还包括企业如何通过技术创新在市场上获得竞争优势,技术创新依旧是大部分企业进行技术追赶的途径之一,故技术创新的研究依旧是热点。由于研发经费和对外直接投资相协调,对外直接投资通过影响研发费用而间接影响研发效率。部分学者认为,在一定的时期内,对外直接投资和研发效率能够相互影响,对外投资的增加可以在一定程度上推动资本的积累,促进研发效率的提升,而研发效率的提高更能提升企业的知名度,进而去抢夺市场占有率[9]。

3)聚类#6 的标题是数据包络分析法,轮廓值为0.878,平均发表年为2013 年,包含区域创新、企业研发活动、双边道德风险、政府补助等子聚类。部分学者通过对创业板的实证分析,指出政府补助与企业的研发效率存在“U”形关系[10]。在政府补助较低的条件下,增加政府补助反而会降低研发效率,当补助强度超过拐点时,随着政府补助的增加,研发效率才会提升。熊和平等通过对初创期企业的实证研究,得出政府补助对初创期研发效率起到促进作用,和成长期的企业呈现出“倒U”形的关系[11]。政府补助对研发效率的影响是促进作用还是降低作用,针对不同类型的公司,作用也不相同。

4)聚类#4 的标题为企业研发,轮廓值为0.803,平均发表年为2013 年,包含环境效应、评价与比较、政府支持、环境约束等子聚类。环境因素主要分为内部因素和外部因素,外部环境大致分为外部经济水平、产业结构、企业的行业、性质等。内部因素分为管理层货币激励、内部控制等。

2 中国研发效率的演进趋势与热点分布的可视化分析

2.1 发文总量分析

2003—2018 年发文总量折线图如图3 所示。

图3 2003—2018 年发文总量折线图

通过发文总量不仅能测量出学术关注度,还能随年度的纵向分布可以反映研究热点的发展趋势[12]。通过绘制出发文量的变化曲线,从发表文献量来看,中国研发效率的研究呈现出整体上升、间歇性波动的情况,将波动性划分为3 个阶段,可以将研发效率分为萌芽期(2003—2008 年),稳固发展期(2009—2015 年)和波动增长期(2015—2018 年),在萌芽期,有关研发效率文献每年发表量不超过25 篇,在稳固发展期,年发表量逐步攀升,截至2015 年末,年发论文超过75 篇,相当于萌芽期的3 倍,在波动增长期,发表论文量呈现出波动上升趋势。从发文总量来看,研发效率总体上正处于生命周期理论中的成长期,未来还有很大的发展空间。

2.2 发文作者和机构分析

作者和机构共现图谱(图4)可以更加清晰反映出核心作者、核心机构及他们之间的合作关系,节点越大代表作者或机构的发文量越大,节点之间的连线越粗表明主体之间的合作越是紧密[13]。以研发效率为主题的文章主要以肖仁桥(13 篇)、钱丽(13 篇)、梁彤缨(10 篇)、雷鹏(6 篇)为发文作者,发文机构主要以华南理工大学工商管理学院、安徽财经大学工商管理学院、东南大学经济管理学院、华中科技大学管理学院、安徽财经大学统计与应用数学学院等为主要发文机构,其中华南理工大学工商管理学院的节点最大,发文量为20 篇,由图4 中可以看出,主要有3 个较紧密的网络结构,表明这3 个网络内部之间已经建立了良好的合作关系,而合作的主体表现为核心发文作者和核心发文机构,说明合作在一定范围内可以促进研究主题的发展。其余的作者和机构呈现出散点状和线状,缺乏机构和学者之间的交流互动与合作。

图4 作者和机构共现图谱

2.3 突现词分析

如图5 所示,考虑了时间对聚类分析结果的影响,这是关键词聚类分析的另一种形式,它可以清晰地显示出聚类分析的发展,从图中可以看出,2003—2008 年文献首先集中发表以技术创新效率、合成控制法、规模效率、超效率dea(#0,#1,#2,#3)为主的4 种主题的文献,然后发展到2009—2015 年,出现了以企业研发、技术创新、数据包络分析为主题的文献(#4,#5,#6),到2016—2018 年,主要发表以技术创新效率、合成控制法、规模效率、超效率dea、企业研发、数据包络分析法等为主题的文献(#1,#2,#3,#4,#6)。另外,该图还显示了每个聚类标签出现的重要的时间节点,例如聚类标签5 中代表的域,范围为2010—2015 年。该研究聚类在2010—2015 年有一系列重要的里程碑。

图5 时间聚类共现图

图6 显示了2003—2018 年关于研发效率的16 个主要突现词,21 世纪前8 年突现了“研发效率”“影响因素”等突现词,2009—2015 年则突现了“研发创新”“随机前沿分析”“技术创新”“区域创新”“效率”“大中型工业企业”“工业企业”“全要素生产率”“价值链”“技术创新效率”“研发创新效率”“融资约束”“dea 模型”等突现词,2016—2018 年则突现了“创新效率”等突现词。上述关键词则反映了研发效率不同时期的研究热点及演进趋势。其中“技术创新效率”“研发创新”“技术创新”的突现强度大于其他突现词,说明该突现词在未来的一段时间内依旧是前沿的热点。通过观察突现词的持续时间,其中“融资约束”“dea 模型”“创新效率”等突现词的持续时间到2018 年,说明在未来研发效率的研究中,该突现词依旧是研究热点。

图6 2003—2018 年研发效率的16 个突现词汇总图

3 结论

通过上述分析可得出研发效率研究的发展大致分为以下3 个阶段。

第1 阶段:2003—2008 年,此时的研发效率的研究处于萌芽期,论文发文量低,大都聚焦于理论的研究上,此阶段中国人力成本低,市场潜力巨大,企业整体上比较依赖于技术引进、模仿创新。研发效率的影响因素主要是技术落后和经济差距。学者们基于发展的国际、国内背景对研发效率存在的问题挑战进行研究,为研发效率的发展奠定了基础。

第2 阶段:2008—2015 年,此时研发效率研究正处于发展期,发文量逐步攀升,从战略角度,明确地将创新驱动列为国家发展战略,从政策角度,给予一定的税收优惠支持。从研究方法角度,在理论研究的基础上,又融入了实证研究,静态效率的研究基础上,又融入了动态效率的研究。在此阶段研究的主体发生了转变,由整体的研发效率转向区域效率、工业企业的研究。

第3 阶段:2016 年至今,此时研发效率研究处于增长期,发文量呈现出波动性增长,从时间图谱来看,研究的主题更加全面、客观。未来国家的发展方向是到2030 年中国进入到创新型国家的行列,到新中国成立100 年成为世界级科技强国,研发效率的研究将被应用于各个领域。

猜你喜欢

发文热点聚类
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
热点
面向WSN的聚类头选举与维护协议的研究综述
结合热点做演讲
改进K均值聚类算法
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法
热点
热点