APP下载

基于科学文献计量的国内区域创新生态系统的研究进展及趋势分析

2021-11-13坚,吉

科技管理研究 2021年19期

张 坚,吉 欢

(华东理工大学商学院,上海 200237)

在国家“十四五”规划中指出,“要强化国家的战略科技力量,完善国家科技体制机制建设,把科技自立自强作为国家发展的战略支撑”。而现有创新集群理论和国家创新体系理论已无法满足科技创新潜力、社会创造力和市场活力的释放需求,同时区域创新系统也存在每个区域特有的特征,现有创新发展已不能适应区域创新水平提升的需要[1]。因此,学界和产业界越来越多的关注到了区域创新,并在前人研究的基础上衍生出了区域创新理论[2-3]。在当前国内多主体创新要素交叉融合的创新环境中,有学者结合生态学的相关知识率先提出了区域创新生态系统(RegionalInnovation Ecosystem,RIE,后文用RIE 表示)的概念和内涵[4-6],他们认为RIE 理论可以更好地揭示了区域创新活动的内在规律,优化创新要素流动和协同,提升区域创新效率[7],促进国家整体科技创新的发展。

截至目前国内已有诸多学者对RIE 的构建[8-9]、评价以及绩效等进行研究[10-12],并且仍是学术界对于区域发展研究的重要议题,但目前尚未有学者对RIE 的研究和趋势进行可视化分析。因此,本文基于文献计量分析方法,通过CiteSpaceV 计量软件从文献基础统计分析、关键词共现分析、关键词聚类分析以及突现分析等方面,对2000-2020 年间的研究文献进行分析,以期为RIE 的未来研究以及管理实践提供借鉴参考。

1 数据来源与研究方法

1.1 数据来源

对于文献数据的来源方面,美国德雷塞尔大学陈超美[13]教授认为应该重点关注文献的查全率。因此,本文为了保证查全率和查准率,首先分别在中国知网、万方数据和重庆维普期刊数据库采用关键词检索功能,在“期刊”选项中通过“主题”进行检索,以检索关键词分别为“区域创新生态系统”“区域创新and 生态”“区域创新and 共生”在三个中文数据库中进行多次检索,检索时间跨度为“2000-2020 年”,选择期刊类别为“北大核心、CSSCI 和CSCD”,然后通过阅读手动删除不相干文献、非研究型文献以及重复文献,最终一共得到264 篇有效核心文献集。

1.2 研究方法

本文使用的CiteSpace Ⅴ软件是实现科学文献计量的常用分析工具,它是由美国德雷塞尔大学的美籍华裔学者陈超美[14]教授基于Java 环境开发的一个实现文献计量与文献可视化的软件。自从2006 年被引入国内,由于具有可视化的突出特点,该分析软件被广泛运用到自然科学与社会科学领域,用于分析文献并识别研究发展历程、前沿方向以及热点话题,可以定量地动态展示研究领域的演变趋势和研究现状。

2 区域创新系统的研究文献分布分析

2.1 时间分布

文献发表数量及时间能够反映该研究主题在该时间范围内受到的关注程度,其中,有关RIE 核心文献集年度分布如图1 所示。我国的RIE 研究从2000 年开始起步,随着进入21 世纪,各地区对科技创新越来越重视。从2000 开始,研究RIE 的期刊论文就逐渐增加,呈现出波动上升的趋势。但是在2014 年以前关于RIE 的研究比较少,期刊论文的发表量都在15 篇以下。从2015 年开始,关于RIE 的研究有一波高峰,论文发表量达到了30 篇以上,RIE 研究开始爆发。之后是在2019 年,论文发表超过了40 篇,研究领域逐渐出现了多元化。总的趋势来看,每年RIE 的相关研究论文产出有升有降,但整体态势是呈现缓慢生长,近几年开始快速增长(其中,由于2020 年的数据不完全,表现出期刊论文数量的下降)。这一趋势表明RIE 在国内的研究地位日益凸显,特别是在党的十八大提出创新驱动战略以来RIE 成为区域创新领域学者们开始关注的新热点。

图1 2000—2020 年每年发文数量

美国科学学与情报科学家普赖斯通过对文献预测和文献发表数量增长的研究[15],用普赖斯曲线描述累计文献发表量随着时间变化的规律,研究主题的发表文献量等于初始时刻的文献量与自然常数e 的期刊文献增长率b与时间t乘积的次幂的乘积,其中文献增长率b是一个时间常数,其数学表达式为:

文献发表数量的持续增长率r是与时间常数b基本相等的,求出r值就相当于求出时间参数b,可以用如下公式(2)来求取r值[16]。

其中:A是文献发表的累积数量;a是初始时刻文献发表数量;n是统计文献的时间范围(年),则

本文A=264;这里a表示2000 年的文献发表数量,a=1;n是2000-2020 年之间的年份数,n=21。将以上数据代入式(4),得b=0.304 110 743。将a值与b值代入式(1),得本文研究的国内RIE 相关文献的累计发表量增长规律可与式(1)近似拟合。

将式(5)与检索实际文献产量进行拟合,拟合结果如图2 所示。两条曲线在图中横轴1~21 范围(2000-2020年)大致拟合,2015年后误差逐渐增大,结合图1 可知,2016 年左右开始国内RIE 领域文献发表量增长缓慢,这是导致2015-2020 年两者之间拟合误差较大的主要原因。本文对于国内RIE 领域的研究时间跨度是2000-2020 年,这21 年的相关数据与普赖斯曲线基本拟合,说明本文RIE 检索文献符合查全率要求,本文研究具有一定的可靠性。

图2 2000—2020 年发文累积量与时间关系拟合对比图

2.2 期刊与作者分布

本文分别从期刊发表、发文作者以及发文机构三个角度,对RIE 相关文献在各个期刊和机构的发表情况进行分析(如图3、图4 和图5)。从期刊发表情况看,文献集共发表于111 本期刊,其中发表文章5 篇以上的期刊主要有10 本,如图3 所示。总体上来看,论文的发表主要集中在技术创新、经济管理领域具有一定影响力期刊,例如《科技管理研究》《科技进步与对策》《科学管理研究》等;这里值得注意的是,发表于前十的期刊的论文数量占了全部文献的43.18%,尤其《科技管理研究》一本期刊就发表了31 篇关于RIE 的文献,占据查找全部文献的11.74%,说明了关于RIE 相关的文献发表具有较大的期刊发表的倾向性;另外,由于RIE 涵盖了一些区域经济发展战略的内容,也有少量文献发表在《商业经济研究》《经济地理》等期刊,表明了RIE 研究领域具有跨学科的综合属性。

图3 文献来源分布

图4 文献集作者分布情况

从文献集的发文作者(不区分作者排序)来看,从2000 年开始,截至2020 年10 月,共有491 位学者在RIE 领域发表论文,但是发表论文数在三次及三次以上学者共有14 位,如图4 所示。其中北京工业大学黄鲁成教授是发表文献较多的学者,达到了11 篇,其余均在10 篇以下,表明RIE 的研究还处于较为离散平均的状态,研究成果还比较分散,该领域还未形成相对权威的代表人物;但是仅从目前文献集数据的发文量团队来看,哈尔滨工程大学的李晓娣和张小燕团队是目前在RIE 方向发表文献较多的团队,研究也较为深入,后续的研究中可以重点关注。

结合文献发表数量中排名前5 位的作者及其团队关注的研究话题分析可以得出:目前不同研究团队对RIE 研究的关注点存在差异。苗红等人[17]主要集中研究的区域技术创新生态系统的问题;哈尔滨工程大学张小燕等[10]、李晓娣等[7,18-20]团队主要关注RIE 的共生性和创新绩效方面的研究;孔伟等[21]、张贵等人[22]的研究主要是集中于RIE 的创新效率和竞争力方面的研究;叶斌等人[23-24]主要研究区域创新网络及其共生性方面的问题研究。

从文献集的发文机构来看,如图5 所示,可以发现RIE 相关研究机构分布呈现零散星点状,包含276 个节点、123 条连线,图谱密度(Density)为0.003 2,整体密度较小,说明目前研究RIE 的机构比较分散,并且机构之间的合作也比较匮乏;且大多都是高校,可见该领域中的研究力量主要集中在高等院校,尤其河北工业大学较多,在后续的研究中可以重点关注这些机构和相关学者。

图5 文献集机构分布

3 区域创新生态系统的知识图谱分析

3.1 区域创新生态系统研究主题分析

本文使用CiteSpace 中的关键词聚类分析方法直接对特定研究领域的主题进行分析[25]。本文保持默认参数不变,选择对数似然比算法(Log Likelihood Ratio,LLR)对RIE 研究领域的关键词进行聚类分析。基于网络结构和聚类清晰度,模块值(Modularity Q,Q 值)可用以衡量所生成的聚类网络的稳定度,一般认为Q值大于0.3,则表示聚类结构显著,效果较好;平均轮廓值(Mean Silhouette,S 值)可用以衡量聚类内部节点的相似程度,一般认为S值大于0.5 则表示聚类内部匹配程度高,聚类合理[26]。聚类结果如图6 所示,Q值为0.900 8(远大于0.3),表明图谱聚类具有较好明晰的架构;S值为0.812 2(大于0.5),表明该聚类有较好的同质性和聚类效果,而且聚类主题也比较明确,聚类的信度较高。

从聚类结果来看,RIE 领域现有研究关键词聚类划分为12 个研究主题,如图6 所示。

图6 RIE 关键词聚类分析视图

可以发现,目前的研究主要是在区域创新方面,但是对RIE 的研究还比较少;并且部分研究借鉴了生态系统理论和创新网络理论,以探索包括区域创新、创新体系、产业集群以及京津冀区域创新等问题。这里,单独出现了“京津冀”的研究主题,说明目前对于京津冀RIE 的研究较多,存在较大的地域性,这与目前发文量较多的北京工业大学黄鲁成教授位于京津冀地区存在较大关系。

3.2 区域创新生态系统研究热点及趋势分析

为了进一步了解RIE 研究热点,并探究RIE 的研究方向和热点,本文对文献集进行RIE 研究关键词共现分析和Timezone 时间演进分析。研究热点是在特定学术领域中学者共同关注的话题[27]。词频分析是选取文献中同一关键词或主题词的频次高低。但仅仅频次高低不足以反映关键词在整个共词网络中的价值,需结合网络科学对网络中节点的价值进行定量判断,即中心性或中心性。

本文选用可视化软件Citespace V 构建关键词聚类知识图谱,探析RIE 研究领域的知识结构与研究方向。在构建CiteSpace 分析模型时,选择时间跨度为“2000—2020”,时间间隔为1 年,逐年提取关键词,并且只显示“Top30”,然后运行CiteSpace软件,得到RIE 研究的关键词共现图谱(如图7)和RIE 发展的高频关键词及其中心性(如表1,其中只显示频率大于14 次,中心性超过0.01 的关键词)。从图5 中,可以发现RIE 相关研究呈现零散多个轮轴辐射结构,包含319 个节点、158 条连线,图谱密度(Density)为0.003 1,整体密度较小,说明关键词共现网络凝聚程度较低,也就是说目前关于RIE 研究较为发散。

图7 RIE 关键词共现图谱

在关键词共现图谱中,关键词出现的频次及其中心性与该领域学者的共同关注程度呈现出正相关,也就是研究热点方向。中心性表示的是该节点在网络中的重要程度,频次与中心性越高的节点说明在该研究领域越重要[13,28]。如表1 所示,整理出现5次及以上的关键词,一共18 个。其中,分析关键词共现网络及频次和中心性排序前十的分别是,创新生态系统(56 次,0.37)、共生演化(25 次,0.1)、区域创新系统(20 次,0.74)、区域创新(18 次,0.32)、区域创新环境(18 次,0.25)、区域创新生态系统(17次,0.21)、科技人才集聚(14 次、0.25)、生态系统(12 次,0.5)、雄安新区(12 次,0.08)、区域创新网络(9 次,0.13),说明在选取的文献集中区域创新出现的次数比较多,同时中心性也是较高的,而且对知识图谱的价值较大,具有显著的影响力,可被看作是连接创新生态系统研究领域高频关键词的重要“中介”术语。这里出现了“高频而低中心性”的关键词“雄安新区”表明其尽管被学者经常提起,但是在整个领域的重要性是较低的,一方面,雄安新区近几年才被提出的规划区域,属于热点区域;另一方面目前的研究成果呈现出较高的地域性,而且发文量较多的作者都处于京津冀区域内。

表1 2000-2020RIE 研究高频关键词频次及其中心性

为考察RIE 研究热点主题在不同时期的变化,在关键词共现分析参数设置的基础上,进一步结合国内RIE 的研究关键词时区图谱分析,本研究利用Timezone 命令,如图8 所示国内RIE 研究文献的关键词共现图谱的时区图。时区图中关键词表示其首次出现的时间,后期每出现一次就在最开始出现的位置增加一次,图中的圈越大就表示出现的次数越多,不同时区之间节点的连线显示出研究对象的传承关系[29]。结合图8 与图1 可知,国内RIE 研究大致可以分为4 个演化阶段。第一阶段是2000—2004 年,国内关于区域创新的研究处于萌芽阶段,主要研究在区域创新科技人才集聚和区域创新环境以及生态经济系统等方面[30-31];第二阶段是2004—2007 年,随着区域创新理论的发展,区域创新网络[23-24]、区域创新系统以及产业集群等逐渐受到学者的关注[32-34];第三阶段是2007—2012 年,这个阶段的区域创新理论走向成熟,区域创新体系[35]、RIE 的概念逐渐被提出来[1,36],并且在以后越来越受到关注和发展,同时也衍生出生态位等研究RIE 的方式[37];第四阶段是2012—2020 年,在之前提出的区域创新网络和RIE 理论的基础上逐渐发展了许多方式方法运用到区域创新的研究中去,比如Lotka-Volterra 模型[38]、文献计量[39]、logistics 模型和产业链等[37,40-41]。

图8 RIE 研究关键词演化时区视图

3.3 区域创新生态系统研究前沿趋势分析

突现分析(Citation Burst)是目前文献内容挖掘的重要工具之一,反映活跃或前沿的研究节点。研究前沿趋势是通过突变率检测了解某时期较为活跃的相关文献,并根据文献的变动趋势来追踪该研究的未来走向[42]。本文保持其它参数不变,设置突现的最小单位时间(Minimum Duration)为1 年,运行“Citation/Frequency Burst Histor”功能,生成RIE领域突变性关键词列表,得到24 个突现关键词。CiteSpace 中的突现词指代某一研究领域中突然出现的关键词,代表着在该领域中的研究前沿[43]。通过运用CiteSpace 计量软件中的突现分析功能,本研究得到文献集在不同阶段的突现关键词。

基于CiteSpace V 的相关功能和分析,得到RIE研究领域突变较强的24 个突变词的结果如表2 所示。其中,颜色较深代表该关键词所在领域在本年份曾有相关学者进行研究,颜色较浅代表该关键词所在领域在本年份几乎没有学者涉及,首次出现深色的年份即为该关键词首次被相关领域学者所提及到的时间。本文RIE 研究经历了十多年的发展演变。2003 年,出现关键词“区域技术创新生态系统”的研究热潮,关注生态化、区域创新系统以及产业集群的研究热点;2015 年,在前期研究的基础上突变出现“创新生态系统”的研究热点;2016 年,协同创新、创新驱动、运行机制以及关于京津冀区域创新成为研究热点。与此同时,RIE 的研究前沿趋势主要体现在协同度、生态位适宜度以及共生的研究。从突现强度来看,创新生态系统是在2015 开始出现以后,而RIE 从2018 年开始突现,到目前的突现强度也非常高的,表明创新生态系统和RIE 是接下来研究的一个热点和趋势。

表2 2000-2020 年RIE 突现强度排名前24 的关键词

为使RIE 的研究领域的研究热点和前沿更加全面地展现,本研究运用了关键词战略图分析研究的趋势和热点,如图9 所示。战略图是一种能够更为直观地判断研究热点与趋势的方法。根据夏恩君等[44]的建议,基于高频关键词统计,预测未来主题研究趋势和热点,需要绘制关键词战略图。因为中心性大于0.1 认为是具有较高重要性的关键词,所以本文以关键词频次为X 轴,中心性作为Y 轴,以关键词坐标中值和中心性为0.1 的交点作为原点,建立关键词战略坐标图,如图9 所示。考虑到“区域创新生态系统”“创新生态系统”和“共生”是作为主题相关搜索词,其频次与中心性都较高,可能影响战略图的分布,因此在图中不予显示。结合表2,可以发现:

图9 2000—2020 年RIE 关键词战略图

a 第一象限:主流领域

关键词“区域创新系统”“科技人才积聚”“区域创新生态系统”“共生演化”“区域创新环境”“区域创新”,具有高频次、高中心性,说明这些关键词是2000—2020 以来在创新方面的研究重点,并取得了丰富的研究成果,也展现了与其他主题较高的相关性。

b 第二象限:高潜领域

关键词“生态位”“适宜度”“创新效率”“产业集群”“产业链”等词具有低频次、高中心性,说明该主题在RIE 领域目前虽不是研究重点,但与其他主题相关度较高,未来可能是潜在的研究热点。并且在第二象限的关键词较多,也从侧面说明了对于RIE 的研究还比较分散,研究方向较为纷繁复杂,还需要进一步的深入和探讨。

c 第三象限:孤岛领域

如图9 所示,大部分的关键词处于第三象限,虽然不具有高频和高中心性,但其中不乏未来研究热点关键词。例如,“创新网络”“共生网络”“协同创新”等关键词可与第一、第二象限的关键词结合起来进行分析,有可能会成为未来创新研究的一个细分方向,并发展成为研究热点;而“区域技术创新生态系统”等关键词相关研究数量逐渐减少,研究时间也较长,随着区域创新的发展可能已处于边缘化的位置。

d 第四象限:边缘地带

第四象限具有高频次、低中心性,表明该研究主题的关键词数量较多,但重要性偏低[45]。从图9可以看出,在第四象限只有一个关键词“雄安新区”,说明在选取的文献中,只有“雄安新区”一个高频出现却重要性很低的词,这可能是由于雄安新区是最近提出来的国家战略区域,关注较多,另一方面也可能是目前对于RIE 研究主要是关于京津冀地区的,发文量较多作者也位于京津冀地区,具有较强的地域性特征。另外,也可以从侧面说明本研究文献集的查准率是较好的。

4 结论与展望

本文采用文献计量分析法,基于中国知网、万方数据和维普期刊中收录的北大中文核心期刊、CSSCI 和CSCD 中对RIE 研究的相关文献分析,并进行知识图谱可视化得出以下结论:

第一,从研究文献分布来看,RIE 的研究文章发表量在近五年有了数量上的突破,但是主要集中发表于经济管理类期刊上;并且研究学者也比较分散,在RIE 研究领域还未出现影响力较大的作者,RIE 领域后续还有较大的深入研究空间;在研究机构方面,研究主体主要是高校,并且彼此之间的合作比较缺乏,亟待加强高校间以及研究机构间的合作交流。

第二,从关键词的共现分析和聚类分析来看,RIE 的研究视角仍比较分散,还没有形成相对较为成熟的主题方向。但是可以发现“区域创新系统”“创新生态系统”“区域创新”和“共生演化”等研究主题是目前关于RIE 领域内的研究文献相对较多的主题,同时“适宜度”“科技人才”“生态位”等较为细分的RIE研究方向也逐步进入研究者的视线,逐渐受到学者们的关注。

第三,从关键词的时区演化来看,国内关于区域创新的研究大致可以分为四个阶段,经历了对于区域创新环境、科技人才等研究的萌芽阶段,到对区域创新网络、区域创新体系等的研究阶段,然后产生了RIE 的研究,一直到目前的针对RIE 的很多生态数学模型和理论研究,比如Lotka-Volterra 模型、logistics 模型、生态位以及竞合方式等理论。

第四,从关键词的突变分析和战略矩阵图分析,目前RIE 的研究,最先开始于黄鲁成教授的区域技术创新生态系统的研究[4-6],并且该研究已经逐渐减少,转而集中于创新生态系统、协同创新和创新系统等层面,而RIE 的生态位、适宜度和共生性研究,以及相关的方法和生态数学模型,是新的热点方向。

因此,基于对RIE 国内研究的文献计量分析,结合其他相关研究与实践的进展,本文对RIE 研究的未来发展提出展望如下:

第一,针对不同区域特点和社会背景下的RIE研究有待增强。当今国家提出科技自立自强,实施创新驱动经济发展战略,各个区域也都在大力发展创新,现有对于RIE 研究尚未将区域特点引入到RIE 中,并且研究也主要集中于京津冀的RIE 研究,而对于长三角、粤港澳等RIE 的还有待进一步的深入研究,发现其影响规律。

第二,现有RIE 研究多基于科技文献、专利与统计数据,在反映区域创新投入产出时具有较好的参考作用,但由于二手数据都具有一定时间滞后的缺陷。面对创新主体的层出不穷和信息的快速更新迭代,在研究RIE 中数据的时效性显得更加重要,更能反映区域创新的发展情况。因此,通过整合科学文献、专利、统计数据、网络信息等多源异构数据来研究RIE 是以后研究区域创新的一个方向和趋势。

第三,从生态学和区域特点视角来提升RIE 共生性适宜度。目前的RIE 研究中,已经有部分关于RIE 的共生性和适度方面的研究,对于特定RIE 的稳定性、多样性及其共生性的研究还乏善可陈,对于区域与RIE 间的“能量”“物质”等的合作流动还尚未考虑研究,因此,这也是接下来对于RIE 研究需要关注的一个方面。特别是对于国家的十四五规划发布以后,对科技创新体制机制改革提出更高要求,对RIE 的研究将会进一步深入,如何将特定区域内的创新资源和创新要素合理高效的适配起来并提高创新主体之间的共生性适宜度以及区域创新系统绩效成为急需攻克的难题。