APP下载

中国科技创新研究热点及演化的可视化分析

2021-11-01向筱茜冀晨辉

科技和产业 2021年9期

吴 丹, 向筱茜, 冀晨辉

(1.北方工业大学 经济管理学院, 北京 100144; 2.伦敦帝国理工学院 数学系, 伦敦 SW72AZ)

党的十六届五中全会明确提出了增强自主创新能力、建设创新型国家的战略。随后中国开始加速推动科技创新发展。党的十八大以来,中国政府不断完善科技创新体制机制,鼓励创新主体多元化,推动政产学研合作创新,推进科技资源优化配置,加速提升国家科技创新能力。党的十九届五中全会明确提出“坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑”,强调“面向世界科技前沿、面向经济主战场,完善国家创新体系,加快建设科技强国”。国家“十四五”规划《纲要》从经济发展、创新驱动、民生福祉、绿色生态、安全保障5个方面,制定落实了“十四五”时期经济社会发展的主要指标,其中,创新驱动是推动中国国民经济和社会发展的重要驱动力,处于国家发展全局的核心位置。同时,国家“十四五”规划《纲要》提出了“完善国家创新体系,提升企业技术创新能力,激发人才创新活力,完善科技创新体制机制,全社会研发经费投入年均增长7%以上。”这为中国进一步强化国家战略科技力量,加快实现“跻身创新型国家前列”的国家发展战略目标提供了重要的战略支撑。为此,开展中国科技创新研究热点及演化的可视化分析研究,对于把握中国科技创新的研究热点和未来研究方向,完善国家创新体系具有重要意义。

1 研究方法与数据来源

1.1 研究方法

陈超美教授开发的CiteSpace软件,作为用于分析和可视化共引网络的重要工具,能够将一个知识领域的演进历程集中展现在一幅引文网络图谱上,帮助把知识图谱上的引文节点文献和共引聚类所表征的研究前沿自动标识出来[1]。CiteSpace软件主要包含3种常用可视化方式:聚类视图、时间线视图、时区视图。其中聚类视图侧重于体现聚类间的结构特征,时间线视图侧重于勾画聚类之间的关系和某个聚类中文献的历史跨度,时区视图侧重于从时间维度上来表示知识演进的视图。为此,应用CiteSpace软件,通过国内科技创新研究文献的科学计量学分析,对科技创新的研究热点及演化开展研究。

1.2 数据来源

中国科技创新研究热点及演化的数据样本取自CNKI数据库中的CSSCI期刊文献,文献检索词为“科技创新”,文献检索时间为“1998—2020年”。通过剔除掉会议访谈、会议综述、会议报告等不利于数据分析的文献,共得到2 853篇文献。同时,选择TOP 50为选择标准,设置时间切片为1,调节阈值得到中国科技创新研究的关键词共现图谱、关键词聚类图谱、时间线图、时区图。

2 中国科技创新研究的关键词共现分析与突变分布

2.1 关键词共现分析

关键词是一篇文章的精髓,出现次数最多的关键词常被用来确定某个研究领域的热点主题[2]。使用CiteSpace 5.7.R2中的关键词共现,将1998—2020年中国知网CNKI收录的CSSCI期刊筛选出2 853篇科技创新文献,并进行数据转换,得到CiteSpace5.7.R2可处理的文件格式。同时,设置分板界面,时间设置为1998—2020,Years per slice默认数值为1,节点类型选择“Key-word”。最终,得到中国科技创新研究的关键词共现图(图1)。

图1中共包含节点867个,连线数量1 820条,网络密度为0.004 8。其中,节点越大,说明该节点词的词频越高;频次越高,说明该词在网络中的中心性越高[3]。根据图1可知,中国科技创新的研究热点重点体现在科技创新能力、科技创新效率、科技创新政策、科技创新体系、科技创新团队、科技创新平台、区域科技创新、农业科技创新、高校科技创新等方面。

图1 中国科技创新研究的关键词共现图

2.2 关键词突变分布

突变词主要是以关键词为基础,在某个时间跨度所发表的文献中专业术语的突显,反映出不同时段的研究热点,主要表现在突变词的年代分布和突变强度两个方面[4]。应用CiteSpace软件,得到国内科技创新文献中前20个突变词,主要包括知识经济、农业、高新技术产业化、科技期刊、高校科技创新、研究型大学、科技创新体系、科技创新平台、机制、指标体系、知识产权、对策、技术创新、高校、自主创新、评价、创新能力、科技创新人才、科技创新政策、创新驱动(表1)。

表1 中国科技创新文献中前20的关键词突变分布情况

根据表1,从中国科技创新文献中前20的关键词突变分布情况来看,随着时间推移,中国科技创新的研究热点不断变化,主要可分为3个阶段。①2000—2006年,农业科技创新、高校科技创新、研究型大学、科技创新体系与机制等成为主流的研究热点[5];②2006—2012年,科技创新体系、指标体系、知识产权、科技创新对策、技术创新、科技创新评价、科技创新能力、科技创新人才成为研究热点;③2012—2020年,中国科技创新的研究热点主要集中在科技创新政策、创新驱动等方面。

3 中国科技创新研究的关键词聚类分析

3.1 关键词聚类图

CiteSpace软件在聚类标签的提取上提供了4种标签提取算法:LSI(潜语义索引)、TF*IDF加权算法(系统默认的自动标签词提取算法)、LLR(对数似然比检验)、MI(互信息算法)[6]。综合来看,使用LLR算法进行的聚类所提取的标签更加符合实际情况且重复情况少。同时,Muscularity(模块化)度量了网络可以划分为多个独立块(模块)的程度。低模块化表明不能将网络简化为具有清晰边界的聚类,而高模块化则意味着网络结构良好。通常,Muscularity的值介于0.4~0.8,说明适合聚类[7]。Silhouette(轮廓度量)是在解释聚类性质时,用来估计聚类所涉及的不确定性。聚类的轮廓值在-1到1之间,表示解释聚类的性质时需要考虑不确定性。通常Silhouette >0.5,则聚类合理;Silhouette>0.7,则聚类令人信服。如果某一聚类的轮廓度量为1,表示它与其他聚类完美分离[8-9]。为此,使用LLR算法,对国内科技创新文献的关键词进行聚类分析,其中,MuscularityQ=0.605 8,Silhouette=0.862 9。最终,得到中国科技创新研究文献的关键词聚类图(图2)。

图2 中国科技创新研究的关键词聚类图

根据图2,中国科技创新研究主要包括8个关键词聚类:#0科技创新、#1科技创新能力、#2科技创新效率、#3高校科技创新、#4创新能力、#5经济增长、#6农业科技创新、#7粤港澳大湾区。其中,从数字0到7看,数字越小,说明聚类中包含的关键词越多。

3.2 时间线分析

以关键词聚类分析为基础,可进一步剖析中国科技创新研究的关键词聚类的时间演变趋势。选择CiteSpace 软件中的“Timeline View”后,调整相关数值,得到中国科技创新研究的关键词时间线图(图3)。

根据图3,对中国科技创新研究的8个关键词聚类的时间线进行分析。其中:

1)聚类“#0科技创新”与剩下的几个聚类连线较为密集,各聚类彼此之间的连线也较为密集,说明各个聚类之间具有高度相关性。该聚类时间线上最大的关键词节点是“科技创新”,与该节点相关的文献最早出现在1998年。从图3中可看出,“科技创新”一直是研究热点并且频繁出现在其余的聚类中。

图3 中国科技创新研究的关键词时间线图

2)聚类“#1科技创新能力”与聚类“#0科技创新”类似,该聚类时间线上最大的关键词节点是“科技创新能力”,相关文献最早出现在1998年。究其原因,1998年,中科院实施“知识创新工程”,作为建设国家创新体系的试点。同年5月,江泽民同志在庆祝北京大学建校100周年大会上宣告:“为了实现现代化,我国要有若干所具有世界先进水平的一流大学”[10]。同时,1998年出现“科技人才队伍”“国家创新体系”等研究主题。

3)聚类“#2科技创新效率”从2005年开始引起关注。该聚类上最早出现的关键词节点是“DEA方法”。DEA方法由美国著名运筹学家查恩斯(Clearness)、库伯(Cooper)和罗兹(Deerhound)等于1978年提出,可评价具有多个输入和多个输出的决策单元的相对有效性[11]。如学者尤瑞玲等运用超效率DEA,对2004—2015年北京市及中国沿海地区12个省(市、区)的科技创新效率进行了评价[12];李嘉怡等采用DEA方法,评价广东省21个地级市的科技创新能力[13]。研究发现,国内科技创新效率评价多以DEA方法为主,评价方式比较单一。

4)聚类“#3高校科技创新” 主要包括“研究性大学”“人才培养”“创新体系”等关键词节点,最早的关键词节点出现在1998年,这与聚类“#1科技创新能力”的关键词节点“科技人才队伍”出现的时代背景一致,说明从1998年起,国家重视高等院校人才培养。根据图3可知,2019—2020年,聚类“#3高校科技创新”的关键词节点几乎为零,说明2019—2020年该聚类的关注度降低。

5)聚类“#4创新能力”中最大的关键词节点是“灵感思维”。许志峰对中外科技史上数百件灵感创新活动进行了概括,发现“灵感”是创新的重要思维方式之一[14]。此外,聚类“#4创新能力”包括“科技创新团队”“人才”“科技投入”等重要的关键词节点,均是影响创新能力的关键因素。党的十九大报告提出:“坚持陆海统筹,加快建设海洋强国”,推动海洋科技创新是建设海洋强国必不可少的重要措施。2019年,中国创新能力的关注点从“人才”“团队”转变为“海洋强国”。

6)聚类“#5经济增长”中最大的关键词节点是“经济增长”,最相关文献最早出现于2007年。聚类“#5经济增长”的关键词节点“经济增长”与其他7个聚类密不可分,其他7个聚类中均出现关键词节点“经济增长”,说明科技创新与经济增长密切联系,科技创新是影响经济增长的关键驱动因素[15]。

7)聚类“#6农业科技创新”中最大的关键词节点是“农业科技创新”,相关文献最早出现在1998年,陈友云等从基本前提、根本目标、主要内容和必要措施4个方面,对中国新的农业技术革命进行了讨论,提出农业发展和科技进步必定会带来新的农业技术革命[16]。2012年中央一号文件聚焦农业科技创新,因此,2012—2020年,关键词节点“农业科技创新”出现的频次增多。

8)聚类“#7粤港澳大湾区”涉及的文献较少,最早与之相关的文献出现在1998年,涉及关键词节点“国际合作与交流”。2019年2月18日,党中央、国务院正式公开发布《粤港澳大湾区发展规划纲要》。把粤港澳大湾区建设成“具有全球影响力的国际科技创新中心”是应对新一轮科技革命挑战、参与全球竞争、提高国家竞争力的重要砝码[17]。2019—2020年,与“粤港澳大湾区”相关的研究文献数量有所增加。

纵观图3中的关键词时间线图分布发现,科技创新一直是中国政府管理部门和学术界的研究热点。但随着不同时期国家政策的调整,关注热点随之改变。同时,科技创新的成果不再单一应用于企业,也广泛应用于高校、农业等其他领域。

3.3 关键词时区分析

关键词时区图侧重于从时间维度上来表示知识演进,可清晰展示某领域文献的更新和相互影响[18]。为此,在剖析中国科技创新研究的关键词聚类的时间演变趋势基础上,进一步得到中国科技创新研究的关键词时区图(图4)。

图4 中国科技创新研究的关键词时区图

根据图4,1998—2020年中国科技创新研究可划分为3个阶段[19]。①1998—2006年,中国科技创新研究主要以中小企业为主体,以政府支持为引导,构建国家创新体系,重点围绕农业科技创新、科技创新能力、高校科技创新、中小企业、科技创新体系、国家创新体系等关键词开展研究;②2006—2012年,中国科技创新研究主体多元化,不仅限于企业技术创新,同时涉及科技创新平台、科技创新团队、科技创新效率、科技创新评价、指标体系等为研究主题;③2012—2020年,中国科技创新研究主要涉及科技创新政策、粤港澳大湾区、创新驱动、协同创新等为研究主题,为推动中国区域科技协同创新、把中国建设成为科技强国提供了重要支撑。

4 结论

利用CiteSpace 5.7.R2绘制了中国科技创新研究文献的关键词共现图谱、关键词聚类图谱、关键词时间线图谱和关键词时区图。研究表明,不同时期中国科技创新研究的侧重点不同,中国科技创新不单以企业技术创新为重点研究方向,国家政策是影响科技创新研究的主导因素。创新是引领发展的第一动力,中国始终坚持创新驱动发展,把科技创新摆在国家发展全局的核心位置,以科技创新造福人类,努力建设成为世界领先的科技创新中心。