大数据环境下新型研发机构文献计量分析
2020-11-23叶涔涔郭杰丹陈军义范金怡
叶涔涔,郭杰丹,陈军义,罗 锴,范金怡,刘 兴
(1.贵州省科学技术情报研究所,贵州 贵阳 550004;2.贵州省科学技术发展战略研究院,贵州 贵阳 550004)
0 引言
近年来,国家层面高度重视科技创新,深入实施创新驱动发展战略。新型研发机构的诞生正是基于这样的背景,并以星星之火可以燎原之势在全国遍地开花,再加上国家及地方各级政府对该领域发展的重视,出台了一系列资金扶持、税收减免、人才引进等方面的优惠政策支持新型研发机构发展,研究人员对该领域的研究也愈发积极,科研成果丰富,但同时存在一些问题阻碍了该领域的研究,如研究人员对现阶段已有研究成果的了解、掌握不够全面,可能存在低水平重复研究,无法真正形成支撑引领作用的关键成果。中国信息通信研究院发布的《大数据白皮书(2016年)》指出大数据是新资源、新技术、新理念的混合体,且具备量大、高速、多样、真实以及研究价值等多种特性,大数据分析就是从大量数据中挖掘出蕴藏价值的信息,帮助分析者获得全面掌握发展现状的新视角以及数据支撑的决策[1]。本研究通过大数据分析的方式,对中国知网数据库中收录的关于新型研发机构的论文数据进行优化检索和分析,旨在揭示现阶段新型研发机构研究的现状和特点,为该领域的后续研究提供借鉴参考。
1 数据来源与研究方法
本研究的文献数据来源于中国知网,对中国知网收录的关于新型研发机构的论文进行检索,发表时间截止到2020年4月1日,检索条件为:关键词“新型研发机构”,OR主题“新型研发机构”,精确检索。为了尽可能缩小研究误差,基于研究内容对检索出的数据进行清洗,并将评论、新闻报道、政策原文或者政策原文摘录以及政策解读、通知通告、资讯、内容不相关文献予以剔除,最终选择174篇文献开展文献计量分析和研究。
2 新型研发机构文献计量分析
2.1 发文年度计量分析
在检出的174篇文献中,每年发表的论文数量呈递增的趋势,2012年发表2篇,占比1.15%;2013年发表2篇,占比1.15%;2014年发表12篇,占比6.90%;2015年发表9篇,占比5.17%;2016年发表13篇,占比7.47%;2017年发表20篇,占比11.49%;2018年发表38篇,占比21.84%;2019年发表65篇,占比37.36%,达到峰值,2020年截至4月1日已发表论文13篇,占比7.47%(见图1)。由图1可知,新型研发机构的相关文献大量发表基本在2014—2020年,究其原因,主要是在这期间政府对于该领域发展的推动,无论是国家层面还是地方各级政府均印发了大量的政策文件推动新型研发机构发展,促使该领域的研究成果不断涌现。以广东省为例,在2014—2020年,先后印发了《广东省人民政府关于加快科技创新的若干政策意见》(粤府2015〔1〕号文)、《关于支持新型研发机构发展的试行办法》(粤科产学研字2015〔69〕号文),从政策环境、经费补助、税收减免等多方面给予支持,并且印发《广东省自主创新促进条例》(简称《条例》),以立法形式明确各地市加快推进新型研发机构建设,根据该《条例》,广州、佛山、东莞等13个地市出台了新型研发机构的专项政策文件,并且广东省内的15个地市设立了专项资金支持新型研发机构发展。除此之外,江苏、安徽、北京等10余个省(市、自治区)也在这期间出台了相应的管理办法支持新型研发机构发展。
图1 2012—2019年新型研发机构相关文献数量变化趋势
2.2 核心作者发文量分析
将排名在第1位的作者认定为核心作者,通过计量分析,该领域共有145名作者发表文章,每位作者发文量在1~7篇不等,发文量为1篇的作者有130人,占总发文量的74.71%;发文量为2篇的作者有10人,占总发文量的11.49%;发文量为3篇及以上的作者有5人,占总发文量的13.79%(见表1)。由表1可知,虽然研究成果较多,但大部分作者发文量仅为1篇,从一定程度上可以说现阶段大部分作者对该领域的研究浅尝辄止,没有深入持续研究,毕竟一篇论文能够承载的信息量有限,再加上当今社会发展日新月异,一个领域的发展也是在不断的变化中。
表1 核心作者发文量统计
将核心作者发文量按递减形式排列,选取发文量在3篇及以上的作者列出(见表2),以便清晰地了解该领域的核心作者。从表2可以看出,在该领域发文量最多的是广东省科学技术情报研究所的任志宽,共发表7篇论文,其次为陈雪和张玉磊,分别发表6篇和5篇。
表2 发文量3篇以上作者
2.3 论文发表区域计量分析
检出的103家研究机构中发表文献最多的是广东工业大学,发表论文20篇,其次是广东省科学技术情报研究所,发表论文17篇,发表两篇以上论文的研究机构有27家,发表论文数占总论文数的56.32%。研究机构所在地涉及22个省(市、自治区),从地区分布来看,该领域发文量最多的是广东省,共计发表论文72篇,其次是江苏省,累计发表论文24篇,安徽、浙江均发表10篇论文,其余各省(市、自治区)发文量具体情况见如图2所示。根据数据分析结果可推测,发文量或许与地区新型研发机构的发展现状相对应,新型研发机构发展越好的地区,发文量相对就较高。如广东、江苏、安徽等发文量靠前的省份均是我国较早一批出台相关管理办法培育建设新型研发机构的省份。
图2 各省(市、自治区)发文量对比
2.4 论文被引用情况文献计量分析
论文被引情况是评价论文质量的重要指标,根据中国知网中论文的被引频次统计数据可知,被引用频次在0~77次不等,本研究将被引情况分为未被引用(0)、低(1~9)、中(10~19)、高(20~29)、甚高引用(≥30)5个等级[2],以便于了解该领域研究水平分布情况(见表3)。从表3可知,该领域未被引用的文献占比最高,而高引文章(包括高和甚高引用两个等级)占比较低,从一定程度上揭示出,现阶段对于新型研发机构的研究还存在较大的提升空间,高质量的论文较少。
表3 发表论文被引情况分布
高引用文章往往是一个领域研究的风向标,最能反映研究的现状。本研究选取甚高引用(≥30)的文章列出(见表4),以便于帮助广大研究人员了解新型研发机构现阶段的重要学术文献和研究的趋势。
表4 甚高引用(被引次数≥30次)文献
2.5 来源分析
检出的174篇论文发表在82种期刊上(包括大学数据库),该领域发表论文最多的期刊是《科技管理研究》,发表27篇,其次是《广东科技》和《中国高校科技》,分别发表10篇和9篇,选取发文量5篇以上的期刊列出,为今后该领域研究人员选择期刊时提供参考借鉴(见表5)。
表5 发文量5篇以上期刊
2.6 相关文献关键词词频分析
论文的关键词往往能够代表一篇文章的研究重点[8]以及研究方向[9],通过对检出的174篇文献的关键词进行词频分析(见图3),了解该领域的研究重点及研究方向。通过关键词词频分析可以了解到,出现频次最高的关键词毫无疑问是新型研发机构,除此之外,出现频次在10次以上的分别是:创新(81次)>转化、发展(均是20次)>建议、模式、科技成果(均是17次)>科技(15次)>对策(14次)>政策、机制、组织(均是12次)>广东、管理、驱动(均是11次)。由此可见,现阶段该领域的研究方向及重点是对新型研发机构体制机制的研究,具体包括:科技成果转化、组织管理模式、运行机制、政策研究、发展对策建议等。基于对该领域现有研究的分析,建议今后的研究可从以下几个方面开展。
注:字体大小反映关键词出现的频次,字体越大,表示出现的频次越高;关键词越靠近中心说明出现的频次越高。(因关键词较多,为便于观察,图中仅显示出现频次为5次以上的关键词)。
3 新型研发机构研究方向建议
3.1 加强对于其他省(市、自治区)特别是西部欠发达地区新型研发机构的研究
根据上述分析可知,该领域的研究存在明显的地区差异,无论是研究机构发文量还是关键词出现的频次,该领域研究比较集中的区域均是广东省,单从研究机构发文量来看,江苏、浙江、安徽等中、东部地区的省(市、自治区)在该领域的研究成果也比较丰富,与新型研发机构区域发展现状相得益彰。而其他省(市、自治区)特别是西部欠发达地区的研究相对比较薄弱,如贵州、西藏、宁夏等西部省(市、自治区)尚未有检出的文献。建议今后可加强对于其他地区特别是西部欠发达地区新型研发机构的发展现状、发展的优劣势、体制机制障碍等方面的研究并有针对性地提出对策建议。
3.2 采取定量分析的方式开展分析
从检出的文献来看,大部分研究采用的是定性分析方式对新型研发机构开展研究,如:文中表4所列甚高引用(被引次数≥30次)的5篇文献均采用了定性分析,从一定程度上也反映出该领域的研究比较注重定性分析,而采取定量分析的方式开展的研究比较欠缺。建议今后的研究可采用定量分析的方式开展研究,统计分析全国或者某个地区新型研发机构数量,从设立年度、类型、所属行业、主要研究方向、成果转化情况等方面开展统计分析,丰富该领域的研究成果。
3.3 加强对新型研发机构政策实施效果的评估研究
国家层面关于新型研发机构的管理办法虽然出台的时间不算长,但广东、江苏、安徽等10余个省(市、自治区)出台的相关管理办法至今已3年有余,但从检出的文献来看对于政策实施效果的评估分析比较欠缺,建议今后可开展对该领域政策实施效果的评估,结合行业和区域经济社会环境特征建立科学合理的评价指标体系,或者通过问卷调查等多种方式开展政策满意度调查,剖析存在的问题,提出改进意见。