基于文献计量的创新创业教育知识图谱研究
2020-10-30曹之然
曹之然
(聊城大学 商学院,山东 聊城 252000)
0 引言
创新创业学科高校教师的职业使命是培养创新创业人才,他应该专注于创新创业教育领域,致力于创新创业教育产品的研发、试验与推广,其中,创新创业教育产品的研发是其首要工作。正所谓“道生一,一生二,二生三,三生万物”,创新创业教育产品研发的逻辑起点就是老子所说的“道”,即创生万物的根本原理,也是Aristotle所说的“第一性原理(First Principle)”,即在每个系统探索中存在的基本命题和假设。创新创业教育领域已有丰富的成果,为了给创新创业教育产品的研发奠定一个更加科学的理论基点。考虑到篇幅限制,本文的研究对象仅限于国内创新创业教育文献。
1 数据来源与研究方法
为了全面收集样本数据,考虑到在不同的数据平台上拥有不同的资源使用权限,结合使用了维普资讯中文期刊服务平台、中国知网(CNKI)和万方数据知识服务平台3个数据库。利用高级检索功能,检索条件设置如下:①字段选择“主题”。若选择“篇名”就会因为难以穷尽近义检索词而漏检,比如“创新创业教育”的近义检索词有“创新创业教学”“创新创业课堂”“创新创业人才培养”“创业精神培养”“创客教育”等。若选择“关键词”或“摘要”就会因为其规范化问题而损失检索质量。“主题词”是规范化的检索语言,它确保了较高的查全率和查准率。②检索词输入“创业教育”,检索方式选择“精确”,时间不限。③期刊类别选择“中文社会科学引文索引(CSSCI)”,它在质量上具有较高的公信力,确保了样本数据的可靠性和代表性。然后对检索到的样本数据进行人工识别,剔除重复的和与主题相关性弱的论文,如书评、会议通知、政策文件等,最终收集到有效样本文献2 572篇,检索日期2019年4月10日。
文献研究方法有内容分析法和文献计量法。内容分析法是先定性分析再定量分析文献内容特征变量的方法,有助于深度挖掘变量内部的维度结构和变量之间的逻辑关系,但是在数量庞大的文献数据面前就会产生以偏概全的风险。文献计量法是先定量分析再定性分析文献形式特征变量的方法,有助于科学探索某一学科领域的整体发展状况,但是却难以深入内容主题探究科学规律。面对数量庞大的国内创新创业教育文献,按照先整体后局部的研究顺序,本文采用文献计量法。
2 创新创业教育文献分布
2.1 文献年度
道法自然,世间万事万物的发展都遵循着播种、萌芽、成长、成熟、衰退的普遍规律,国内创新创业教育的发展也不例外。①播种,标志性事件是联合国教科文组织于1989年11月27日在北京召开的“面向21世纪教育国际研讨会”,大会通过了《学会关心:21世纪的教育——圆桌会议报告》,报告中首次提出了“创业教育”的概念,即开展事业心和开拓技能教育,并称它为与学术教育、职业教育同等重要的“第三本教育护照”。1995年,联合国教科文组织颁布了《关于高等教育的变革与发展的政策性文件》,指出高等教育培养的不应只是求职者,还应是成功的企业家和工作岗位的创造者。这一时期的文献数据没有在图1中呈现出来,原因是现已开发的CSSCI数据库始于1998年,实际上武夷山1988年在《国际科技交流》期刊上发表的《美国的企业孵化器》一文中就首次使用了“创业教育”,它是国内创新创业教育研究的开端,随后每年都有相关文章发表,只是这一时期的发文量较少,截至1997年,10年间发文总量不足百篇。②萌芽,标志性事件是1998年5月举办的首届清华大学创业计划大赛。同年,清华大学在国内首次开设了MBA创新创业管理方向的教育课程。1999年,由共青团中央、中国科协、全国学联主办,清华大学承办的首届“挑战杯”中国大学生创业计划竞赛掀起了大学生创新创业浪潮。2002年4月,教育部确定了清华、北大等9所高校为创业教育试点院校。“试点”是这一时期的主要特征,说明事物的发展面临不确定性,要么消失在萌芽阶段,要么进入到成长阶段。图1显示,这一时期的CSSCI文献数据除了2003年和2005年有所回落以外,整体处于缓慢增长的态势,直到2008年年度发文量首次破百。③成长,标志性事件是教育部于2010年5 月下发了《关于大力推进高等学校创新创业教育和大学生自主创业工作的意见》,要求高等学校落实创新创业教育的全面覆盖,既要面向全体学生,又要融入人才培养全过程,并把创新创业实践作为创新创业教育的重要延伸。2012年8月1日,教育部办公厅印发了《普通本科学校创业教育教学基本要求(试行)》,内容涉及教学目标、教学原则、教学内容、教学方法和教学组织等5个方面。2015年5月13日发布的《国务院办公厅关于深化高等学校创新创业教育改革的实施意见》中明确提出了2017年要普及创新创业教育、2020年要建立健全创新创业教育体系的奋斗目标,说明我国创新创业教育在最近几年仍将处于成长阶段。图1显示,2010-2014年的年度发文量在200~300篇区间波动,2015-2017年的年度发文量呈快速增长的态势,2018年略有回落。
图1 文献年度分布
2.2 文献期刊
联系是世界上一切事物的客观本性,科学技术的任一学科也不例外,它都或多或少、或远或近地与其他学科相关联,表现在外就是一个学科的文献分散在其他学科的期刊上。英国著名文献学家Samuel Clement Bradford[1]认为,如果将科技期刊按照其刊载某个学科主题文献的数量以递减顺序排列,那么就可以把这些期刊分为核心区、相关区和边缘区,各分区的文献数量比例是1:1:1,各分区的期刊数量比例是1:n:n2。本次检索涉及到的CSSCI来源期刊总共288种,其核心区根据比利时著名情报学家Leo Egghe[2]提出的公式r0=2ln(eE×Y)计算,式中r0是核心区期刊数量、E是欧拉常数0.577 2、Y是最大载文量期刊的载文量。本研究中最大载文量期刊是《中国高等教育》,其载文量是137篇,则r0=2ln(e0.5772×137)≈11,说明核心区是载文量排名前11位的期刊,见表1。核心区的11种期刊约占期刊总数的3.82%,载文量共计824篇,约占文献总数的32.03%。核心区以外的其他每种期刊载文量都不足40篇,载文量只有1篇的期刊有129种。由期刊所属学科不难发现,国内创新创业教育文献在教育学期刊上分布相对集中,同时广泛地分布于经济学、管理学、情报学、社会学、统计学、心理学等多学科期刊上,说明创新创业教育受到了各个学科的关注,这与创新创业教育自身的多学科属性不无关系。
表1 文献期刊分布
2.3 文献作者
美国情报科学创始人之一Derek John de Solla Price[3]认为,核心作者群中最低产作者发文量M是最高产作者发文量Nmax的平方根的0.749倍,公式表示为M=0.749×(Nmax)1/2,并且核心作者群的发文总量约占所有作者发文总量的50%。本次检索的国内创新创业教育研究领域中最高产作者是东北师范大学思想政治教育研究中心的王占仁教授,其以独立作者或者首位作者发表的文章数量高达23篇,代入上述公式计算可得核心作者群中最低产作者的发文量是4篇,据此统计出核心作者38人,核心作者群发文总量262篇,占所有作者发文总量的10.19%,距离50%近40个百分点,表明国内创新创业教育研究领域尚未形成严格意义上的核心作者群。不难发现,Price认定核心作者的指标是发文量,它的本质是数量决定论。核心作者应该是对某一领域有杰出贡献的人,其贡献大小即创造价值的多少,理论上它等于该作者的每一篇论文所创造的价值量的总和,所以它取决于每一篇论文的质量和所发表论文的数量,操作上可以用论文的被引量和作者的发文量两个指标分别测度。美国物理学家Jorge E.Hirsch[4]提出了统合论文被引量和作者发文量的h指数,即某一学者在一定时间内发表的论文至少有h篇的被引频次不低于h次。统计了38位核心作者的h指数,并按照h指数从高到底的顺序排列,表2罗列了h指数5的作者及其发文量和所属机构,可见位列前三的作者分别是黄兆信、王占仁、徐小洲,他们在国内创新创业教育研究领域影响较大,以他们为核心的科研团队成果颇丰,他们所属的温州医科大学、温州大学、东北师范大学、浙江大学也都是名列前茅的发文机构。
表2 文献作者分布
2.4 文献基金
基金表明需求,基金类别表明需求主体,基金额度表明需求程度,基金是某学科领域研究价值的一种体现。CNKI给出了按照发文量由多到少的顺序排列的前39项基金,基金论文合计928篇、占比36.72%,其中,国家级589篇、占比23.31%,部级76篇、占比3.01%,省级73篇、占比2.89%,厅级181篇、占比7.16%,市级9篇、占比0.36%。因为论文挂靠高级别基金项目可能优先录用的诱惑,真实数据会有所出入,上述数据只是在某种程度上反映出创新创业教育研究得到了各级政府的资助,国家科学基金位于主导地位,从另一角度理解是国内创新创业教育研究的基金来源单一,其他科学基金位于从属地位。此外,本文还从时间视角对发文量前三名的国家社会科学基金、国家自然科学基金、全国教育科学规划进行了统计,见图2。国家社会科学基金论文最早出现在2006年,处于较快的上升通道,每年的发文量较大,发文量合计236篇;国家自然科学基金论文最早出现在2001年,处于中间的上升通道,每年的发文量居中,发文量合计176篇;全国教育科学规划论文最早出现在2010年,处于较慢的上升通道,每年的发文量较小,发文量合计95篇。综合来看,国家科学基金论文整体处于上升通道,2010年之前增长相对缓慢,2011年出现大幅增长,2015年再现大幅增长,背后是推进和深化创新创业教育的政府支持。
图2 文献基金分布
3 创新创业教育研究热点
3.1 关键词频次与中心度分析
中国科协学会学术部[5]早在2002年8月发文规范了关键词的选择:①学术论文必须在摘要后列出至少4个关键词。②第一个关键词列出该文主要工作或内容所属的二级学科名称。第二个关键词列出该文研究得到的成果名称或文内若干个成果的总类别名称。第三个关键词列出该文在得到上述成果或结论时采用的科学研究方法的具体名称。第四个关键词列出该文主要研究对象的事或物质的名称,或者题目中出现的作者认为重要的名称。如有需要,第五、第六个关键词等列出作者认为有利于检索和文献利用的其他关键词。调查发现,虽然学者们在选择关键词时大多都没有严格遵照这一规范,但是其选择的关键词却能较好地体现论文的研究内容。CiteSpace统计结果显示,2 572篇有效样本文献中共有328个关键词,由于篇幅限制,表3只罗列出频次排序前20位的关键词及其中心度。“创业教育”的频次最高、中心度最大,它验证了样本文献的可靠性,但是却反映不出创新创业教育研究的细分主题,所以在形成知识图谱时应该去除,类似的关键词还有“创新创业教育”“创新教育”。“大学生”的频次和中心度都位居第二,它反映了创新创业教育研究的研究对象,同类的高频关键词还有“大学生创业”“高校”“创业型大学”“学校”“高等教育”“高职院校”,说明国内创新创业教育研究的研究对象主要是高等教育院校及其学生,“农民工”“新生代农民工”“农民”鲜有提及,“儿童”“青少年”“家庭”还未出现。“创业”的频次和中心度较高,它代表的是创新创业实践活动,同类的高频关键词还有“创新创业”“创新”。“创业能力”中心度0.17,高居第三,它聚焦的是创业者,同类的高频关键词还有“人才培养”“创业意向”“创业意愿”。“创业环境”频次86、中心度0.14,它反映了创业环境也是创新创业教育研究的热点之一,同类的高频关键词还有“创业政策”。“就业”频次76、中心度0.13,它反映了国内创新创业教育研究对大学生就业问题的高度关注。排序第21位的“美国”频次53、中心度0.07,它反映了国内创新创业教育研究对他国创新创业教育经验的借鉴,同类关键词还有“英国(频次7)”“日本(频次4)”“韩国(频次3)”“德国(频次2)”,其中心度都是0。综上可知,国内创新创业教育研究的研究对象单一、研究内容丰富,主要围绕大学生的创新创业实践活动、创新创业人才培养、创新创业环境、就业、创新创业教育他国经验展开。
表3 关键词频次与中心度
3.2 关键词共词分析
关键词频次与中心度虽然在某种程度上反映了国内创新创业教育研究的热点及趋势,但是仅仅按照频次高低线性排列关键词,并不能直观地、客观地反映它们之间的亲疏关系,为此需要进行关键词的共词分析。共词分析的基本原理是对关键词两两统计它们在样本文献中共同出现的频次,频次越大说明这两个关键词之间的关系越紧密,频次越小说明这两个关键词之间的关系越疏远。统计方法是在数据库中对关键词进行两两共词检索,或者是借助BibExcel等文献分析软件进行统计,由此本研究得到了328×328的共词矩阵,表4呈现了频次排名前10位关键词的共词矩阵。该矩阵是一个对称矩阵,主对角线上的数值是关键词与自身的共现频次,即该关键词的频次;非主对角线上的数值是两个不同关键词的共现频次,即这两个关键词同时出现的文献篇数。比如“创业教育”与“大学生”的共现频次是153,即这两个关键词在153篇样本文献中同时出现,而“创业教育”与其他关键词的共现频次相对较低,说明“创业教育”与“大学生”关系更加紧密。
表4 关键词共词矩阵
表5 关键词相关矩阵
3.3 关键词聚类分析
为了更加直观地显示频次、中心度、共现强度等关键词特征,揭示国内创新创业教育的研究热点及其发展规律,我们需要对关键词进行聚类分析(Cluster Analysis)。关键词聚类分析的基本原理是在没有先验知识即所要划分的类是未知的前提下,依据关键词的特征数据,把关系紧密的关键词聚集起来形成类别划分。启动CiteSpace.5.3.R11,创建New Projects,Time Slicing时间跨度选择1998-2018,Node Types节点类型选择Keyword,Thresholds三个阈值都设定为(4,3,20),即选择出现频次大于等于4、共现频次大于等于3、相似系数大于等于0.2的关键词进行聚类分析。运行结果显示,关键词共现知识图谱中包含Nodes节点132个、Links连线211条。进入可视化界面,待系统自行优化后,呈现的关键词共现知识图谱节点重叠、连线交织、难以识别,在此基础上去除“创业教育”“创新创业教育”“创新教育”“论点摘编”“研究热点”“知识图谱”等不能反映创新创业教育研究细分主题的关键词,然后调试标签阈值、字体大小、节点大小、图形颜色,最终得到的关键词共现知识图谱如图3所示。图中节点表示关键词的自身属性,关键词出现频次越高,节点越大;关键词出现时间用节点渐变色表示,时间越早颜色越浅,时间越晚颜色越深。图中连线表示关键词的关系属性,关键词中心性越强,连线越多;关键词共现频次越高,连线越粗。图3显示了频次在36次及以上的关键词,其中“大学生”“创业”“创新创业”“高校”“大学生创业”的节点较大、连线较多,反映了国内创新创业教育研究领域的热点问题。
图3 关键词共现知识图谱
为了更加直观地呈现国内创新创业教育研究的热点,在关键词共现知识图谱的基础上进行聚类分析。首先点击Find Clusters功能按钮,Modularity Q的数值显示0.604 9,说明聚类之间的耦合关系偏松散,Mean Silhouette的数值显示0.559 4,说明聚类内部的同质性平均值位于中等偏上,整体而言聚类结果较为理想。然后依次点击LLR按钮、K按钮,按照LLR算法选取有代表性的关键词命名并显示聚类标签,调试优化后的关键词聚类知识图谱如图4所示。CiteSpace将国内创新创业教育研究领域自动划分成了八个聚类,大大提升了聚类效率,但是聚类结果尚存缺陷,比如名称相近、类别过多、逻辑不清。为了进一步提升聚类质量,我们在此基础上根据每一关键词的内涵进行人工聚类,最终聚合出前后逻辑关联的三大类别:①面向“创新创业活动有何规律”的创新创业活动规律研究,它是创新创业教育的前因变量。具体内容有“创业意愿”“创业意识”“创新能力”“创业能力”“创业素质”“创业自我效能”等所归属的创业者研究,有“新常态”“政策”“社会资本”等所归属的创业环境研究,还有“创新”“创业”“创业绩效”“影响因素”等所归属的创业活动研究。其中,创业者和创业环境可以视为影响创业活动的内因和外因。②面向“创新创业教育如何开展”的创新创业教育系统研究,它是创新创业教育的自身属性。“高等职业院校”“高校”“大学”是创新创业教育的实施主体,“大学生”“研究生”“大学毕业生”是创新创业教育的实施对象,“人才培养模式”“人才培养质量”“创业教育体系”“创业教育模式”“实践教学”“课程体系”是创新创业教育的研究内容,“美国”表明了国内创新创业教育的他国经验借鉴。③面向“创新创业教育有何影响”的创新创业教育影响研究,它是创新创业教育的结果变量。创新创业教育播种了“创业精神”“工匠精神”,引发了“教学改革”“教育改革”,促进了“大学生就业”,形成了具有“创业文化”的“创业型大学”和“创业型经济”。
图4 关键词聚类知识图谱
为了进一步探索国内创新创业教育研究的发展规律,本文在前文文献年度分布研究的基础上,通过对CiteSpace给出的被引频次最高的57个关键词及其突发年份和关键词聚类知识图谱Timeline视图(图5)的综合分析,将国内创新创业教育研究的发展大致划分为4个阶段:1999-2004年的尝试探索阶段,“大学毕业生”“就业”“创业教育”等关键词表明了创业教育解决大学毕业生就业问题的研究主题;2005-2009年的经验学习阶段,“创业活动”“创业环境”“创业政策”等关键词表明了创业活动管理的研究主题,“创业型人才”“大学生创业教育”“创业教育体系”等关键词表明了创业型人才培养的研究主题,“美国”“启示”则表明了以上主题的他国经验借鉴;2010-2014年的全面推进阶段,“地方高校”“高等职业院校”“创业型大学”“创业精神”“创业教育模式”“校企合作”“创业动机”“创业意愿”等关键词表明了在高校和高等职业院校全面推进创新创业教育的研究主题;2015-2018年的深化与体系化建设阶段,“创业课程”“创业绩效”“众创空间”“创客空间”“创客教育”“大众创业”“生态系统”“协同创新”等关键词表明了创新创业教育研究从宏观到微观、从学校到社会的发展态势。
图5 关键词聚类知识图谱Timeline视图
4 结语
本文采用文献计量法研究了1998-2018年20年间来自CSSCI期刊的2572篇创新创业教育文献,研究内容有创新创业教育文献分布和创新创业教育研究热点。文献分布部分,年度发文量印证了国内创新创业教育经历的播种、萌芽、成长发展过程;根据公式r0=2ln(eE×Y)识别出了国内创新创业教育领域的11种核心区期刊;结合公式M=0.749×(Nmax)1/2和h指数识别出了国内创新创业教育领域的核心作者群;基金发文量体现了推进和深化创新创业教育的国家意志。研究热点部分,经过关键词频次与中心度分析、共词分析、聚类分析,聚合出了创新创业教育的前因变量、自身属性、结果变量等三大主题,发现了主题演变历经的尝试探索、经验学习、全面推进、深化与体系化建设等4个阶段。展望未来,创新创业教育应该从讲座、阅读、视听、示范等知识留存率较低的被动式学习到研讨、实践、教导等知识留存率较高的主动式学习,其关键路径是让创新创业实践成为创新创业课堂;创新创业教育应该从关注大学生群体到关注青少年、农民、职员等更广泛的群体,尤其是青少年的创造力培养;创新创业教育应该从高校经济管理专业到高校其他专业、家庭、企事业单位、社会等更广阔的空间,尤其是作为人生第一所学校的家庭。