教育学学科领域大数据研究热点主题可视化分析*
2018-11-05吕红
吕 红
(湖北医药学院 公共卫生与管理学院,湖北 十堰 442000)
伴随着大数据技术的发展,蕴藏着海量数据的教育行业正成为大数据分析的重要应用领域。教育大数据对教育领域改革与创新发展具有重要影响,其正在成为一股推动全世界教育系统变革的重要推动力。大数据在教育教学中的应用具有重要作用,大数据及其应用正逐渐辐射到教育行业。[1]从学科层面看,教育学科在国内人文社会科学领域大数据研究中所占的比重呈现逐年增加的态势[2],这在一定程度上反映出教育学领域对教育大数据及其相关问题的探讨吸引着越来越多的研究人员。为更好地推动教育大数据及其相关问题的研究,本文基于南京大学开发的中文社会科学引文索引(Chinese Social Sciences Citation Index,以下简称“CSSCI”)对国内教育学科领域针对大数据及其相关问题的研究热点主题进行识别。
一、数据来源说明
CSSCI来源期刊具有较高的权威性[3],通常,CSSCI来源期刊在国内各个学科领域具有相当高的学术影响力和典型代表性,是国内各学科内受认可度普遍较高的学术刊物。CSSCI数据也经常被用于分析学科研究热点与研究前沿主题。[4-7]经文献调研发现,目前已有的研究仅选择中国知网CNKI数据库作为教育学学科领域大数据研究热点与趋势分析的数据来源[8-12],还鲜有研究者选择CSSCI数据库作为该研究主题分析的数据来源。同时,考虑到CSSCI的权威性、影响力和代表性,以及本研究对文献引用数据的现实需要,笔者选择提供引文数据的CSSCI作为数据检索来源。在CSSCI来源文献检索界面,通过篇名(词)、学科类型、文献类型和发文年代四个限定条件进行高级检索,检索表达式及结果如下:篇名(词)=大数据 and文献类型=论文 and学科类型=教育学 and年=1998-2016,共检索出159篇文献,检索时间为2017年7月13日。
基于CSSCI文献检索结果分析发现,国内教育学学科领域的大数据研究始于2013年,起初就有18篇CSSCI来源文献发表,表明教育学学科领域对大数据这一新兴信息技术和理念有强烈的关注和兴趣。同时,国内教育学学科领域大数据研究呈现出逐年上升的态势,表现为从2013年的18篇增长到2014年的25篇,2015年53篇,再到2016年63篇,这反映出自2013年以来,教育学学科领域对大数据相关研究持续关注。伴随着大数据技术及其理念在教育学理论与实践应用层面的探索,笔者认为教育学学科领域对大数据及其相关问题的学术研究关注度还会进一步持续和深化,将在研究文献量保持平稳增长的同时,在研究内容方面进行更加深入的探讨,并逐步形成由大数据基础理论、大数据技术与方法以及大数据实践应用三个层面构成的教育学领域大数据研究内容框架体系,从而促进教育学领域大数据研究的深入发展。总之,从CSSCI来源文献的增长变化趋势来看,教育学领域大数据及相关问题研究有可能成为国内教育学学科领域的新兴研究热点之一。
二、重要期刊情报源分析
基于CSSCI的数据分析发现,159篇文献刊发在49种期刊中,刊均载文数值约3篇,目前国内教育学领域大数据研究成果集中在少量期刊上,表现为占总期刊数量77.55%的38种期刊载文量不超过刊均载文数值,且占总期刊数量57.14%的28种期刊仅刊发了1篇文献。有11种期刊的载文量超过了刊均载文数值,共载文108篇,占总文献量的67.92%,见表1。可见,表1所列期刊是目前国内教育学领域大数据研究的重要期刊情报源。表1中所列期刊均是CSSCI(2017-2018)来源期刊,约82%的期刊是教育学CSSCI来源期刊,仅2种期刊不属于教育学领域CSSCI来源期刊,分别是《思想理论教育导刊》、《情报科学》。按载文量来看,排在前3名的期刊分别是《现代教育技术》、《中国电化教育》、《电化教育研究》,载文量分别是31、23和12篇,可见,该3种期刊对教育大数据及其相关研究的关注程度较高。此外,从表1所列11种期刊所刊载文献的研究内容主题来看,主要涉及五个研究主题,分别是基于教育大数据的个性化教育、学习分析及其隐私保护、大数据时代下的人才培养模式与教育评价、教育大数据的技术体系与发展趋势、基于大数据理念的教育应用与教育改革。
表1 国内教育学领域大数据研究的重要期刊情报源
三、研究热点主题可视化分析
研究热点主题识别有助于领域研究者对研究内容框架的设计思考,并帮助其更好地把握领域的创新研究方向。[13]利用作者标注的文献关键词统计及其共词聚类分析能一定程度上表征出研究内容视域下学科领域研究主题及其热点的分布情况[14-15],目前,基于高频关键词的共词聚类分析结果常被作为识别学科或领域研究热点主题的方法之一。文献关键词统计结果显示,目前教育学领域对大数据的研究篇均关键词较低,159篇论文共涉及433个关键词,篇均关键词约2.7个,同时存在大量的低频关键词,表现为占总关键词数量近90%的关键词仅出现过1次。在高频关键词阈值选择方面,有研究指出,可以选择累积频次的34%进行高频词的选择,作为热点高频词来分析研究热点。[16]统计分析发现,频次≥2的关键词总数为49个,其关键词累计频次占总频次约42%,超过累积频次34%的热点高频词阈值标准。因此,为实现研究热点主题识别的研究目的,笔者选择这49个关键词作为高频关键词并进行共词聚类分析以及研究热点主题分析。需要指出的是,在构建作者关键词共现矩阵之前,为弥补不同作者使用的同义关键词对聚类分析结果准确性的影响,笔者先根据文章内容对部分同义关键词进行统一合并处理。具体如下:关键词“伦理道德”、“伦理”统一合并为“伦理问题”;关键词“安全隐私”、“隐私”、“数据隐私”统一合并为“数据隐私”;关键词 “个性化学习”、“自适应学习”、“适应性学习”、“自适应学习系统”、“个性化自适应学习”统一合并为“个性化自适应学习”;关键词“个性化教学模式”、“个性化教育”统一合并为“个性化教育”;关键词“个性化评价系统”、“个性化学习评价模型”、“个性化分析模型”、“个性化学习分析模型”统一合并为“个性化学习分析模型”;关键词“改革创新”、“高教改革”、“教育改革”统一合并为“教育改革”;关键词“综合评价”、“评价”、“教育评价”统一合并为“教育评价”;关键词“人才培养”、“人才培养机制”、“人才培养模式”统一合并为“人才培养模式”;关键词“人才评价”、“人才评价体系”统一合并为“人才评价体系”。通过自编VBA程序对高频关键词进行共现统计处理,并生成49×49的高频关键词原始多值共词矩阵,频次≥5的关键词数据见表2。从高频词的频次绝对值来看,排名第一的高频关键词为“大数据”,其频次达到100,而排名第二的高频关键词为“教育大数据”,其频次仅达到19。为尽可能消除高频关键词自身频次之间的较大悬殊对聚类结果带来的影响,利用Equivalence Index系数将高频关键词原始共词矩阵转换为对应的相似矩阵[17-18],频次≥5的关键词数据见表3。
文献可视化工具VOSviewer在聚类知识图谱及节点可视化显示方面具有独特优势。[19-22]将转换后的教育学领域大数据研究高频关键词共词相似矩阵进行数据格式变换处理,并导入VOSviewer(Version 1.6.5)。采用该可视化工具提供的关联强度计算方法进行规范化处理[23],以及LinLog布局技术与modularity聚类技术进行显示。[24-26]根据可视化结果布局显示的需要,吸引力参数值(Attraction parameter)和斥力参数值(Repulsion parameter)分别设置为2和0。教育学领域大数据研究热点主题可视化网络知识图谱见图1。图1网络中共有49个节点,8个聚类,109条连线,总关联强度值为14.99。图1中,圆形节点及其标签的大小取决于该关键词对应节点的权重(总关联强度值),即节点的权重值越大,节点及其标签的字体也越大。“个性化学习分析模型”和“电子书包”两个关键词的权重值最大,均为2.3714,在图1中显示出最大的节点及其标签。
表2 基于CSSCI的教育学领域大数据研究高频关键词共词原始矩阵(频次≥5)
表3 基于CSSCI的教育学领域大数据研究高频关键词共词相似矩阵(频次≥5)
图1的可视化网络图谱显示,基于CSSCI的教育学领域大数据研究高频关键词被划分为8个聚类,相互间具有较高相似性的高频关键词节点具有相同颜色以表现为同一个聚类,并对应着相应的研究热点主题。从图1的聚类结果来看,基于CSSCI的教育学领域大数据研究热点主要包括八大主题,按照各聚类所包含高频关键词及其相互间关系对研究热点进行解释命名,并按照聚类所含高频关键词数量的多少进行排序,依次是——Cluster1(17个关键词):基于教育大数据的个性化教育与学习分析研究;Cluster2(7个关键词):大数据时代下的人才培养模式与教育评价研究;Cluster3(6个关键词):基于大数据理念的教育应用与教育改革;Cluster4(5个关键词):大数据技术在高校思想政治教育中的应用创新;Cluster5(4个关键词):大数据时代实现教师专业发展的数据智慧研究;Cluster6(4个关键词):大数据学习分析中的数据安全保护与隐私伦理问题研究;Cluster7(3个关键词):电子书包中基于大数据的个性化学生分析模型研究;Cluster8(3个关键词):高等教育大数据分析的机遇与挑战。
图1 基于CSSCI的教育学领域大数据研究热点主题可视化知识图谱
(1)基于教育大数据的个性化教育与学习分析研究。大数据学习分析使得个性化教育与学习的实现成为可能。[27]该研究热点主题主要侧重于以学习者学习过程中产生的个性化数据为基础进行大数据分析,并合理预测学习者的个性化特征与预期表现进而发现其教学过程与学习过程中的负面因素并实施个性化干预。教育大数据产生于各种类型的教育活动中,目前在线学习环境中的个性化教育与学习干预分析是目前教育大数据应用服务的重要实践。基于大数据实现在线学习预警功能从而提升在线学习质量是在线教育发展过程中亟需解决的重要问题。[28]学习者所产生的阶段性学习经历数据蕴含着丰富的学习分析价值。个性化和自适应学习系统是教育大数据应用服务的主要阵地,其通过采集学习过程中的行为数据来提供个性化的学习服务。[29]有研究者构建了基于教育大数据和学习分析的,以干预引擎为核心的“状态识别—策略匹配—干预实施—成效分析”四环节循环结构干预模型。[30]还有研究者从数据与环境、关益者、方法和目标4个维度构建了基于大数据的个性化自适应在线学习分析模型。[31]伴随着智慧教育的发展,在线学习的普及,以及大数据技术在教育领域的广泛应用,基于教育大数据的个性化教育与学习分析研究将成为以教育大数据挖掘为研究基础的教育技术新范式。
(2)大数据时代下的人才培养模式与教育评价研究。大数据时代带来的变革推动着高校专业人才培养模式与教育评价体系的创新。该研究主题主要探讨大数据给专业人才培养模式与教育评价所带来的新的教育理念、思想方法和有效应用。大数据技术影响着专业人才的培养机制与模式,大数据环境下,高校需为专业学习者构建融知识、技能与素质为一体的新结构及其实现方式。大数据时代下,教育大数据技术推动了教育评价中数据驱动决策的实现。[32]同时,大数据分析技术有助于将教育评价从基于小样本数据或片段化信息的推测转向基于全方位、全程化数据的证据性决策。[33]大数据时代下,各专业人才培养机制与模式,以及教育评价策略都应进行相应的调整,以新的人才专业课程和知识体系、新的教学理论与实践、新的教育评价思想来适应大数据时代给专业人才教育带来的新变化。
(3)基于大数据理念的教育应用与教育改革。大数据理念对教育领域的最大影响表现为数据分析及其应用驱动教育改革,教育各领域产生的海量数据在大数据时代具有广泛的应用价值,该研究热点主题侧重基于大数据理念进行教育应用与教育改革。大数据应用于教育领域并从三方面推动教育改革,分别是[34]:促使教育模式多元化发展、重构教学评价方式和推动教学思维持续革新。笔者认为,基于大数据理念的教育应用与教育改革关系密切,表现为基于大数据理念的教育改革需要以大数据在教育的广度和深度层面应用为强力推动,而基于大数据理念的教育应用又需要大数据时代教育发展的创新改革作为重要基础支撑。
(4)大数据技术在高校思想政治教育中的应用创新。大数据思维在高校思想政治教育中的应用创新能够实现高校思想政治教育工作的针对性和前瞻性。利用大数据分析学生行为并构建相应的大学生行为模型,依据行为与思想间的关系从而分析预测大学生思想的变化情况。[35]同样,大数据给研究生思想政治教育领域也带来了变革与机遇[36]:帮助研究生思想政治教育扫除盲区、重新构建研究生综合评价体系、革新研究生思想政治教育工作者的思维和教育模式。大数据使思想政治教育方法得以发生根本性的变革,表现为从定性转向定量研究法、从线性转向非线性关系、从局部转向整体分析法、从模式化转向多样化方法。[37]伴随着大数据分析技术的发展,高校思想政治教育领域需要思考如何借助大数据分析技术来推进和创新高校思想政治教育的应用实践。
(5)大数据时代实现教师专业发展的数据智慧研究。该研究热点主题是大数据时代提升教师管理教育数据能力的新话题,数据智慧是大数据时代实现教师在教学活动中获得专业发展的重要基础。教师要利用教学过程中的数据改进教学,需要具有数据智慧。[38]如何提升教师数据智慧进而实现教学质量的提升与教师专业发展是大数据时代下教育大数据服务于教师发展的重要课题。大数据时代的教师数据智慧来源于教育大数据的决策过程,数据智慧是改进教学的新方式,教学决策推动数据智慧改进教学。[39]大数据驱动实现教师专业发展的数据智慧是大数据分析与教师教育融合的新理念。
(6)大数据学习分析中的数据安全保护与隐私伦理问题研究。基于大数据的学习分析应用推广不可避免地要应对海量数据收集过程中存在的数据安全保护与隐私伦理问题。该研究热点主题侧重于大数据技术应用于教育领域中所面临的挑战,大数据应用离不开数据收集环节,而其中最重要的挑战就是数据安全与隐私权保护。大数据学习分析中涉及的伦理道德问题尤其是分析过程中引发的数据安全与隐私问题也成为了教育领域研究热点。[40]相关政府部门通过大数据政策引导及其立法管理来构建教育大数据应用的数据安全与隐私保护法规政策体系,成为突破大数据在教育领域应用的重要主题。
(7)电子书包中基于大数据的个性化学生分析模型研究。数字化学习工具电子书包中所记录的海量学生学习行为数据为学生个性化分析提供了大数据应用的数据基础,该研究热点主要以电子书包中产生的学习大数据为基础进行个性化学习分析与评价。电子书包的发展和教育大数据技术的出现为学生个性化学习评价提供了可能。[41]有学者提出了基于电子书包大数据的学生个性化分析模型,并从资源推送、过程监控与指导、社区推荐三个方向分析了所构建模型的实现路径。[42]基于电子书包产生的学习大数据,从理论内容和应用路径两个方面研究个性化学习分析模型的构建是目前该研究主题要解决的重要问题。
(8)高等教育大数据分析的机遇与挑战。教育质量是高等教育发展的核心,大数据时代下,以往各类日常高等教育活动中产生的海量行为数据背后所隐藏的有益于高等教育质量提升的价值更有可能被挖掘,可以说,高等教育大数据分析为高等教育质量提升提供了新的路径。教育数据挖掘是大数据时代实现高等教育改革的路径之一。[43]高等教育大数据分析有利于高等教育机构产生绩效与过程两方面的结果,同时其面临着来自大数据技术方面、高等教育机构自身方面、隐私与伦理道德限制等方面的挑战。[44]大数据应用同样可以给高等教育治理方式变革带来新变化,其功能表现为可推动高等教育治理决策科学化、加强高等教育多元主体的合作、提升高等教育的社会服务能力、提高高等教育治理的绩效水平。[45]大数据给整个高等教育生态系统所带来的革命性变化,将直接导致高等教育在理念与形式方面的变革。利用大数据分析技术来更好地抓住高等教育创新发展变革的机遇与挑战是高等教育工作者亟待思考的重要研究主题。
四、结束语
大数据技术通过促使教育数据分析的深层次改进从而推进着教育领域在教育方式、教育理念和教育质量方面的深度变革,教育领域正成为大数据应用实践的重要领域,教育大数据正成为大数据研究的重要内容之一。为保证教育大数据的均衡发展,需要从安全、应用与治理三方面进行深入分析。[46]本文基于CSSCI数据库,对教育学学科领域大数据的研究热点主题进行探讨。通过分析,发现国内教育学学科领域对大数据这一新兴信息技术和理念产生了强烈的关注和兴趣,国内教育学学科领域大数据研究呈现出逐年上升的态势。目前,通过高频关键词共现可视化知识图谱识别出国内教育学学科领域大数据研究热点主题,主要包括:基于教育大数据的个性化教育与学习分析、大数据时代下的人才培养模式与教育评价、基于大数据理念的教育应用与教育改革、大数据技术在高校思想政治教育中的应用创新、大数据时代实现教师专业发展的数据智慧、大数据学习分析中的数据安全保护与隐私伦理问题、电子书包中基于大数据的个性化学生分析模型、高等教育大数据分析的机遇与挑战。