基于CiteSpace的教育数据研究可视化分析
2019-12-30贾伟梅迪
贾伟 梅迪
摘 要 以中国知网数据库收录的期刊论文为研究对象,利用可视化网络分析工具CiteSpace绘制国内教育数据研究的科学知识图谱,以直观的方式揭示我国教育数据研究的发展状况,给出进一步的总结和建议,希望能够为国内教育数据研究领域的未来研究方向提供依据。
关键词 教育数据;知识图谱;CiteSpace;大数据
中图分类号:G640 文献标识码:B
文章编号:1671-489X(2019)12-0036-03
Visual Analysis of Educational Data Research based on Cite-space//JIA Wei, MEI Di
Abstract Taking the journal papers included in the China National Knowledge Infrastructure database as the research object, a map of scientific knowledge in the study of domestic educational data is drew by using the visual network analysis tool CiteSpace. The map reveals the development of educational data research in China in an intuitive way, and gives further conclusions and suggestions. We hope to provide a basis for future research directions in the field of domestic educational data research.
Key words educational data; knowledge map; CiteSpace; big data
1 我国教育数据研究时序分析
本文的研究目的在于可视化分析国内教育数据研究现状,以中国知网(CNKI)为基础数据源,以“教育数据”为主题词检索,期刊来源限定为全部期刊,时间检索范围为2001—2017年。检索结果共获得434篇文献,并在此基础上对样本进行二次清理后剩余280篇,形成教育数据研究的样本数据。
为分析教育数据研究的成果产出情况,统计2001—2017年的期刊论文数量,各年度文献数量及变化趋势如图1所示。教育数据研究领域论文量逐年上升,2013年成为高速发展的起点,2015年开始,教育数据相关研究呈现井喷式增长,由此国内教育数据研究进入快速发展阶段。整体看,教育数据研究呈现上升趋势,受到学者广泛关注,但是研究的产出成果仍然较少,目前对于教育数据的研究仍然是一个较新的领域,有很大的研究拓展空间。
2 我国教育数据研究前沿知识图谱分析
关键词共现图谱及其分析 论文的关键词是论文主旨的提炼,因此,关键词出现频次的排序在一定程度上代表了该领域研究热点的排序。为考察教育数据的研究热点情况,在该图谱中,每一个圆形节点代表一个关键词,圆圈的大小代表该关键词出现频次的高低,圆圈越大则代表出现频次越大;不同颜色代表不同的年份,连线的多少则说明关键词共现的系数,连线越多则代表关键词间相互联系越密切。
关键词共现网络整体密度为0.090 6,研究热点知识图谱网络结构总体上松散、密度偏低。研究大多点到即止、面面俱到,追求广度,在研究主题上缺乏足够的专注度。
从图2可知,大数据的节点最大,这一方面是由于检索词选用的是教育数据,另一方面主要是由于对教育数据的研究大多是基于大数据的背景。数据挖掘的出现频次仅居于第二位,对于教育数据的研究多集中于数据相关技术的研究,通过数据挖掘来追踪学习者行为,分析学习效果等。学习分析高频关键词说明学习行为研究逐渐成为重点关注领域。教育信息化、智慧教育和教育决策高频关键词显示了将课程建设及教育方式与互联网技术相结合,突出了对于教育变革的研究。但是在高频关键词中并没有对于教育数据的实证研究和价值分析,以及基于教育数据本身的研究。
我国教育数据研究前沿聚类分析 研究的文献中关键词众多,为了更好地展示研究前沿及研究热点,将关键词进行聚类分析。生成的共现网络如图3所示,Cluster ID越小,聚类的规模越大,其所包含的文献数量也就越多。Modularity Q=0.862 1>0.3,说明得到的网络聚类结构是显著的。
为了考察学者们突出的研究热点和近年来的研究前沿,選取轮廓值较高且年份较近的聚类进行分析,因此,选取#2、#4、#6、#7这三个聚类进行分析。
#2为教育数据挖掘聚类,教育数据挖掘是教育数据领域的研究热点。葛道凯[1](2012)研究分析了E-Learning数据挖掘的模式与应用,分解出三类挖掘任务情境并对应地构建出三种有效的数据挖掘模式。首新[2]等(2017)通过对教育大数据的子集计算机记录的log数据进行数据挖掘,认为log数据挖掘有助于分析问题解决过程,为教育科学决策以及教学调整和发展提供有效的支持。陈子健[3]等(2017)通过教育数据挖掘分析线学习者学业成绩的影响因素,发现学习者行为和父母的参与度与态度对学业成绩的影响排名前两位,学习者人口统计学方面的特征对学业成绩的影响最小。数据驱动的学业成绩预测建模的模型分类预测准确性与原始数据集有较大关系。
在教育数据挖掘的研究中,对于教育数据预处理的分析以及数据安全的研究较少,学者可以以此为突破点,开创新的研究方向。
#4和#6为学习分析技术聚类。马杰[4]等(2014)对学生学习成果与过程进行研究,构建了学习分析的预测模型,通过实证研究证明模型的可靠性。吴永和[5]等(2013)研究了学习分析的技术策略,包括学习分析技术手段、企业技术手段借鉴以及学习分析系统建设。目前,学习分析的技术手段主要有社会网络分析、话语分析、内容分析等。牟智佳[6](2017)研究学习分析工具的功能并设计出满足学生端和教师端需要的学情分析功能。
学习分析对于教育信息化变革具有重要的作用和研究价值,目前对于学习分析的研究还不很深入,比较笼统。学习分析技术涉及多种方法和工具,各种方法和工具适合应用的场景尚待研究。学习分析模型的建立和使用过程中对于数据本身的研究缺乏,如研究数据的隐私性、安全性问题。学习分析技术的应用领域有待进一步拓展,如面向宏观教育决策领域。
#7为智慧教育聚类。柯清超[7](2013)指出,数据是信息化社会的重要资源,教育数据是智慧教育发展的基础,从教育网络大平台建设、学习者学习方式变革、学校教育系统重构等多个角度,能够推动建构基于大数据与学习分析技术的智慧教育教学。王帆[8](2015)从智慧教育视角论述教育数据的变迁与潜能,认为教育数据影响学习者预测未来、教师重塑实践与学校的宏观调控。杨现民、骆娇娇[9]等(2017)认为,大数据时代的教学范式正在从经验模仿和计算辅助教学走向数据驱动的教学,教学方法与方式正在转化为智慧教育理念下的方式方法,应从组织数据素养针对性培训、打造大数据化的智慧学习平台、创建数据驱动教学示范项目等方面,全面促进国内数据驱动教学的发展。
3 结论与建议
科研机构建立持续稳定的科研长效机制,推动研究深度的发展 对时间、作者、机构、时序以及关键词分布图谱分析得出,我国教育数据研究成果在数量上虽然表现为逐年提升的趋势,参与该领域的研究者数量逐年增加,但是研究大多缺乏深入性和纵深性。技术研究大都浮于表象,研究技术的针对性不足,深层次本质分析明显欠缺。科研机构应建立持续稳定的科研长效机制和创新科研评价机制,不单单注重科研的数量,更加注重科研的深度和质量。保持研究主题的纵深专注度,技术性研究不能浮于表面,不能盲目跟风,在找准研究方向的同时挖掘热点与创新点,深入挖掘不同切入点。
注重教育数据本身层面的研究分析,建立健全数据建设制度与标准 教育数据是信息化时代教育教学的基础分析源,通过对教育数据的挖掘与分析,能够为教师教学、学校管理提供预测[10]。但教育数据本身也具有研究意义与价值,教育数据的定位、存储、获取搜集、预处理等是分析的初始阶段,也应受到研究重视。目前的研究前沿对于教育数据本身层面的研究分析较少,学者可以以此作为新的切入点,加强相关的研究。
加强数据安全体系建设,注重隐私保护研究 教育数据资源是学校教育教学以及学生行为活动所产生的相关数据,对教育数据的研究必然涉及对于教育数据的挖掘与分析,在分析过程中涉及学生与教师等行为主体的隐私内容不可避免,因此,为确保数据安全,注重隐私保护便成为关键课题[11-12]。教育大数据背景下必须建立健全主体隐私保护机制,确保在教育主体知情的情况下采集数据,获取有利于促进教学改善的数据信息。加强数据安全体系建设应建立健全信息安全管理制度,加强数据安全监控管理,建立动态预警机制,及时有效地对异常情况采取应对措施,实现数据安全的全局性实时动态控制。
参考文献
[1]葛道凯.E-Learning数据挖掘:模式与应用[J].中国高教研究,2012(3):8-14.
[2]首新,叶萌,胡卫平,等.教育大数据背景下log数据挖掘与应用:以PISA(2012)中国区问题解决测验为例[J].电化教育研究,2017,38(12):58-64.
[3]陈子健,朱晓亮.基于教育数据挖掘的在线学习者学业成绩预测建模研究[J].中国电化教育,2017(12):75-81,89.
[4]马杰,赵蔚,张洁,等.基于学习分析技术的预测模型构建与实证研究[J].现代教育技术,2014,24(11):30-38.
[5]吴永和,陈丹,马晓玲,等.学习分析:教育信息化的新浪潮[J].远程教育杂志,2013,31(4):11-19.
[6]牟智佳,武法提.基于教育數据的学习分析工具的功能探究[J].现代教育技术,2017,27(11):113-119.
[7]柯清超.大数据与智慧教育[J].中国教育信息化:基础教育,2013(12):8-11.
[8]王帆.从智慧教育视角论教育数据的变迁与潜能[J].中国电化教育,2015(8):10-15.
[9]杨现民,骆娇娇,刘雅馨,等.数据驱动教学:大数据时代教学范式的新走向[J].电化教育研究,2017,38(12):
13-20,26.
[10]张子石,吴涛,金义富.基于CiteSpace的网络学习知识图谱分析[J].中国电化教育,2015(8):77-84.
[11]吕海燕,周立军,张杰.大数据背景下教育数据挖掘在学生在线学习行为分析中的应用研究[J].计算技术与自动化,2017,36(1):136-140.
[12]于长虹,王运武.大数据背景下数字校园建设的目标、内容与策略[J].中国电化教育,2013(10):30-35,41.