智能化教育评价领域演进路径、研究热点与前沿的可视化分析
2020-04-01张殿尉
张殿尉
(1.北京师范大学,北京 100875;2.河北对外经贸职业学院,河北 秦皇岛 066311)
0 问题与背景
2019年8月1日上午,北京师范大学校长董奇在2019人工智能与教育大数据峰会上做了题为“面向未来的智能化教育评价”的主题报告。他指出,随着科技的进步和时代的发展,教育评价需要被重新赋能,使其能更好的反映出“五育并举”的全面发展理念,积极推动素质教育的实施。他从教育评价的目标、理念、功能、对象、信息源、任务、方式及结果反馈等层面分析了智能化教育评价的新趋势,并介绍了智能化教育评价在情绪情感、社会技能、语言表达能力、信息素养、科学素养等方面的新进展[1]。
截至目前,历史上共出现了4代教育评价体系,分别是测量、描述、判断和建构,不同时代有不同内涵,其方式也各有侧重。大数据、云技术、教育现实呼唤着智能化教育评价政策的落地与方法的实施。而关于“智能化教育评价”究竟经历了怎样的发展轨迹?什么契机促进了它的发展?当前研究的热点和前沿是什么?笔者借助知识可视化技术对此进行探讨,以期发现新线索,并为国内研究学者在该领域研究提供有益启示。
1 样本与方法
本文采用以引文分析和信息可视化技术为基础的科学知识图谱的方法,所用的工具选取美国德雷塞尔大学信息科学与技术学院陈超美博士开发的CiteSpace软件(版本为CiteSpaceV),形象地展示出“智能化教育评价”领域研究的演进路径、研究热点与研究前沿[2]。
1.1 样本选择
以Web of Science数据库中的全部6个子库(WoS核心合集、中国科学引文数据库、KCIKorean Journal Database、Medline、Russian Science Citation Index和Scielo Citation Index)为数据来源,检索策略为“主题 =Intelligent Education Evaluation”,时间跨度默认为所有年份,即1900—2019年,共检索出806条论文记录(检索时间为2019年9月21日)。笔者考查该文献数据集的出版时间分布,发现第1篇主题相关论文的发表时间为1934年,故选取1934—2019年的文献数据做“智能化教育评价”领域的演进路径分析。
1.2 参数设置
笔者将1934—2019年所发表的以“智能化教育评价”为主题的806篇论文的全部data(包括标题、关键词、摘要、参考文献等)导入CiteSpace软件中。时间分区设为每1年一个分区。分析节点选择“reference”,默认调节阈值。运行软件,首先可得到“智能化教育评价”研究共被引网络分布图,借此可析出关键节点文献;其次,将主题词设置为名词短语(noun phrase)和“突变”词(burst terms)2种,将其来源(terms sources)设置为标题(title)、摘要(abstract)、关键词(keywords)、附加关键词(keywords plus)[3]。借名词短语和“突变”词可析出“智能化教育评价”领域的研究热点、研究前沿和发展趋势。
2 结果与分析
2.1 “智能化教育评价”研究文献量的时间序列分布
通过生成图谱发现,相关文献最早出现于2011年, 共 9篇;2012年 7篇;2013年 4篇;2014年 20篇;2015年 16篇;2016年 24篇;2017年22篇;2018年5篇;2019年1篇。共108篇,中心相关性文章37篇,相关度从0.01~0.29不等。“智能化教育评价”领域的研究经历2014—2017年井喷式发展后开始逐渐呈剧烈下降趋势。
2.2 “智能化教育评价”领域研究的演进路径分析
时区视图(time zone)显示方式突出共引网络节点随时间变化的结构关系。运行软件得到“智能化教育评价”领域文献共引网络节点的时区视图(见图1),中心性≥0.16的7篇关键节点文献的详细信息见表1、2,表2是经过查询WoS获得。
图1 “智能化教育评价”领域共引网络节点时区视图
综合图1和表1、2,按照时间顺序分析这7篇关键节点文献,可梳理出“智能化教育评价”研究的演进路径。
第1篇 文 献 是2014年,Srivastava,Nitish,Hinton, Geoffrey,Krizhevsky, Alex等人发表在《机器学习研究杂志》 (Journal of Machine Learning Research)上的《中止:一种防止神经网络过度拟合的简单方法》(Dropout: A Simple Way to Prevent Neural Networks from Overfitting)一文。该文认为,过度拟合在强大的具有大量参数的深层神经网络机器学习系统中是一个亟待解决的严重问题。由于大型网络使用速度过慢,即使在测试时将许多不同大型神经网络的预测组合起来,过度拟合问题也很难解决。“中途停止”是解决这个问题的一种技巧。关键是在训练过程中从神经网络中随机删除单元(以及它们的连接)。这就防止了单元的过于适应问题。在训练过程中,从指数级的不同“细化”网络中剔除样本。这大大减少了过度拟合,并比正统化方法有了更大进展。研究表明,中止提高了神经网络在视觉、语音识别、文档分类和计算生物学等领域的具备监督学习任务中的性能,在许多基准数据集上获得了最新的结果[4]。
第2篇文献是2014年,Da Silva, Per Goncalves,Ilic, Dejan,Karnouskos,Stamatis等人发表在《工业电子工程公司智能电网》(Ieee T Smart Grid)杂志上的《智能电网用户分组对预测精度的影响及其对当地电力市场交易的效益》(The Impact of Smart Grid Prosumer Grouping on Forecasting Accuracy and Its Benefits for Local Electricity Market Trading)一文。该文基于Seasonal-Nave和holtwinters算法,选取一个团队参与市场的个案,研究了群规模与预测精度之间的关系,以及预测误差对由消费者和“散户”组成的日内本地电力市场交易的影响;得出了“创建组”这一策略即使面对不可预测的个人市场,也可以降低其成本,减少预测误差[5]。
第3篇文献是2015年,Chitsaz,Hamed, Shaker,Hamid, Zareipour, Hamidreza等人发表在《能源建筑》(Energ Buildings)杂志上的《微网建筑物短期电力负荷预测》(Short-term electricity load forecasting of buildings in microgrids)。该文认为,电力负荷预测是电力系统运行的关键。随着分布式和可再生能源发电在许多国家的普及,微电网的短期负荷预测也成为一项重要的任务。微电网可以加强对可再生资源和常规资源的管理,提高与电力市场的能源交易经济性。由于微电网负荷时间序列具有高度的非平稳性和波动性,其stlf甚至比电力系统的stlf更为复杂。为此,该文提出了一种新的预测方法,即采用自回归小波神经网络(srwnn)作为预测引擎,实现了levenberg-marquardt(lm)学习算法,并对其进行了自适应训练。作者在一个微网格中对一个教学楼的实际小时数据进行了检验。并与其它负荷预测方法进行了比较,验证了所提方法的有效性[6]。
第4篇文献是2016年,Chou, Jui-Sheng,Ngo,Ngoc-Tri等人发表在《应用能源》(Appl Energ)杂志上的《基于滑动窗口元启发式优化的时间序列分析机器学习系统识别建筑能耗模式》(Time series analytics using sliding window metaheuristic optimization-based machine learning system for identifying building energy consumption patterns)。该研究开发了一个新的基于时间序列滑动窗口元启发式优化的机器学习系统,提出了一种基于滑动窗口的时间序列预测方法,用于预测智能电网收集到的实时建筑能耗数据。此种方法可以使终端用户进一步预测信息,尤其是在高峰时期提高能源利用效率,潜在地扩大大数据在预测建筑能耗中的作用,从而降低建筑能耗[7]。
第5篇文献是2017年,Liu Weibo, Wang Zidong,Liu Xiaohui等发表在《神经计算》(Neurocomputing)杂志上的《深层神经网络结构及其应用综述》(A survey of deep neural network architectures and their applications)。该文讨论了广泛应用的深度学习结构及其实际应用;介绍了4种深度学习结构,即自动编码器、卷积神经网络、深度信念网络和限制玻尔兹曼机;综述了不同类型的深层神经网络,总结了近年来的研究进展;重点介绍了深度学习技术在语音识别、模式识别和计算机视觉等领域的应用[8]。
第6篇文献是2018年,Zhang Qingchen,Chen Zhikui等人发表在《信息融合》(Inform Fusion)杂志上的《大数据深度学习调查》(A survey on deep learning for big data)。该文认为,深度学习作为目前最引人注目的机器学习技术之一,在图像分析、语音识别和文本理解等领域取得了巨大的成功。它使用有监督和无监督的策略来展现学习层次结构中的多级表示和特征,以完成分类和模式识别任务。传感器网络和通信技术的最新发展使大数据的收集成为可能。虽然大数据为电子商务、工业控制、智能医疗等领域提供了巨大的发展机遇,但由于其海量、多样、速度快、准确性高等特点,给数据挖掘和信息处理带来了诸多挑战。近年来,深度学习在大数据分析解决方案中发挥了重要作用。该文综述了基于大数据特征的深度学习模型的研究进展,并指出了大数据深度学习的挑战[9]。
表1 “智能化教育评价”研究的7篇关键节点文献(按中心性排序)
表2 “智能化教育评价”研究的7篇关键节点文献详情、频次与中心性(按时间排序)
第7篇文献是2019年,Kong Weicong,Dong Zhao Yang,Jia Youwei等人发表在《工业电子工程公司智能电网》(Ieee T Smart Grid)杂志上的《基于LSTM递归神经网络的短期住宅负荷预测》(Short-Term Residential Load Forecasting Based on LSTM Recurrent Neural Network)。该文认为,随着电力系统正面临向更智能、更灵活、更互动的系统过渡,可再生能源发电、负荷预测、电力市场化的趋势日益明显;特别是对单个电力用户的短期负荷预测在未来电网规划和运行中发挥着越来越重要的作用。除了大规模的住宅总负荷外,由于涉及到高波动性和不确定性,预测单一能源用户的电力负荷相当具有挑战性。该文提出了一种基于长-短期记忆(lstm)递归神经网络的框架来解决这一棘手问题,该框架是最新也是最流行的深度学习技术之一。所提出的架构基于一组可公开获取的真实住宅智能电表数据测试,作者把该组数据的性能与各种基准(包括负荷预测领域的最新技术)进行了全面比较。结果表明,该文提出的lstm方法在居民家庭短期负荷预测方面优于其它同类算法[10]。
2.3 “智能化教育评价”领域研究热点与研究前沿分析
1)利用CiteSpaceV的术语自动聚类功能,确定“智能化教育评价”研究的主要领域和研究热点,共发现7大明显聚类(见图2):分别是地理人工智能应用(geoai application),智能适应自 动 化(intelligent adaptive automation), 远 程教育(distance education),基于物联网的智能家居(iot-based smart home),基于深度学习的社会人口信息识别(deep learning-based sociodemographic information identification), 研 究方法(research approaches),监督能量分解模型(supervised energy disaggregation model)。
图2 “智能化教育评价”领域研究聚类图谱
2)按照常规模式勾选Burst Terms,则可以析出“智能化教育评价”领域研究前沿。
图3 “智能化教育评价”领域突变词语图谱
选 择 export—network summary table将其 展开,“智能化教育评价”研究前沿见图4。
图4 “智能化教育评价”领域突变词语图谱展开图
笔者结合图3和图4,整理出变化频次最高的18个突现词,见表3。
表3 “智能化教育评价”领域突变词语中英文释义(按频次高低排序)
表3中,“机器学习”这一术语变化频次最高,说明随着科技、思维发展,人类越来越注重专门研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,主要使用归纳、综合而不是演绎。智能化教育评价要从其十大经典算法中探索凝练,不断提升、改善自身效能。
“深度学习”变化频次排在第二位,智能化教育评价要注重学习样本数据的内在规律和表示层次,这样有助于解释学习过程中获得的信息,诸如文字、图像和声音等数据,从而将其识别,取得进展。
“系统”“模型”则呼唤智能化教育评价要注重自身内部体系的构建,模型建立要科学,经得起推敲论证。
排在5~18位的术语不再一一解释与演绎,它们代表着与“智能化教育评价”相关的研究前沿,是今后研究的一些重点和需要突破的难点,也是容易在某一方面有所建树的研究领域。
3 结论
在分析学科演化、热点与前沿领域等方面,CiteSpaceV可视化应用软件所表现出来的较强探测和检验等辅助功能在“智能化教育评价”领域研究中得到了一定体现,通过对WoS数据库中收录的所有以“智能化教育评价”主题的研究论文的可视化分析,可以得到以下研究结论:1)“智能化教育评价”涉及教育学、统计工学、理学、信息科学等多学科交叉领域,但应用并不明显;2)“智能化教育评价”作为新生事物,其演进路径并没有在806篇历史文献中得到清晰的呈现;3)“智能化教育评价”领域的研究热点有7个,在此不再陈列;4)“智能化教育评价”领域的研究前沿有18个,一是与机器学习、深度学习的结合和相互借鉴,二是自身内部体系的构建和指标体系的持续建立与不断完善等。