物理虚拟仿真实验的可视化学习分析*——以“霍尔法测量磁场”实验为例
2022-09-27李渔迎刘冰洁王依朦
李渔迎 倪 晨 刘冰洁 关 佳 王依朦
物理虚拟仿真实验的可视化学习分析*——以“霍尔法测量磁场”实验为例
李渔迎1倪 晨1[通讯作者]刘冰洁2关 佳1王依朦1
(1.同济大学 物理科学与工程学院,上海 200092;2.科大奥锐科技有限公司,安徽合肥 230000)
随着大规模虚拟仿真实验的开展,在线教学因缺乏个性化辅导与实时反馈而制约了实验的教学效果。而高仿真、沉浸式的虚拟仿真实验为网络化、智能化、个性化的实验教学提供了新途径,是国家教育新型基础设施建设的重点。基于此,文章依据精准教学驱动下的可视化学习分析方法,结合虚拟仿真实验过程中产生的多答案、高耦合异构数据特征,设计了实验特征分析、问题域挖掘、问题归因三个特征模型,并借助直观的可视化图形帮助教师从知识掌握、实验态度、实验操作方法等多角度对学生虚拟仿真实验的学习效果进行精准诊断,从而实现个性化指导。同时,文章以“霍尔法测量磁场”实验为例,基于上述三个特征模型进行了教学应用、分析了应用效果,明确了实验难点和错误之间的关联。文章对物理虚拟仿真实验进行的可视化学习分析,有助于物理实验教学的数智化转型升级,并推动可持续发展的高质量虚拟仿真实验教学体系构建。
可视化学习分析;虚拟仿真;精准教学;大学物理实验
引言
近年来,基于计算机仿真、虚拟现实和网络技术构建的高度仿真的虚拟实验环境,以其网络化、沉浸式、高效率、低成本等优势,在实验教学中得到了广泛应用。其中,物理虚拟仿真实验通过对真实物理实验仪器和实验过程的高度仿真,较大程度地保证了实验的真实度和输出结果的可靠性。有研究表明,学生在虚拟实验中所获得的科学探究能力和实验技能的熟练程度会对应迁移、转化,为真实的实验工作奠定基础[1]。作为线下实验室的教学补充,虚拟仿真实验室有助于改善学习者的学习体验,达到更好的学习效果[2]。但在教学应用的过程中,虚拟仿真实验存在教学指导理论缺失、师生交互设计不足、教学评价制度不完全等问题,导致教与学脱节严重,使教学易陷入学生实验操作难、教学指导难的困境[3][4]。
学习分析通过对数据的处理和分析,利用已知模型和方法去解释影响学习者学习的重大问题,评估学习者的学习行为,已成为当代提供教学反馈的重要支持手段之一[5]。可视化技术基于学习行为数据内在的结构和规律匹配不同的可视化方案,清晰、高效地传达数据背后的意义,进一步凸显了学习分析在解决复杂问题上的优势,使师生能够在快速理解教育现象的基础上,启发教育决策[6]。因此,可视化学习分析综合学习分析和可视化分析的优点,支持教师基于学习数据进行自主假设、探索、验证、解释等动态推理,可帮助教师通过人机协同来更灵活地探索如何在虚拟仿真实验教学中做出复杂的教学决策,从而充分发挥教师的主导作用[7]。该技术在虚拟仿真实验教学应用中尚处于起步阶段,亟待推进相关的理论与实证研究,建立科学、系统的虚拟仿真实验教学指导方案与评价体系。
基于上述分析,本研究与物理虚拟仿真实验系统研发单位科大奥锐科技有限公司合作,以精准教学理论为指导,将云平台的学习数据特征与物理实验教学规律相结合,设计物理虚拟仿真实验可视化学习分析的思路。在此基础上,本研究构建实验特征分析、问题域挖掘、问题归因三个特征模型,开展虚拟仿真实验教学的科学评测应用研究,以期为引导学生自主学习、赋能个性化教育实施、推进信息技术与高等教育实验教学深度融合、推动教学模式创新提供参考。
一 物理虚拟仿真实验可视化学习分析的思路
相较于其他学科,物理虚拟仿真实验更注重探究性与实验方法的设计。在实验过程中,实验元件的初始参数会在虚拟仿真实验开始时随机生成,因而实验结果多样。另外,实验测量结果也会受不同型号实验仪器的精准度差异影响,导致读数不一。物理实验步步相扣,各答案之间的关联性极强,因此复杂的物理虚拟仿真实验数据关系梳理需要借助可视化学习分析的方法辅助诊断、反馈等教学环节开展。可视化分析过程包括数据采集与预处理、建立模型与验证假设、可视化表征、获取知识等步骤,是一种非线性过程[8]。在精准教学理念的驱动下,可视化学习分析注重学习者的内在学习条件、学习过程和个性化发展,这就对所收集实验数据的全面性与采样率、学习分析模型的准确度与执行频率提出了更高要求[9]。结合物理实验特征和学习分析流程,本研究设计了物理虚拟仿真实验可视化学习分析的思路,包括数据收集与预处理、数据分析模型构建、结果可视化呈现与反馈三个主要环节,如图1所示。
图1 物理虚拟仿真实验可视化学习分析的思路
1 数据收集与预处理
学习行为数据的采集,是精准教学得以顺利开展的必要前提和实施依据[10]。在虚拟仿真实验云平台,学生的个人信息、实验信息等结构化数据被存储于SQL数据库中,而实验报告以XML文件半结构化形式存储,还有少量的实验效果评价、实验过程交流等非结构化数据。因此,在进行数据预处理之前,要先将所有数据统一为适合挖掘的结构化数据,以提高对数据的管理和查询效率;在数据预处理阶段,要通过过滤或修改那些不符合要求的数据,以提高数据的质量[11]。本环节收集了虚拟仿真实验平台上支持学生行为直接测量的相关数据,并将所有数据转为结构化数据后存储于数据仓库中,以供数据分析使用。
2 数据分析模型构建
数据分析模型是可视化学习分析的核心,以解决实际需求为目标,设计匹配算法,获得可靠的数据分析结果。常见的数据挖掘技术有分类、聚类、统计、回归、关联规则挖掘、序列模式挖掘、可视化数据挖掘、文本挖掘等[12]。在实际情况中,面对复杂的决策需求,各类数据挖掘算法经常要结合具体的应用情境一起使用,严谨而全面地规划各数据挖掘算法的应用范围以达到精准决策的目的。可视化学习分析并非线性的过程,需结合外部评价法与内部评价法对学习分析模型进行质量诊断与细节调控,以实现模型迭代[13]。数据分析模型运行后产生的结果最终由指导教师进行验证,如果运行结果中仍含有特征不明的数据集,可以挑选出来进行二次运算,直至结果可定义。最终的运算结果被标记后,将以实验项目为单位存储于知识库中。本环节采用知识库配对存储数据挖掘与专家分析结果,采用程序包存储面向不同需求的、完整的学习分析算法,有利于推动各虚拟仿真实验之间学习分析模型的共建共享。
3 结果可视化呈现与反馈
结果可视化呈现与反馈是指利用合适的图表直观地呈现学习分析结果,为教师、学生、开发者等相关用户提供决策支持与反馈。但在进行反馈干预时,由于教育的复杂性,需着重考虑干预方案实施时的具体情境。如何捕捉合适的时机、教学场景、反馈方式以提供合适的教学干预,需要大量的科学研究和教师丰富的教学经验[14]。如果干预效果与预想不符,反思原因后就需重新回到模型构建阶段再次迭代,直至满足实际需求,达到精准干预的目的。待明确一套完整的以测辅学方案后,将其数据分析方法、挖掘结果标记及其可视化呈现方法相结合,在此基础上构建一个精准学习方案库,可以为后续相关研究提供参考。
二 物理虚拟仿真实验可视化学习分析的特征
在进行虚拟仿真实验可视化学习分析时,所收集数据的类型与特征会直接影响具体算法的选择,而不同的数据分析模型会影响最终的可视化图形选择。基于此,本研究围绕学习者的学习情况诊断这一需求,对其关联的异构数据特征、基于该需求开发的数据分析模型特征及其对应的可视化图形特征展开具体分析。
1 异构数据特征
根据维度数,物理虚拟仿真实验报告中生成的数据可分为一维、简单多维、复杂多维三类。
①一维数据:是数据集中最小的分析单位。实验操作判别、计算结果、物理量等数据一般以一维形式呈现,多维的实验过程性数据表格也是由多个一维数据组成。清洗后的一维数据有两大特征:正确结果可能多样,且各结果簇接近正态分布。除此之外,一维数据因受实验仪器测量值读取错误、数据处理过程单位转换错误等影响导致密度分布不均匀。
②简单多维数据:物理实验过程中常用多次测量以获得准确的结果,该类数据属于多维数据,在实验报告中多以表格形式呈现。该类数据在不同实验测量内容中由于各维度数据的函数关系不同,造成数据簇的分布形状各异,如存在线性关系的条形分布、平方关系的弧形分布等。
相关的工作人员应该努力学习造林技术,对高科技的手段能够熟练的运用,对营造林的技术进行宣传,对科学的理论进行全面的掌握,建立一支强大的高素质的造林队伍,不断实现造林水平的上升。在进行营造林的过程中应该重视科技的使用,而不仅仅依靠原始的技术。此外,还应该大力宣传营造林的意义,可以通过网络的作用进行营造林的宣传,让更多的人了解造林的好处,积极参与其中。
③复杂多维数据:复杂多维数据与简单多维数据的区别在于维度数是否超过20。当输入的维度数大于20时,基于距离的计算方法失效[15]。考虑到后续部分的算法原理与距离相关,为更利于开展降维处理,故做此区分。
除了数据本身的特征外,物理实验数据还存在各步骤之间的答案关联性强、各步骤的正确答案不唯一两大特点,在进行数据分析模型设计时需考虑其教学意义。
2 数据分析模型特征
基于上述异构数据特征分析,本研究设计了实验特征分析、问题域挖掘、问题归因三个特征模型,以适合不同虚拟仿真物理实验项目的学情分析需求。
①实验特征分析模型:基于描述性统计方法,从学生实验次数、平均实验时长、实验成绩、最高分四个维度描述在线实验的基本学情。这四个维度的数据获取便捷、主题多样,有利于辅助教师快速掌握实验项目的难度和学生的知识掌握情况、学习习惯等显性信息。运用本模型得到的挖掘结果可用于与线下实验教学的正常数据进行对比,以发现实验平均时长和实验次数异常、平均成绩异常等情况。
②问题域挖掘模型:借助聚类算法,对同一步骤实验数据的相似类对象进行标识与分组。本模型结合专家对模型挖掘结果各相似类对象的定义,来精准定位错误类型。根据三种不同的数据类型,本研究相应选取三种聚类算法。其中,一维数据的问题域挖掘选取实现较为简单、且以质心为圆心对数据进行划分的K-Means算法——为解决该算法初始类别数K值不确定,聚类质量受初始聚类中心、噪声和孤立点的影响较大等问题,本研究在数据预处理阶段采用Canopy算法删除孤立点,并初步确定K值和各个聚类中心,以降低算法的不稳定性。对于简单多维数据的问题域挖掘,本研究选取基于高斯混合模型(Gaussian Mixed Model,GMM)的聚类算法——该算法根据数据分布的特点不断训练,以自动拟合簇的形状,适合多维且数据关系不明确的变量集。而对于复杂多维数据的问题域挖掘,本研究首先利用主成分分析法对数据进行降维,之后根据新产生的特征因子数对应采取改进版的K-means算法或GMM算法。
③问题归因模型:在问题域挖掘模型结果的基础上,借助关联规则算法找出各步骤答案的频繁项集,并发现项与项之间的顺序关系。前后项均为错误类的关联规则,说明前项错误大概率是导致后项错误出现的主要原因,即后项错误并不是真正的知识难点,而是由前项错误导致。从教学有效性的角度考虑,筛选出该类规则后,只需重点关注前项(即实验时存在的关键问题)即可。由于错误记录数占总记录数的比值较小,故本研究将Apriori关联规则算法中的支持度设置为1%,表示两步骤的错误类同时出现的概率应大于1%;置信度设置为60%,表示前项错误类的出现能导致60%概率以上的后项错误发生。
3 可视化图形选择
三 物理虚拟仿真实验可视化学习分析的教学应用
1 案例介绍
“霍尔法测量磁场”实验是大学物理和实验教学中的一个重要内容,大多数高校都开设了该实验项目,在教学中具有代表性。基于此,本研究以上海市T大学的“霍尔法测量磁场”实验为例,介绍虚拟仿真教学过程及其可视化学习分析结果。本实验为“物理实验(下)”课程中的内容,面向理工科一年级本科生开设,每年有约3000名学生参与该实验。虚拟仿真实验的教学内容与线下实验基本一致,学生基于物理实验中心平台仿真实验模块提供的实验简介、原理、内容等学习资源进行自主学习,同时基于仿真程序搭建仪器、调节数据、获取数据进行模拟实验,并将实验报告文件提交至平台,项目操作界面与实验报告界面如图2所示。
图2 “霍尔法测量磁场”虚拟仿真实验项目操作界面(左)与实验报告界面(右)
2 分析过程
本实验分析数据由平台上学生提交的实验报告文件批量读取并转换获得,主要包括学生信息、实验次数、实验时长、实验成绩、完整的测量数据五部分内容,这些内容客观、真实地记录了学生在虚拟仿真实验教学中的学习行为和学习结果。具体的分析过程如下:①借助Minidom解析器解析XML实验报告文件,遍历各节点,实现从半结构化数据到结构化数据的无损映射;借助正则表达式拆分非结构化字符串类数据,提取其中的结构化数据。②对残缺、错误、重复的数据进行清洗。③根据各步骤的数据维度采用相关聚类算法,对该实验的13个步骤分别进行问题域挖掘;挖掘后经由教师验证,对各步骤的显著答案类别进行编码与含义标记,编码格式为“HE步骤序号_类别序号”。④运行Apriori关联规则算法,挖掘各步骤、各答案类别之间的显著关系。⑤借助Excel、Echarts等工具实现问题域挖掘结果和问题归因模型挖掘结果的可视化。
3 应用效果
(1)实验特征分析模型:发觉学情异常点
依据从实验次数、平均实验时长、实验成绩、最高分四个维度分析得到的班级整体分布情况,可以初步掌握学生完成实验项目的情况,及时发现潜在的学习异常现象。本研究对T大学参与“霍尔法测量磁场”实验的2730名学生为期一学期的实验数据进行统计,得到15851条虚拟仿真实验记录,在此基础上运用条形图绘制了“霍尔法测量磁场”实验特征分析模型统计图,如图3所示。教师可根据图内线条的花色和长短,识别各维度数据的占比差异。
图3显示,从实验的最高分看,68.36%的学生处于90分以上的高分段。而在线下实验教学中,教师根据实验操作情况和实验报告内容给出评分,仅有约46%的学生总评达到90分以上。经对比,本研究发现学生的最高线上实验成绩显著高于线下(Sig.值为0.000),此结果证实了霍尔效应虚拟仿真实验的教学有效性。但从实验完成度来看,有36.29%的实验记录得分<5分,一半以上学生的实验次数>3次,说明学生无法通过一次实验就能完成所有的学习内容。结合占比最大的半小时内实验时长记录分析,可知许多学生并没有认真地对待每一次实验,他们可能利用物理实验课程最终成绩选取整个实验过程中所得最高分的评价漏洞多次猜答案,以获得高分。针对这个线上教学常见的问题,教师需要精准掌握学生的学习行为,严格监督其实验态度,指引学生从知识理解出发对知识进行加工、内化,避免走向唯分数论的试误型、无意义学习。实验特征分析模型初步表征了实验项目的难度和实验完成度,有利于分析学习异常情况,为更深入的学习分析提供了依据。
图3 “霍尔法测量磁场”实验特征分析模型统计图
(2)问题域挖掘模型:健全评价综合度
霍尔电压测量是“霍尔法测量磁场”实验的重难点内容。本研究以该内容的问题域挖掘结果为例,采用多维平行坐标系图进行可视化呈现,结果如图4所示。平行坐标系将实验表格中的多维数据落点于多个等距数轴上,随着数据的增多,各点连线后的形状差异越发明显。教师根据平行坐标系中各类数据的线条形状,即可快速识别不同的数据规律。该内容聚类结果与平台实际评分进行比较,求得福尔克—马洛斯指数(Fowlkes-Mallows Index,FMI)值为0.672,说明成对的准确率与召回率的几何平均值较高,聚类质量良好。
在图4中,类别1为正确答案,由几组正反向线性曲线构成。对比正确答案,观察其他类别在图中各数轴上的值域范围和数轴之间的关系,可以发现:①曲线整体距离零轴较远,即错误数值的绝对值主要集中在0或10附近(类别3、4),导致该错误的具体原因是霍尔效应实验开始时未调零。②曲线呈波浪曲线而非线性变化,说明不同数轴之间的符号没有进行正负转变(类别6),导致该错误的具体原因是学生未掌握换向法测量原理,数据呈单项递增或递减趋势。③曲线呈震荡,说明部分极性设置错误(类别2、7),该类学生在测量原理或磁场、电压的设置有误——如果是粗心导致,那么就要对学生的实验态度和学习习惯多加注意。但是,原因也可能在于学生对霍尔实验仪器开关的控制不熟练,导致部分符号出错。④曲线开口较小,与零刻度轴更为贴近,原因主要在于实验刚开始前未调零,或测量元件位置放置不当,导致数值略微偏小(类别5)。基于问题域挖掘模型分析结果,教师在物理虚拟仿真实验教学中可从实验操作、实验数据处理、实验知识点、实验态度等维度细化评价内容。
图4 “霍尔法测量磁场”中复杂多维数据的聚类结果图
图5 “霍尔法测量磁场”虚拟仿真实验各题答案的关联规则图
(3)问题归因模型:提升反馈精准度
在有向关系图中,各节点编码名称与问题域挖掘结果一致。本研究采用有向关系图,绘制了“霍尔法测量磁场”虚拟仿真实验各题答案的关联规则图,如图5所示。图5(a)呈现了“霍尔法测量磁场”实验中所有的关联规则,图5(b)对其中前后项均为错误类的关联规则进行了可视化呈现。图中箭头由前项指向后项,表明前项是后项的因。经验证,图5(b)所得结果均与实验逻辑关系相符。从实验操作来看,由于霍尔电压(HE6、HE8)、霍尔系数(HE10)、载流子类型(HE11)、载流子浓度(HE12)存在计算关系,如未将霍尔元件置于磁场中央而影响霍尔电压的测量,必然会导致以上步骤出现一系列错误关联,即所有实验结果测量值均偏小。而从知识点掌握来看,概念理解不清的学生在第6、第8步骤均存在符号记录错误问题(HE6_2、HE8_3),且该问题会受实验内部逻辑关系的影响,从而造成元件类型判断错误(HE11_0)。
在实验中,物理数学关系越复杂的物理量往往错误率越高,也越难明确根本性的错误原因。关联规则归因模型通过追溯错误答案类别之间的关系,精准定位错误步骤,诊断错误原因,有效解决了这一难题。该模型通过提升反馈精准度,既提高了教师的在线辅导效率,又有利于改善学生的在线学习体验,避免其因学习陷入困境而出现厌倦感,保证了高质量的学习[16]。
四 结语
相较于理论性课程,物理实验课程的实验内容更加复杂、实验答案更具开放性和关联性,这进一步加大了教师精准诊断的难度,也强化了学生对及时、有效教学指导的需求。本研究发现,借助可视化学习分析可以表征虚拟仿真实验数据的分布规律,呈现清晰的物理量关联关系,并帮助教师由原来基于经验假设的教学逐渐转为基于数据指导的教学,提高了教学效能,故在改善线上虚拟仿真实验教学效果方面潜力巨大。后续研究可在学情分析的基础上,结合相关学科特点和教学过程,增加对科研能力、设计能力、情感态度等更多维度的考察,从诊断、预测、评价、反馈等多方面发挥可视化学习分析方法的作用,从而不断丰富精准教学方案库,建设更高质量的虚拟仿真实验教学服务体系。
[1]Miranda-Valenzuela J C, Valenzuela-Ocaña K B. Using virtual labs to teach design and analysis of experiments[J]. International Journal on Interactive Design and Manufacturing(IJIDeM), 2020,(4):1239-1252.
[2]Cheng L, Niu W-C, Zhao X-G, et al. Design and implementation of college physics teaching platform based on virtual experiment scene[J]. The International Journal of Electrical Engineering & Education, 2021,(2):1-14.
[3]Moozeh K, Farmer J, Tihanyi D, et al. Learning beyond the laboratory: A web application framework for development of interactive postlaboratory exercises[J]. Journal of Chemical Education, 2020,(5):1481-1486.
[4]Reeves S M, Crippen K J. Virtual laboratories in undergraduate science and engineering courses: A systematic review, 2009-2019[J]. Journal of Science Education and Technology, 2020,30:16-30.
[5]徐鹏,王以宁,刘艳华,等.大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013,(6):11-17.
[6]Vieira C, Parsons P, Byrd V. Visual learning analytics of educational data: A systematic literature review and research agenda[J]. Computers & Education, 2018,122:119-135.
[7]胡立如,陈高伟.可视化学习分析:审视可视化技术的作用和价值[J].开放教育研究,2020,(2):63-74.
[8]Keim D.A, Mansmann F, Schneidewind J, et al. Visual data mining [M]Springer, 2008:76-90.
[9]Lambe D, Murphy C, Kelly M E. The impact of a precision teaching intervention on the reading fluency of typically developing children[J]. Behavioral Interventions, 2015,(4):364-377.
[10]张忻忻,牟智佳.数据化学习环境下面向个性化学习的精准教学模式设计研究[J].现代远距离教育,2018,(5):65-72.
[11]Rahm E, Do H H. Data cleaning: Problems and current approaches[J]. IEEE Data Engineering Bulletin, 2000,(4):3-13.
[12]Paiva R, Bittencourt I I, Tenório T, et al. What do students do on-line? Modeling students’ interactions to improve their learning experience[J]. Computers in Human Behavior, 2016,64:769-781.
[13]Song Y, Chen W Y, Bai H, et al. Parallel spectral clustering[A]. Joint European Conference on Machine Learning and Knowledge Discovery in Databases[C]. Berlin: Springer-Verlag, 2008:374-389.
[14]Hatala R, Cook D A, Zendejas B, et al. Feedback for simulation-based procedural skills training: A meta-analysis and critical narrative synthesis[J]. Advances in Health Sciences Education, 2014,19:251-272.
[15]Berkhin P. Survey of clustering data mining techniques[A]. Grouping Multidimensional Data[C]. Berlin: Springer-Verlag, 2006:25-71.
[16]袁磊,张淑鑫,雷敏,等.技术赋能教育高质量发展:人工智能、区块链和机器人应用前沿[J].开放教育研究,2021,(4):4-16.
Visual Learning Analysis in Physical Virtual Simulation Experiment——Taking the Experiment of “Hall Method to Measure Magnetic Fields” for Example
LI Yu-ying1NI Chen1[Corresponding Author]LIU Bing-jie2GUAN Jia1WANG Yi-meng1
With the development of large-scale virtual simulation experiment, the lack of personalized tutoring and real-time feedback restricts the teaching effect of the experiment. The highly simulated and immersive virtual simulation experiment provides a new way for networked, intelligent and personalized experimental teaching, which is the focus of the new infrastructure construction for national education. Accordingly, based on the visual learning analysis method driven by precision teaching, combined with the multi-answer and highly coupled heterogeneous data characteristics generated in the process of virtual simulation experiment, this paper designed three feature models of experimental feature analysis, problem domain mining and problem attribution, which can help teachers accurately diagnose students’ learning effects of virtual simulation experiments from the perspectives of knowledge mastery, experimental attitude and experimental operation methods with the help of intuitive visual graphics, so as to realize personalized guidance. At the same time, taking the experiment of “Hall method to measure magnetic fields” as an example, this paper carried out teaching application, analyzed application effects, and clarified the relationship between the experiment difficulties and the experiment errors, based on the above three feature models. The visual learning analysis in physical virtual simulation experiment in this paper was helpful for the digital intelligence transformation and upgrading of physical experiment teaching, and could promote the construction of a sustainable high-quality virtual simulation experiment teaching system.
visual learning analysis; virtual simulation; precision teaching; college physics experiment
G40-057
A
1009—8097(2022)09—0091—09
10.3969/j.issn.1009-8097.2022.09.010
本文为虚拟仿真实验教学创新联盟项目“虚拟仿真物理实验精准教学评价研究”(项目编号:VSE21013R07)的阶段性研究成果。
李渔迎,在读硕士,研究方向为智慧教学及物理实验信息化教学研究,邮箱为1930937@tongji.edu.cn。
2022年2月20日
编辑:小米