浅谈学生考试成绩预测模型在高职教学中的应用
2018-06-11杨东海钱莹
杨东海 钱莹
[摘 要] 考试成绩是评价教学质量的重要指标,对学生考试成绩的准确预测可以帮助教师提前预估学生学习效果并及时调整教学方法和策略。回顾利用数据挖掘算法搭建学生考试成绩预测模型的关键步骤,重点讨论该模型在高职教育中的应用方法、关键要点以及如何根据预测结果来优化调整后续的教学工作并提高学生培养质量。
[关键词考试成绩;预测;数据挖掘;高职教育
[中图分类号]G712 [文献标志码] A [文章编号] 2096-0603(2018)34-0001-03
一、引言
近年来,我国出台了一系列政策来支持发展现代职业教育,希望培养大批技能型人才来服务于经济社会的发展。同时,“中国制造2025”计划的提出,也将带来新一轮的制造业升级,对具有“工匠精神”的应用型人才的迫切需求向高等职业教育提出了越来越高的要求。在我国,高职院校是培养应用技能型人才的主要基地,其在高等职业教育系统内的重要地位不言而喻。随着我国高等教育招生规模的逐年扩大,高职院校也在快速发展,但依然面临着生源质量不高等一系列问题。在高考中,高职院校的分数线普遍低于本科,是最后一个批次录取。进入高职院校就读的学生往往高考成绩不够理想,其知识基础、学习习惯、自我约束力、自我激励等主客观因素都存在很大的改善空间[1]。因此,学生求知欲不强、缺乏刻苦钻研的精神、与教师的课堂互动不积极等现象普遍存在于高职院校的教学过程中。最终的结果体现在教学质量不高,学生实际能力难以满足社会的需要。
在高等教育中,学生的考试成绩往往是评价教学质量的重要依据之一,考试分数能够在一定程度上反映学生对专业知识的掌握程度[2]。然而在实际教学中,期末考试往往意味着该门课程教学过程的完结,在考试结束后即使知晓了学生的分数,也再没有机会对已经结束的教学过程进行调整和优化。因此,许多高校教师迫切希望使用更加有预见性的工具,在教学过程中能够随时评估教学质量,从而可以根据预先评估的结果对教学进行实时调整,强化优势,弥补不足,进一步改善教学质量。事实上,在学生参加期末考试且分数真正揭晓之前,其学习效果并非无迹可寻,而是隐藏在一系列“蛛丝马迹”中,例如学生自身的特点、前导课程的成绩、出勤统计、听课状态、平时作业完成情况等,这些特征都与其考试成绩有着千丝万缕又难以解释的联系。具有多年教学经验的教师能够凭经验从这些特征中得到一些模糊的“感觉”,然而仅仅凭主观经验和感觉来评估学生的学习效果,其准确性和科学性都是值得商榷的。
为了解决这个问题,学者提出使用数据挖掘算法来搭建学生考试成绩预测模型,通过对学生成绩的预测,来提前评估教学质量。数据挖掘技术是一种深层次的数据分析方法,通过仔细分析大量数据来揭示有意义的新的关系、趋势和模式的过程,其任务就是发现隐藏在数据中潜在的模式,为决策提供支持[3,4]。所以数据挖掘技术非常适合用于揭示学生考试成绩与其他相关因素之间隐含的非线性的复杂关系,其搭建的成绩预测模型是将教师的一些主观经验和感觉以数学的形式进行量化描述。近几年,决策树、核Fisher判别分析、人工神经网络、贝叶斯网络、支持向量机、多元回归分析等数据挖掘算法已经用于实现学生成绩预测模型的搭建,并取得了良好的效果[1,4-6]。然而,大部分学者的研究重点放在如何在“技术”上取得突破(例如,各种数据挖掘算法的应用、改进与创新),却很少有学者讨论应用该模型的初衷——如何在“教育”(特別是高职教育)中基于该模型的预测结果来优化调整后续的教学工作并提高学生培养质量。
为了能够更好地将“技术”服务于“教育”,本文在作者前期研究成果的基础上,首先回顾了利用数据挖掘算法搭建学生成绩预测模型的主要步骤,然后分析讨论了在高职教学中应用预测模型的若干关键问题,如使用模型的目的和方法、如何根据预估的成绩采取有针对性的措施来优化当前的教学过程等。
二、建立学生考试成绩预测模型的主要步骤
在不同的教学场景,教师对成绩预测的要求也不尽相同,一部分教师仅仅希望知晓学生的成绩是否能够及格,而另一部分教师则希望看到学生考试成绩具体分数的预测结果。根据采集到的数据和预测结果的不同类型,成绩预测可以转化为分类、关联分析、回归分析等问题,因此建立预测模型所采用的数据挖掘算法、输入和输出数据的形式也不同。在目前的研究中,更多的是把预测模型假设为“黑箱”,影响考试成绩的因素是黑箱的输入,考试成绩作为黑箱的输出,则搭建预测模型的问题可以简化对黑箱功能函数的逼近[7]。
无论采用哪种数据挖掘算法,其建立预测模型的框架是类似的,包含的主要步骤为:
(一)数据收集
学生考试成绩与影响成绩的因素之间的复杂关系隐藏在样本数据中,最终的模型也是通过数据挖掘算法对样本数据训练而得到的,因此数据是模型搭建的核心要素之一。需要收集的数据范围主要是学生的考试成绩和那些对成绩影响比较大的要素,比较常用的包括学生个人信息(性别、生源地、入学成绩等)、教学过程中的相关信息(前导课程的成绩、学生的出勤统计、平时作业分数等)等。
(二)数据预处理
收集到的原始样本数据可能会存在缺失、冗余、不在合理区间等现象,直接使用这些不规范的数据会影响预测模型的准确性和泛化能力,因此需要在使用之前对数据进行筛选、补充等预处理操作,有些数据挖掘算法还要求对数据做进一步的采样、离散化、归一化等操作。
(三)确定输入特征变量
输入特征变量代表模型输入数据的维度属性,应该从原始样本数据中选择那些对学生考试成绩影响最大的一组变量。
(四)建立预测模型
采用某种数据挖掘算法对训练数据集进行训练,得到预测模型。
(五)优化模型参数
预测模型中会包含某些参数(不同的数据挖掘算法所使用的参数不同),这些参数会对模型的性能产生比较大的影响,因此需要基于不同的参数组合反复训练模型,并利用验证数据集的测试结果选择一组最优的参数组合,用于训练最终的预测模型。
(六)进行学生成绩预测
利用搭建好的模型对学生成绩进行预测(如果是进行实验,则可以对测试数据集进行测试,并基于测试结果进行评价)。
三、在高职教学中应用成绩预测模型的若干关键
问题
使用数据挖掘算法搭建学生考试成绩预测模型在技术上已经趋于成熟,作为专业教师,我们还应该关注如何在高职教学中应用这种模型工具来辅助教学。
(一)明确使用预测模型的目的
作为在高职教学一线工作的教师,我们需要意识到,对学生考试成绩进行预测仅仅是一种手段,而高职教育的最终目的是为了通过高质量教学来培养动手能力强的应用技能型人才。因此,在应用预测模型时,不应该仅仅沉迷于建立一个预测精度高的数学模型,却忽略了教学的本质——建立模型并进行成绩预测并不是工作的终点,恰恰相反,这才是后续一系列重要教学工作的起点。教师需要根据预测的结果来综合评估每个学生的学习状态和整体教学效果,并根据学生的不同状态因材施教,切实根据学生个体作个性化的指导。对有可能不及格的学生及时找出原因,有针对性地采取具体措施提高他们的学习成绩;对成绩优异的学生则可以引导其进行更深入的自主学习或者参与课外项目。
(二)模型输入特征变量的选择
预测模型的准确性与数据挖掘算法的特点、模型参数及输入特征变量的选择息息相关。为了得到尽可能准确的预测结果,教师应根据讲授课程的实际情况,从学生的自身特点、前导课程的成绩、教学过程数据等信息中提取出一组对成绩影响最大的关键因素作为输入的特征变量。这里需要注意的是,不同的学校、课程和学生有其独特性,对成绩影响最大的关键因素也不尽相同,不能盲目地将其他成绩预测模型的输入特征变量全盘照搬过来。如对于深圳信息职业技术学院物流管理专业的学生来讲,深圳市外的生源普遍好于深圳本市的生源,女同学的平均成绩高于男同学,因此在我们搭建的学生成绩预测模型中,生源地和性别作为两个与成绩相关性很强的属性被选择成为输入变量特征中的成员要素,这些都是针对本校学生的自身特点而定制的[1]。但是对于其他高校的某些专业来讲,生源地和性别对成绩的影响未必如此突出,需要任课教师重新考虑是否将它们纳入输入特征变量的选择范围内。
除了依靠教师的经验选择输入特征变量外,还可以借助于特定的特征遴选方法[4]、主成分分析[8]等方式选择或加工得到最优的一组属性特征(在数据挖掘领域,特征选择是一个比较重要的研究领域),这些方法不仅有助于得到一个更高预测精度的模型,还从客观上帮助教师辨识出对学生成绩潜在影响较大的那些因素,它们会成为教师开展后续工作的重要参考依据。
(三)提高学生成绩的举措
对预测成绩较差、有可能不及格的学生,教师应给予较多的关注,并采取有效的措施帮助他们提高成绩。
1.找出学生成绩欠佳的根本性原因
学生某门课程的成绩欠佳是有多方面原因的,既有个体性原因(学习方法不当、家庭变故等),也有普遍性原因(教师的教学方法不当等),多种因素错综复杂地纠缠在一起,很难将全部因素进行量化处理。因此在采取明确的教学措施之前,可以通过与学生交流或向学生辅导员调研的方式了解其成绩欠佳的根本性原因,基于具体原因开展有针对性的工作,可以避免眉毛胡子一把抓,从而最终高效解决问题。
2.及时优化教学方法和教学设计
如果预测结果显示大部分学生有可能不通过考试或成绩欠佳,则警示的是一种整体性的教学效果不理想,此时教师需要及时调整教学方法和教学设计。面对任课教师所展现出的不同的教学方法、态度和风格,学生对该门课程的学习积极性也会有所不同。高职学生的特点决定了他们往往觉得理论性较强的课程比较枯燥,排斥机械死板、照本宣科的授课模式。而幽默风趣的讲解风格搭配上多案例、多实操的教学形式,会激发学生的学习兴趣,活跃课堂氛围,学生在这种轻松的氛围中接受新知识的意愿也较强。因此,教师应努力强化自己的教学基本功,积极优化教学设计,力求在课堂上实现理论与实际案例相结合,同时适度运用多媒体和信息化技术提升学生的感性认知,在轻松的课堂气氛中提高学生学习的效果。
3.增加师生互动,提高学生自信心
当前高职院校在读学生,他们的特点是思维开放、接受新鲜事物快、自尊心强、比较排斥传统说教式的管理方法。有部分学生成绩不佳是因为对学习新知识主观能动性差,厌学情绪严重。在面对这类学生时,教师要根据学生的特点因势利导,应避免面对面的直接批评教育,转而采取相对委婉的态度和迂回的策略。可以在课堂上有针对性地增加与这些学生的互动,以正面鼓勵的方式提升他们的自信心,激发他们对学习的兴趣。
4.关注特别的学生个体
对于那些在主观上乐于学习,但由于自身基础知识薄弱、家庭变故等客观原因而造成成绩欠佳的学生,任课教师也应给予特别的关注——可以用课下个别辅导的方式弥补其基础知识的不足,还可以采取谈心的方式对其心理进行疏导,使他们恢复到正常的学习状态。
(四)引导成绩优异的学生拓展能力
如果成绩预测模型是基于回归分析建立的,教师可以利用它来估计学生考试成绩的具体分数,如果预测的分数较高,则表明该学生对课程内容理解深入,从一定程度上反映出该学生具有较强的学习能力。对于这类学生,教师可以引导其进行更深入的自主学习和课外学习,如鼓励他们参加相关的技能大赛、协助教师进行课程建设、参与教研科研项目等。在学生学有余力的情况下指导他们参与课外项目,有利于学生储备更广泛的知识技能,增强未来职业发展的竞争力。
四、结束语
基于高职院校生源和课程体系的特点,为教学一线的教师提供预测学生考试成绩的工具可以帮助教师提前评估教学效果,优化教学方法和策略。本文回顾了使用数据挖掘算法搭建学生成绩预测模型的关键步骤,分析在高职教育中应用该模型的方法和关键问题,最后重点讨论在得到预测结果后如何采取具体的教学措施来提高教学质量。
虽然基于数据挖掘算法搭建学生考试成绩预测模型的方法在技术上已经日趋成熟,但是如何将模型更好地与教学相结合还需要更深入的研究。相信经过在实践中不断的摸索,学生考试预测模型会成为高职教师对学生因材施教、改善学生学习效果并挖掘其成长潜力的有力工具。
参考文献:
[1]杨东海,胡凌,钱莹.基于核Fisher判别分析的高职学生考试成绩预测[J].中国教育信息化,2016(16):76-79.
[2]黄建明.贝叶斯网络在学生成绩预测中的应用[J].计算机科学,2012(S3):280-282.
[3]王光宏,蒋平.数据挖掘综述[J].同济大学学报(自然科学版),2004(2):246-252.
[4]孙力,程玉霞.大数据时代网络教育学习成绩预测的研究与实现:以本科公共课程统考英语为例[J].开放教育研究,2015(3):74-80.
[5]吴青,罗儒国.基于在线学习行为的学习成绩预测及教学反思[J].现代教育技术,2017,27(6):18-24.
[6]孙毅,刘仁云,王松,等.基于多元线性回归模型的考试成绩评价与预测[J].吉林大学学报(信息科学版),2013(4):404-408.
[7]邱文教.基于人工神经网络的学习成绩预测[J].计算机与信息技术,2010(4):5-6.
[8]谭常春,张雪莲,胡俊迎.基于Adaptive-Lasso的本科成绩统计分析[J].应用概率统计,2016(5):541-550.
◎编辑 张 慧