APP下载

基于数据挖掘的学生个体属性与考试成绩相互关系研究

2017-04-14戴筠栗君

中国教育信息化·高教职教 2017年2期
关键词:网络课程继续教育相关性

戴筠++栗君

摘 要:以上海大学继续教育学院2015-2016学年开设的“传统养生”和“个人理财”两门网络课程为例,采用数据挖掘的方式研究学生入学时登记的基本个人信息(个人属性)和这两门网络课程考试成绩的相关性。研究表明这两门网络课程的考试成绩和性别、年龄以及户籍存在一定的相關性。

关键词:继续教育;网络课程;数据挖掘;个体属性;相关性

中图分类号:G434 文献标志码:A 文章编号:1673-8454(2017)03-0049-03

一、引言

继续教育是面向学校教育之后所有社会成员,特别是成人的一种教育活动。和常规教学相比,它存在一些特殊性,比如,学生不愿意(或没有办法)在规定的工作日(时间),到指定的地点接受知识面授,他们更愿意在家或方便的场所,随时进行学习以获取知识,网络教学将是适应继续教育特点的一种主要教学方法。[1]

网络教学是学生利用计算机或移动终端,通过互联网远程登录到服务器来学习教师已录制的教学内容。国内外已有许多有关网络教学的研究报道,有文献[2]研究网络教学中学生登录、资源浏览、作业、测试等网络学习行为特点及其影响因素,也有文献[3]探讨了学生学习登录记录、作业成绩和考试成绩之间的关系,这些都是针对网络学习行为特征取得的效果而开展的研究,学生的个体属性对考试成绩的影响,特别是继续教育学生的个体属性和考试成绩关系的研究还不多见。

继续教育的学生不同于常规在校生,目前社会人口流动性比较大,继续教育的学生会来自全国不同的地区,以前接受的教育各不相同,造成每个学生的学习基础差异很大;另外,他们年龄跨度较大,离开学校时间长短不一,经过社会多年历练,学习新知识的能力也有很大不同,这些个体属性都会影响继续教育学生的学习行为,从而影响他们的学习效果和考试成绩,因此开展继续教育学生的个体属性和网络课程考试成绩的研究,显得十分必要和有现实意义。

二、样本数据的获取和处理

“传统养生”和“个人理财”是上海大学继续教育学院为本、专科各专业学生开设的选修课,自2015-2016学年开始,这两门课从传统的课堂讲授转为网络授课,课程考试采用的是形成性考核,平时成绩在考试成绩中占有较大的比例,而平时成绩又和网络在线学习总时长(即学习进度)以及每次的作业完成情况有关,课程考试成绩是:学习进度占30%,平时作业占30%,期末大作业占40%。

在2015-2016学年春季学期中,有843名和437名学生分别选修了“传统养生”和“个人理财”网络课程。研究选取其中262名共同选修这两门课学生的考试成绩,以及他们在入学时登记的一些基本个体信息——性别、年龄、身份证号码、民族、政治面貌等。根据研究的需要,将这些基本个人信息归结于五个个体属性——性别、年龄、户籍、民族和政治面貌,再加上他们就读的专业层次,这样形成了六个个体属性。这六个个体属性具有各自的特点,从而会影响学生的网络课程学习行为以及最终的考试成绩。

男生对自己感兴趣的课程,愿意花费较多的时间来学习,而一般的网络课程,可能会利用零星的空余时间,甚至在考前突击观看视频,这样就会影响平时成绩(学习进度),但是他们会主动在网上查询和学习相关知识,也能够较好地完成作业;女生一般能够按照教学要求观看视频和完成作业,这样可以获得较高的平时成绩,她们会利用整段时间来学习网络课程,取得好的学习效果。

人的记忆力随年龄而发生变化,年龄小的有好的记忆力,能够较快地学习新知识;如果网络课程的网页呆板,课堂辅导缺少交互性,教师网上答疑不够及时,这些对年龄小的学习会有负面影响;年龄小的学生还习惯于集中式课堂学习,而年龄大的更喜欢独立地自主学习;另外,年龄大的学生相对年龄小的,具有一定的生活和工作压力,这样也会带来学习行为的变化。

在专业层次方面,一般来说本科层次学生比专科层次学生学习基础好,学习方法和技巧也高,能够在课程学习中取得较好的成绩。沪籍学生是在上海较高的高考录取率淘汰后,进入继续教育学院读书的,相对非沪籍学生,他们的学习基础差一点;非沪籍学生还有一个迫切愿望和动力,就是通过再学习来达到“户口入沪”打分标准。在政治面貌个体属性中,一般认为党团员自律性比较高,能够完成教师布置的作业,获得较高的平时成绩,因而考试成绩也会高一点。

将学生的个体属性进行数据处理(变量设置),如表1所示,处理后的学生个体属性数据,通过“学号”和他们的考试成绩进行关联。表1还给出了不同属性学生数量分布图,可以发现除了民族和政治面貌这两个属性分布不均匀以外,其它几个属性的分布基本一致。

在年龄属性数据处理时,将所有学生分成三个年龄段。25岁以下学生是一个年龄段,这些学生从学校出来时间不长,一些是高中毕业直接读专科,一些是专科毕业读专升本(本科),还具有学习的持续性和集中学习的习惯;他们年龄小,接收新知识能力强;这个年龄段的学生易受外界影响大,还容易贪玩,会影响到学习成绩。26岁到35岁是另外一个年龄段,在这个年龄段的学生,一般都结婚组成家庭,生活工作有压力,学习时间和精力受到外部因素影响大;通过再学习来得到职业晋升以及工作环境改变,甚至为了子女教育等,这些又成为他们再学习的动力;36岁以上年龄段学生,离开学校时间长,已经不习惯集中学习的教学方式,更喜欢根据自己的时间和精力来安排学习;丰富的人生阅历和知识积累,对自己感兴趣的新知识有一套自己的学习方法,能够获取较好的学习效果;这个年龄段的学生,特别是非沪籍学生,改善生活(比如户口入沪打分、子女入学等)也是他们主要动力之一;另外他们年龄相对大些,记忆力下降,学习效率和精力易受影响,会导致一些课程学习效果不佳。

三、分析方法

相关性分析是数据挖掘中的一种方法,它研究变量之间是否存在某种依存关系,并对具有依存关系的现象探讨其相关方向以及相关程度,一般常用相关系数ρXY来表示。在n个实验样本中,变量X和Y的相关系数用公式(1)表示:[4]

ρXY=(1)

其中,SX和μX是样本X的标准偏差和均值,SY和 μY是样本Y的标准偏差和均值。

相关系数ρXY取值在-1到1之间,ρXY=0时,变量X和Y不相关;ρXY=1时,变量X和T完全相关;ρXY>0.8时称为高度相关,当ρXY<0.3时称为低度相关,其它時候为中度相关。

用t试验来验证相关系数ρXY的有效性, 如公式(2)所示:

t=(2)

把一个要检验的假设记作H0,称为原假设(或零假设),与H0对立的假设记作H1,称为备择假设。在原假设为真时,决定放弃原假设出现的概率,通常记作α,这样的假设检验称为显著性检验,概率α(P 值)称为显著性水平。α值小于0.05时说明显著,α小于0.01时就是非常显著。

四、结果及讨论

1.学生个体属性和考试成绩的相关性分析

通过“学号”这个关联词,将每个学生的个体属性数据和他们的考试成绩做相关性分析,采用公式(1)计算它们的相关系数

从表2可以看到,所有相关系数的绝对值都小于0.3, 处于一个低度相关或不相关,说明本研究中选取的六个学生个体属性不是影响学生成绩的主要因素;从这些已研究的学生个体属性中,能够得到学生的性别、年龄、户籍和成绩存在一定的依存关系,它们和成绩的相关系数绝对值是在0.12到0.19之间,其它三个个体属性和成绩的相关系数绝对值全部小于0.12,甚至趋于0,说明它们和成绩不相关或极弱相关;另外学生的六个个体属性和这两门课程的考试成绩之间呈现一致的相关性,比如性别和户籍是负相关,年龄是正相关,专业层次、民族和政治面貌都是不相关(极弱相关)。

在性别和成绩的相关性分析中,发现这两门课程的男生成绩都不如女生,所研究的两门课程“传统养生”和“个人理财”是扩展知识、培养兴趣的选修课,只要按照教师的要求,认真观看网络课程,完成平时作业,一般来说能够取得较好的成绩,符合女生的学习行为,因而能够取得较好的分数。在相同的样本分析中,“传统养生”课的相关系数是-0.1895,而“个人理财”课的相关系数是-0.1515,后者比前者稍高一点,说明男生“个人理财”课成绩和女生的差距,没有“传统养生”课的大,男生对比女生的劣势降低了,这个也印证了男生愿意在他们感兴趣的“个人理财”课程学习中多花费时间。

在年龄和成绩的相关性分析中,两门课程的相关系数都呈现正相关性,也就是年龄大的学生取得的成绩比年龄小的要高,说明年龄大的学生对这两门课程更加感兴趣,刺激和调动他们的学习愿望和热情,在学习中投入的时间更长,学习新知识更加积极和认真,能够取得更加好的学习效果。

另外从户籍和成绩的相关性分析来看,户籍对考试成绩也有一定的影响,上海籍学生的成绩比非上海籍学生考试成绩差,说明非沪籍学生更想通过这样的选修课取得较好的成绩,进而提高整个学习期间的GPA(Grade Point Average,平均成绩点数),也说明非沪籍学生的学习基础比沪籍学生要好,学习新知识的能力强。

其它三个属性专业层次、民族和政治面貌与考试成绩的相关系数都接近0,说明它们之间几乎没有相关性或相关性极弱。

2.学生个体属性和考试成绩的显著性分析

由于样本数量有限,相关性分析得到学生的个体属性和他们成绩的相关系数可信度是否高,需要通过试验来验证,表3给出了它们的显著性P值。一般来说,P值小于0.05就说明是显著的,而小于0.01就是非常显著,实验结果可信度很高。从表3可以看出,性别、年龄、户籍和成绩的显著性P值全部小于0.05,而在传统养生课程中,性别、年龄的显著性P值小于0.01,表现出非常显著,说明相关性分析中得到的结论和实际情况符合。在“传统养生”课程中,政治面貌和成绩的相关系数是0.1122,似乎说明两者之间有依存关系,但是从它们的显著性P值(0.0699)来看,它们是不显著的,说明相关系数0.1122是不可信的。

五、结束语

本文提出了研究学生个体属性和考试成绩相互关系的一种方法,采用数据挖掘研究继续教育学生的个体属性和他们在网络课程学习考试成绩的相关性,发现在“传统养生”和“个人理财”两门网络课程学习中,学生的个体属性和考试成绩之间存在一定的依存关系,女生成绩好于男生,年龄越大成绩越好,非上海籍学生在这两门课程中取得的成绩比上海籍学生高,而这两门课的成绩和学生的民族、政治面貌以及专业层次没有相关性。

研究基于学生入学时填写的个人基本信息,来探讨个体属性和网络课程考试成绩的关系,结果表明这些基本属性和考试成绩之间是一个弱相关,说明影响学生成绩可能还有其它一些个体属性(比如婚姻状况、孩子数量、职业等)以及网络学习行为,因此将学生个体属性和在线网络学习行为结合起来,针对它们和考试成绩的关系值得进一步研究。

参考文献:

[1]Franciska Hegyesi, Jozsef Kopjak, Rita osz. Educational Strategies in Adult Education. 9th IEEE International Symposium on Applied Computational Intelligence and Informatics[C].Timisoara, Romania,May 15-17,2014:219-223.

[2]魏顺平.在线学习行为特点及其影响因素分析研究[J].开放教育研究,2012(4): 81-90.

[3]Chien-Ming Chen, Cheng-Hao Ma, Bin-Shyan Jong et al. Using Data Mining to Discover the correlation between Web Learning Portfolios and Achievements.38th ASEE/IEEE Frontiers in Education Conference[C]. Saratoga Springs, NY. October 22-25, 2008.9-14.

[4]Daulet Moldabayev, Joseph A. Menicucci Jr., Sarim Al-Zubaidy et al. Attendance, Performance and Culture. 2013 IEEE Global Engineering Education Conference [C].Technische Universitat Berlin, Berlin, Germany.March 13-15,2013:6-10.

(编辑:王天鹏)

猜你喜欢

网络课程继续教育相关性
对会计人员继续教育问题的研究
新时代下会计人员继续教育研究
小儿支气管哮喘与小儿肺炎支原体感染相关性分析
脑梗死与高同型半胱氨酸的相关性研究(2)
脑梗死与高同型半胱氨酸的相关性研究
对初中英语教师继续教育模式的思考