基于聚类分析方法的高职高等数学分层教学的新探索
2010-12-31曾亮
职业时空 2010年11期
摘要:结合肇庆科技职业技术学院“高等数学”分层教学实践,按模块给出一套难易适中的分层考试试题,依此试题统计出考生的各模块得分情况,再使用聚类分析方法中的K-均值聚类法对记录进行分类,根据分类结果从而制定相应的授课计划。结果对比显示,此分类法较按成绩排名分类更具科学性、合理性,为高职高等数学分层教学的推广提供了一种新思路。
关键词:高职教学;分层教学;聚类分析;K-均值聚类法;SPSS软件
高职高等数学分层教学已得到普遍实施,目前,对学生进行分层时通常采取的措施是根据专业或者分层考试成绩来分[1-3]。然而,如何较好地利用考试成绩来科学合理地分层,这仍然是亟待完善解决的问题。本文根据聚类分析的基本原理和方法,借助SPSS软件实现了对分层考试有关数据的计算,得出了一套科学合理的分层方案,为高职高等数学分层教学的推广提供了新思路。
一、高职高等数学分层教学的思路
由于我院为民办高职院校,入校学生数学基础参差不齐,若采取统一授课方式,易造成“基础好学生吃不饱,基础差学生跟不上”的局面,故有必要在新生入校后进行高等数学分层考试,按层次分班并有针对性地进行授课。以往的分层方式是直接按考试成绩从高到低分段分层,笔者认为这种方式存在一定的弊端,比如甲和乙为两个考试成绩一样的学生,被分入同一层次,接受同样的授课方式貌似很合理,其实不然,极有可能这两位学生在各个知识模块上所掌握的程度不同,极端情况是截然相反。比如甲学生导数知识模块比较好,但在空间解析几何模块方面较差,而乙学生的情况恰好与甲学生相反。因此,为了较好地避免此类问题的发生,这需要在试卷命题和如何分层上得到解决。
我院学生中95%以上为广东地区学生,且各个专业文理科生并存。依照《2009年普通高等学校招生全国统一考试数学(理科)考试大纲的说明(广东卷)》,并结合《高等数学》课程授课内容,为更好地体现学生的真实数学基础,将入学分层考试试题安排50小题,百分制,分为8个模块,各模块及其分值分别为:
(1)函数概念及基本初等函数Ⅰ(指数函数、对数函数、幂函数),20分。考查范围为函数定义域,函数图象理解,函数单调性,指数、对数计算等。
(2)空间解析几何与空间向量,10分。考查范围为空间直角坐标系表示点的位置,空间两点间距离,平面、球体方程表示,空间向量的线性运算、数量积和有关应用等。
(3)三角函数,12分。考查范围为正弦、余弦、正切间的相互转换以及有关它们的图像、周期、单调性、最值,二倍角公式,和与差的三角函数公式等。
(4)数列,8分。考查范围为数列通项表示方法,等差等比前项和等。
(5)导数及其应用,20分。考查范围为导数运算,导数几何意义,利用导数判断函数单调性和求极值、最值等。
(6)定积分,6分。考查范围为定积分的相关概念,几何意义和简单定积分的计算等。
(7)圆锥曲线与方程,8分。考查范围为圆、椭圆、双曲线、抛物线的标准方程、图像及简单性质等。
(8)极限,16分。考查范围为极限概念,不同类型的简单极限求解等。
二、聚类分析的基本原理与方法
所谓聚类分析[4],就是将研究对象(若干个个体的集合)按照某个标准分成若干类。聚类方法经过多年的发展,已经逐渐形成了自身的方法体系。进行聚类时,可以是按照变量对观察值进行聚类,这称为Q型聚类;也可以是按照观测值对变量进行聚类,称之为R型聚类。如果按照方法原理来区分,经典的聚类方法大致分为三类[5]:层次聚类法、非层次聚类法(以K-均值聚类法最为常用)和智能聚类方法(较常见的是两步聚类法和神经网络中的自组织图技术)。
由于文中需要聚类的数据量较大,而且是对记录进行聚类,故选择K-均值聚类法实现。K-均值聚类法又叫快速聚类法,这种聚类方法的思想是把每个样品聚集到其最近形心(均值)类中去。它在SPSS软件中是按照如下步骤来进行的:
(1)首先确定需要聚类的类别数量,这个是由分析者自己指定。
(2)根据分析者自己指定的聚类中心,或者由数据本身结构的中心初步确定每个类别的原始中心点。
(3)逐一计算每一个记录到各个类别中心点的距离(默认为欧式距离平方来度量),把各个记录按照距离最近的原则归入各个类别,并计算新形成类别的中心点。
(4)按照新的中心位置,重新计算每一记录距离新的类别中心点的距离,并重新进行归类,更新类别中心点。
(5)重复步骤4,直到达到一定的收敛标准,或者达到分析者事先指定的迭代次数为止。
三、聚类分析应用于分层教学的过程及SPSS软件的实现
分层考试试题中八个模块依次用变量X1-X8表示,对应情况如下:
X1:函数概念及基本初等函数Ⅰ(指数函数、对数函数、幂函数)模块;X2:空间解析几何与空间向量模块;X3:三角函数模块;X4:数列模块;X5:导数及其应用模块;X6:定积分模块;X7:圆锥曲线与方程模块;X8:极限模块。
限于篇幅,现只抽取2009-2010学年度机电系部分学生(共20人)入学分层考试成绩来做分析。各模块得分情况如下表1:
由于各变量为连续性的,同量纲,且数量级相差不大,故在聚类分析前不需将数据作标准化处理。通过SPSS软件实现快速聚类法[6],将分类数定为3,可以得到表2-表5重要表:
输出结果中,表2是样本的分类情况。从表中可以看出,根据考试成绩将20名学生分为这样三类:{1:4、7、9、11、12、13、15、18、19};{2:1、2、8、16、17};{3:3、5、6、10、14、20}。从表3和表5中可以看出,第一类为大部分模块表现较好,个别模块表现一般的学生。此类学生数量为9人。该类学生在第二模块(空间解析几何与空间向量模块)、第三模块(三角函数模块)和第五模块(导数及其应用模块)都表现比较突出,相对薄弱模块为第七模块(圆锥曲线与方程模块)和第八模块(极限模块)。第二类为总体表现一般,个别模块表现突出的学生。此类学生数量为5人。该类学生在第七模块和第八模块表现比较优秀。第三类为总体表现较差的学生。此类学生数量为6人。该类学生在第一模块(函数概念及基本初等函数Ⅰ模块)和第六模块(定积分模块)极其薄弱,第六模块得分情况实际上和文理科有一定的关系。有了这些信息,那么在对各类学生进行授课时则可以比较有针对性,对表现好的模块部分少讲或者往更高难度讲,对薄弱环节则重点详细讲解,使其掌握这些必备的基础知识。比如,在对第三类学生授课时,应首先详细讲解函数概念和指数函数、对数函数、幂函数的有关内容。表4为方差分析表,根据F值的大小可近似得到各个变量对聚类结果的重要程度(由重向轻)依次为:导数及其应用模块、函数概念及基本初等函数Ⅰ(指数函数、对数函数、幂函数)模块、空间解析几何与空间向量模块、极限模块、圆锥曲线与方程模块、定积分模块、三角函数模块、数列模块。
将此分类结果与按成绩排名情况相对比,可得到表6:
从表6可以看出,按聚类分析方法分类与直接按成绩排名分类有所不同。例如序号为17的学生虽然排名靠前,但将其列入第二类,从表1的实际成绩来看,该学生极限模块掌握的很好,而导数及其应用模块欠佳,与第一类学生相比有差距,而与第二类学生相比恰为极限模块都掌握很好的一类,因此,将其划入第二类较为合适。由此看来,用聚类分析进行分类比直接按成绩排名分类更科学、更合理。
四、该方法的改进及推广
以上在用K-均值聚类法进行分类时,将初始分类数定为3,此分类数可根据本校的具体实际情况来确定。分类越多,层次就越分明,授课就更有针对性,但与此同时,带来教学管理上的不便。同时,变量的选取也具灵活性,而值得注意的是,在进行聚类时,应该尽可能考虑变量之间的相关性,否则容易造成聚类结果的区分度不强或者意义不大。如果存在共线性问题,最好先对变量进行预处理(剔除,或者提取主成分)再进行聚类分析。由于K-均值聚类法适用于大数据量的分类同时不占太多的内存空间和计算时间,所以可进行大范围推广。
参考文献:
[1] 邓轶婧.分层次教学在独立学院微积分教学中的应用[J].廊坊师范学院学报(自然科学版),2010,10(3):134-136.
[2] 沈忠环.分层教学在高等数学教学中的应用[J].中国电力教育,2009,(6):33-34.
[3] 范晓兰.分层教学在高等数学教学中的探索[J].现代教育,2007,(2):76.
[4] 费宇.应用数理统计——基本概念与方法[M].北京:科学出版社,2007:145.
[5] 张文彤.SPSS统计分析高级教程[M].北京:高等教育出版社,2004:236-260.
[6] 何晓群.多元统计分析(第二版)[M].北京:中国人民大学出版社,2008:102-104.