APP下载

主成分聚类分析法在综合评价学生成绩中的应用

2016-11-15齐宗会

太原城市职业技术学院学报 2016年8期
关键词:平均分方差聚类

齐宗会

(天津商业大学宝德学院,天津 300384)

主成分聚类分析法在综合评价学生成绩中的应用

齐宗会

(天津商业大学宝德学院,天津 300384)

本文采用SPSS统计软件对学生的课程成绩进行主成分聚类分析,分析结果显示,主成分聚类分析综合评价法比传统的平均分分析法和主成分分析综合评价法更科学、更合理,同时该方法为学校管理层提供更可靠的学生管理信息。

主成分分析;聚类分析;平均分;累积方差贡献率

高校现行的评优方法就是依据学生的综合测评成绩进行评优,而综合测评中占主要分量的就是学生的课程成绩,但如果仅是将学生的课程成绩进行简单累加再取平均分来评价学生的优劣不太合理,因此我们需要对学生的课程成绩进行综合评价。通过学生各科成绩来对学生进行综合评价的问题属于多指标问题。因为学生的各科成绩之间会有一定的相关性,所以我们需要将学生的各科成绩重新组合,然后根据需要从这些重新组合的新的彼此无关的成绩指标中选出几个具有代表性的指标来尽可能多地反应原始数据的信息,这就是所谓的主成分分析法。主成分分析法的思想就是先考虑第一主成分,如果第一主成分的方差贡献率大于等于85%,这时我们可以认为第一主成分可以反映原始数据的大部分信息,然后根据第一主成分得分对学生成绩进行排名即可。但一般情况下,第一主成分的方差贡献率都达不到85%,所以我们需要考虑第二、第三等主成分,得到主成分综合得分F=η1F1+η2F2+…+ηiFi(其中Fi表示选出的主成分,ηi为各主成分的方差贡献率),然后利用主成分综合得分对学生成绩进行排序和评价。这种综合得分评价法看起来非常合理,但经简单计算可知,主成分综合得分不但没有增加方差的贡献率,反而使得方差的累计贡献率变小了(综合得分反映原始数据的信息量更小了),所以当第一主成分方差贡献率不够高的时候,利用该方法对学生成绩进行评价难以服众。本文采用主成分聚类分析方法来评价学生的成绩,就能很好地解决上述问题。

1.主成分聚类分析法的思想和步骤

主成分聚类分析法是指将主成分分析与聚类分析相结合,先对数据进行主成分分析,得到主成分得分矩阵,根据原始数据和主成分得分矩阵计算出新的数据矩阵,然后对新矩阵进行聚类分析,进而得到主成分聚类排名。具体做法如下:

(1)按照累计方差贡献率不低于85%的原则选出前r个主成分,得到前r个主成分的得分Fk(k=1,2,…,r)。

(2)由原始数据矩阵与主成分得分矩阵(F1,F2,…Fr)相乘得到新的数据矩阵,并对新的数据矩阵进行系统聚类

(3)计算各类中样品的第一主成分得分均值,确定类间排序

(4)根据每一类中样品第一主成分得分确定每类中样品的排序,进而得到主成分聚类分析排名。

2.主成分聚类分析法在综合评价学生成绩中的应用

对天津商业大学宝德学院国际工商管理系会计学(注册会计师方向)1212班44名学生大一、大二两个学期15门考试科目课程成绩做主成分分析。15门课程对应15个指标,分别记为:微积分x1,线性代数x2,大学英语x3,毛泽东思想和中国特色社会主义理论体系概论x4,数据库技术x5,计算机基础x6,管理学x7,会计学原理x8,微观经济学x9,宏观经济学x10,中级财务会计x11,统计学x12,经济法x13,市场营销学x14,财务管理x15,这15门课程成绩为变量。这44名学生的15门课程成绩构成44×15的矩阵作为原始矩阵。15门课程学分不同,说明每门课程对学生的影响不同,所以我们采用各门课程的学分除以总学分作为每门课程的权重,再乘以该门课程的原始成绩来合理化数据,而对于多学期授课的课程,如微积分是将各个学期课程成绩平均值作为该门课程的原始成绩。

首先借助SPSS软件将合理化的数据标准化,计算标准化之后的各门成绩之间的相关系数矩阵。结果显示:微积分与线性代数显性相关,相关系数高达0.684,这说明大一打好微积分的基础对大二线性代数的学习有很大的帮助;微积分与微观经济学、宏观经济学、中级财务会计、统计学、市场营销、财务管理这些专业课程显著相关;线性代数与宏观经济学、中级财务会计、统计学、经济法、市场营销学、财务管理这些专业课显著相关,说明学好数学基础课对本专业课程的学习有非常重要的影响。除此之外,许多专业课之间的相关性也比较强,说明这15门课程信息具有很大的重叠性,而因子分析中的主成分分析法正是解决此类信息相关性较强问题的一种方法。它将原有相关性较强的成绩指标重新组合成一组相互无关的综合指标,再根据实际需要选取较少的指标来尽可能多地反映原始数据的信息。该方法降低了数据的维数,为实际计算提供便利。

利用SPSS软件对标准化后的数据做因子模型的适应性分析,得出KMO=0.720>0.6,Sig=0.000通过KMO和Bartlett的检验,说明原始数据适合做主成分分析。抽取主成分时采取主成分对应的特征值大于0.5的前r个主成分,因子分析收敛的最大迭代次数为25。借助SPSS软件提取出8个主成分,其累积方差贡献率高达88.132%,满足累积方差贡献率不低于85%的判断准则,旋转的成分矩阵在第18次迭代后收敛,所以只需选择前8个主成分即可表达原来15个指标所包含信息量的88.132%。由合理化的原始数据矩阵乘以主成分得分矩阵得到新数据矩阵,对该矩阵进行系统聚类分析,类间距离采用平方和Ward法,聚类阙值为5。44个学生被分为9类,按照各类的第一主成分得分的平均值得出类间排序,再按每类中每个成员的第一主成分得分对44名学生进行主成分聚类排名,并将主成分聚类排名、主成分综合得分排名和平均分排名列表如下。

由表格中找到5号同学和29号同学,5号同学的平均分排名为21,主成分综合得分排名为18,主成分聚类排名为32,而29号同学的平均分排名在26,主成分综合得分排名在21,主成分聚类排名为28,5号同学的平均分排名和主成分综合得分排名都排在29号同学前面,而主成分聚类排名却排在29号之后。查询两名同学的原始成绩可以看出,5号同学的15门课程的总分高于29号同学,所以5号同学的平均分排名和主成分综合得分排名都排在29号同学的前面,但具体分析两名同学的成绩不难看出,5号同学大学英语94分,而微观经济学才54分,5号同学15门成绩的总方差高达101;而29号同学15门成绩则比较稳定,15门课程成绩总方差才78。通过对两名同学的原始成绩进行分析不难看出,5号同学存在偏科现象,对自己喜欢的课程比较有积极性,考试成绩较高;对自己不喜欢的课程,则是消极对待,致使该门课程考试成绩不及格。而29号同学则是注重均衡发展,每门课程都能认真学习,所以每门课程都取得较好的成绩。而我们大学的教学就应该注重学生的均衡发展,尽量避免“瘸腿”现象的发生,主成分聚类分析排名能很好地体现这一点,所以说主成分聚类分析比主成分分析和平均分分析更具优势。同时,在开展学生管理工作的时候,班主任可以根据学生成绩的不同特点采取不同的方法。比如5号同学,班主任可以向微观经济学的任课教师说明该学生的偏科情况,让任课教师对该学生多给予关注,加强对该学生学习兴趣的引导,提高他对该门课程的学习热情,进而提高这门课程的成绩,为后续专业课的学习打下基础。而针对29号同学,班主任可以引发他对一些课程更感兴趣,学习积极性更高,这样也能提高他的成绩。

通过对学生成绩的分析得出,主成分聚类分析方法得出的排名比平均分排名和主成分综合得分排名更科学、更合理,它更能体现学生的综合素质,更能适应21世纪对大学生的要求。

学号  1  2  3  4  5  6  7  8  9  1 0 1 1主成分聚类排名  4 0 3 7 9  3 3 3 2 3 8 4 2 3 9 4 1 3 1 3 6主成分综合得分排名  4 2 3 5 1 0 2 5 1 8 3 7 4 1 4 4 3 8 1 7 3 4平均分排名  4 4 2 2 2 9 1 1 2 1 4 0 3 6 4 3 3 4 1 3 3 0

学号  1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 2 1 2 2?主成分聚类排名  1 4 4 3 1 6 2 5 1 9 1 2 3 4 6  2 9 3 5 4主成分综合得分排名  1 6 4 0 1 3 2 8 2 7 1 5 3 1 7  3 3 3 2 5平均分排名  3 8 3 3 1 7 3 1 2 5 1 0 1 5 8  3 5 2 0 9

学号  2 3 2 4 2 5 2 6 2 7 2 8 2 9 3 0 3 1 3 2 3 3主成分聚类排名  1  3 0 1 8 2 6 4 4 2 7 2 8 1 1 2 2 2  2 0主成分综合得分排名 1  3 6 2 4 3 9 4 3 2 2 2 1 8  2 3 3  9平均分排名  1  3 7 2 3 4 1 3 2 2 7 2 6 5  2 4 3  1 4

学号  3 4 3 5 3 6 3 7 3 8 3 9 4 0 4 1 4 2 4 3 4 4主成分聚类排名  2 4 2 1 1 0 2 3 7  1 5 5  3  8  1 3 1 7主成分综合得分排名 3 0 2 9 1 1 2 0 1 4 1 2 6  2  4  1 9 2 6平均分排名  3 9 4 2 7  1 8 1 9 1 2 6  2  4  1 6 2 8

[1]刘璐,杨景明,赵会仁等.主成分聚类分析在学生成绩综合评价中的应用[J].辽宁工业大学学报(自然科学版),2012,32(3):200-204.

[2]张虎.主成分聚类分析法的案例教学方法[J].统计与决策,2007(2):163-164.

[3]禹建丽,郑芬芸,周瑞芳等.主成分分析法在综合评价学生成绩中的应用[J].管理工程师(高教管理),2014,19 (4):60-62.

TP

A

1673-0046(2016)8-0182-02

猜你喜欢

平均分方差聚类
概率与统计(2)——离散型随机变量的期望与方差
这样做合理吗
教你学会平均分
基于K-means聚类的车-地无线通信场强研究
方差越小越好?
计算方差用哪个公式
方差生活秀
平均分一半
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现