APP下载

基于主成分分析的考试成绩与能力相关性研究

2018-04-12缪盾

科技视界 2018年10期
关键词:主成分分析考试成绩相关性

缪盾

【摘 要】考试是一种重要的、常用的教育测量手段,在高校中被广泛使用。如何合理的看待学生考试成绩与能力的关系,是帮助学生了解自己不足,明确努力方向的关键,也是学生就业方向选择和创业的判别依据。通过主成分分析的方法对大量考试数据进行数据挖掘,找出评价的综合指标,保留原始变量的主要信息,使我们在评价学生的能力时能够抓住主要方面。

【关键词】考试成绩;主成分分析;相关性

中图分类号: R95 文献标识码: A 文章编号:2095-2457(2018)04-0011-003

Research on Correlation between Test Score and Ability Based on Principal Component Analysis

MIAO Dun

(Zhejiang University, Tongji University, Jiaxing, Zhejiang 314051, China)

【Abstract】Examination is an important and commonly used measure of education and is widely used in colleges and universities. How to reasonably treat the relationship between students test scores and abilities is the key to help students understand their own shortcomings and make clear the direction of their efforts. It is also the basis for the selection of students employment orientation and entrepreneurial basis. Through the method of principal component analysis, data mining is performed on a large number of test data to find comprehensive indicators for evaluation, and the main information of the original variables is preserved, so that we can grasp the main aspects when evaluating students abilities.

【Key words】Test scores; Principal component analysis; Correlation

0 引言

考試作为一种常规性的评价手段,是用来评估教与学质量和水平的重要方法,且贯穿于学生求学的各个阶段节点上。尤其在高校,一门课程的考试就意味着这门课程的终结,考试成绩与学生能力的关系被简单的赋予正相关的关系,即考试成绩高,则认为学生能力高,导致学生、家长甚至是教师都一味的追求高分,却忽略了高分背后是否真正体现了高能。考试能力不代表学生真正的专业能力和学业能力,因此如何合理看待学生考试成绩与能力的关系,是学生明晰自身能力偏向,择业方向的关键,也是教师综合评价学生能力,潜力和个性化教学的判别依据。

1 主成分分析法

高校学生的考试成绩数据量庞大,每个个体又由很多元数据组成,个体数据和群体数据又存在复杂的联系,给分析带来了很大的不便。采用目前主流的统计分析方法—主成分分析法,借助计算机快速处理信息数据,能较为客观地透过数据表象看到数据背后的内容。

1.1 方法概述

主成分分析法(Principal component analysis,简称PCA)首先是Hotelling在1933年提出的。主成分分析法是一种利用数学思想达到降低维数的统计方法[1],即把多指标转化为少数几个综合指标(即主成分),使每个主成分能够反映原始变量的大部分信息,这种方法在引进多方面变量的同时将复杂因素归结为几个主成分,使问题简单化,同时得到的结果更加科学有效反映全部数据的信息[2]。

1.2 主成分分析步骤

设研究某一事物涉及到p个分量,每个变量都有n个数据,可以得到一个n×p阶的矩阵,将其记为公式(1)[3]:X=[x(1)

其中i=1,2,…,n;j=1,2,…,p。

(1)对矩阵进行标准化处理,见公式(2)[3]:

其中xj=,则原始矩阵计算后得到的标准化矩阵为:

(2)求得标准化后矩阵的相关系数矩阵,见公式(4):rij=,j,k=1,2,…,p(4)

(3)求得相关系数矩阵R的特征值[λi]和相应的特征向量。

2 考试成绩主成分分析

选取某大学2013级土木工程专业122名学生的15门专业课考试成绩为分析样本,将其各科成绩作为变量,生成122*15的矩阵,部分数据如图1所示:

将课程变量用代码表示,如表1所示:

每位学生的学业成绩为mi=[X1i,X2i,…,X15i],其中i∈[1,122]。得到考试成绩原始矩阵X=,通过对样本相关阵的内部结构关系的研究,找出影响学生成绩的综合指标,使综合指标为原变量的线形组合。综合指标不仅保留了原始变量的主要信息,彼此之间又不相关,比原始变量具有一些更优越的性质,使我们在评价学生的能力时能够抓住主要方面。标准化矩阵并计算样本相关系数,求得矩阵的特征值和贡献率,如表2所示:

通过表2可以发现前四个主成分的贡献值对最终结果的影响较大,因此本文选取累计贡献率达到70%为阈值,选择前四个主成分变量代替原始的15个变量。求得前四个主成分对应的特征向量如下表3所示:

将每个学生的相应科目成绩代入上式,可以计算得到四个主成分值,第一主成分各个变量的系数均为正值,且相差不大,可以认为第一主成分值代表了学生的综合实力。

第二主成分中,在X7,X9-X13,X15几个变量的系数出现负数,即变量所代表的课程建筑施工,混凝土结构设计原理,基础工程设计等课程的成绩低,则F2值高,这些课程均为专业课,因此可以认为F2值高代表了学生的专业基础扎实,但是专业能力还比较弱。

第三主成分F3中,工程制图,结构力学,气体结构,建筑施工,建筑设备五门课程变量的系数为负值,成绩越低,此分量的值越高,而混凝土结构设计,基础工程设计和钢结构设计三个变量与F3是正相关的,说明得分高的学生能力偏重设计,而施工能力偏弱。

第四主成分F4中,结构力学,砌体结构,混凝土结构设计基本原理,建筑设备,地下工程,基础工程设计,建筑钢结构设计七门课程变量的系数为负值,当学生这七门课程成绩偏低,F4值则高,第四主成分中系数为正的系数较高的变量有工程制图,建筑施工和建筑工程法规,说明F4主成分的值主要体现了学生的识图施工实操能力,但所体现的设计计算能力偏弱,所以通过F4主成分排序后可建议得分高的学生往施工方向就业。

3 结论

在高校,学生和教师都要理性的看待考试成绩,通过先进的统计方法,挖掘考试成绩[5]中隐含的意思。本文采用了主成分分析的方法,评价了毕业班学生的综合能力,从第二、第三、第四主成分计算值中可以了解到学生在专业能力上的偏向,对学生择业或创业,继续深造中的方向选择,发挥优势,弥补劣势提供了判别的依据,为教师开展针对性的教学改革,课程改革和分层教育提供了依据。

【参考文献】

[1]刘佳佳,刘志杰.基于MATLAB的考试数据主成分分析[J].电脑知识与技术,2015,11(1):10-14.

[2]劉天华.技术视角下的高校考试改革探析[J].教育探索,2016,23(12):69-71.

[3]张超,彭道黎.基于PCA-RBF神经网络的森林碳储量遥感反演模型研究[J].中国农业大学学报,2012.57(4):148-153.

[4]李瑞琴.主成分分析在学生成绩综合评定中的应用[J].开放教育研究,2003,44(4):49-51.

[5]李真,廖兴.基于大学生考试成绩相关性分析-以四川大学锦城学院工业工程专业为例[J].技术与市场,2017,24(4):260-261+262.

猜你喜欢

主成分分析考试成绩相关性
考试成绩转换成偏态分布量化成绩的算法
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
小儿支气管哮喘与小儿肺炎支原体感染相关性分析
脑梗死与高同型半胱氨酸的相关性研究(2)
脑梗死与高同型半胱氨酸的相关性研究
因子分析法在高中地理考试成绩分析中的应用