基于PCA与BP神经网络的小学教育质量指数研究
2023-05-10罗杰冯超
罗杰 冯超
关键词:教育质量指数;影响因素;PCA;BP神经网络;BPEQI
1引言
小学教育作为中国教育的组成部分,已被列入国家教育的重中之重[1]。保证小学教育的质量,是实现“科教兴国”战略的基础保障。2001年,在《国务院关于基础教育改革与发展的决定》文件中提出,“改革考试评价和招生选拔制度”“建立对地区和学校实施素质教育的评价机制”。由此可见,建立一套完善的小学教育质量评价体系,量化教育质量评价指数,一直以来都是国家教育发展的战略需求。
目前,国际教育指数体系主要包括3类:世界银行发行的《世界发展报告》、联合国教科文组织的教育指数体系、经济合作与发展组织的教育指数体系[2],这些指数体系过于宽泛,并且难以适用于不同地区的教育评价。针对不同地区情况和我国基本国情,适用的指数有人口文盲率、入学率、专任教师岗位合格率等。然而,分散而庞杂的指数体系难以给教育质量直观的评价,并且不同指数之间缺乏逻辑关系,难以建立理论框架。因此,一种基于经济学基尼系数的指数体系被应用到教育质量评价中[3]。这种基于基尼系数的质量评估局限于评价分配体系的公平程度,难以为小学教育质量评价提供多角度的指数。
为了弥补上述小学教育质量评价体系中的缺陷,本文综合考虑不同地区小学校数、教学点数、班数,学生数、教职工数、专任教师学历情况、专任教师年龄结构、图书馆数量等因素,提出了一种基于主成分分析(Principle Component Analysis)与BP神经网络(Backpropagation neural network)模型的量化指数PBEQI(Principle Component Analysis and Back propagationneural network Education Quality Index),来评价我国不同地区的小学教育质量,为我国教育质量评估提供新的理论框架与应用参考。
2影响因素相关性分析
影响小学教育质量因素众多,本文调研了全国31个省份的小学教育情况,考虑的影响因素主要有:小学招生数、各年级在校生数、小学学校数、教学点数、各年级班数、专任教师数、行政人员数、教辅人员数、工勤人员数、代课教师数、兼任教师数、教师学历分布(研究生毕业、本科毕业、专科毕业、高中阶段毕业、高中)、教师专业技术职务分布(中学高级、小学高级、小学一级、小学二级、小学三级、未定职级)、小学办学条件(教室、实验室、图书馆、微机室、体育馆、教师办公室、教工宿舍、学生宿舍、食堂、厕所)。
在众多影响小学教育质量的因素中,许多因素之间存在强烈的相关关系。图1为统计了31个省份小学教室面积与实验室面积的散点图,图中每个点对应一个省份,每个点对应的横纵坐标分别表示该省份小学教室总面积与实验室总面积,可以看出,所有的3 1个点均匀分布在黑色的直线附近,这表明小学教室面积(S1)与实验室面积(S2)线性相关,通过教室面积可以推算出实验室面积,推算式为:
在统计学中,互相关矩阵与协方差矩阵能够刻画任意2种变量之间的关系。然而,影响小学教育质量因素间的相关关系十分复杂,可能存在2种或3种因素的共同作用下,与另1种影响因素相关。例如,学生数与专任教师数二者共同作用下与教室面积相关。显然,互相关系数或者互相关矩阵难以描述多種因素之间的相关性。在数据挖掘领域可用主成分分析(PCA)来分析不同影响因素之间的线性相关关系。利用PCA对影响小学教育质量的因素进行降维,首先将31个省份的70种影响因素组合成待降维的矩阵,其次将其中心化(减去均值),并计算协方差矩阵,然后对协方差矩阵进行特征分解,得到特征向量,最后取特征向量前若干行组成降维后的矩阵,以保留95%的信息。实验表明,通过对影响小学教育质量的因素利用PCA进行降维,包含有70种影响因素的数据降维到6维,并且这6维保留全部信息的95%,这6种新“构造”出来的影响因素并非原来的影响因素,而是70种影响因素的线性组合。换言之,大量的影响因素是线性相关的,这也符合最初对影响因素之间高相关性的推断。
3评价指数建立
由第2节可以得到剔除冗余后所构造出的6种新的影响因素,这6种影响因素将用于评价指数的建立。纵观文献,评价指数的提出往往是给不同影响因素分配不同权重,重要的影响因素分配大的权重,这种分配方式本质上是一种线性模型的理念。然而,实际的教育质量评估系统十分复杂,利用线性模型显然难以刻画出影响因素与教育质量之间的关系。因此,利用非线性模型来构建小学教育评价指数体系,有着非常坚实的理论依据与实际价值。在机器学习领域,最经典的非线性模型是BP神经网络。对于BP网络,首先需要利用训练数据训练网络,得到模型的各个参数:然后利用测试数据对模型进行测试;如果测试精度达标,最后就可以利用训练好的模型进行预测,得出小学教育质量评价指数。在教育质量评价指数体系构建中.BP网络的输人为PCA降维后的6种影响因素的值,输出为评价指数。为了获取训练数据中的基准评价指数,可以参考文献[4]。表1列出了教育质量最好的前3个省份教育质量指数与本文预测教育质量指数PBEQI。
根据表1可知,前3个省份的教育质量指数预测效果较好,所构建的PBEQI指数能够较好地刻画地区的小学教育质量。
4结束语
本文研究小学教育质量指数框架的构建,并提出了一种新型的指数PBEQI。影响小学教育质量的70种因素从中国教育部网站获取,通过PCA降维得到保留原数据95%信息的新的影响因素;将降维后的因素输入到BP神经网络中进行训练,得到最优的网络模型,并通过测试验证了模型的准确性,最终构建出一套完整的小学教育质量指数体系框架。该框架能够很好地应用到不同地区的小学教育质量评价中,对于中等教育和高等教育的教育质量评价,同样有借鉴意义。