基于R语言在教学中学习成绩分析的探究
2018-09-15巴桑卓玛
范 娟 巴桑卓玛
(西藏大学理学院 西藏 拉萨 850000)
一、引言
R是用于设计支持统计计算和图形绘制的一类编程语言,也
指实现该语言的软件环境,同时更是一款免费的开放自由软件。R是一个GNU项目,这即确保了R的开源优势,许多不同领域的工作者致力于研究编写各专业的安装包和函数,为R的普及发展和便捷应用提供了良好重要的现实基础。本文基于R语言的学生成绩解析作为实例主题而展开研究。
二、成绩分析
下面将借助R语言实例应用环节计算和作图分析,本文以高三一班69个同学的理科成绩为数据对象,课程包括语数英外物化生,原始数据存储为表,数据分析前数据导入到R语言。
(一)学生成绩分布
了解学生成绩的分布,可采用直方图、茎叶图,所以本文判断学生成绩是否属于正态分布,结合R语言的Q-Q图,使用函数qqnorm()和qqline()验证样本是否正态分布,然后拟合正态分布曲线,最后对试卷评估。
本文以英语和理综/文综成绩为样本进行实例应用,画出两科成绩的直方图和Q-Q图,判断语文和数学成绩是否属于正态分布,评估试卷的出题质量难易。
图1 两科直方图与Q-Q图
从图中英语和理综/文综成绩基本上服从正态分布,命题相对更科学,质量要更好些。最后,使用shapiro.test函数,p值表示的是服从正态分布的概率,语文和数学成绩P值分别为0.417和0.102,都大于0.05,两科成绩分布都属于正态分布。
2.初步统计分析
通过R语言的函数功能来实现对学生学习成绩的初步分析,以高三一班6个考试科目成绩为例,进行分析。
表1 初步统计表
看表1发现变异强度最低的是语文学科,其次是数学学科,除了上面的函数外,还可以通过summary()函数来简单地得到成绩的信息。
2.学生学习成绩的差异性
结合R语言中stars()函数,我们据学生的成绩数据画出学生成绩星图。
Stars()函数能处理三到五维的数据,英语、化学/历史的变异系数太大,所以选取除此的五门数据进行处理,如图2所示,从图中可以看到69个学生关于五个科目的成绩轮廓图,班上学习成绩差异较大。
三、结语
R是一套强大的数据统计、分析和制图的软件系统。本文中将R语言引入教学分析,介绍了几个相对简单易学的图,在平时生活中常见的图例都可以运用R语言得到设计实现。另外,通过本次研究可知,相比通过语言描述理解计算的方式,利用图示能够更趋生动形象地地呈现数据价值,并基于当下学生成绩,有的放矢调整教学方案,逐步达到客观理想的教学目标。
图2 成绩星图