APP下载

基于聚类分析法的大学生体质健康评价*

2014-05-14朱家明苏思美赵天梅张娟娟

通化师范学院学报 2014年6期
关键词:生源体质体重

朱家明,苏思美,赵天梅,张娟娟

(安徽财经大学统计与应用数学学院,安徽蚌埠 233030)

基于聚类分析法的大学生体质健康评价*

朱家明,苏思美,赵天梅,张娟娟

(安徽财经大学统计与应用数学学院,安徽蚌埠 233030)

针对大学生体质健康的评价,通过对原始的数据进行分析,先用拉依达法则和Matlab7进行异常点的剔除,得到较准确的数据,分别建立了男女生体重指数(BMI)的对比分析、多元线性回归、K-均值聚类分析、得分等级判定、数理统计和Fisher判别模型,运用Excel、Spss、Eviews软件编程分析法,得到影响大学生体质健康的各类指标的评价标准.

体质健康评价;聚类分析;得分等级判定模型;误差分析

近年来,大学生体质健康呈下降趋势.中国大学生体质调查显示,2010年国民体质监测结果与1985年相比,肺活量下降近10%;大学女生800米跑、男生1000米跑的成绩分别下降10.3%和10.9%,立定跳远成绩分别下降2.72厘米和1.29厘米;学生过重或过瘦,这不能不引起学校、家庭、社会的广泛关注.影响大学生体质健康水平的原因很多,大学生体质健康的评价问题对如何提高体质健康水平有现实指导意义[1,2].本文旨在探究影响大学生体质健康的各类指标的评价标准并建立大学生体质健康的综合评价模型(详见2013年第十届五一数学建模联赛A题).

1 男女生体重指数(BMI)的对比分析模型和多元线性回归模型

1.1 建模准备

(1)对原始数据剔除异常值

拉依达法则[3]:设对某变量测得的值为x1,x2,…,xn,算出算术平均值=(∑xi)/n,以及绝对误差Δxi=xi-,i=1,2,…,n,按贝塞尔公式测得值的标准误差:

若某个测量值xd的绝对误差Δxi(1dn)满足下式|Δxi|3,则认为xd是含有粗大误差的异常值,需剔除不要.

(2)对剔除异常值之后的数据进行分析

首先根据附录1高校大学生体能测试表中男女生身高和体重两指标值,分别计算出男女生的BMI数值,再将它们按照国际生命科学委员会中国办事处规定的符合中国人体质等级标准将男女生的体重指数划分等级.最后由男女生的身高体重等级简历对比分析摸型,进行相关数据的处理,最后得出体重对体质健康的影响.再根据附录1中高校大学生体能测试表中的各项数值,建立影响体质健康的其他各指标与BMI的多元线性回归模型.最后利用Matlab7进行残差分析和拟合优度检验.

1.2 模型的建立与求解

(1)体重指数的对比分析模型

中国人的体质等级:低于15.6为营养不良;15.6~17.5 之间为较轻体重;17.5 ~18.5 之间为轻体重;在18.5~24之间为正常体重;24~28之间为超重;28以上为肥胖;超过31为重度肥胖.可以按照此等级标准规定进行评价,具体划分为:等级1:营养不良 BMI15.6;等级2:较轻体重 BMI值在15.6 ~17.5 之间;等级 3:轻体重 BMI值在 17.5 ~18.5之间;等级4:正常体重BMI值在18.5~24之间;等级5:超重 BMI值在24~28之间;等级6:肥胖 BMI值在28~31之间;等级7:重度肥胖BMI31.通过对该高校大学生体能测试表的数据进行分析,得出BMI等级分布情况如下(见图1、图2).

图1 女生体重指数分布图

图2 男生体重指数分布图

从图1和图2可以看出:一方面该高校绝大多数男生的BMI等级在正常体重范围内,不合格人数所占的比重比较少,不合格人群中,体重轻的男生人数所占比重低于超重和肥胖的男生人数所占比重,同时,男生中没有出现营养不良的现象;另一方面该高校绝大多数女生的BMI等级在正常体重范围内,不合格人数所占的比重比较少,不合格人群中,体重轻的女生人数所占比重高于超重和肥胖的女生人数所占比重,同时,女生中几乎没有出现营养不良的现象.

该高校大学生 BMI等级范围的总体分布情况(见图 3、图 4).

图3 女生BMI等级总体分布图

图4 男生BMI等级总体分布图

从图3和图4男、女生BMI等级的总体分布图中,可以更加直观地看出男女生的体重指数是相对集中的,绝大多数学生的BMI是在正常范围之内的.非正常体重范围内的人数占的比例较少;说明该高校大学生的BMI总体状况还是良好的.由男、女生体重指数分布对比图5中可以看出:男生BMI值要高于女生.男、女生在正常体重两侧的分布不平衡,非正常体重范围中,低体重比例低于超重和肥胖比例,总体偏向高体重一侧,其中男生的现象尤其明显.且集中在正常体重两端的轻体重和超重人数相对较多,说明大学生BMI值有很大的改善空间.

图5 男、女生体重指数分布对比图

(2)多元线性回归模型[4,5]

在女生中:x1表示肺活量体重指数,x2表示台阶测试指数,x3表示坐位体前驱,x4表示立定跳远;在男生中:x1表示肺活量体重指数,x2表示台阶测试指数,x3表示握力指数,x4表示立定跳远.

将所计算出来的男、女生的BMI作为y值.建立男、女生体重指数与影响体质健康的各个指标之间的多元线性回归模型y=β0+β1x1+β2x2+β3x3+β4x4,其中 β0,β1,β2,β3,β4为回归系数.

利用Matlab7建立影响体质健康的其他各指标与BMI的多元线性回归模型,得出的男、女生的体重指数与影响体质健康的各指标之间的多元线性回归方程的回归系数(见表1).

表1 男、女生多元线性回归系数表

据此得出,男、女生体重指数与影响体质健康的各指标之间的多元线性回归模型如下:

根据Matlab7编写的程序后所求得的结果以及男、女生所建立的多元线性回归模型中可以得出附录1中1、2、3班学生的可能偏差测试结果为:前三个班级女生体能测试的各项指标没有异常值;而在男生体能测试中有异常值出现,根据Matlab7所求得的结果,得出男生体质健康测试的各项指标值中出现异常值的男生学号分别为:120002,120051,120053.

2 K-均值聚类分析模型

2.1 建模准备

运用K-均值聚类法[6]在Spss中对数据进行初步分析,初步统计结果如下(见表2).

表2 不同生源地的不同类别的人数及百分比

2.2 模型的建立与求解K-均值聚类分析模型

鉴于表2,可以运用Excel软件对每个生源地中的四个类别进行对比分析(见图6).

图6 每个生源地不同类别人数的百分比图

由图6可以看出,不同生源地的类别比例有显著不同,举例来说,其中生源地5中类别1所占的比例最多,而生源地8中类别1所占的比例最少.说明生源地5学生的体质健康状况明显好于生源地8,这与不同地区的环境、生活水平以及生活习惯有相当大的关系.另外,8个生源地有7个(除第8个)都是体质优秀者所占的比重最大,第8个生源地体质合格者所占比重最大.

3 分等级判定模型[7]

3.1 建模准备

根据《国家体质健康标准》对学生每项测量成绩进行评分(见表3).

表3《国家学生体质健康标准》大学生评价项目权重

各个测试项目的得分之和为《国家学生体质健康标准》的最后得分,根据最后得分来评定等级:90分及以上为优秀,75分~90分为良好,60分~75分为及格、59分及以下为不及格,分为优秀、良好、及格、不及格四个等级.

3.2 模型的建立与求解——分等级判定模型

根据不同的等级得到不同学生得分等级情况(见表4、表5).

表4 全体大一新生得分等级分布

表5 一班学生得分等级分布

由表4可知,对剔除异常值后的全体大一学生1046个学生进行分析,其中不及格人数为627人,所占比率为59.94%;及格人数为292人,所占比率为27.92%;良好人数为 125人,所占比率为11.95%;优秀人数为 2人,所占比率为 0.19%.合格率为40.06%,明显低于国家要求.

并单独对一班学生的得分等级分布进行分析,其中不及格人数为19人,所占比率为65.52%;及格人数为4人,所占比率为13.79%;良好人数为6人,所占比率为11.95%;优秀人数为0人,所占比率为0.合格率为34.48%,低于全体大一新生的合格率.可以得出一班学生的身体素质相对于全体大一新生较差.

4 数理统计模型

对于问题三所计算出来的男、女生各单项指标以及总体得分用Excel进行分析(见图7).

从图7中可以得到大一新生的体重指数合格率非常高,这与改革开放以来人们生活水平显著提高有密切关联,但是体质健康的其他标准合格率都未达到国家要求,尤其是肺活量体重指数、台阶指数、以及立定跳远,导致体质健康的总体得分未达到国家要求.

5 总结

要改善大学生体质健康不佳的状况,需要国家、学校及个人三方面的共同努力.国家必须进一步对大学生的体质健康给予高度重视;各高校领导与相关部门也应关心和重视大学生的体质健康;学生自身的努力是非常关键的.对于学生的体质状况可以根据问题三的公式进行计算,得到体质健康总分,使学生的体质状况能够量化处理,进而能够有针对性地加强锻炼,提高自身的体质健康水平.

[1]石娟娟.大学生体质健康综合评价分级模型构建的研究[D].武汉:华中科技大学,2009.

[2]方秋丽,蒋浩.大学生体质健康标准解析[J].聊城大学学报,2004,17(2).

[3]居乔.大学生身高体重指数与体质健康指数相关性研究[D].武汉:华中科技大学,2009.

[4]张焕明.统计学实验教程[M].天津:天津大学出版社,2009.

[5]杨桂元,黄己利.数学建模[M].合肥:中国科技大学出版社,2008.

[6]李子奈,潘文卿.计量经济学[M].北京:高等教育出版社,2011.

[7]朱家明,张晓芳,王强,等.葡萄与葡萄酒质量的综合评价[J].通化师范学院学报,2013,34(3).

University Students'Physical Health Evaluation Based on Cluster Analysis

ZHU Jia-ming,SU Si-mei,ZHAO Tian-mei,ZHANG Juan-juan
(School of Statistics and Appl.Math,Anhui University of Finance and Economics,Bengbu,Anhui 233030,China)

In this paper,in order to solve the problem of university students'physical health evaluation,through the original data analysis,firstly removing abnormal point using Pauta rule and Matlab software,to get more accurate data,establishing body mass index(BMI)contrastive analysis,multiple linear regression,K -means cluster analysis,score level decision,mathematical statistics and Fisher discriminate model,by the application of analysis method of Excel,SPSS,Eviews software programming,gets all kinds of evaluation index affecting universtiy students'physical health standard.

physical health evaluation;cluster analysis;score level decision model;error analysis

O29

A

1008-7974(2014)03-0020-04

2014-01-16

朱家明(1973-),安徽泗县人,硕士,副教授.

国家自然科学项目(11301001);安徽财经大学教研项目(acjyzd201429).

(责任编辑:王宏志)

猜你喜欢

生源体质体重
长洲怡生源记货单考论
中医“体质”问答
中医“体质”问答
中医“体质”回答
给鲸测体重,总共分几步
农村生源不是“摇钱树”
28天吃出易瘦体质
称体重
你的体重超标吗
我为体重烦