模糊聚类在大学生体质健康分析中的应用*
2012-09-14冯兴刚李媛
冯兴刚李媛
(1.西南科技大学体育部 绵阳 621010;2.西南科技大学城市学院 绵阳 621000)
模糊聚类在大学生体质健康分析中的应用*
冯兴刚1李媛2
(1.西南科技大学体育部 绵阳 621010;2.西南科技大学城市学院 绵阳 621000)
采用模糊聚类思想与方法,对大学生体质健康测试数据进行分析,从庞杂的数据中获取有价值的信息,建立学生体质健康状况评价模块,用以帮助教师及学生更好的了解学生的体质状态,选择锻炼方法,提高学生健康质量。本文以 5000名在校大学生的体质健康测试数据为案例,应用模糊聚类方法对数据进行处理分析,得到了各类的语意解释,从而量化的评价了学生体质健康情况。
体质健康;模糊聚类
1 大学生体质健康标准
《学生体质健康标准》是检验当代大学生体质健康的重要依据,也是高校开展体育教学、课外活动、群体竞赛等各项活动工作的主要参考指标之一[1]。
本文对案例学校提供的大学男生的测试项目(如表1)进行模糊聚类分析和研究,以达到帮助教师改善教学方式,让学生切实了解自身体质健康状况,有目的的进行锻炼的目的。
表1 案例男学生《学生体质健康标准》测试项目成绩
身高标准体重指身高与体重两者的比例应在正常的范围,是评价人体形态发育水平和营养状况及身体匀称度的重要指标;肺活量是评价人体呼吸系统机能状况的一个重要指标;台阶试验指数是反映人体心血管系统机能状况的重要指数;握力体重指数反映的是肌肉的相对力量,即每公斤体重的握力;立定跳远反映了学生下肢爆发力[1,2]。
2 模糊聚类及案例分析结果
2.1 基本概念
2.1.1 样本集:选取西南科技大学2007级5000名男学生《学生体质健康标准》测试数据作为原始数据,样本容量为5000。测试项目见表1。用X表示样本集X={x1, x2, …, x5000}。xi表示第i个学生的测试成绩,i =1, 2, …, 5000。
2.1.2 属性集:在表1中,每一列为一个属性。用F表示属性集F = {f1, f2, f3, f4, f5}。这里,f1=“身高标准体重”;f2=“肺活量”;f3=“台阶试验”;f4=“握力体重指数”;f5=“立定跳远”。
2.1.3 模糊集:在每一个属性上定义三个模糊集,M为所取模糊集的集合,M ={m1, m2, …, m15}。其中,m1=“身高标准体重成绩高”,m2=“身高标准体重成绩中等”,m3=“身高标准体重较小”,m4=“肺活量大”,m5=“肺活量一般”,m6=“肺活量小”,m7=“台阶试验成绩高”m8=“台阶试验成绩中等”,m9=“台阶试验成绩低”,m10=“握力体重指数高”,m11=“握力体重指数中等”,m12=“握力体重指数低”,m13=“立定跳远成绩高”,m14=“立定跳远成绩中等”,m15=“立定跳远成绩低”。模糊集经过交、并运算之后还是模糊集。例如,m1∩ m4=“身高标准体重大并且肺活量大”,m8∪ m10=“台阶测试成绩中等或者握力体重指数高”。
2.2 模糊聚类算法
本文采用聚类算法[3],其具体过程如下:Step1:
∀x∈X,μθ(x)是x在聚类分析中属于某一类的最大隶属度,其中θ为M中的某个模糊集。Step 2:
对于每个 x∈X,求出 x的模糊描述ζx。ζx满足:ζx∈2M,其中 2M是集合 M 的幂集;≥ μθ(x) - ε,ε是一个充分小的正数或零,并且对于y∈X,y ≠ x,尽可能地小。换句话说,用模糊集ζx把样本x与X中其他样本最大限度地区分开,那些无法与 x区分的样本为 x的同类。模糊集ζx可以看作是这个男学生的一个表述。
下面给出求样本x的模糊描述的算法步骤:
1.选取适当的ε ≥ 0,ε应充分小。对任意x∈X,m∈M,计算μm(x),选出所有mj使得
将mj放入一个集合,记为。
2.选取极大的集合H⊆Bxε, 使得
然后将分子∩β∈Hβ放入一个集合,记为xεΛ。
Step 3:
根据x的模糊描述ζx给出任意xi, xj∈ X,xi与xj相关的程度
其中X={x1, x2, …, x5000},MΛ=(mij)为X上模糊关系矩
Step 5:
对于在置信度 下X被分为C1, C2,…, Cl类,
模糊集 ζCi为类Ci的模糊描述。求出所有样本属于每类模糊描述的隶属度,进行比较。每个样本属于哪类模糊描述的隶属度最大,那么该样本就属于哪类。这样可以进一步对样本聚类。模糊集ζbou描述了模糊分类的所有类之间的边界,其中
指标Iα可用于评价以 为置信度分类结果的好坏,其中
其中 当 Iα最小时,分类最清晰。
2.3 案例分析
按照上面的步骤,对西南科技大学的5000名男学生《学生体质健康标准》 测试数据进行聚类,聚类结果如表2所示,其中各参数的值为ε = 0,δ = 0.6,α = 0.6。5000名男学生被划分为3类,第一类C1的包含1325样本,这类模糊描述的模糊集ζC1为{m3∩ m12∩ m15} + {m6∩ m9∩ m12∩m15},即第一类为“身高标准体重小且握力体重指数低且立定跳远成绩低”或“肺活量小且台阶试验成绩低且握力体重指数低且立定跳远成绩低”。第二类C2包含3015个样本,这类模糊描述的模糊集ζC2为{m8∩ m11∩ m14},即第二类为“台阶试验成绩中等且握力体重指数中等且立定跳远成绩中等”。第三类C3包含660样本,这类模糊描述的模糊集ζC3为{m4∩ m7∩ m10∩ m13},即第三类为“肺活量大且台阶试验成绩高且握力体重指数高且立定跳远成绩高”。
通过对比三类模糊描述可以得出结论,影响学生整体评价的关键性因素是“台阶测试”,“握力体重指数”,“立定跳远”。第一类学生整体的测试指标都比较低,或者可以认为该类学生在关键性测试(台阶测试,握力标准体重指数,立定跳远)中的成绩较低,从而导致整体评价不高。第二类学生在关键性测试中的测试指标都比较一般,而“身高标准体重”和“肺活量”测试结果对这类学生而言整体性比较强,对类别的划分影响不大。第三类学生的测试成绩都比较高,他们的整体情况比较优秀。
通过表2可以看出,模糊聚类结果并不是绝对的,也就是说某个学生并不是绝对的隶属于哪一类,而是依隶属程度而言的。比如第一个学生x1,明显的隶属于第三类,程度为0.88;而第二个学生x2,隶属于第一类的程度为0.54,而隶属于第二类的隶属程度也有0.39,这就说明这个学生在某些方面成绩还是比较突出的,整体而言,比较接近“中等”程度。对于这样的学生,结合每个学生的模糊描述,我们就可以因人而异的制定锻炼方案,搞清楚锻炼方向,并不会盲目的对各项测试都进行训练。对于第一个学生而言,他隶属于第三类的程度较高达到 0.88,但是根据他的模糊描述ζx1={m3} + {m10∩ m13},“身高标准体重小”或者“握力体重指数高并且立定跳远成绩高”,该同学就可以针对身高标准体重小这个特点有针对性的在以后进行提高。
对于教师而言,通过对模糊聚类对学生测试成绩进行分析,可以全面的了解学生的身体状况,而根据不同学生的模糊描述ζx,可以有针对性的对学生进行训练,制定因人而异的训练方案。
3 结语
本文通过案例分析的方法,将聚类分析的思想应用到大学生体质测评结果中,通过数据处理分析得到学生体质情况评价描述,获取了体质健康数据中有价值的学生体质信息,为提高体育教学工作质量提供了新的思维方式和实践方法。
1 徐武,罗建萍,李树梅.《学生体质健康标准》测试报告信息增进系统的构建研究[J].北京体育大学学报,2008,31(10):1264-1265
2 陈文杰.江苏省高校实施《学生体质健康标准》现状及对策研究[J].北京体育大学学报,2006,29(10):2
3 Xiaodong Liu, Wei Wang, and Tianyou Chai.The Fuzzy Clustering Analysis Based on AFS Theory [J], IEEE Transaction on Systems, Man, Cybernetics-partB: Cybernetics,2005, 35 (5): 1013 – 1027
The Application of Fuzzy Clustering in the Analysis of College Students' Physic Health Standard Test
Feng Xinggang,etal.
(Southwest University of Science and Technology, Mianyang, Sichuan 621010,china)
In this paper, fuzzy clustering is used to analyze students’ physic health standard test, which helps to teach students according to their individual differences, and to improve the teaching methods so that enhance the teaching quality.This paper takes 5000 college students’ physic health standard test performance for example, and the 5000 students are clustered into three categories with a clear semantic interpretation from which the student’s physic health conditions can be quantitatively evaluated.
physic health; fuzzy clustering
西南科技大学青年预研基金,项目编号:10sx3115。
冯兴刚(1978—),男,陕西人,硕士,讲师,研究方向:体育管理与教学。