APP下载

基于数据挖掘技术在人体肌肉力量数据分析中的应用——以人体握力肌肉力量测试数据研究为例

2010-12-29于岱峰钟亚平于亚光

体育科学 2010年2期
关键词:测试数据握力决策树

于岱峰,钟亚平,于亚光

基于数据挖掘技术在人体肌肉力量数据分析中的应用
——以人体握力肌肉力量测试数据研究为例

于岱峰,钟亚平,于亚光

为了科学地评价人体握力肌肉力量测试数据,应用人体肌肉力量测试系统和数据挖掘技术,对人体握力肌肉力量数据进行分析。研究发现,采用肌肉力量 F-T变化过程曲线,可定量地反映人体握力的最大力量、启动力量、相对力量等参数,通过应用 ID3算法、决策树,可以确定出不同测试参数的根节点,为选择人体握力 Gain(K3)指标,作为评价人体握力肌肉力量指标,提出科学依据。

数据;挖掘;分析;决策树;人体握力肌肉力量

引言

肌肉力量是指肌肉紧张或收缩时对抗阻力的能力,也是人体能够产生运动的惟一动力来源,因此,力量能力是在竞技体育中决定运动成绩的体能要素之一。

近年来,国内、外在研究人体肌肉力量的方面,主要集中在对人体肌肉力量的测试方法、测试仪器等方面的研究,而对测试结果的数据分析、数据处理,仍停留在一般性的分析和统计性处理、相关性的比较和检验上。对于体育科学研究中采集到的大量原始数据结果,缺乏更深层次的数据挖掘研究和决策分析,更无法发现测试数据中隐含着的东西。虽然,统计学方法在体育科学研究中取得了有目共睹的成果,但在应用数据分析过程中,暴露出了统计方法自身的局限性,使我们在解决和分析大量实际测试数据中,显得不尽人意。数据挖掘技术的出现,为人们从大量的数据中,抽取隐藏在数据之间的有用信息,提供了科学的方法[2]。

本文在前期对人体背力、握力数据的采集方法的研究基础上[4,5],将数据挖掘技术应用于测试人体肌肉力量的数据分析中,为探讨人体握力肌肉力量参数的结构特征、相互关系,以及应用 ID3算法对测试数据进行决策分析,提出理论依据。

1 研究对象与方法

1.1 研究对象

随机抽取山东体育学院不同专业学生为实验对象,其中男性23名,女性15名,应用人体肌肉力量计算机数据分析系统[5],对研究对象进行测试与数据分析。

1.2 研究方法

1.2.1 测量方法

测试受试者的握力时,要求受试者充分做好准备活动,测试过程中要求受试者的双手下垂置体侧,掌心向内,上臂稍向外,但不能超过30°。并用力握住握力计的测力部分,手臂不得左右摆动,左、右手各握3次,记录测试结果。

1.2.2 测试仪器

人体肌肉力量测试装置,采用两只CZL-Y B型应变式拉压负荷传感器组成,测力范围:握力 0~100 kg;背力0~300 kg,最大桥压为5 v,测试灵敏度2 mv/v,其非线性F·S为±0.02%。信号放大电路,采用了高性能、超低漂移运算放大器作为输入级放大,模拟信号输出范围0~5 v,测试精度:0.3级。

数据采集由M-8051为核心的单片机组成,采用12位高精度的A/D作为转换芯片,转换时间间隔35μs,转换精度≤0.05%。

系统分析软件采用Visul C++6.0作为开发工具,以SQL SERVER-2000数据库作为数据库管理工具。

1.2.3 数据挖掘

数据挖掘(DatAMining简称DM),是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,为使人们发现有用的新规律、新概念,提高研究人员对大量原始数据的深层理解、认识和应用[2,3]。数据挖掘分析方法很多,其中决策树算法作为数据挖掘的一种重要方法,该方法可通过对大量数据有目的地分类,并从中发现或找出潜在的,有价值的信息,从而得到分析结果。而数据可视化挖掘,可加深对测试数据的理解,并用形象、直观的计算机图形技术表示测试过程,为准确表达原始数据和测试过程,以达到深入剖析测试数据的目的。

数据挖掘过程,并非是采用一个简单的数据→模型→结果套用公式过程,通常针对不同的研究问题,应用数据挖掘过程对数据进行分析,其过程主要包括:数据理解、数据预处理、模型建立、评估与分析等几部分组成,其步骤见图1所示。

本研究以人体握力肌肉力量测试数据为例,对相关测试参数进行可视化处理与测试参数决策分析。

图1 本研究数据挖据流程图

2 数据挖掘技术在人体握力肌肉力量分析中的应用

2.1 数据挖掘的可视化过程

展现大量测试数据,是数据挖掘的重要内容。数据挖掘可视化为支持多维数据的可视化提供了工具。数据可视化并不是把不同内容、不同层次抽象问题,以及不同性质的数据、观察数据进行相互结合,而是将不同属性的数据进行可视化映射,并把数据表转换为可视化结构的过程,然后通过坐标定位、缩放比例等方法,创建可视化结构图,并通过人机交互动作,控制这些参数的变换和显示。将丰富的测试数据结果应用图像方法展现出来,为科学研究和决策者提供了帮助。

2.1.1 肌肉力量的F-T曲线及相关参数

根据测力和时间的关系,将肌肉力量测试过程,局限到特定力与时间框架中,采用 F-T曲线的方法来描述、或解释肌肉力量变化特征,其结果见图2所示。

图2 本研究肌肉力量F-T曲线图

2.1.1.1 肌肉最大力量

根据力和时间函数关系,假若f(x)∈[0,t],因为f(x)在[0,t]区间内连续(见图 2-A),所以,根据闭区间上连续函数的有界定理可知,f(x)在[0,t]上存有最大值。又因为f′(x)≥0,所以,f(x)在[0,t]上是单调递增的,从而,f(x)的最大值应在右端点X=t处取得,即:

其中fmax为肌肉力量最大值,根据F-T曲线和数学计算,可以认为:最大力是指,神经肌肉系统通过最大随意收缩所表现出的最高力值的能力[7]。但是肌肉最大力不等于绝对力量。

2.1.1.2 肌肉最大速率参数

人体握力肌肉力量变化速度V的最大值表示为:

2.1.1.3 肌肉力量变化率

我们认为:通过对F-T曲线中力与时间的变化率的比值,可以定量反映和评定人体肌肉力量的变化率,其数学表示关系为:

2.1.1.4 其他肌肉力量参数

通过F-T曲线的关系,可以挖掘出其他肌肉力量参数(表 1)。

2.1.2 人体握力肌肉力量测试数据的分析

我们采用人体握力肌肉力量测试系统,对4名男、女研究对象的右手握力进行测试,其测试数据结果见表2所示。

表1 本研究测试参数一览表

表2 本研究男、女右手握力测试参数一览表

通过以上测试数据结果可以看出,男子右手的握力绝对力量一般要大于女子,这说明由于男性雄性激素分泌增多,促进了男性肌肉和骨骼体积的增大,因此,使男子的肌肉力量增长速度要明显高于女性,另外,大多数的男性喜欢参加一些具有发展力量和爆发力的体育运动项目,例如:篮球、足球、田径的投掷、中长跑项目等,而这些活动的开展,对促进男性的肌肉力量的增长,具有十分重要的帮助。而大多数的女性比较喜欢从事一些非力量性的,或者力量水平较低的活动,这在一定的程度上影响了女性肌肉力量的增长。

在完成爆发性的动作中,快慢肌纤维开始收缩的时间差最短(只有几毫秒),两种肌纤维的开始收缩时间几乎是同时进行的。据精确计算,快肌纤维较慢肌纤维要早些达到最大值(快肌为49~90 ms,慢肌为90~100 ms)。具体来说,在50~120 ms内就可达到最大爆发力[11]。我们通过对不同男子和女子的启动力量 STK50的测试可以看出[5]:男子右手启动力量为0.830±0.077 kg,而女子的右手启动力量为0.540±0.079 kg。这说明:男子的启动力量要大于女子。

男子的右手握力测试的曲线短,且峰值突出,而女子的测试曲线长,且波峰较低,呈逐渐下降趋势,但是,下降的速度要比男子慢。男子在绝对力量、爆发力、启动力量等参数方面均优于女子。

在利用 F-T曲线,通过计算 EXK参数,(即:EXK=Δf/Δt)作为评价人体肌肉量变化率,即:通过测试同一时刻的 EXK参数,可以看出:若ΔEXK的值>0,说明人体肌肉力量的变化率处于增加状态,反之,则处于下降状态。因此,通过测试不同专项运动员的 F-T曲线,可以定量地反映人体肌肉力量的变化状况。在表2所示数据中,可以根据不同测试对象的变化率值进行直接比较,如测试对象01的肌肉力量变化率为19.11,02的肌肉力量变化率为13.00,通过变化率数值可以判断01的快速力量优于02。

2.2 数据挖掘的决策过程

传统测试人体握力肌肉力量的方法,仅能一般性的对测试数据的局部或表面分析,缺乏对数据中更深层次的挖掘研究,以及对测试数据的整体特征的描述。因此,如何对大量数据资料进行仔细筛选,从中找出或发现隐含规律和联系,并应用决策树和 ID3方法快速分析、清理相似数据,确定最终分析目标,对提高分析测试样本的分类的准确率,起到重要作用。

2.2.1 数据挖掘决策

采用决策树和 ID3算法,评价人体肌肉力量测试参数,对测试结果制约公平性的若干因素分析,进行优化评价。

2.2.1.1 决策树

决策树是一种树状的结构图,根据不同的研究问题,将数据样本划分成不同的数据样本子集,并在每个数据样本子集上构成一子节点,对测试数据结果进行分类的过程。构造决策树是为了快速找出或发现不同属性和类别的关系,并用它来预测将来未知类别的类型。

2.2.1.2 ID3算法

ID3算法是将树的每个节点上使用的信息增益度量进行选择测试属性,将具有最高信息增益的属性作为当前节点的测试属性。由于该属性对结果划分中的样本分类所需的信息量较少,可使分析结果找到一棵更简单的树。

设定S是s个数据样本的集合,其标号为Ci(i=1,…,m)具有m个不同值,由于si是Ci中的样本数,则所需信息为:其中Pi=Si/S为任意样本属于Ci的概率事件。

由期望信息和熵值可以得到对应的信息增益,其计算公式为:

通过对计算每个属性的信息增益,并选取具有较高增益的属性作为给定集合S的测试属性。并产生相应的分支结点。

2.2.2 决策树和ID3算法在人体握力肌肉力量分析中的应用

通过对人体握力的绝对力量、握力/身高、握力/体重等参数指标的评价,可以反映出人体握力的多项特征,但是,随着测试数据的增多,如何有效地使用测试结果进行科学研究和对测试数据进行优化,发现数据内在的相互关系和说明问题,或者从大量数据结果提炼出不易察觉的关系,并给出一个合理的理论解释,传统的数据分析方法无法得以解决,而数据挖掘技术为此问题的解决提供了方法上的依据。

本研究应用人体肌肉力量测试系统,通过对23名男运动员和15名女子运动员的人体肌肉力量测试参数,如性别、身高、体重、握力绝对力量测试值、握力/身高 等参数。通过数据挖掘技术的决策算法,针对不同变量进行分裂选择。下面以人体握力参数为例说明决策算法的应用(表 3)。

表3 本研究测试数据结果一览表

2.2.2.1 数据特征提取

根据表1测试结果,对测试数据进行概念化抽取,以重新构建新的属性表。根据全国体质监测标准设定“优”测试设定为A,等级为“Ⅲ”,“良”测试设定为B,等级为“Ⅱ”,“差”测试设定为C,等级为“Ⅰ”。统计样本数为S。握力成绩 =K1;握力/身高成绩 =K2;握力/体重 ×100=K3。重新构建概念化数据表,见表4所示。

我们应用ID3算法对以上数据进行信息增益的特征属性检验,选择出信息增益最大特征,以提取出决策树的根结点。

由表2给出的样本所需的期望信息为:

同理属性K2、K3的信息增益分别为:

所以信息增益结果为:Gain(K3)>Gain(K2)>Gain(K1)

根据以上结果可以看出,K3的信息增益最大,因此选K3属性为根节点,并在对应的每个根节点下创建分枝。其决策树见图4所示。

表4 本研究概念化数据成绩集一览表

图4 决策树

2.2.2.2 对决策树的解释

通过对握力参数分析,可以得出3个指标参数的信息增益为 Gain(K3)>Gain(K2)>Gain(K1),结果表明,在所选择的3个握力评价指标参数中,使用 Gain(K3)对人体握力进行评价具有更高的效度。通过理论推演的方法也可对这一结果进行佐证。体重大的人一般具有较大的绝对力量,并随着体重增大,绝对力量值增大。这可以解释为什么那些必须克服外部阻力项目(如投掷、摔跤等)运动员的身材一般都较大。而对于那些仅克服自身体重,但对速度、灵敏等素质要求较高的项目(如体操、跳高等),运动员必须具备较高的相对力量,不同类型的运动项目对力量素质有不同的要求。由此可知,绝对力量与体重是一种函数关系,体重的改变就会引起绝对力量的改变。但在有些情况下,仅仅对绝对力量评价是不合理的,会大大影响力量评价结果的信度。这是因为,肌肉力量不仅仅与肌肉的横断面积有关,而且还与肌纤维类型与募集、神经系统的机能状态,对抗肌与主动肌的协调性有关,如果仅对绝对力量进行评价,其实质就是仅仅对肌肉的横断面积(体重)进行了评价,评价内容的缺失造成了评价信度的降低,继而导致决策失误。而采用 Gain(K3)评价指标就会消除了体重这一重要协变量的影响,使评价结果更具有可比性。因此,选择人体握力 Gain(K3)即:握力/体重指标参数,作为评价人体肌肉力量的能力,要比单一选择人体握力的“绝对力量”,作为评价人体肌肉力量的条件,更为合理、科学。

评价指标 Gain(K2)的评价效果基于二者之间也存在其合理性。多数研究表明,身高与体重具有很高的相关性[7],因此,Gain(K2)在一定程度上也可消除体重这一协变量的影响,尽管如此,但在消除协变量影响的效果上不如 Gain(K3),但优于 Gain(K1)。上述分析表明,通过数据挖掘技术,可以发现隐藏在大量测试数据后面的信息资源,为信息评定和思维决策提供更加合理的思路。

3 结论

1)采用肌肉力量 F-T曲线,可定量地反映人体的最大力量、启动力量、相对力量等参数和肌肉力量变化过程;2)应用数据挖掘技术、ID3算法和决策树分析方法,可快速发现不同测试参数的根节点,为数据进行科学优化评价,提出依据;3)选择人体握力 Gain(K3)即:握力/体重指标参数,作为评价人体肌肉力量的能力,要比单一选择人体握力的“绝对力量”,作为评价人体肌肉力量的条件,更为合理、科学;4)通过数据挖掘技术在人体握力测试参数分析的应用,为科学评价人体握力测试结果和决策分析,以及发现测试数据后面的隐藏信息,提出新的探索思路,数据挖掘技术可作为体育测量与评价的方法加以推广。

[1]陈小平.竞技运动训练实践发展的理论思考[M].北京:北京体育大学出版,2008.

[2]陈小平.力量训练的发展动向与趋势 [J].体育科学,2004,24(9):36-40.

[3]国家体育总局群体司.2000年国民体质研究报告[M].北京:人民体育出版社,2003.

[4]胡可云,田凤占,黄厚宽.数据挖掘理论与应用[M].北京:清华大学出版社,2008.

[5]毛国君,段立娟,王实,等.数据挖掘原理与算法[M].北京:清华大学出版社,2007.

[6]山东省体育局.2000年山东省国民体质监测报告[M].济南:山东大学出版社,2003.

[7]王清.我国优秀运动员竞技能力状态诊断和监测系统的研究与建立[M].北京:人民体育出版社,2004.

[8]万德光,万猛.现代力量训练[M].北京:人民体育出版社,2003.

[9]于岱峰,田彤,何伟.精确测试人体肌肉力量的新方法 [C].第6届全国体育科学大会论文摘要汇编,2000.

[10]于岱峰,张建平,官文强.人体背力、握力肌肉力量数据分析系统的设计与实现[J].体育科学,2006,26(9):40-13.

[11]BUHRLE M.Maximalkraft-schnellkraft-reaktivkraft[J].Sport-wissenschaft,1989,(19):311-325.

[12]GRESSMANN M.Fahrradtraining[M].Verlag Sport Buch Strauss Koln,2001.

Application of DatAMining Technology in Human Muscle Power Data Analysis—Taking the Testing Data of Muscle Power of Grip Strength as Example

YU Dai-feng,ZHONGYa-ping,YU Ya-guang

In order to value the testing data of muscle power of human grip strength scientifically,this paper,applying the testing system of human muscle power and the datAMining technology,analyzes the data of human muscle power.The results show that F-T curve reflects the parameters of human body’s maximum power,starting power,relative power and the changing process of muscle power,sets the different root nodes of the parameters by using ID3 algorithm and decision tree.It provides the scientific basis for choosing the targets of human grip power Gain(K3)and alsofor valuing the human muscle power.

data;mining;analysis;decision tree;muscle power ofgrip strength

G804.8

A

1000-677X(2010)02-0070-05

2009-10-10;

2010-01-08

山东省科学技术厅项目(2007GG20008002);山东体育学院自然科学资助项目(071104)。

于岱峰(1955-),男,山东青岛人,副教授,研究方向为运动生物力学、体育仪器器材,E-mail:YDF90971@163.com;钟亚平(1968-),男 ,湖北武汉人 ,教授 ,博士 ,研究方向为体育信息技术,E-mail:zhongyap@tom.com;于亚光(1986-),男,山东济南人,研究方向为运动训练,E-mail:23896156@qq.com。

山东体育学院,山东济南250063

Shandong Institute of Physical Education,Jinan 250063,China.

猜你喜欢

测试数据握力决策树
巧练握力益康寿
儿童握力弱,未来健康差
简述一种基于C4.5的随机决策树集成分类算法设计
不容忽视的握力
测试数据管理系统设计与实现
决策树学习的剪枝方法
基于自适应粒子群优化算法的测试数据扩增方法
空间co-location挖掘模式在学生体能测试数据中的应用
你能活多久,握下手就知道
决策树在施工项目管理中的应用