基于BP人工神经网络的大学生最大摄氧量估测模型研究
2017-01-04孙忠伟马永平马慧敏
孙忠伟,马永平,马慧敏,张 冰
基于BP人工神经网络的大学生最大摄氧量估测模型研究
孙忠伟1,马永平1,马慧敏1,张 冰2
国内大学生关于心肺耐力室外估测还有待于进一步研究,采用文献资料研究、实验、数理统计和计算机编程等方法,随机选择80名大学生(男、女各40人,年龄19~23岁),以实验室跑台心肺代谢仪直接测试作为研究标准,参考国外经典1 mi跑测试方程,利用Neuroph Studio构建BP人工神经网络最大摄氧量估测模型。研究结果显示,BP人工神经网络输入变量确定为年龄、性别、体重、1 600 m跑时间和跑后即刻心率,三层网络层级结构具体为5-9-1,通过2.198万次反复训练及验证,将模型输出的错误率控制在0.001,进一步统计分析模型估测与实验室测试值的相关系数r为0.923,P<0.01,对两个样本进行t检验,t=0.06,P>0.05,显示没有显著性差异。可见,采用BP人工神经网络进行最大摄氧量估测具有快速、有效、精确等特点。
估测模型;最大摄氧量;人工神经网络;大学生
1 前言
2 测试对象与方法
2.1 测试对象
80名某高校本科学生,其中,男、女各40名。
2.2 研究方法
2.2.1 文献资料研究
通过中国知网、万方数据、维普、Web of Science、EBSCO Sport及谷歌学术等数据库及检索引擎进行了本研究的文献检索,充分了解国内、外相关研究现状。
2.2.2 实验法
2.2.3 统计分析
通过SPSS 11.0、MedCalc 11.4和Excel 2003对实验数据与人工神经网络模型估测数据进行统计分析。
2.2.4 计算机编程
本研究采用NeurophStudio进行BP神经网络开发。NeurophStudio是一个轻量级的模拟常见的神经网络架构Java框架,由塞尔维亚的贝尔格莱德大学工商管理学院的助理教授Zoran Sevarac以及Ivana Jovicic、Marko Ivanovic、Vladimir Kolarevic、Damir Kocic等联合开发出来的一个开源项目,属于通用的Java Swing应用程序框架,它还能够提供一组GUI组件和一个模块系统,用于开发自定义桌面应用程序。将本研究实验测试的相关数据输入NeurophStudio人工神经网络系统进行建模,然后反复实验、训练与验证,最终模型在预期精度实现收敛,并形成模型的JAVA代码。
3 研究结果与分析
BP人工神经网络,是指含有隐藏层的多层前馈网络,能够大大提高网络的分类能力,由于多层前馈网络的训练常采用误差反向传播算法,人们常将其称为多层前馈神经网络。其主要建模思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成,首先,正向传播时,输入样本从输入层传入,经各隐藏层处理后,传向输出层,若输出层的实际输出与期望的输出不符,则转入误差的反向传播阶段;其次,误差的反向传播是将输出误差以某种形式通过隐藏层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据,这种信号正向传播与误差反向传播的各层权值调整过程,是周而复始的进行,权值的不断调整的过程,也就是网络的训练学习过程,此过程将一直持续直到网络的输出误差降低到预期可接受的范围或预先设定的学习次数才会停止[10]。
数据标准化转换完成之后,就可以利用NeurophStudio工具进行创建网络。也是采用三层网络结构,考虑到本次人工神经网络的预测精确度要求较高,初次确定隐藏神经元的尝试方法为2n+1,其中,n为输入层神经元个数,因为本次输入层有年龄、性别、体重、1 600 m跑时间和跑后即刻心率5个变量,所以,隐藏层初步尝试为11个(图1)。
表 1 标准化转换后的数据统计一览表
Table 1 Statistics Standardization after Conversion (n=80)
XSD年龄0.900.03身高0.420.07体重0.650.101600m跑时间0.660.09跑完后即刻心率0.250.0VO2max0.540.11
第1次测试时采用全部样本(80人)训练网络,测试选定的神经网络是否能够实现收敛,考虑到样本人数比较少,拟采用80%训练及20%验证和90%训练及10%验证。设置训练的总体均方误差和验证的总体均方误差都在0.001位。因为设置的精确率较高,结果显示,整个曲线已经开始逼近边线和底线,模型的收敛速度较快,训练效率比较理想。
通过测试发现,选择不同的学习率会对网络训练迭代次数产生较大影响,也就是学习率越高,网络的迭代次数就越少。学习率的范围是[0,1],越接近于0需要的训练周期也越长,迭代次数也就越多,也就导致网络的训练过程比较缓慢。相反,越接近1学习率也越高,容易导致权重系数偏离,目标函数的纠错功能幅度偏大,导致网络训练准确率偏低。如图2所示,采用0.02需要的迭代次数为175 241次,而0.9需要90 121次,相比约高一倍的迭代次数,但考虑到本次构建网络需要较高的精确性,而网络的运行输出效率仅作为次级指标考虑,由此确定采用0.02学习率进行网络学习训练。
图 2 三层人工神经网络训练迭代次数与学习率关系示意图Figure 2. Three Artificial Neural Network Training Iterations with Learning Rate Relations
网络动量对训练过程的影响是一个比较关键的因素,动量过低导致学习过程缓慢,也会不容易辨别系统的局部最小值。适当的动量能帮助增加系统的收敛速度。如果网络的动量参数设置过高,也可以促使网络对最小值容错幅度过大,导致训练后的网络产生不稳定现象。考虑到本网络估测精度较高,训练后要求要保证网络的稳定性,通过图3的测试发现,从0.1~0.9,网络的迭代次数由59 847次迅速下降到了9 016次,学习效率逐渐提高,而在0.7位置就降到了9 215次,之后都在9 016次以上并没有显著的降低,由此确定采用0.7比较合适。
图 3 三层人工神经网络训练迭代次数与记忆率关系示意图Figure 3. Three Artificial Neural Network Training Iterations and Memory Rate Relations
通过对网络隐藏层的不同的神经元数量进行训练,可以发现,随着神经元数量的增多网络的训练过程在缩短,
通过图4可以发现,当选3~7个神经元作为隐藏层进行计算,迭代次数都在6.5万次以上,效率偏低,选择9个和11个神经元时,迭代次数比较接近,而选择11个神经元的迭代次数同9个神经元相比没有明显的下降,进一步的样本测试发现,采取2n+1的9个隐藏神经元比较适合本网络建模。
图 4 三层人工神经网络隐藏层不同神经元数量与训练过程示意图Figure 4. Three Different Artificial Neural Network Hidden Neuron Number and Training Process Layer
训练尝试网络输入隐藏层隐藏层神经元训练比例(%)最大误差学习率记忆率迭代次数总均方误差验证总均方误差16113800.0010.020.7242190.000910.0012626113900.0010.020.7219810.000930.00139
图 5 训练完成后的网络权重系数示意图Figure 5. Network Weighting Factor after Training
通过多次建模训练尝试发现,要保证后期误差率能够达到0.001的情况,需要采用0.02的学习率,0.7的记忆率进行训练。第1次采用最大错误率为0.001,学习率0.02,记忆率0.7,训练次数约2.4万次,总均方差达到了目前最低的0.009 1,并且迭代次数也仅为242 19次,比较理想;而第2次训练虽然采用了90%的训练样本进行学习,但网络的精度并没有显著提高,且总体方差验证为0.001 39,高于第1次的0.001 26,由此认为,第2次的训练得出得结果符合预期目标(表2)。
最后确定本次构建的神经网络模型结构为6个输入神经元,隐藏层9个神经元,输出为1个神经元,通过图5可以看出,训练后网络中的权重系数在[-1,4]的范围间保持了稳定的状态,尤其输出层3(layer3)最后也保持在了一个平面,呈现出比较平稳的输出模式,达到了预期的精度。
网络训练完成后,通过网络输入全部数据进行计算,将系统估测的结果利用SPSS软件进行统计分析,如表3所示,与实验室运动心肺仪测试相比,其均值非常接近,其中,ANN为人工神经网络,为本网络的缩写。
表 3 实验室测试和人工神经网络模型(ANN)的估算结果一览表
Table 3 Laboratory Testing and Artificial Neural Network (ANN) Estimation Results
X±SD(n=80)实验室测试49.61±10.32ANNtest49.75±10.44
表 4 实验室测试和人工神经网络(ANN)的相关分析一览表
Table 4 Correlation Analysis Laboratory Testing and Artificial Neural Network(ANN)
公式实验室Pearson相关(n=80)实验室独立t检验(n=80)R值显著性t95%CIP值ANN0.9250.0000.006-4.7~4.70.995
图 6 实验室测试和人工神经网络(ANN)的Bland-Altman散点图Figure 6. Laboratory Tests and ANN(artificial neural network) Bland-Altman Scatter Plot
4 结论
[1]韩立群.神经网络和遗传算法在催化剂配方及建模与优化中的应用研究[J].化学工程学报,1994,5(4):500-504.
[2]施彦,韩力群,廉小亲.神经网络设计方法与实例分析[M].北京:北京邮电大学出版社,2009:23-24.
[3]ADAMO D E,TALLEY S A,GOLDBERG A.Age and task differences in functional fitness in older women:Comparisons with senior fitness test normative and criterion-referenced data[J].J Aging Phys Activ,2015,23(1):47-54.
[5]American College of Sports Medicine.Resource Manual for Guidelines for Exercise Testing and Prescription[M].9th ed.Phila-delphia:Lippincott William & Wilkins,2013.
[8]HAGAN M T,MENHAJ M B.Training feedforward networks with the Marquardt algorithm[J].IEEE T Neural Networks,IEEE Transactions on,1994,5(6):989-993.
[9]HAURET K G,GREENE S,ROSSI S,etal.Combined effect of body mass index and aerobic fitness on stress fracture risk among women[J].J Exe Sci:Conference Proceedings,2015,9(3):39.
[10]HAYKIN S.Neural Networks:A Comprehensive Foundation[M].MacMillan College Publishing,New York,1994:166.
[13]LARSEN C M,BALL C A,HEBL V B,etal.Echocardiographic predictors of cardiopulmonary exercise test performance in hypertrophic cardiomyopathy[J].Circulation,2014,130(Suppl 2):A17268-A17268.
[14]MAUD P J,FOSTER C.Physiological assessment of human fitness[M].Champaign,IL:Human Kinetics,2006.
[15]NIEMAN D C.The exercise test as a component of the total fitness evaluation[J].Prim Care,2001,28:49.
[16]PRZEDNOWEK K,ISKRA J,PRZEDNOWEK K H.Predictive modeling in 400-metres hurdles races[J].Life Sci J,2014,11(11):794-797.
[17]SCOTT A L,BROZIC A,MYERS J,etal.Exercise stress testing:An overview of current guidelines[J].Sports Med,1999(27):285-312.
Construction of Students BP Artificial Neural Network Model based on Maximal Oxygen Uptake Estimation
SUN Zhong-wei1,MA Yong-ping1,MA Hui-min1,ZHANG Bing2
Domestic Students cardiorespiratory endurance outdoor estimation method needs further study,this paper,using the literature review,experiment,mathematical statistics and computer programming method,randomly selected 80 college students (40 male and 40 female,aged 19~23 years old) ,taking laboratory testing as a research standard,with reference to foreign classical equation 1 mile run test,use NeurophStudio builds BP artificial neural network model to estimate maximal oxygen uptake.The results showed that BP artificial neural network input variable to be age,gender,weight,1600-meter run time and heart rate,the three-tier network hierarchy 5-9-1 specifically by 21980 times repeated training and validation the error rate in the output of the model control thousandth correlation coefficient r further statistical model to estimate the value of laboratory testing and is 0.923,P<0.01,two sample T-test,t=0.06,P>0.05,There were no significant differences in the display,showing the use of BP artificial neural network to estimate maximal oxygen uptake is fast,efficient,accurate.
estimationmethod;maximaloxygenuptake;artificialneuralnetwork;collegestudent
1002-9826(2016)03-0056-05
10.16470/j.csst.201603008
2014-12-02;
2016-03-08
国家体育总局体育哲学社会科学基金资助项目 (217SS15062)。
孙忠伟(1980-),男,黑龙江甘南人,讲师,博士,主要研究方向为运动与健康,Tel:(0991)8586850,E-mail:sunzhongwei@coopering.cn;马永平(1982-),女,新疆伊犁人,讲师,硕士,主要研究方向为学校体育,Tel(0991)8586850;马慧敏(1957-),女,新疆乌鲁木齐人,教授,硕士,主要研究方向为学校体育,Tel(0991)8586850,E-mail:shasha9596@163.com;张冰(1960-),男,甘肃兰州人,教授,博士,主要研究方向为运动与健康,Tel(010)62796932,E-mail:bzhang@mail.tsinghua.edu.cn。
1.新疆大学 体育教学研究部,新疆 乌鲁木齐 830046;2.清华大学 体育与健康科学研究中心,北京 100084 1.Xinjiang University,Urumqi 830046,China;2.Tsinghua University,Beijing 100084,China.
G804.49
A