腕部加速度计中不同类型能耗预测模型的建构与评估
2019-06-22陈庆果刘耀天谭雅兮杨强杨珊珊彭莉
陈庆果 刘耀天 谭雅兮 杨强 杨珊珊 彭莉
摘 要:構建不同类型的腕部加速度计能耗预测模型,并横向比较其准确性,为腕部加速度计(智能手环)的算法优化提供实证支持。方法:42名受试者(实验组28人和验证组14人),测试时每名受试者佩戴气体代谢分析仪Cosmed K4b2和2个佩戴加速度计Actigraph-GT3X于手腕和髋部处,分2个阶段完成20项体力活动。以间接测热法为能耗预测校标,采用实验组数据分别建立一般线性回归模型、两阶段模型、神经网络模型和支持向量机模型,并利用验证组数据对其测量准确性进行横向比较。结果:建立了线性模型(METs=0.000228×VM+2.019)、两阶段模型、10-21-1三层神经网络模型(初始学习率为0.05,动量常量设为0.5,误差率为0.000 1)和支持向量机模型(10个输入指标、RBF为核函数、gamma为1.5、C为10、损失系数为0.01)。在RMSE上,神经网络模型<支持向量机模型<两阶段模型<线性回归模型。神经网络模型和支持向量机模型的预测值90%CI均落在校标(K4b2)的等效区间内,在B-A图上的各指标均优于两阶段模型和线性回归模型。结论:在腕部能耗预测中,建立的神经网络模型和支持向量机模型能有效监测日常体力活动,具有应用价值;应谨慎运用两阶段模型,不宜使用一般线性模型。
关键词:腕部加速度计;运动手环;体力活动;能耗预测模型
中图分类号:G 804.49 学科代码:040302 文献标识码:A
Abstract:Through developing different energy expenditure prediction models of wrist accelerometers and comparing their accuracy, this research aims to provide empirical support for algorithm optimization of wrist accelerometers (Smart Bracelets). Methods: 42 subjects (28 in the experimental group and 14 in the control group) who wear the gas analyzer (Cosmed K4b2) and 2 accelerometers (Actigraph-GT3X) positioned in waist and wrist performs 20 items physical activities in two stages. Indirect calorimetry was used to calibrate energy consumption. The data from experimental group were used to establish general linear regression model, two-stage model, neural network model and supportive vector machine model, respectively. The data from validation group were used for horizontal comparison. Results: A linear model (METs = 0.000228 × VM + 2.019), a two-stage model and a 10-21-1 three-layer neural network model (initial learning rate of 0.05 and momentum constant of 0.5 and error rate of 0.0001) and support vector machine model (10 inputs indexes, kernel function of RBF, gamma of 1.5, C of 10, and loss coefficient of 0.01) are developed. At RMSE, the neural network model < support vector machine model < two-stage model < linear regression model. The 90% CIs of neural network model and support vector machine model fall within the equivalent range of K4b2, and all the indexes in B-A chart are better than the two-stage model and linear regression model. Conclusion: In the wrist accelerometer, neural network model and support vector machine model can effectively monitor daily physical activity. The two-stage model should be used with caution. The general linear model is not suitable for application.
Keywords:wrist accelerometer; sports bracelet; physical activity; predictive model of energy expenditure
目前,常见的几种运动手环都属于腕部加速度计范畴,测量的准确性并不理想。温煦等[1]的研究显示,常见的4种运动手环在监测走跑能耗时,与实测值之间的相关系数为0.02~0.67不等,对38种手环的调查中仅有5种手环具备体力活动自动识别功能,并认为算法问题可能是目前运动手环测量效度偏低的重要原因之一。
早在20年前就有研究提出腕部加速度计的能耗测量问题,其回归模型仅能解释实际能耗3.3%的变异,后来Trost等[2]和Yang等[3]认为髋部因靠近身体质心,更能准确反映体力活动整体情况,是加速度计佩戴的理想部位,加之算法上无新的突破,腕部加速度计能耗预测研究进入停滞状态,此领域的研究基本上围绕髋部加速度计展开。最早的算法是一元线性回归模型,用髋部加速度计的count值预测运动能耗,该种方法简便易行,在早期被广泛使用,最为知名的是Freedson研究的模型[4],该模型是基于走跑项目而建立的,预测生活中体力活动存在较大误差,后期不断有学者通过获取更多体力活动的特征数据来优化回归模型,例如Hendelman研究的模型[5]、Swartz研究的模型[6]等,但该类模型预测的准确性较大依赖于运动项目,Freedson研究的模型适于预测走跑类体力活动的能耗,预测生活方式类体力活动时则有较大误差;Swartz研究的模型则相反。总体上来看,该类模型由于其自身的算法局限,不能有效地解决该问题。鉴于此,Crouter等[7]设计了两阶段模型,该算法首先通过count值将体力活动分为静息类和非静息类,静息类体力活动赋值为1 METs;然后在非静息类体力活动中依据变异系数分为周期类和非周期类,并分别建立回归方程,该方程测量的准确性受运动项目影响较小,精度较高。无论是一元回归模型还是Crouter的两阶段模型,均需将原始数据转变为count值后代入模型,这势必会损失原始数据中所蕴含的其他信息,进而影响测量的准确性;而回归模型的共线性问题又限制其纳入更多反映原始数据信息的指标。随着机器学习算法的兴起,其算法的自我学习特征可使其整合和利用更多的原始信息,越来越多的学者逐渐尝试纳入更多的指标。Rothney等[8]将峰度系数、四分位差等15个指标纳入到神经网络模型中计算能耗,Staudenmayer等[9]则将6个基于count值的百分数作为指标建构神经网络模型;有学者则对随机森林回归算法预测能耗的准确性进行了评估[10],其他的机器学习算法也被相继引入到该领域研究,机器学习算法逐渐成为新的研究热点和趋势,而这也为腕部加速度计的能耗预测提供了新的思路,并且在实践中,腕部佩戴更为方便,更受健身人群的欢迎[11]。目前,已有少量的研究将机器学习算法引入腕部加速度计的能耗预测中,Montoye等[12]研究了神经网络模型的应用,还有研究引入了时间序列模型[13]。
但总体上来看,此领域的研究成果还相对较少,研究均是建构某种机器学习模型并进行评估,但缺乏对不同类型模型进行系统性分析的研究。因此,本研究旨在以髋部加速度计能耗算法演变历程中的3类典型模型为蓝本,借鉴其思路用以构建基于腕部加速度计的一般线性模型、两阶段模型、支持向量机模型和神经网络模型,并对各模型的测量准确性进行比较,为腕部加速度计算法的优化、软件的完善提供理论支持。
1 研究对象与方法
1.1 研究对象
受试者为42名在校非体育专业大学生,测试前随机将其分为建模组(28人)和验证组(14人),建模组中男生、女生各14人,验证组中男生8人、女生6人。2组受试者的形态学指标无显著性差异(P>0.05)。所有受试者测试前均接受质询并签署知情同意书,确保其身体健康、无运动禁忌症。受试者测试前24 h无大强度体力活动,测试均在餐后1 h进行。受试者基本信息见表1。
1.2 测量仪器
采用恒康佳业HK-6000身高体重仪测量受试者身高和体重,使用VIVENTE-GOLD体成分仪测量体脂率。加速度数据的采集采用Actigraph-GT3X(以下简称GT3X),将其统一佩戴在受试者优势侧手腕处(腕横纹处)和右侧髋部(髂嵴处)。测试前,该设备时间校准及受试者信息的录入工作在配套的Actilife 6.11软件中进行,采样频率设为30 Hz,测试完成后将其数据以“*.gt3x”的格式保存,以便转制为各种所需数据库。
以间接测热法实时记录受试者的体力活动能耗并作为参考标准,使用的仪器设备为Cosmed K4b2(简称K4b2)。为保障测量精度,每天测试前均对仪器进行预热和校标。测试中,测试人员在每1 min第1 s按压仪器主機上的Enter键开始正式记录数据,确保GT3X和K4b2在每分钟内预测的数据同步。
使用K4b2系统配备的心率带同步监控受试者心率,便于测试者根据心率确定间隔时间。
1.3 测试方案
测试分为2个阶段进行。第1阶段首先对测试者介绍测试流程和注意事项,签署知情同意书后进行身高、体质量和身体成分测量,然后进行静息类体力活动(5项)和周期类体力活动的测量(6项),每项活动时间为5 min,因静息类体力活动坐姿项目测量时,受试者自身选择舒适、身体放松的坐姿分别进行打字、读书、看手机。打字要求受试者按照日常打字速度将纸质文档上的内容转换为电子文档,读书与看手机时要求受试者双手持书或手机。走跑类体力活动在Pular跑台上进行。
第2阶段测试为非周期性的体力活动,共计9个项目(见表2),除跳绳为2 min外,其余项目均为5 min,休息间隔的安排与第1阶段相同。扫地与拖地时要求受试者模拟日常状态打扫地面。整理书桌或叠衣服时,受试者按照编号顺序将打乱的书或衣物重新归置好。乒乓球和羽毛球采用多球练习的方式,受试者不捡球。篮球运球的速度由受试者本人控制,不能手持球。
依据陈立基研究中对周期性运动项目的界定“动作结构单一固定,且需重复运动的项目”[14]和Mansoubi等[15]对静息类体力活动的界定,将体力活动项目分为静息类体力活动和非静息类体力活动。其中非静类体力活动分为周期性体力活动和非周期性体力活动2类。因跳绳项目受运动技术等的影响较大,受试者随时可能中断,并且在跳绳的过程中,学生有时双脚跳,有时单脚跳,故将其界定为非周期性体力活动。
各项体力活动之间的间隔时间依据心率恢复情况而定(1~5 min),除跳绳外每项体力活动取其中第2~4 min的数据进行分析,因跳绳只采样2 min,故将其全部数据纳入统计分析;因此,每名受试者有58 min的数据被统计分析,建模组共有1 624个统计单元(28名受试者×58 min),验证组为812个统计单元(14名受试者×58 min)。
所有测试均在实验室内进行,2个阶段测试共需120~140 min,测试时间为08:30—11:30,14:30—17:30和18:30—21:30。室内温度控制在18 ℃~25 ℃,相对湿度在50%~60%。
1.4 数据处理与统计
数据处理时,首先将前期从腕部加速度计中导出的“*.gt3x”文件分别转为以下3类数据:1)每秒30 Hz的原始加速度数据;2)每分钟的count值数据;3)每10 s的count值数据。以以上3种数据分别建构和验证各腕部加速度计能耗模型;髋部加速度计的原始数据只转为每分钟的count值数据。将从K4b2导出的“*.spo”文件分别转换获取METs/10 s的数据和METs/min的数据,由于K4b2采用每口气呼吸测量法,METs/10 s数据中存在少量缺失值,本研究采用相邻数据的均值来替代。
采用matlab7.0工具箱对腕部加速度计原始数据进行处理,合成每分钟的相关指标,然后连同count/min一起与METs/min的数据一一对应形成总数据库,并按照前期分组名单将其分为建模数据库和验证数据库。采用SPSS 22.0软件建立线性回归模型,采用matlab 7.0软件建立神经网络模型和支持向量机模型。
将count/10 s的数据与METs/10 s的数据一一对应后形成两阶段模型数据库,采用SPSS软件计算每分钟内6个10 s count值的变异系数(coefficient of variation,以下简稱CV),然后使用Medacle12.0软件利用ROC曲线确定基于count值的静息类体力活动切点和基于变异系数的周期性体力活动切点,将体力活动分为3类,静息类体力活动METs 赋值1,并分别建立周期性体力活动和非周期性体力活动的能耗方程。
模型验证时,引入常用的髋部加速度计中的Freedson模型和Hendleman模型,将建构的腕部模型从多方面与其进行测量准确性的对比。
采用SPSS软件计算各个模型在整体和各类体力活动上的均方根误差(root-mean-square error,以下简称RMSE)和平均百分误差(以下简称Bias)、进行测量准确性的比较,2个指标的计算公式为:
使用Medacle 12.0软件绘制Bland-altman图比较各模型在整体上预测值和实测值之间的一致性;使用MiniTAP软件进行等效性检验,以判断预测METs和实测METs测量结果的等效性,标准为:预测均值90%置信区间是否落入实测均值的等效区间(?滋±10%?滋)[16],如果落入则接受备择假设:下限<检验值/校标均值<上限,可认定2种测量方法等效。
2 研究结果
2.1 不同类型腕部加速度计能耗模型的建构
2.1.1 线性回归模型的建构
从图1可知,手腕部VM的值在4 000~6 000时,METs有较大的波动,在VM值大于20 000后,点较为分散。本研究采用简单线性回归的方法建立VM对METs的能耗方程METs=0.000 228×VM+2.019, R2为0.419,SEE为1.901。
2.1.2 两阶段模型的建构
Crouter的两阶段模型首先通过count值将体力活动分为静息类和非静息类,静息类体力活动赋值为1 METs;然后在非静息类体力活动中,依据变异系数分为周期性体力活动和非周期性体育活动,然后分别建立相应的回归方程。
2.1.2.1 区分静息类体力活动和非静息类体力活动的VM临界点的建立
本研究采用ROC的方法寻找Youden指数最大时所对应的VM的数值,即确定VM的体力活动临界点,由表3和图2可知,此临界点为335.5,此临界点的AUC大于0.9,且特异性与敏感性也均在0.9以上,ROC曲线接近于左上角的位置,这表明该临界点区分2类体力活动具有高度的准确性。
2.1.2.2 区分周期性体力活动和非周期性体力活动的CV临界点的确立
研究表明,判断周期性体力活动与否的CV的临界点为10.8,此临界点AUC为0.766,由表4和图3可见,根据Fawcett [17]的标准,该临界点具备一定的诊断价值,但其诊断的准确性,是否会影响后续建立模型的准确性需要进一步评估。
2.1.2.3 周期性体力活动与非周期性体力活动回归模型的建立
与Crouter-2010腰部两阶段模型类似,以VM/10 s的335.5为界点,将小于该值的体力活动界定为静息类体力活动,赋值为1 MET。在VM/10 s≥335.5的体力活动中,将CV/min<10.8的视为周期性体力活动,依据散点图和多个拟合方程的比较建立二次回归方程,如图4所示。CV/min≥10.8的归为非周期性体力活动,建立一般线性回归方程。每分钟的METs等于该分钟内连续6个10 s的METs的平均值具体方程,见表5。
2.1.3 神经网络模型的建构
神经网络模型能够依据计算误差反向传播来进行自主学习,是众多机器算法中的一种,基本模型一般由输入层、隐层和输出层组成,该模型通过处理大量的输入变量和輸出变量拟合出贴近的映射关系,得出非线性模型。与传统算法最主要的区别是不需输入变量权值、映射关系等就能自主完成运算,是一个“黑箱”模型,适用于预测研究,已在多个领域中广泛应用 [18] 。
2.1.3.1 神经网络模型输入端变量的确定
运动能耗线性模型中输入的指标一般为count值,实际为单位时间内原始数据的积分值,该指标并不能完全反映原始数据蕴含的全部信息,实际在该领域的指标体系可分为:1)时域类指标;2)频域类指标。参考Ellis等[10 ]、Rothney等[8]和Montoye等[19]的研究成果,选取mvm等14个指标(见表6),同时因佩戴部位在腕部,加速度计的空间位置在不断发生变化,而空间位置可以通过各轴与重力加速度的3个夹角来表示,如图5所示。该指标蕴含着丰富的体力活动数据信息,通过重力加速度与其在三轴加速度传感器的X、Y、Z轴的分量关系可以对其进行计算,由三角函数关系可以得出下式:
通过进一步的数据分析,表6中的指标中mvm、sdvm、df、fpdf、sd-?琢、sd- ?茁、sd-?酌 、cv、qd和peak与METs的相关系数分别为0.720、0.742、0.542、-0.475、0.635、0.672、0.651、0.730、0.498;而m-?琢 、m-?茁、m-?酌和skewness的相关系数低于0.4,属于中低强度相关关系,为了简化神经网络模型,降低模型的迭代次数,固不将以上4个指标纳入到计算模型中。10个输入指标在各个体力活动项目上的描述性统计见表7。
2.1.3.2 输入数据的归一化运算
为满足网络权值调整需要,减轻网络训练时间,对输入数据进行归一化运算,经标准公式Y=(X-Xmin)/(Xmax-Xmin)运算后,所有数值为0~1。
2.1.3.3 模型参数的设定
传统网络局部极小值和收敛速度慢的问题,本研究采用动量-学习率自动调整算法,为保障训练的准确性,初始动量取值范围0.5~0.9,学习率范围0.01~0.2,训练网络的最大误差设定为0.001。模拟训练表明误差在网络迭代次数5 000次以上时不再增加,故将5 000次作为停止训练的标准,以防止出现过度训练的现象。
2.1.3.4 隐层节点数的确定
隐层节点数的确定是神经网络模型设定的关键问题,适宜节点数可以在提高网络预测精度的同时预防过度拟合。本研究采用试凑法,以验证样本中的平均绝对值误差作为指标,确定隐层节点数,如图6所示,当隐层节点数为21后,MAPE保持相对的稳定,依据模型简约性的原则,确认隐层节点数为21。
2.1.3.5 模型的确定
通过对输入层指标的筛选和相关参数的调整比较,最终确认初始学习率为0.05,动量常量设为0.5,误差率设为0.001的10-21-1的三层神经网络模型。
2.1.4 支持向量机模型的建构
支持向量机模型是另一种近年来广泛应用于预测、分类和模式识别的算法,是建立在结构风险最小化原理和统计学习理论基础上的机器学习算法,在高维数据和非线性数据处理上,能够有效地解决“过学习”和“维数灾难问题”[18]。
2.1.4.1 支持向量机模型输入端变量的确定
与神经网络模型输入的变量相同,在此不再赘述。
2.1.4.2 支持向量机模型关键参数的确定
支持向量机模型建构中核函数参数(gamma)和惩罚因子(C)的设置是预测模型精度的关键。参数gamma代表着RBF的幅宽,设置太大容易影响泛化功能,数值太小影响预测准确性,而参数(惩罚因子)控制着模型复杂度和逼近误差时的折中[20 ]。
本研究根据特征量、样本数并参考已有研究,选择径向基函数(RBF)作为模型的核函数。通过试凑法,以MAPE为标准确定2个参数的数值。
图7显示的是MAPE随核函数gamma变化的情况(C恒等为10),gamma参数在1.5时,模型的预测精度最高。在确定gamma系数后,通过试凑法,确定C系数为10。此外,将模型的损失系数设置为0.01。
2.1.4.3 支持向量机模型的确认
通过多次对比和参数调整,最终选择以RBF为核函数、gamma为1.5、C为10、损失系数为0.01的支持向量机模型。
2.2 各模型测量准确性评估
选取在学界广泛使用的Hendleman模型和Freedson模型与本研究构建的4种腕部加速度计模型进行预测准确性的比较,上述2个模型均是针对髋部加速度计而设计的线性回归模型,见表8。
2.2.1 各模型整体预测准确性的比较
从模型整体测量误差上看(如图8所示),无论是在Bias还是在RMSE上,腕部神经网络模型测量误差最小(RMSE=1.28;Bias=0.032),其次是支持向量机模型(RMSE=1.31;Bias=-0.035);在Bias指标上,髋部Hendleman模型最高,为0.310;而在RMSE指标上,腕部线性回归模型最高,为1.78。从整体上看,腕部的神经网络模型和支持向量机模型的预测准确性高于髋部的Freedson模型和Hendleman模型。
通过Bland-Altman法,本研究分别计算了6种方法预测结果与气体代谢分析仪测量值的一致性限度区间(limits of agreement, mean ),线性回归模型为(-3.3,3.6),两阶段模型为(3.3,-2.2),神经网络模型为(-2.4,2.5)、支持向量机模型为(-2.2,2.8),Freedson模型为(3.2,-2.1)和Hendleman模型为(3.6,-3.3),从图9可见,神经网络模型和支持向量机模型的预测结果与实测值的一致性程度较高。
为进一步检验各模型预测值与实测值(K4b2测量结果)之间的一致性,本研究采用等效性检验中的可信区间法,该方法可以得出2组数据等效或无差异[21]。本研究采用Nolan等[16]制定的标准为检验等效性的依据,即预测均值90%置信区间是否落入实测均值的等效区间(?滋±10%?滋)。
从表9可知,线性回归模型、两阶段模型、Freedson模型和Hendleman模型预测数值90%的置信区间均没有落入校标实测值的等效区间里,神经网络模型和支持向量机模型90%置信区间分别为4.01~4.17和3.86~4.13,落在了3.72~4.54的等效区间内,可以认定,后2种模型预测值与K4b2校标值测量之间具有等效性。
2.2.2 模型在各体力活动项目测量的准确性
从图10可知,神经网络模型和支持向量机模型的散点普遍靠近参考线,支持向量机模型在20个体力活动项目中,低估所有的家务劳动类体力活动和运动类体力活动,在全部低估的14个项目中 ,6个项目低估幅度在10%以内,有6个项目低估的幅度在10%~20%, 所有高估的幅度均在10%以内;神经网络模型高估了10项体力活动的能耗,低估了10项体力活动项目;两阶段模型有6个体力活动项目的估计误差在±20%以上,其在上、下肢体力活动的项目中有较好的预测效度;而线性模型预测中有12项体力活动项目的预测误差在±20%以上,预测误差明显高于其他3个模型。
对单个体力活动项目进行分析发现(见表10),在擦桌子时,一般线性回归模型和两阶段模型的预测误差较大,分别高估能耗87%和59%,而基于机器学习算法的2种模型却有较高的精确性,类似的情况还出现在3 mph3%走、3 mph8%走和5 mph3%跑上,这3个项目的共同特征是带有坡度的走跑类体力活动,而没有坡度的走跑运动则各模型均有较准确的预测;此外,4个腕部模型都在跳绳项目上严重低估其能耗,低估的幅度为29%~40%。
3 分析与讨论
3.1 实验方案的分析
在日常体力活动能耗测量的研究中,研究者普遍摒弃了早期以Freedson模型为代表的走跑运动实验方案[5],认为走跑运动方案难以准确反映日常体力活动的特征,其建构的模型不能准确测量日常生活中的非走跑类体力活动[22],实验方案的制定必须是走跑类体力活动方案与非走跑类体力活动方案的结合[23]。在此基础上,部分学者在研究中将静息类的体力活动融入到体力活动方案中,认为静息类的体力活动虽然梅脱值低,但在日常体力活动中占据较长时间,不能因其引入方案会影响模型对走跑类体力活动和非走跑类体力活动的预测准确性就视而不见[24]。此外,还有学者认为在设计体力活动方案时应该考虑上、下肢的活动特征。综上所述,本研究认为在进行加速度计预测日常体力活动的能耗研究中,实验方案应是被预测人员日常生活的缩影,在构建时应考虑被试者因素、肢体活动特征因素和体力活动强度因素,选择适宜种类和数量的体力活动,保证方案的代表性。
因此,本研究的实验方案由5种静息类体力活动、6种走跑类体力活动,5种家务劳动类体力活动和4种体育锻炼类体力活动构成,基本囊括大学生日常体力活动的主要类型和项目,同时又兼顾了体力活动的肢体特征和强度特征,坐着看手机、坐着打字和坐着读书均涉及少量上肢肢体活动,而叠衣服、整理书桌主要是站立状态下较大幅度的上肢活动,扫地和拖地及其他体育锻炼类体力活动均是上、下肢活动兼有的非周期性体力活动,所有的走跑类体力活动为上、下肢活动兼有的周期性体力活动。本方案有6项体力活动属于小强度的体力活动(<3 METs),8项体力活动属于中等強度的体力活动(3~5.9 METs),6项体力活动属于大强度体力活动(≥6 METs),测试方案基本满足强度特征。
虽然有研究表明,在走跑运动中,随着坡度的增加,基于回归模型的加速度计能耗预测误差加大;但是鉴于坡道情况下的走跑类体力活动在日常走跑活动中占据较大比重,同时考虑到机器学习算法的普适性检验,遂将坡度走跑类体力活动纳入实验方案中。
3.2 腕部加速度计各预测模型准确性的分析
3.2.1 线性回归模型和两阶段模型能耗预测准确性分析
加速度计能耗模型经历了线性回归模型、两阶段模型和机器学习模型这3个阶段,3个模型主要是髋部模型,针对腕部模型的研究数量较少。早期对线性回归模型的研究中:Swartz等[6]将CSA单轴加速度计佩戴在腕部和髋部,对其能耗准确性进行评估,回归方程只能解释3.3%的变异。而Chen等[25]的研究表明3轴加速度计VM值与校标值之间的决策系数为0.41,这与本研究的结果相近,造成前后不同研究结果差距较大的主要原因与加速度计的性能相关,单轴加速度计不能有效反映腕部加速度计的状况。Rosenberger等[26]在此基础上,将两阶段模型和线性回归模型同时进行评估,结果显示两阶段模型中ROC区分静息类体力活动的AUC曲线为0.76,区分周期性体力活动的为0.56,低于本研究的AUC(0.99和0.76),而能耗预测的平均差值0.82 METs,高于本研究的0.55 METs,测量误差高于本研究。这可能与该研究选择的体力活动方案有关,例如,选择自行车等项目势必会降低预测的准确性。虽然本研究横向上与Rosenberger等的研究结果略有不同,但研究纵向比较的结果基本一致,均是两阶段模型的测量准确性明显优于一般线性回归模型;但该类模型最早是针对髋部加速度计而设计的,从腕部的应用效果上来看,测量的准确性低于髋部,其实践应用的价值有待进一步探究。
在本研究中,线性模型的截距为2.019,也就是说在静息类的体力活动中其预测的能耗都高于2.0 METs,而实测值在1.3 METs左右,远高于实测值,6个项目的预测误差在59%~70%。而两阶段模型对于静息类体力活动赋值为1 METs, 其预测的误差远低于线性回归模型;鉴于此,Crouter等[27]在两阶段模型和线性回归模型之间提出了一种折中的算法,仅把体力活动分为静息类和非静息类体力活动,静息类体力活动赋值为1 METs,非静息类体力活动建立线性回归方程,有效地解决了静息类体力活动测量误差偏大的问题。在儿童中应用的结果显示,矢量技术的预测方程的RMSE为1.38 METs,预测误差高于本研究和Rosenberger等的研究结果,这提示进一步对体力活动进行细分,并分别建立回归方程,有助于提高预测的准确性。
Swartz等[6]针对走跑运动建构线性回归模型,腕部的R2为0.03,而髋部则为0.32,Mannini等[28]和Chen等[25]的研究结果也类似。而对于两阶段模型而言,也存在相同的问题,髋部的预测准确性明确高于腕部,Rosenberger的研究[26]显示腕部的平均误差为0.82 METs,高于髋部的0.55 METs,其分类准确性也低于髋部模型。由此可以推断,无论是线性回归模型预测,还是两阶段模型预测,腕部加速度计能耗预测模型的预测准确性均低于较髋部。
3.2.2 机器学习算法预测准确性分析
本研究将机器学习算法中的神经网络模型和支持向量机模型同时引入到腕部加速度计模型中,结果显示:RMSE分别为1.28 METs和1.30 METs。该研究结果得到其他研究的支持,Montoye等[12]的神经网络模型测试结果显示r为0.84,RMSE为1.25 METs,这与本研究的结果相近,表明神经网络模型在腕部加速度计的能耗预测中具有一定的稳定性。还有研究构建和评估随机森林分类器算法模型,其同时融合心率信号和加速度信号,结果显示RMSE为1.00 METs[10];Strath等[13]则探讨了时间序列模型的测量准确性,其RMSE为0.81~1.04 METs。上述研究结果显示,机器学习算法之间的误差相差很小,这也与本研究的结果基本一致,在本研究中机器学习算法和支持向量机算法的RMSE也只仅相差0.03。
本研究的结果表明,机器学习算法在腕部加速度计能耗的预测准确性高于线性回归模型和两阶段模型,该结果也部分得到Montoye研究[19]的印证,该研究显示神经网络模型和一般线性回归模型的RMSE分别为1.26~1.32 METs和1.55~1.61 METs,神经网络模型优于一般线性回归模型。Staudenmayer等[9]对不同模型进行对比后也得出相似结果。机器学习算法预测精度优于传统模型的一个最主要原因就是其充分利用原始数据,将其合成为反映原始数据信息的众多指标,而传统的模型则受算法限制只能将原始数据合成单一的count值,不能充分挖掘原始数据中蕴含的丰富含义。
此外,本研究的结果还显示神经网络模型和支持向量机模型无论在RMSE还是Bias指标上均低于髋部的Freedson模型和Hendleman模型,但应该认识到建立上述2个模型所依据的体力活动方案和实验对象都不同。因此,并不能简单地通过等效性检验和RMSE分析就得出腕部的2个模型预测准确性高于Freedson模型和Hendleman模型的结论, 这还需要更多的研究来支撑。
在测量部位对机器学习模型测量准确性影响的探讨中,Ellis等[10]发现相同随机森林算法的髋部模型和腕部模型之间测量准确性并无显著性的差异,其RMSE分别为1.09 METs和1.00 METs。还有研究发现神经网络算法在体力活动类型识别上,髋部与腕部的准确率之间无显著性差异[29],Montoye等[19]的研究结果也相似。目前,对该问题的实证研究较少,但可以推断,机器学习算法能够比线性回归模型更好地应用于腕部加速度计中,且测量准确性与髋部相近,其原因在于:机器学习算法具有“智能”特征,能够自主学习,可以依据现有数据优化算法,充分利用数据中蕴含的丰富信息反映体力活动特征,而是否存在着机器学习算法受佩戴部位影响小、线性回归模型和两阶段模型受佩戴部位影响大这种佩戴部位和算法模型之间的交互效应,还应有更多的研究进行系统的探讨。
3.3 机器学习模型输入指标体系的分析
本研究建立了含有10个指标的机器学习输入层指标体系,其中:7个指标是借鉴髋部加速度计的相关成果,3个指标是根据腕部的运动特征而专门设计的,以反映加速度计在空间中的位置变化速度,从与实测值的相关系数上看,这3个指标是满足预测需要的。目前,该研究领域的指标体系分为2大类:一类是时域指标;一类是频域指标。时域指标因其提取简便、含义清晰而受青睐,但频域指标能够深层次地反映某些时域指标不能体现的信息[28]。目前,对指标的筛选和数量的确认缺乏明确的标准,少数研究采用试凑法对此进行研究,Kate等[30]認为对于体力活动类型识别的任务,更多特征指标的输入能够提高机器学习模型的准确性;而对于能耗预测的任务,特征指标的数量对预测准确性的影响具有边际效应。Montoye等[12]的研究结果也支持这一结论。但上述研究对于不同指标组合的确认具有较大的主观性,如何客观地筛选指标是下一步研究应该解决的问题。
3.4 本研究的局限
本研究中的受试者均为18~29岁的正常体质量大学生,所建立的模型是否具有人群的局限性还需要后续研究加以探讨;在研究方案上,本研究所有的测试均在实验室情境下以体力活动任务清单的形式执行,虽然体力活动项目众多,基本反映日常体力活动的状况,且各强度兼而有之,但还是与日常生活的实际情况有较大差距,下一步应在条件允许的情况下,探讨实际生活情景下的预测模型,进一步提高方程预测的准确性。
4 結论
本研究所建构的4个腕部加速度计能耗预测模型中,神经网络模型和支持向量机模型预测的准确性高于两阶段模型和线性回归模型,前2种模型可以较好地预测日常体力活动中的能量消耗,具有较高的实践应用价值;而在腕部能耗预测中,应慎重应用两阶段模型,一般线性回归模型不适宜应用于腕部加速度计。应进一步加强对相同计算模型不同部位间的比较,系统探究计算模型、佩戴部位和体力活动类型对加速度计测量准确性的影响。
参考文献:
[1] 温煦, 袁冰, 李华, 等.论智能可穿戴设备在我国体力活动大数据分析中的应用[J]. 中国体育科技, 2017, 53(2):80.
[2] TROST S G, MCIVER K L, PATE R R. Conducting accelerometer-based activity assessments in field-based research[J]. Medicine and Science in Sports and Exercise, 2005, 37(11):531.
[3] YANG C C, HSU Y L. A review of accelerometry-based wearable motion detectors for physical activity monitoring[J]. Sensors, 2010, 10(8):7772.
[4] FREEDSON P S, MELANSON E, SIRARD J. Calibration of the computer science and applications, inc. accelerometer[J]. Medicine and Science in Sports and Exercise, 1998, 30(5):777.
[5] HENDELMAN D, MILLER K, BAGGETT C, et al. Validity of accelerometry for the assessment of moderate intensity physical activity in the field[J]. Medicine and Science in Sports and Exercise, 2000, 32(9 ): 442.
[6] SWARTZ A M, STRATH S J, BASSETT D R, et al. Estimation of energy expenditure using CSA accelerometers at hip and wrist sites[J]. Medicine & Science in Sports & Exercise, 2000, 32(9):450.
[7] CROUTER S E, CLOWERS K G, BASSETT JR D R. A novel method for using accelerometer data to predict energy expenditure[J]. Journal of Applied Physiology, 2006, 100(4):1324.
[8] ROTHNEY M P, NEUMANN M, BéZIAT A, et al. An artificial neural network model of energy expenditure using nonintegrated acceleration signals[J]. Journal of Applied Physiology, 2007, 103(4): 1419.
[9] STAUDENMAYER J, POBER D, CROUTER S, et al. An artificial neural network to estimate physical activity energy expenditure and identify physical activity type from an accelerometer[J]. Journal of Applied Physiology, 2009, 107(4):1300.
[10] ELLIS K, KERR J, GODBOLE S, et al. A random forest classifier for the prediction of energy expenditure and type of physical activity from wrist and hip accelerometers[J]. Physiological Measurement, 2014, 35(11):2191.
[11] TROIANO R P, MCCLAIN J J, BRYCHTA R J, et al. Evolution of accelerometer methods for physical activity research[J]. British Journal of Sports Medicine, 2014, 48(13): 1019.
[12] MONTOYE A H, PIVARNIK J M, MUDD L M, et al. Wrist-independent energy expenditure prediction models from raw accelerometer data[J]. Physiological Measurement, 2016, 37(10):1770.
[13] STRATH S J, KATE R J, KEENAN K G, et al. Ngram time series model to predict activity type and energy cost from wrist, hip and ankle accelerometers: implications of age[J]. Physiological Measurement, 2015, 36(11):2335.
[14] 陳立基. 周期性运动项目训练手段的发展趋势[J]. 武汉体育学院学报, 1987(2):47.
[15] MANSOUBI M, PEARSON N, CLEMES S A, et al. Energy expenditure during common sitting and standing tasks: examining the 1.5 MET definition of sedentary behaviour[J]. BMC Public Health, 2015, 15(1): 516.
[16] NOLAN M, MITCHELL J R, DOYLE-BAKER P K. Validity of the apple iphone?/ipod touch? as an accelerometer-based physical activity monitor: a proof-of-concept study[J]. Journal of Physical Activity & Health, 2014, 11(4):759.
[17] FAWCETT T. An introduction to ROC analysis[J]. Pattern Recognition Letters, 2006, 27(8):861.
[18] 张学工. 关于统计学习理论与支持向量机[J]. 自动化学报, 2000, 26(1):32.
[19] MONTOYE A H K, BEGUM M, HENNING Z, et al. Comparison of linear and non-linear models for predicting energy expenditure from raw accelerometer data[J]. Physiological Measurement, 2017, 38(2):343.
[20] 丁世飞, 齐丙娟, 谭红艳. 支持向量机理论与算法研究综述[J]. 电子科技大学学报, 2011,40(1): 2.
[21] 袁秉祥, 朱芳. 生物等效性检验的计算及计算程序[J]. 西安医科大学学报, 2001, 22(2):164.
[22] LEENDERS N Y, SHERMAN W M, NAGARAJA H N. Energy expenditure estimated by accelerometry and doubly labeled water: do they agree[J]. Medicine & Science in Sports & Exercise, 2006, 38(12):2165.
[23] 朱琳, 陈佩杰. 应用ROC曲线确定活动计数在青春期少年运动强度诊断中的最佳临界值[J]. 体育科学, 2012, 32(11):70.
[24] CHEN K Y, BASSETT D R. The technology of accelerometry-based activity monitors: current and future[J]. Medicine & Science in Sports & Exercise, 2005, 37(11S):490.
[25] CHEN K Y, ACRA S A, MAJCHRZAK K, et al. Predicting energy expenditure of physical activity using hip-and wrist-worn accelerometers[J].Diabetes Technology & Therapeutics, 2003, 5(6): 1023.
[26] ROSENBERGER M E, HASKELL W L, ALBINALI F, et al. Estimating activity and sedentary behavior from an accelerometer on the hip or wrist[J]. Medicine and Science in Sports and Exercise, 2013, 45(5):964.
[27] CROUTER S E, JENNIFER I F, DAVID R B. Estimating physical activity in youth using a wrist accelerometer[J]. Medicine and Science in Sports and Exercise ,2015,47 (5): 944.
[28] MANNINI A, INTILLE S S, ROSENBERGER M, et al. Activity recognition using a single accelerometer placed at the wrist or ankle[J]. Medicine & Science in Sports & Exercise, 2013, 45(11):2193.
[29] TROST S G, ZHENG Y, WONG W K. Machine learning for activity recognition: hip versus wrist data[J]. Physiological Measurement, 2014, 35(11): 2183.
[30] KATE R J, SWARTZ A M, WELCH W A, et al. Comparative evaluation of features and techniques for identifying activity type and estimating energy cost from accelerometer data[J]. Physiological Measurement, 2016, 37(3): 360.