基于行为识别匹配的用户日常运动检测
2018-03-08夏磊
夏 磊
(南京理工大学 计算机科学与工程学院,南京 210094)
0 引言
随着人们生活节奏加快,工作压力不断加大,日常运动已经成了现代人的一种现状[1]。步行走路作为简单易行的锻炼,确保我们的身体能够保持活力和健康。计步器[2]通过实时监测用户日常步行用以掌控运动量,步态在测算走路时所表现的姿态,及走路所有的动作。用户日常运动中步态计步器(Pedometer of Gait,POG)检测问题不同于传统的统计机器学习方法[3],模板匹配方法[4]往往在具有较高精度的同时能够保持相对较高的效率,被普遍应用与人体姿态识别实际应用中。Muscillo[5]等利用基于个体的模板,实现了对下肢特定动作的识别和捕捉。此外,Chen和Shen[6]构建了一个基于模板匹配方法的识别框架,实现对右下肢精确动作的捕捉。朱保锋和宋艳[7]将不同的动作编译成序列的符号,利用字符匹配的方法实现动作识别。然而,据我们所知,模板匹配方法尚未被应用于用户日常运动的POG检测应用中。
综上所述,传统的统计机器学习方法精度低、效率差,很难被实际应用于POG实时检测。模板匹配方法具有精度高、实时性好等优点,但尚未应用于POG实时检测。基于此, 本文提出一种改进的Dynamic Template Wrapping(DTW)模板匹配方法,用于POG 实时检测。在介绍典型的模板匹配方法的基础上,提出本文设计系统的具体框架,及算法流程,阐述实验设计及结果分析比较。
1 模板匹配方法
1.1 Euclidean Distance
欧几里得度量[8]是一个通常采用的距离定义,指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。令X=x1,...,xi,...,xm,Y=y1,...,yi,...,yn为两个时序序列,则距离di(i=0,...,n-m-1,n (1) 在日常的生活中我们最经常使用的距离毫无疑问应该是欧式距离,但是对于一些特殊情况,欧氏距离存在着其很明显的缺陷,比如说时间序列[10],特别是当样本长度不一样时,DTW能够衡量这两个序列的相似程度,或者说两个序列的距离。DTW算法的质量就是运用动态规划的思想,利用局部最佳化的处理来自动寻找一条路径,两个特征矢量之间的积累失真量最小.从而避免由于时长不同而可能引入的误差。 图1 典型DTW比较子序列 定义序列Q(模版信号)和C(记录信号),长度分别为n和m,即: X=(t1,x1),...,(ti,xi),...,(tn,xn) (2) Y=(t1,y1),...,(tj,yj),...,(tn,yn) (3) 1)边界条件:所选的路径必定是从左下角出发,在右上角结束。 2)连续性:就是不可能跨过某个点去匹配,只能和自己相邻的点对齐。这样可以保证X和Y中的每个坐标都在W中出现。 3)单调性:点在包络路径上的间隔要求是单调的。 满足上面这些约束条件的路径可以有指数个,然后我们感兴趣的是使得下面的规整代价最小的路径,这样我们有: Dist(X,Y)=D(xi,yj)+Dmin (4) 其中:Dmin=min{Dist(i-1,j-1),Dist(i-1,j),Dist(i,j-1)}。 一条最优路径,在每一条最优路径中,对应两个连续数据片段相似部分的往往只有路径上的一小段。因此我们需要将最优路径上特定的子路径切割出来,这些子路径满足的条件是: 1)子路径包含的点的数量,即子路径长度长于L; 2)子路径包含的所有点的平均值,即子路径平均值小于θ。给定一条包含N个点的路径以及子路径长度限制L(L (5) 在信号处理中,经常要研究两个信号的相似性,或者一个信号经过一段时间延迟后自身的相似性,以便实现信号检测、识别与提取等[12]。可用于研究信号相似性的方法称为相关。给定两个时间序列X和Y,其长度分别为n和m,其互相关函数定义为: (6) 通常来讲,互关联指数可以对两个信号的标准差进行归一化,及互相关系数: (7) 其中:σYY和σXX分别为Y和X的标准差,其值介于-1和+1之间。若γYX(τ)=-1,则说明Y与X形状相同但相位相反;若γYX(τ)=0,则说明Y与X不具有相似性;若γYX(τ)=+1则说明Y与X完全相似。当信号与自身相比较时,称为自相关,定义如下: (8) 该函数通常用来从白噪声中分离周期性信号以识别信号周期及信号的重复模式。 文献[13]等通常利用傅立叶变换來提取时域和频域的不同特征,来进行POG的检测与分类。本文根据POG测量信号[14]的特定,从模版匹配的角度出发,采用一种改进的sDTW算法:IsDTW,来实现POG的检测与预警,在保持识别精度的前提下降低算法的复杂度。 本文所述POG检测和分析过程,主要可以分为两个个环节:1)数据预处理阶段:主要完成模板生成、阈值确定等工作,即模型训练阶段;2)实验分析阶段:利用所提出算法,进行相似度计算,判别POG。 Notations:原始信号记为X={(t1,x1),(t2,x2),...,(ti,xi),...,(tn,xn)},待查询子序列记为Y={(t1,y1),...,(tj,yj),...,(tm,ym)}。子序列表示从时刻i到j的X子序列。 图2 系统框架示意图 模板序列Y,其长度m为预设好的匹配窗口长度,模板序列中包括若干传感器采集数据子序列(加速度轴Ax,Ay,Az等)。在样本数据中,包含大量标记好的POG和非POG数据,分别将两类数据划分为长度为m的子序列,并利用Matlab的“interp1”函数进行平均化,得到正常步态模板如图3所示。对子序列的每一个轴向都做相同的处理,从而得到POG步态的模板如图4所示。 图3 正常步态模板 图4 POG步态模板 上述算法另一个待解决的问题是损失函数阈值ε的确定。由常理可知,由于个体差异和噪声等原因,该阈值会因人而异,不同的实验对象理应具有不同的阈值设定。出于以上考虑,本论文在前期统计建模的基础上,提出一个基于统计机器学习的动态门限阈值估计方法。在数据预处理阶段,通过标注的训练数据,利用ANN分类器[15],分析得出适合实验对象的阈值ε,作为实验分析阶段的输入。该方法通过机器学习方式获得,在大量真实数据的基础上,运行速度快、可信度高。 与DTW算法相似,通过更新距离计算矩阵来计算相似性。每次IsDTW计算过程存储两个值,D(t,k)和X(t,k)。D(t,k)为序列Y和子序列Si,t之间DTW距离的最小值,X(t,k)为序列Xi,t的开始时间,即i=X(t,k)。D(t,k)可以通过如下方式获得: (9) 其中:Distbest=min{Dist(t,k-1),Dist(t-1,k),Dist(t-1,k-1)},D(t,0)=0,D(0,0)=D(0,k)=+∞,(t=1,2,...,n,k=1,2,...,m)。同理,X(t,k)可以通过下式得到: (10) 其中:X(t,0)=t。IsDTW的目标是在给定序列X中,查找出所有与给定序列Y相似度满足给定阈值ε的子序列Xi,j,即Dist(Xi,j,Y)≤ε,其中j=i+m-1,i=1,2,...,n-m+1。算法流程如下: Input:xtattimet Output: 相似子序列si,t Fork=1tomdo CalculateD(t,k)andX(t,k) End IfDmin≤εthen If∀D(t,k)>Dmin∨X(t,k)>tethen ReturnDmin,ts,te Dmin=+∞ Fork=1tomdo IfX(t,k)≤tethen D(t,k)=+∞ End End End End IfD(t,m)≤ε∧D(t,m)≤Dminthen Dmin=D(t,m) ts=X(t,m) te=t End Fork=0tomdo D(t-1,k)=D(t,k) X(t-1,k)=D(t,k) End 本文方法所依托数据来自开源数据集[6]。Bachlin及其同事以10名PD病人用户(7名男性,3名女性;年龄66.5±4.8;病史年限:13.7±9.67)为实验对象进行分析。实验对象皆有步行病史,并在无外力协助的情况下可以在“off-medicine”条件下行走。所有实验都在“off-medicine”的条件下完成数据采集和分析。 实验对象根据要求完成几种实验场景下的数据采集:直线前后行进、随机停止-行进、360度转弯以及日常生活活动。全程所有的活动流程都通过摄像机记录。两名医务人员通过视频信息实时诊断病人的两种不同活动状态:非冻结(行走、站立、转弯)和冻结。当每次POG检测时,记录起止时间。每名实验对象身上带有3个3轴加速度计,分别放置于shank、thigh和lower back,采用频率设置为64 Hz。在数据集中,共包含10名实验对象8 h 20 min的实验数据,237段POG数据。 图5 实验数据与真实标度 图5所示为某位PD病人用户实验过程中,传感器记录数据的示意图。由图可见,实验对象在起步时即发生POG现象,短暂停留后开始正常行进;随后,传感器有监测到由POG引起的颤抖,即发生了腿部的卡顿现象;较长时间的POG过后实验对象进行了较快的行进,在又一次短时POG后进入休息状态。基于医生的检测结果在图中用彩色字体标注,与实验结果相一致。此外,由图可知,在第一、第三次POG中,短时的POG卡顿被精确识别出来而不是识别成休息状态;第二次POG中腿部由于POG的引起的颤抖,也被准确识别,说明了算法的有效性。 图6为检测系统实验的Receiver Operating Characteristic(ROC)曲线。图示为分别利用后背下侧、大腿、小腿以及全部三个加速度数据时,系统识别性能的ROC曲线。由图可知,当数据较为丰富时(即全部使用),系统ROC性能更好,即曲线更接近左上角。当仅利用小腿数据时,性能相对较好,其原因可能与该部位更能反应POG特性有关。 图6 ROC示意图 本文利用不同的模板匹配方法在数据集[6]上进行POG检测分析,获得了不同的识别结果,如图7所示。 图7 IsDTW方法在不同实验数据集上的结果比较 本文所提出的改进的DTW算法在不同的实验场景下,都取得了较好的实验结果。从以上实验结果,我们可以得到以下结论: 1)不同的算法在不同的实验数据集上获得了不同的精度,所有数据都利用时精度最高,利用shank时略低。由此可见,shank,其余部位数据起到了一定的辅助作用。 2)在不同的实验数据集上,本文所述IsDTW算法都获得了相对较高的精度,体现出算法的稳定性。同时,其最高精度达到92%。同其他算法相比,IsDTW在运行过程中持续更新最小路径,保持高效率的同时获得了较高的精度;利用ANN更新动态阈值,保持了算法的有效性。 3)DTW相关的算法普遍优于Eudidean和Cross Correlation算法,说明在相似性度量上,对于变长数据及不确定长度序列的判别DTW更具有优越性。 为了进一步验证算法的有效性,本文将基于模版匹配的POG检测方法实验结果与传统统计分类方法进行了比较,包括Decision Tree(DT),Naive Bayesian Network (NBN)和Artificial Neural Network(ANN)。根据参考文献[6]所示,本文选择了13个常用的时域和频域分类特征中,利用Relief方法筛选出9个用于分类,特征如表1所示。 利用开源工具Weka,在实验数据及上的测试结果与本文所提出的模版匹配方法IsDTW相比较,结果如表2所示。从结果可以看出,IsDTW方法在分类精度上具有显著的优势,即IsDTW>ANN>NBN>DT。ANN在统计分类方法中具有较高精度,但仍明显低于IsDTW,同时,在运行效率上也远低于本文方法,难以满足实时应用的需求。DT由于算法简单,具有较高的运行效率,但是精度难以满足应用需要。 表2 IsDTW与统计机器学习方法性能比较 由此可见,本文提出的IsDTW方法具有高精度、高实时性的优点,能够满足实际应用需求。 本文集中讨论了利用模板匹配的方法进行POG检测。通过在开源数据集上的验证分析,对比了基于模板匹配规则的Euclidean、DTW、SDTW、Cross Correlation和本文提出的IsDTW算法的不同性能。由实验结果可以得出结论,模板匹配方法对POG检测有一定的优越性,同时IsDTW方法具有更高的判别精度。作为对比,本文进一步的将IsDTW方法与非模板方法进行比较,结果显示,本文方法不仅具有相对较高的实验精度,在运行效率上也在一定程度上优于传统方法,对实际应用更具价值。 [1] 陈 静,姜汉钧,徐乃昊,等. 运动传感器辅助的心电运动伪迹识别与消除方法[J]. 传感器与微系统,2016,35(1):49-51. [2] 袁宪锋,周风余,袁 通,等. STM32和iNEMO模块的高精度计步器设计[J]. 单片机与嵌入式系统应用,2013,13(9):42-45. [3] 孟池洁,王 伟,耿光刚. 基于统计机器学习的互联网暗链检测方法[J]. 计算机应用研究,2015,32(9):2779-2783. [4] 呙润华,苏婷婷,马晓伟. BP神经网络联合模板匹配的车牌识别系统[J]. 清华大学学报(自然科学版),2013,53(9):1221-1226. [5] Azizpour H,Razavian A S,Sullivan J,et al. From generic to specific deep representations for visual recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2014:1-1. [6] Huang G B,Zhou H,Ding X,et al. Extreme learning machine for regression and multiclass classification.[J]. IEEE Transactions on Systems Man & Cybernetics Part B Cybernetics A Publication of the IEEE Systems Man & 310 Cybernetics Society,2012,42(2):513-29. [7] 朱保锋,宋 艳. 一种改进的BM算法性能分析[J]. 中州大学学报,2015(3):114-116. [8] 邢哲源,冯秀芳. 一种基于时序信誉的WSNs恶意节点检测算法[J]. 传感器与微系统,2015,34(7):118-120,124. [9] 汪海涛,花 静. 基于相对变换距离的半监督分类算法[J]. 计算机应用与软件,2013,30(6):178-181. [10] 李海林,杨丽彬. 基于增量动态时间弯曲的时间序列相似性度量方法[J]. 计算机科学,2013,40(4):227-230. [11] 刘 鹤. 基于人工神经网络的认知无线电频谱感知研究[J]. 电子测试,2012,(9):37-41. [12] 王 燕,安云杰. 时间序列相似性度量方法[J]. 计算机工程与设计,2016,37(9):2520-2525. [13] Graves A,Mohamed A R,Hinton G. Speech recognition with deep recurrent neural networks[J]. 2013,38(3):6645-6649. [14] 刘明亮,朱江淼. 数字信号处理对电子测量与仪器的影响研究[J]. 电子测量与仪器学报,2014,28(10):1041-1046. [15] 陈 洁,余诗诗,李 斌,等. 基于双阈值比较法超声波流量计信号处理[J]. 电子测量与仪器学报,2013,27(11):1024-1033.1.2 DTW
1.3 sDTW
1.4 Cross Correlation
2 系统框架与算法设计
2.1 模板生成
2.2 阈值确定
2.3 相似度计算
3 结果与分析
3.1 数据集
3.2 实验结果
3.3 与其它模板匹配方法比较
3.4 与统计机器学习方法比较
4 结论