基于样本熵的人体活动识别
2018-03-14闵玉寒张国兴张磊
闵玉寒,张国兴,张磊
(1.山东省济宁市微山县第一中学,微山277600;2.中国矿业大学计算机学院,徐州221116)
0 引言
人体活动识别是近年来的研究热点[1]。活动识别的目的是识别用户不显眼的活动或者行为,并对这些行动采取必要的响应[2]。目前,人体活动主要有三种方法:基于视频的方法[3]、基于环境传感器的方法[4]、可携带传感系统方法[5]。基于加速器的活动活动识别方法虽然能够提供更高的识别率,然而对长期的活动监控是不可行的[6]。相比之下,安装在腰部、胸骨或者背部的加速计能够较好地识别基础活动(如站立、走路、跑步),但在基础活动的过渡过程和动态活动中(如上楼、下楼)识别较差。从频率或者时间域提取的特征具有不同的准确率。频率域特征需要大量的排列组合来识别活动,因此其时间复杂度太高。时间领域的特征可以从时间序列中很容易的提取出来且计算复杂度较小。然而,用这些特征进行识别时准确率不高。
针对以上问题,本文将样本熵[7]引入到人体活动识别领域,因为样本熵作为时间序列稳定性的度量能够检测出时间序列发生异常的时间点,从而实现长期的人体活动识别,并且通过观察排列熵,样本熵对测试准确率的影响来判断其有效性。
1 活动序列数据的样本熵
样本熵是一种非线性的度量序列的复杂度和统计量化的动力学参数,用一个非负数来衡量一个时间序列的复杂度,反应时间序列中的新信息率。样本熵对时间序列的长度要求不高,可以用于长度较短的时间序列的检测。
采用样本上从活动序列数据抽取样本熵特征,算法如下:
(1)设原始时间序列为{Y(i),i=1,2,…,n},共 n 个点。将时间序列进行重构,得到重构矩阵X(i)。
其中,j=1,2,3…,K,m为嵌入的维数,τ为延迟时间,K=n-(m-1)τ。
(2)定义重构矩阵的两个向量X(i)与X(j)之间的距离d[X(i),X(j)]为两个向量对应元素中差值最大的一个。即:
(3)对于给定阈值r,对于每个值统计d[X(i),X(j)]小于r的数目及此数目与距离总数n-m的比值,记为,即:
其中 i=1~n-m+1,i≠j。
(5)则此序列的样本熵为:
将其表示成:
2 基于ELM的人体活动识别
极限学习机(ELM)是一种新的前反馈神经网络方法。该方法通过隐藏层输出矩阵的广义逆操作进行分析确定,用最快的速度提供最大的泛化能力[8]。本文采用EML作为活动识别分类器。
对于N个不同的样本(xi,ti)∈Rn×Rm有L个隐藏节点的输出函数G(ai,bi,x)的SLFNs可以用下面的公式来建模:
其中(ai,bi)是隐藏节点的参数,βi是第i个隐藏节点和输出节点的权重向量。
H是神经网络隐藏层的输出矩阵,H矩阵的第i列是和x1,x2,…,xN关联的第i个隐藏节点的输出。
3 实验与分析
3.1 数据描述
实验采用UCI HAR Dataset数据集,该数据集包含30名志愿者的活动数据。他们携带着智能手机完成了六个动作。通过嵌入在手机上的加速度计和螺旋仪,获取三轴向线性加速度和三轴角速度,通过视频标识给活动类别加标签。将实验数据随机分为两组,70%的数据作为训练集数据,其余30%的数据作为测试数据。
3.2 实验结果
为了验证本文方法,将ELM和SVM(支持向量机)相比较。首先用其原始数据进行实验,将原始数据直接输入到SVM、ELM。将原始数据进行了预处理,形成了长度为256的时间序列,实验样本有5159个。实验结果如表1:
表1 原始数据训练结果
从表1可以看出,用原始数据进行训练,准确率很低,最好情况不会超过30%。
对原始数据进行提取,计算其样本熵(SE)。将时间序列的长度扩大到512,样本数目有2579个,其SE如表2。
表2 长度为512时计算结果表
其中,维数取值为5,SE中的维数取值为2,r取值为0.2std。从表2中的数据我们可以看出,Walking、Upstairs、Downstairs的熵值较小,说明其时间序列的复杂度较小,而 Standing、Sitting、Laying的熵值较大,说明其时间序列的复杂度较高。
对SE进行学习,其结果在表3中显示。
表3 长度为512时机器学习的结果表
从上表中看出,对比原始数据,SE能明显的提高测试准确率。且ELM准确率高于SVM。
通过实验不难看出,样本熵作为人体活动识别过程中的一个重要处理过程,可以显著的提高人体活动识别的准确率。
4 结语
本文将样本熵引入到人体活动识别的领域,通过计算活动序列数据的样本熵作为序列特征,采用ELM作为分类器,提出了基于样本熵和ELM的人体活动识别方法。在UCR数据集上的测试结果表明:本文方法较好地提高了人体活动识别的准确率。
[1]Reyes-Ortiz J L,Oneto L,Samà A,et al.Transition-Aware Human Activity Recognition Using Smartphones[J].Neurocomputing,2016,171(C):754-767.
[2]冯辅周,饶国强,司爱威,孙野.排列熵算法的应用和发展.装甲兵工程学院学报,2012,26(2).
[3]凯泽斯.视频监控系统的活动识别和检测的概念及设计[J].数码世界,2015(10):33-34.
[4]王金甲,孔德明,刘建波,等.基于传感器数据的人类活动识别研究[J].高技术通讯,2016,26(2):207-214.
[5]刘斌,刘宏建,金笑天,等.基于智能手机传感器的人体活动识别[J].计算机工程与应用,2016,52(4):188-193.
[6]Chen C,Jafari R,Kehtarnavaz N.A Survey of Depth and Inertial Sensor Fusion for Human Action Recognition[J].Multimedia Tools&Applications,2016:1-21.
[7]Ahmad R F,Malik A S,Amin H U,et al.Nonlinear Features Based Classification of Active and Resting States of Human Brain Using EEG[C].IEEE International Conference on Signal and Image Processing Applications.IEEE,2016:264-268.
[8]Guang-Bin Huang,Qin-Yu Zhu,Chee-Kheong Siew.Extreme Learning Machine:Theory and applications,ScienceDirect Neurocomputing 70 2006:489-501.