基于三轴加速度传感器的人体行为识别研究

2016-05-14余杰杨连贺焦帅易明雨于佃存

软件工程 2016年9期

余杰杨连贺焦帅易明雨于佃存

摘要：目前，在人体行为识别领域中，分类模型通常有两种，分别是通用模型和个性化模型。但是通用模型没有考虑人体多样性问题，不能适用于所有人，而个性化模型需要人为干预较多，针对这两种模型的不足提出了一种折中的模型训练方法，即对人体多样性因素分区间后的原始加速度数据进行训练得到多个模型。另外，为了使识别模型适用于更加广泛的情况，在数据采集阶段还考虑了加速度传感器的位置。该方法使得模型更具普遍性的同时又能够提高识别精确度，通过对人体静止、走路、跑步、上下楼梯五种行为进行试验，识别率达到了95%左右。实验表明该方法是切实有效的。

关键词：人体多样性；行为识别；模型；位置；精确度

中图分类号：TP3-05 文献标识码：A

Abstract：At present，in the field of human action recognition，there are generally two classification models：the general model and the personalized model.But the diversity of human bodies is not considered in the general model，so it is not suitable for everyone.On the other hand，the personalized model needs more human intervention.In order to make up the deficiency of the two models，the paper proposes a compromise model training method which trains the raw acceleration data after partitioning the diversified factors of human bodies to obtain multiple models.Additionally，the position of the acceleration sensor has been taken into consideration during the process of data collection，in order to extend the application scope of the recognition model.This method provides the model with better universality and recognition accuracy.Eventually，through the test on the five human actions of standing，walking，running，going up and down the stairs，the recognition rate reaches about 95%.Experiments show that the method is practical and effective.

Keywords：diversity of human bodies；action recognition；model；position；accuracy

1 引言（Introduction）

近年来，人们对智能交互和健康监护等方面的需求日益迫切，使得基于加速度传感器的人体行为识别[1，2]在医疗保健、运动监测、能耗评估等领域受到了广泛的关注。与其相对的是基于计算机视觉的行为识别[3，4]，相比之下，前者更能体现人体运动的本质，并且不受场景或者时间的限制，携带方便，成本较低，更适合推广应用[5]。

在人体行为识别中，行为分类器的构建对识别结果是至关重要的。目前，大部分的研究集中在对分类器构建算法的改进和优化上，采用的数据只是少部分比较集中的人的加速度来构建通用模型，并没有考虑到人体多样性等实际问题。

人体多样性简单地表现在性别、年龄、身高、体重等物理方面，更深入地表现在家庭背景及其行为方式等。Nicholas D.Lane等人[6]研究了人体多样性对行为识别的影响，作者在模型训练阶段采用相似度的概念，通过使用与用户相似度高的多人的原始加速度数据训练模型，达到数据分享的目的，但是计算量较大，所需时间较长。郭忠武等人[7]以健康青年人为研究对象，通过获取步态运动学参数，比较了男女之间步态的差异，得出了两性之间大多数步态参数的数值存在显著性差异的结论，并且分析了步态参数与身高、体重的相关性。也说明了年龄的不同对步态也会有不同程度的影响。

在日常活动中，人们会根据个人习惯将手机放在某个位置，常见的有上衣口袋、裤口袋、包中和手中，赵中堂[8]研究了多个设备被同时部署在人体不同位置的情况，得到了不同位置加速度不相同的结论。在过去的研究中，上面提到的四个手机位置被经常用到，但是并没有人说明究竟哪个位置对行为识别是最好的，因此大部分情况下建议使用多个传感器来提高识别精确度[9]。Ling Bao等人[10]使用五个二轴加速度传感器放在受试者身体的不同部位进行了无监督的数据采集。

针对以上问题，本文进行了基于人体多样性的行为分类和预测。将所有训练好的模型保存起来，用户输入基本信息后可立即获取对应的模型进行识别，不仅可以减少计算量，也减少了所需时间。

2 人体行为识别过程（Human action recognition

process）

人体行为识别主要包括模型训练和识别阶段，具体包括数据采集、数据预处理、特征提取和选择、模型训练、分类器识别五个模块。首先利用手机加速度传感器采集人体行为的原始加速度数据，为了提高识别精确度，需要对原始加速度数据进行去噪处理，然后提取并选择原始加速度数据的时域和频域特征，接着使用模型分类算法实现模型的训练和最终的行为预测识别。整个行为识别过程如图1所示。

2.1 数据采集与预处理

根据实验需要，共采集了80个人的走路、跑步、上楼、下楼和静止的原始加速度数据，其中，性别包括男女，年龄包括两个区间段[20，30]、[50，60]，身高包括两个区间段[160，170]、[170，180]，体重包括两个区间段[55，65]、[65，75]。因此，根据性别、年龄、身高、体重，共有16种组合，本文选取了其中的5种组合，每种组合的志愿者数量为10人。

采集数据的过程中，为了覆盖人们常用的四个位置，共使用四部手机，均是小米公司生产的Redmi Note 3，以消除不同手机对结果产生的可能影响。在每个志愿者的每种行为中，分别将四个手机放到上衣口袋、裤口袋、手中和包中。要求志愿者的每种行为能够采集到80条数据，经过筛选后能够保证有70条数据。整个过程由志愿者独立完成，没有受到其他因素的干扰，以保证数据的质量。

为了方便加速度数据的采集，我们团队自己开发了一款手机APP，它不仅能够完成数据的采集，并且能够实时查看志愿者采集到的加速度数据的波形，可以根据波形进行数据的筛选。添加采集对象界面、设置界面、采集界面和加速度展示界面分别如图2（a）—图2（d）所示。

实际采集的加速度数据一般都有噪声，需要进行预处理，预处理的方法通常有平滑、去噪、归一化、加窗等。本文为了提高识别精确度，使用了带通滤波、频谱滤波（自定义，即选取频域中峰值较大的前四个），处理后可获得更加平滑的数据。

为了方便下一步的特征提取，本文使用加窗的方法分割原始加速度信号，使用窗口长度为256个样本点的矩形窗分割原始加速度信号，加速度信号的采样频率为64Hz，所以，加窗后的每个加速度信号的时间跨度为四秒，足以包含单个完整的动作。

2.2 特征提取与选择

实验共提取了19个特征值，选择使用了13个特征，其中，时域特征包括过均值率、平均值、最小值、四分位距、绝对平均差、中位数，对原始加速度数据进行了快速傅里叶变换后，获得的频域特征包括质心、能量、熵、谱峰位置、标准差、平均值、偏度。

首先，由于人们放置手机的位置是不确定的，并不能保证手机的朝向和角度保持不变，而朝向和角度的改变会导致加速度传感器读数的多变性，进而影响数据分布的复杂性，进一步影响到后续步骤建立的行为识别模型的复杂性。为了消除朝向和角度的影响，我们对每个时刻的加速度进行合成。当某个时刻加速度传感器的读数为（ax，ay，az）时，合成加速度为：

主要特征值的计算公式如下：

（1）平均值

（2）绝对平均差

（3）标准差

式中，N为样本数，X为样本平均值，标准差是经常被使用的统计特征之一。标准差反映了加速度传感器数据的离散程度。由于人在静止时加速度数据是基本不变的，标准差几乎为零，而在运动时加速度数据会不停变化，其标准差总是远远大于零，因此标准差是识别静止与运动的重要特征。

（4）偏度

式中，N为样本数，X为样本平均值，σ为样本标准差。偏度是用来度量加速度传感器数据分布偏斜方向和程度的统计特征。

（5）熵

一般用于当行为间的能量相似时提供辅助的区分能力，其计算方法为：对信号X经离散傅里叶变换后，将各分量幅度的信息熵进行归一化。

2.3 模型训练及识别算法

人体行为识别中，模型训练通常有两种方法，一是构建一个通用的模型，二是为每个用户构建一个个性化的模型。前者省时省事，更易于实现，但是没有考虑到人体多样性的问题，是以降低识别精确度为代价的，并不能满足大多数人的需求；后者与前者相比，识别精确度比较高，但是在模型的建立中，需要用户过多地参与，即通过采集训练人的加速度数据训练出个性化的模型，增加了用户的负担。

本文采集了多种多样的人的原始加速度数据，进行了多个模型的训练，可以根据用户的基本信息为其选择一个最优的分类模型。此举不仅减少了用户的负担，也提高了识别的精确度。

本文采用的模型训练及识别算法是著名的SVM（Support Vector Machine，支持向量机）。在机器学习领域，SVM是一个有监督的学习模型，通常用来进行模式识别、分类和回归分析。SVM通过寻求结构化风险最小来提高学习机泛化能力，实现经验风险和置信范围的最小化，从而达到在统计样本量较少情况下亦能获得良好统计规律的目的。

3 实验结果（The experimental results）

实验根据人体的多样性，通过训练多个模型，再根据每个用户的基本信息寻找出最匹配的模型。

以上四张图直观地表明了性别、年龄、身高、体重的不同对加速度值的直接影响。

经过不断地实验，将年龄、身高、体重的区间长度均定为10，即年龄包括两个区间段[20，30]、[50，60]，身高包括两个区间段[160，170]、[170，180]，体重包括两个区间段[55，65]、[65，75]，再加上性别区分，根据定量的思想选择不同的组合，每个组合随机选出九个人的数据做训练集，剩余一个人的数据做测试集，训练出模型后，使用对应的测试集得到识别精确度，另外使用所有人的数据训练出一个通用模型得到精确度，并且和只有一个属性不同时的模型精确度作比较，模型编号和测试集编号对应关系如表1所示。

其中身高的单位是厘米，体重的单位是千克，编号1和2只有性别不同，1和3只有年龄不同，2和4只有身高不同，1和5只有体重不同。测试结果如表2所示。

数据可以得出结论：性别、年龄、身高、体重对行为识别的精确度是有影响的，对应区间的精确度高于通用模型和相对区间的精确度。

从每个组合中重新选择训练集和测试集进行多次实验，然后从所有数据集中再选择出其他组合进行同样的实验，得到的最终结论是一样的，充分证明了本文提出的方法的正确性。

4 结论（Conclusion）

本文针对当前设计模型的不足，提出了使用智能手机三轴加速度传感器采集数据和SVM分类算法进行基于人体多样性的行为识别的思想，通过将性别、年龄、身高、体重四个人体多样性因素进行区间划分，使得每一类人都有一个对应的模型，不仅能够保证模型具有普遍性，也提高了识别精度。在实验过程中，我们同样考虑到加速度传感器种类和所放位置对行为识别的影响，并采取了相应的措施，以尽可能考虑到实际情况的复杂性。本文通过与通用模型和相对模型的识别结果进行比较，证明了本文方法的可行性。

参考文献（References）

[1] Palaniappan A，Bhargavi R，Vaidehi V.Abnormal Human Activity Recognition Using SVM Based Approach[C].International Conference on Recent Trends in Information Technology，2012：97-102.

[2] Wei H X， He J，Tan J D.Layered Hidden Markov Models for Real-time Daily Activity Monitoring Using Body Sensor Networks[J].Knowledge and Information Systems，2011，29（2）：479-494.

[3] Qian H M，et al.Recognition of Human Activities Using SVM Multi-class Classifier[J].Pattern Recognition Letters，2010，31（2）：100-111.

[4] Khan Z A，Sohn W.Abnormal Human Activity Recognition System Based on R-transform and Kernel Discriminant Technique for Elderly Home Care[J].IEEE Transactions on Consumer Electronics，2011，57（4）：1843-1850.

[5] 王洪斌.基于三轴加速度传感器的人体行为识别研究[D].无锡：江南大学，2014.

[6] Nicholas D.Lane，et al.Community Similarity Networks[J].Personal and Ubiquitous Computing，2014，18（2）：355-368.

[7] 郭忠武，等.正常青年人步态运动学参数的研究[J].中国康复理论与实践，2002，8（9）：532-533；544.

[8] 赵中堂.自适应行为识别中的迁移学习方法研究[D].北京：中国科学院大学，2013.

[9] K.Van Laerhoven，A.Schmidt，H.-W.Gellersen.Multi-sensor Context Aware Clothing[C].Proceedings of the Sixth International Symposium on Wearable Computers，2002：49-56.

[10] Ling Bao，Stephen S.Intille.Activity Recognition from User-Annotated Acceleration Data[J].Lecture Notes in Computer Science，2004，3001：1-17.

作者简介：

余杰（1991-），女，硕士生.研究领域：数据挖掘，模式识别.

杨连贺（1965-），男，博士，教授.研究领域：数据挖掘，计算

机辅助设计.

焦帅（1984-），男，博士，助理研究员.研究领域：感知计算.

易明雨（1992-），男，硕士生.研究领域：智能算法.

于佃存（1991-），男，硕士生.研究领域：行为识别，情景感知.