APP下载

基于单个三轴加速度计的人体行为识别研究

2019-03-08高志勇周大海

网络安全与数据管理 2019年2期
关键词:加速度计特征提取加速度

张 宇,郭 达,高志勇,周大海

(1.北京邮电大学电子工程学院,北京 100876;2.爱动超越人工智能科技(北京)有限责任公司,北京 100007)

0 引言

人体行为识别是当今诸多研究课题中极具前景的一个领域。目前在该领域主要有两个研究方向,即基于视频数据的人体行为识别和基于传感器数据的人体行为识别[1]。前者使用摄像机来监视人体行为,已有众多研究将重点放在前者[2-3],但在复杂场景下,识别效果不尽人意。最近十年,随着传感器技术的进步,借助手机内置加速度计[4]、腕带式加速度计[5]、腰跨式加速度计[6]等传感器采集的时间序列数据进行人体行为识别已经成为国内外的热门研究方向。

很多已有研究往往利用多个传感器以期获得较好的识别效果,例如REZAIE H利用四个加速度计组成体域网将人体行为识别用于健康监测[7];MANNINI A通过在受试者手腕和脚踝上佩戴多个加速度计进行多项日常行为的识别[8]。但是受限于设备功耗、硬件成本、对个体行动的干扰性等,在一个个体上部署多个传感器具有一定的难度,因此一些文献提出了利用单个加速度计来进行人体行为识别[6,9]。

虽然基于加速度时间序列的人体行为识别研究已取得一些成果,但如何进行预处理并提取有效特征,如何设计有效的分类算法以实现对不同行为的准确识别,仍需要开展进一步的研究工作。本文将利用内置于腕带式智能手表中的单个三轴加速度计,通过数据采集、数据预处理、特征提取以及设计一种改进的子窗口集成学习算法,实现有效的人体行为识别。

1 数据预处理和特征提取

首先,对课题采用的数据集进行介绍;其次,由于原始时间序列往往包含噪声,实现一个三阶巴特沃斯低通滤波器,完成去噪工作;最后,给出待提取特征并实现一个针对时间序列分段的特征提取算法。

1.1 数据集介绍

本文的Sanitation数据集自行采集自开放环境,利用内置于腕带式智能手表中的单个三轴加速度计,采集环卫工人的7类日常工作行为数据,即:走(walk)、跑(run)、大扫帚扫地(bweep)、小扫帚扫地(sweep)、清洁(clean)、倒垃圾(dump)以及日常活动(daily)。采样频率为25Hz。

将智能手表表盘正面水平朝上,沿表盘水平向右为X轴,沿表盘水平向上为Y轴,垂直表盘向上为Z轴。整个数据集包含样本266 555条,每条样本包含X、Y、Z三轴加速度数值。各类行为样本比例如图1(a)所示。图1(b)通过部分样本波形图直观展示了该数据集的数据特征,其中横轴代表样本点的相对时间顺序,纵轴代表三轴加速度计三个轴的读数,其中每1 000 代表一个重力加速度g,也即9.81 m/s2。

图1 Sanitation数据集

1.2 数据预处理

加速度计存在数据漂移问题,其在静置状态下,所采集时间序列有轻微的摆动。通常这是受限于加速度计本身的制造工艺,导致其所测量的重力加速度并不竖直于地面而造成的读数漂移。对于读数漂移的校准,处理方法为去除时间序列波动的中心点,也就是去除静置状态下时间序列摆动的均值。假设某个轴测量的加速度分量为am,该轴的时间序列波动中心点为Δ,则实际该轴的加速度分量at计算如下:

at=am-Δ

(1)

另外,采集的原始加速度时间序列往往包含一些环境噪声。KARANTONIS D M利用n阶滑动平均滤波器滤除了加速度信号中的随机噪声[10];DONG L采用卡尔曼滤波器对热机械噪声和电噪声进行了滤除[11]。

加速度时间序列是数字信号,且其主要噪声为高频噪声,可采用无线脉冲响应(Infinite Impulse Response,IIR)滤波器设计一个三阶巴特沃斯低通滤波器,完成去噪工作。另外鉴于人体行为的频率较低,则设定滤波器的截止频率为15Hz。该三阶巴特沃斯低通滤波器能有效消除时间序列毛刺噪声,同时能保持处理后的时间序列趋势和原始时间序列高度吻合。

1.3 特征提取

原始的加速度时间序列特征不明显,另外有些分类器对输入数据的格式有一定要求,原始数据并不能作为这些分类器的输入。所以需要对加速度时间序列进行特征提取以及有关标准化的处理工作。PREECE S J比较了14种提取加速度时间序列特征的方法,包括基于小波变换等在内的时域和频域信号特征[12]。

时间序列的特征值包括三个方面,即时域特征、频域特征以及时频域特征。对于人体行为识别而言,时域特征是时间序列最主要的特征,而频域特征及时频域特征对最终的识别效果影响较小且会导致特征过多影响训练和识别速度,因此本文只进行时域特征的提取。

某个轴的时间序列s可表示为:

s=(s1,s2,…,sT),T∈Ζ+

(2)

表1是待提取的时域特征,除最后一个相关系数特征是对三轴加速度分量每两轴计算进行提取外,其余特征均为对三个轴分别进行提取,特征共计57个。

为配合后文所提出的一种改进的子窗口集成学习算法,并不对时间序列整体利用滑动窗口进行特征提取,而是将某一窗口所选中的时间序列分段作为输入值,对该时间序列分段进行特征提取。算法伪代码如表2所示。由于计算方法不同,所得到的时间序列的多个特征值的数量级往往并不相同,例如均值和能量的数量级很有可能相差甚远。这样,对于某些分类算法,例如常用的K近邻算法(K-Nearest Neighbor,KNN),数量级越大的特征值对最终分类结果的影响就越大。而实际上,假设时间序列的各个特征对最终分类结果的影响应该是平等的,所以必须对每一个特征的特征向量进行标准化处理,使得处理后各个特征的特征向量之间的数量级保持在相同量级上。表2伪代码中的第6行即为对特征的特征向量进行标准化处理。

表1 待提取特征描述

表2 特征提取算法伪代码

经过特征提取之后,可以将仅包含三轴加速度分量和对应标签的时间序列分段,转换成包含57条特征值以及对应标签的特征数据。

2 一种改进的集成学习算法及实验

首先提出一种改进的子窗口集成学习算法,再与其他传统机器学习算法进行实验对比。

2.1 一种改进的集成学习算法

集成学习是机器学习的一种,通过训练多个模型来解决问题。与从训练数据中得到一个模型的一般机器学习方法相比,集成学习方法则是通过构造一组模型并加以组合使用[13]。多数研究通过对时间序列利用固定尺寸的滑动窗口进行特征提取,再利用某种分类算法训练得到模型并进行预测。但是,不同的数据集可能具有不同的最适滑动窗口尺寸。若固定窗口尺寸,则算法的普适性将大大降低,因此文献[14]提出一种基于可变子窗口的集成学习算法以克服此问题。本文对该算法进行了改进,将训练基模型所用的算法从支持向量机(Support Vector Machine,SVM)更改为性能更优越的XGBoost算法,称为改进的子窗口集成学习算法(Improved Subwindow Ensemble Model,ISWEM)。

该算法分为训练和预测两部分,首先介绍训练部分,其伪代码如表3所示。

可以看出,该算法的训练部分通过设定不同尺寸的子窗口,对带有标签以及三轴加速度分量的时间序列生成多个对应的特征集,再利用基算法对各个特征集进行训练得到多个对应子模型。

接下来给出该算法的预测部分,其伪代码如表4所示。

表3 ISWEM算法训练部分伪代码

表4 ISWEM算法预测部分伪代码

在对时间序列分段进行预测时,首先利用不同尺寸的子窗口对该分段进行特征提取,形成多个对应的特征集,再针对不同特征集利用对应子窗口尺寸下的子模型进行预测,得到预测集,最后对预测集通过某种方法(如多数投票方法)进行处理得到该时间序列分段的预测标签。

2.2 实验

为了验证所提出的改进的子窗口集成学习算法的优越性,将和未改进的原算法以及四个传统机器学习算法进行对比,这四个传统机器学习算法分别是KNN、决策树(Desicision Tree,DT)、朴素贝叶斯(Naive Bayes)以及SVM。由于人体行为识别问题可以视作一种分类问题,因此采用在分类问题中常用的F1-score作为评价指标。

实验结果如表5所示。

表5 各个算法在Sanitation数据集上的F1-score

不难发现,无论是对单个行为识别的F1-score还是对整体识别的平均F1-score,本文所提出的ISWEM算法均取得了优于作为对比的其他算法的表现。

3 结论

针对利用单个三轴加速度计进行人体行为识别的场景,提出了数据预处理及特征提取方法,并进一步提出一种改进的基于子窗口集成学习算法,该算法通过集成各个尺寸窗口下得到的各个基模型,一方面克服了固定尺寸窗口带来的普适性低的问题,另一方面,集成多个基模型使得识别指标F1-score得以有效提升。通过和未改进的算法以及其他四种传统机器学习算法进行实验对比,验证了所提出算法的优越性。

猜你喜欢

加速度计特征提取加速度
“鳖”不住了!从26元/斤飙至38元/斤,2022年甲鱼能否再跑出“加速度”?
面外轴向检测MEMS加速度计研究现状*
高精度加速度计测试标定系统的构建*
减载加速度计组合减振设计与分析
空间目标的ISAR成像及轮廓特征提取
梳状电容式微加速度计温度性能优化
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
天际加速度
基于Daubechies(dbN)的飞行器音频特征提取