用户无关的多分类器融合行为识别模型
2016-10-31王忠民
贺 炎, 王 科, 王忠民
(西安邮电大学 计算机学院, 陕西 西安 710121)
用户无关的多分类器融合行为识别模型
贺炎, 王科, 王忠民
(西安邮电大学 计算机学院, 陕西 西安 710121)
为了提高行为识别模型的准确率,给出一种与用户无关的多分类器融合行为识别模型。采用决策树C4.5自顶向下构建基分类器,将基分类器对各行为的识别准确率作为权值,利用融合算法对行为识别结果进行融合处理,生成与用户无关的行为识别通用模型。采用未参与基分类器训练用户的加速度数据对该模型进行测试,对比结果表明,多分类器融合模型对步行、跑步、上楼、下楼等日常行为识别准确率均有所提高。
基分类器;多分类器融合;行为识别;决策树
人体行为识别主要分为基于视觉的人体行为识别和基于加速度传感器的人体行为识别两个方向,在行为监测、健康监控等方面均有应用,已成为人工智能与模式识别领域内热点研究之一[1]。
基于视觉的人体行为识别从图像和视频中提取相关特征,利用支持向量机(Support Vector Machine,SVM)等分类算法训练的行为识别模型[2-5],虽然可以提高视频序列中人体行为识别准确率或检测人体动作,但是需要对图像和视频序列进行处理,计算数据量相当庞大。通过加速度传感器采集原始加速度信号,从中提取特征,建立行为识别模型,可实现人体日常行为识别[6-11],但其准确率与模型的训练集和测试集紧密相关,新用户的行为识别准确率明显降低。为了提高新用户行为识别的准确率,采用迁移学习方法,将训练出通用模型迁移至新用户,生成适用于新用户的行为识别模型[1,12-13],但该方法需要先对新用户的无标签样本打标签,然后结合新用户的少量带标签样本重新训练行为识别模型,算法较为复杂。
为了提高新用户的行为识别准确率,本文提出一种与用户无关的多分类器融合行为识别通用模型,通过对多个基分类器的识别结果进行融合处理来提高行为识别准确率。
1 行为识别过程
与用户无关的多分类器融合行为识别模型的处理过程包括原始数据采集、特征提取、基分类器训练与测试、融合处理4个步骤,如图1所示。
图1 行为识别过程
2 多分类器融合的行为识别
通过训练基分类器,利用融合算法建立与用户无关的行为识别通用模型。
2.1基分类器训练
采用决策树C4.5自顶向下构建基分类器[6]。训练集的特征包含均值、中位数、方差、小波能量、小波峰等14个常见特征[1],基分类器层数较多,图2仅为决策树基分类器的局部内容。
图2 决策树基分类器(局部)
图2中,C4.5使用信息增益率作为节点分裂的依据,在根节点分裂时,计算所有特征的信息增益率。将信息增益率最大的方差的两个取值,分为两个子集,即根节点的两棵子树。在左子树所包含的样本子集中,所有样本均被识别为上楼,该子树无需继续分裂。将右子树按照同样的规则继续分裂,直到每颗子树中所有样本的都被识别为同类行为。
2.2模型建立
采用融合算法对训练好的基分类器进行融合处理,构建与用户无关的行为识别通用模型。
融合处理步骤如下。
步骤1利用基分类器对测试集样本进行识别得到结果矩阵Mi。
Mi为m×5的矩阵,其中i是基分类器编号;5列依次代表静止、步行、跑步、上楼、下楼5种行为;行数m代表一共有m个样本数据。每个样本数据的识别结果均为1×5的向量。若基分类器将某样本识别为某一行为时,其识别结果向量的对应值设定为1,否则为0。
步骤2计算各基分类器识别结果Mi的权值矩阵
(1)
其中,k=1,2,…,5是样本行为标签;Nk表示第k种行为的样本总数;B表示行为,NB1表示Nk个样本中被识别为第一种行为的样本数;NB2~ NB5的取值规则和NB1相同。基分类器输出结果的加权矩阵为
Oi=MiRi。
(2)
步骤3计算各基分类器输出结果加权矩阵之和
(3)
其中n为基分类器个数。
步骤4对矩阵O中的每行(对应1个样本)求其最大值,该最大值的下标就是其行为标签,即该样本行为识别的最终结果。
融合后的行为识别模型如图3所示。
图3 多分类器融合的行为识别模型
3 测试及结果分析
为了验证多分类器融合行为识别模型的有效性,将基分类器的识别结果与融合模型的识别结果进行对比分析。
3.1测试数据
测试数据来自人体日常行为数据库XUPT-AAD[6]。根据用户年龄分布,将20~30岁用户的部分数据训练基分类器C1,30~40岁用户的部分数据训练基分类器C2,将20~30岁用户的部分数据和30~40岁用户的部分数据组合成训练集,用于训练基分类器C3。抽取11人的加速度数据并分组,其中20~30岁之间5人(U1~U5),分为A1和A2两组;30~40岁之间6人(U6~U11),分为B1和B2两组,具体分组情况如表1所示。
A1组数据用于训练基分类器C1,B1组数据用于训练基分类器C2,(A1+B1)组数据用于训练基分类器C3。将(A2+B2)组数据作为3个基分类器共用测试集。
表1 用户分组情况
数据采集时所用手机品牌包括中兴、三星、华为、小米、酷派、苹果等。每位用户依次将手机放置在裤子口袋、包中、手中,均采集静止、步行、跑步、上楼、下楼等5种日常行为的加速度数据,具体样本数据如表2所示。
表2 样本数据
5种行为分别经过基分类器C1、 C2和C3进行训练的样本数和融合模型的测试样本数如表3所示。
表3 基分类器训练集与测试集各行为样本数
基分类器C1、C2和C3训练的时间复杂度如表4所示。
表4 基分类器训练的时间复杂度
由表4可以看出,基分类器训练的时间复杂度随着特征数和样本数的增加而相应增加。
3.2测试结果分析
基分类器C1、C2和C3分别对测试集进行识别后,采用融合算法对其识别结果进行处理,得到融合模型行为识别的最终结果,如表5所示。
表5 基分类器及融合模型对各行为的识别准确率
从表5中可以看出,各基分类器静止行为的识别准确率都能达到100%,符合“静止”行为的特点;但基分类器C1、C2和C3对步行、上楼、下楼这3种易混淆行为的识别准确率较低。
基分类器C1在5种日常行为的识别中,对步行、跑步、上楼的识别准确率均比C2和C3高,跑步的识别准确率高达90%。基分类器C2步行的识别准确率仅为12.44%,与其他4种行为的识别情况差异过大。基分类器C3的训练集包含不同年龄段用户的特征数据,5种行为的平均识别准确率并没有明显提高。除静止外,其他4种行为的识别准确率均介于C1和C2之间。
融合模型结合了3个基分类器的优势,对步行、跑步、上楼、下楼4种行为的识别结果均有所提高。上楼的识别准确率最多提高29.65%,平均识别准确率最多提高22.42%。相对基分类器C1、C2和C3,融合模型与用户的相关度更低,通用性更好。
本次实验的测试集共有201个步行样本,基分类器C1、C2和C3及融合模型对样本的识别情况如表6所示。
表6 步行样本的识别情况
从表6中可以看出,C2将104个步行样本错分为上楼,将70个步行样本错分为下楼,这与B1组用户样本数较少及该组用户的步行、上楼、下楼3种行为相似度较大有关。由于融合模型在对基分类器的识别结果进行融合处理时,由基分类器各行为的识别准确率来决定其对各行为最终识别结果的影响程度,C2对步行这一行为的识别准确率很低,融合模型确定步行样本的最终识别结果时,C2的识别结果不会降低融合模型对步行的识别准确率。
4 结语
将多个基分类器对各行为的识别准确率作为权值,根据融合算法对基分类器的识别结果进行融合处理,生成与用户无关的行为识别通用模型。采用测试集对该模型进行测试,得到行为识别的最终结果。融合模型测试结果表明,与基分类器的识别结果相比,融合模型对静止、步行、跑步、上楼、下楼五种行为的平均识别准确率最多提高22.42%,上楼的识别准确率最多提高29.65%。
[1]王忠民, 屈肃. 一种极速学习机人体行为识别模型迁移方法[J/OL].西安邮电大学学报, 2015,20(1):49-54[2016-03-20].http://dx.chinadoi.cn/10.13682/j.issn.2095-6533.2015.01.010.
[2]邵延华, 郭永彩, 高潮. 基于特征融合的人体行为识别[J/OL].光电子·激光,2014(9):1818-1823[2016-03-10].http://www.cnki.com.cn/Article/CJFDTotal-GDZJ201409029.htm.DOI:10.16136/j.joel.2014.09.027.
[3]吴冬梅, 谢金壮, 王静. 基于多特征融合的人体行为识别[J/OL].计算机应用于软件,2015(11):171-175[2016-03-10].http://dx.chinadoi.cn/10.3969/j.issn.1000-386x.2015.11.040.
[4]LIHP,ZHANGF,ZHANGSW.Multi-featurehierarchicaltopicmodelsforhumanbehaviorrecognition[J/OL].ScienceChinaInformationSciences,2014, 57(9): 1-15[2016-03-10].http://dx.doi.org/10.1007/s11432-013-4794-9.
[5]SONGW,LIUN,YANGG.ANovelHumanActionRecognitionAlgorithmBasedonDecisionLevelMulti-FeatureFusion[J/OL].ChinaCommunications, 2015(S2):93-102[2016-03-10].http://en.cnki.com.cn/Article_en/CJFDTotal-ZGTO2015S2012.htm.
[6]范琳, 王忠民. 穿戴位置无关的手机用户行为识别模型[J/OL]. 计算机应用研究, 2015,32(1): 63-66.http://dx.chinadoi.cn/10.3969/j.issn.1001-3695.2015.01.015.
[7]苏竑宇, 陈启安, 吴海涛.基于SVM和HMM二级模型的行为识别方案[J/OL].计算机与现代化,2015(5):1-8[2016-03-10].http://dx.chinadoi.cn/10.3969/j.issn.1006-2475.2015.05.001.
[8]王忠民, 王斌. 多频段时域分解的行为识别特征优选方法[J/OL].计算机应用研究,2015,32(7):1956-1958[2016-03-20].http://dx.chinadoi.cn/10.3969/j.issn.1001-3695.2015.07.009.
[9]CHENYQ,ZHAOZT,WANGSQ,etal.ExtremeLearningMachinebaseddevicedisplacementfreeactivityrecognitionmodel[J/OL].SoftComputing,2012,16(9):1617-1625[2016-03-20].http://dx.doi.org/10.1007/s00500-012-0822-8 .
[10] 何卫华. 人体行为识别关键技术研究[D/OL]. 重庆: 重庆大学, 2012:3-134[2016-03-20].http://cdmd.cnki.com.cn/Article/CDMD-10611-1012047169.htm.
[11]YANGJ,WANGS,CHENN,etal.Wearableaccelerometerbasedextendableactivityrecognitionsystem[C/OL]// 2010IEEEInternationalConferenceonRoboticsandAutomation(ICRA) ,Anchorage,AK:IEEE, 2010: 3641-3647[2016-03-20].http://dx.doi.org/10.1109/ROBOT.2010.5509783.
[12] 支周,屈肃.一种基于迁移极速学习机的人体行为识别模型[J/OL].物联网技术.2015,5(9):18-20[2016-03-20].http://dx.chinadoi.cn/10.3969/j.issn.2095-1302.2015.09.007.
[13] 王忠民, 王晶, 张荣. 一种基于人工标签数据的行为识别模型迁移方法[J]. 西安邮电大学学报, 2016,21(2): 92-97.DOI:10.13682/j.issn.2095-6533.2016.02.018.
[责任编辑:祝剑]
A user-independent behavior recognition model based on multi-classifier fusion
HE Yan,WANG Ke,WANG Zhongmin
(School of Computer Science and Technology, Xi’an University of Posts and Telecommunications, Xi’an 710121, China)
To improve the accuracy of the behavior recognition model, a user-independent behavior recognition model based on multi-classifier fusion is proposed. Decision tree C4.5 is used as the classification algorithm to generate the base classifiers from top-down. Then the accuracy of the base classifiers is used as the weight value, and the fusion algorithm is used to deal with the recognition result of the base classifiers to build the user-independent behavior recognition model. The model is tested by the dataset collected by several users whose acceleration data are not used to train the base classifiers; the final behavior recognition results are then produced. Experimental results show that the recognition accuracy of the proposed fusion model is increased to recognize the behaviors such as staying, walking, running, going upstairs, going downstairs.
base-classifier, multi-classifier fusion, behavior recognition, decision tree
10.13682/j.issn.2095-6533.2016.05.010
2016-05-13
国家自然科学基金资助项目(61373116);陕西省科技统筹创新工程计划项目(2016KTZDGY04-01)
贺炎(1980-),女,硕士,讲师,从事机器学习和智能信息处理研究。E-mail: heyan0220@xupt.edu.cn
王科(1988-),女,硕士研究生,研究方向为嵌入式系统与设计。E-mail: 344512721@qq.com
TP391
A
2095-6533(2016)05-0050-05