APP下载

基于蚁群算法的行为识别特征优选方法

2014-07-18王忠民

西安邮电大学学报 2014年1期
关键词:特征选择子集特征值

王忠民, 曹 栋

(西安邮电大学 计算机学院, 陕西 西安 710121 )

基于蚁群算法的行为识别特征优选方法

王忠民, 曹 栋

(西安邮电大学 计算机学院, 陕西 西安 710121 )

为了降低特征冗余,提高移动用户行为识别的准确率,提出一种基于蚁群算法的移动用户行为识别加速度信号特征优选方法。首先对样本数据进行预处理,根据特征对不同行为的分类敏感度进行初次优选,降低特征搜索空间的维度;然后利用蚁群算法结合神经网络分类器,以特征的分类准确度为评价准则对特征集合进行了二次优选。实验结果表明,该方法优选出的特征集具有较好的识别性能。

蚁群优化;行为识别;特征提取;特征优选

行为识别研究是人工智能领域的一个重要课题。早期的研究主要通过构建智能空间,特制各种可穿戴传感器在实验室环境开展的。随着移动通信技术的快速发展和移动智能终端制造水平的不断提高,内置于智能手机内的各类传感器使开展基于智能手机的移动用户行为识别研究成为可能[1]。为了增强用户体验,目前智能手机都有内置加速度传感器,近年来国内外有不少学者开展了基于加速度信息的人体行为识别研究,但手机所放置的位置和方位,以及人的行为差异等都会对加速度信号产生影响[2-4]。如何从加速度信号的时域、频域和时频域特征中优选出与手机放置位置和方位无关、算法复杂度低、与人体运动行为敏感度高的特征子集成为本领域急需解决的关键技术难题。

特征优选方法已经有很多研究,文献[5]从搜索策略和评价准则两个角度对特征选择方法进行了分析和总结;文献[6]利用相关分析和K-NN 算法进行组合式特征选择;文献[7]提出了基于相关性和冗余度的联合特征选择算法;文献[8]将互信息和模糊粗糙集结合提出最大互信息最大相关熵标准,并基于这一标准设计了一种新的特征选择算法;文献[9] 针对入侵检测的需求,设计了一种攻击特征的在线选择方法。但以上方法针对移动用户行为识别特征选择这一特定问题,还缺乏有效的解决方法。

本文在蚁群算法[10-12]的基础上,提出一种移动用户行为识别特征优选方法,把对某种行为最敏感的特征作为候选特征,使用蚁群算法进行特征子集优选,并以神经网络分类器的分类效果作为特征子集优劣的评价准则,根据分类错误率更新特征的信息素来指导搜索过程。

1 基于蚁群算法的行为识别特征优选方法

1.1 行为敏感特征选择

加速度信号的时域、频域和时频特征很多,首先要从众多的特征中迅速剔除冗余特征、选出敏感特征,以降低特征集维数,从而缩小后续基于蚁群算法的特征子集二次优选时的搜索空间。在对人体行为模式进行识别的过程中,每种特征值对于每种行为模式的识别度不同,提取对每种行为模式最敏感的特征值,剔除冗余特征,可降低无关特征影响,缩短算法搜索时间。

将候选特征集合中的特征值a所对应特征向量样本放入分类器训练和测试,获取特征值a对行为模式k的识别率r(a,k)以及特征值a致使其他行为模式错分至行为模式k的错分率w(a,k)。评价函数为

q(a,k)=r(a,k)-l×w(a,k)

(1)

其中l为激励因子,当q(a,k)高于规定阈值Q时,特征值a对行为模式k敏感,将特征值a添加进候选特征集合。遍历每种特征值之后,得到最终候选特征集合H。

1.2 基于蚁群算法的特征子集优选

1.2.1 问题描述

图1 蚁群算法示意图

1.2.2 蚂蚁的路径选择

每只蚂蚁搜索结束之后,得到一个局部解,每个解包含n个不同的特征值。每只蚂蚁从随机一个特征点出发,根据信息素的强度和启发规则选择下一个特征点,直到寻找到n个特征值。每只蚂蚁选择特征点的转移规则为

(2)

对于每一只蚂蚁,p(j)为蚂蚁选择特征点j的概率值,概率值大的优先选择;u(j)为特征点j的信息素水平;ξ(j)为特征点的分类敏感度;α为信息素启发因子,β为期望启发因子,如果设为0,则表示此阶段暂时不考虑特征值的分类敏感度;K为蚂蚁的可选子集,即除了已被选择剩余的特征集合。

蚂蚁i搜索结束后,将每个局部解所对应的特征向量样本输入分类器进行训练和测试,得到分类正确率τ(i),用以评价特征子集的优劣。

1.2.3 信息素更新策略

当蚁群完成一次搜索后,更新各特征点上的信息素。信息素更新规则为

(3)

其中ρ信息素参数,τ(i)为最优解的分类正确率,ε为概率变化系数。反复迭代MI次,以得到最优特征子集及其分类正确率。

1.3 算法描述

优选算法描述如下。

输入:数据集S,候选特征集合H,特征全集G,阈值Q,激动因子I,行为模式B,蚂蚁个数m,初始信息素水平u0,迭代次数MI,特征值个数n,蚁群算法的各参数;

输出:选择的最优特征子集F以及最终分类结果。

算法流程:

(1)H={};//初始化特征候选子集;

(3)ifq(a,k)>Q;//利用式(1);

(4)ifa∉H;

(6)End for;

(7)∀i∈H,ui=u0,u0∈[0,1],k=1;//初始化信息素,使每个节点的信息素相同;

(8)fori=1:n;//对于不同的特征值个数,进行循环;

(9)while (k

生成m个蚂蚁,随机选择m个特征值,每只蚂蚁根据式(2)选择下一个概率值大的特征点;

(10)k++;

(11)End whlie;

(12)用分类器评估每个解的优劣,返回分类的正确率;

(13)通过返回的最优解的分类正确率进行信息素的更新,利用式(3);

(14)重复(9)至(13),迭代MI次,得到最优特征子集F及其分类正确率;

(15)End for

(16)得到最终的最优特征子集FF及其分类正确率。

2 实验设计与结果分析

2.1 实验数据集

所有实验数据均利用Android智能手机采集。选取阈值为-2g~2g(g=9.8 m/s2)加速度传感器的智能手机HTC G2,华为U8608等,由4名实验人员分别利用这些智能手机对静止、走路、跑步、上楼、下楼、乘车6种行为模式的加速度数据进行采集。实验人员在不同的时间段,手机处于不同位置和不同方向的情况下,做了780次实验,其中每种模式各进行了130次实验,每次采集的持续时间为10 s,采样频率为20 Hz。不同的时间段主要考虑车流量对采集数据的影响,不同的位置主要分为手中,裤兜中,上衣口袋中以及包中,不同的方向主要分为手机横放,颠倒放置,平放等。为了保证数据的有效性,并去除一定的噪音,只取每次采样数据的第4~6 s之间的数据。对采样数据频谱分析发现,六种行为采集到的加速度信号的能量主要处于1~5 Hz之间(如图2所示)。因此,通过低通滤波对原始数据进行了去噪声滤波。

图2 行为模式滤波前后频谱分析图

2.2 实验方法

实验初始特征集合为{最大值,最小值,范围,方差,均值,主系数和,直流分量,中间值,均方根},根据特征选择方法,在对数据进行预处理之后,先进行了第一次行为敏感特征优选,得到蚁群算法的初始特征全集,通过蚁群算法的二次优选,得到最终特征集合。行为敏感特征选择中参数设置为

l=0.8,Q=0.85,

蚁群算法的参数设置为

MI=5,u0=0.5,n=1,2,…,5,
α=0.8,β=0,ρ=0.3,
ε=0.9,m=3。

2.3 实验结果分析

实验首先进行初次特征选择,每种特征值的正确率和错分率分别如表1和表2所示,其中Std代表标准差,Max代表最大值,Min代表最小值,Range代表范围,Var代表方差,Mean代表均值,Sum代表主系数和,Dc代表直流分量,Med代表中间值,Rms代表均方根。经过计算之后,选取{标准差,最大值,最小值,范围,均方根}作为下阶段的特征集合。

表1 每种特征值的正确率

表2 每种特征值的错分率

确定特征候选集合之后,实验利用蚁群算法进行二次特征选择,经过多次统计之后,得出最终结果如表3。

表3 蚁群算法测试结果

特征子集{范围,标准差,最大值,均方根}为选出的最优子集,正确率可达89%。相比单独使用蚁群算法,时间复杂度得到了大幅度下降,证明了算法的有效性。

3 结束语

通过行为敏感特征选择算法及蚁群算法从加速度信息中选出特征子集,利用BP神经网络算法对所选出的特征子集的有效性进行了验证。实验结果表明,该特征优选方法可提高行为识别的正确率,证明了方法的有效性。

[1] Zheng Yu, Liu Like, Wang Long hao, et al.Learning transportation mode from raw gps data for geographic applications on the web[C]//World Wide Web.ACM Press,2008:247-256.

[2] Wang Shuang quan , Chen Can feng , Ma Jian . Accelerometer based transportation mode recognition on mobile phones[C]//Asia-Pacific Conference on Wearable Computing Systems. ShenZhen: IEEE Press,2010:44-46.

[3] Reddy S, Mun M,Burke J,et al.Using Mobile Phones to Determine Transportation Modes[J].ACM Transactions on Sensor Networks, 2010,6(2):13-27.

[4] Davide F,Pedro C D,Diogo R F, et al.Preprocessing techniques for context recognition from accelerometer data[J].Pers Ubiquit Comput,2010,14(7):645-662.

[5] 姚旭,王晓丹,张玉玺,等.特征方法综述[J].控制与决策,2012,27(2):161-166.

[6] Uncu O,Turksen IB. A novel feature selection approach: Combining feature wrappers and filters [J]. Information Sciences (S0020-0255), 2007, 177(2): 449-466.

[7] 周城,葛斌,唐九阳,等.基于相关性和冗余度的联合特征选择方法[J].计算机科学,2012,39(4)181-184.

[8] 赵军阳,张志利.基于最大互信息最大相关熵的特征选择方法[J].计算机应用研究,2009,26(1):233-235.

[9] 朱莉,李玲娟.攻击特征在线选择方法的研究[J].西安邮电学院学报,2009,14(3):72-74.

[10] 温文波,杜维.蚁群算法概述[J].石油化工自动化,2002,1(19):19-22.

[11] 王璐,邱桃荣,何妞,等.基于粗糙集和蚁群优化算法的特征选择方法[J].南京大学学报,2010,5(46):487-493.

[12] 黄丹凤,祁云嵩,许姗娜.基于粗糙集和蚁群算法的特征基因选择方法[J].计算机技术与发展,2012,6(22):68-74.

[责任编辑:祝剑]

A feature selection method for behavior recognition based on ant colony algorithm

WANG Zhongmin, CAO Dong

(School of Computer Science and Technology, Xi’an University of Posts and Telecommunications, Xi’an 710121, China)

To reduce redundancy features and improve accuracy of mobile user behavior recognition, an acceleration signal feature selection method is proposed for mobile user behavior recognition based on ant colony algorithm. The sample data is preprocessed and features are optimized initially according to the classification sensitivity of every feature of the different behavior to reduce dimension of the feature search space. Then, ant colony algorithm combined with neural network classifier is used to make a secondary optimization and feature classification accuracy for evaluation criteria. Experiment results show that the feature set selected by the method has a better recognition performance.

ant colony algorithm, behavior recognition, feature selection, feature optimization

10.13682/j.issn.2095-6533.2014.01.016

2013-11-26

国家自然科学基金资助项目(61100166);陕西省教育厅产业化培育基金资助项目(2012JC22)

王忠民(1967- ),男,博士,教授, 从事智能信息处理研究。E-mail:wzm_678@163.com 曹栋(1988- ),男,硕士研究生,研究方向为嵌入式系统设计与开发。E-mail:395812022@qq.com

TP391

A

2095-6533(2014)01-0073-05

猜你喜欢

特征选择子集特征值
一类内部具有不连续性的不定Strum-Liouville算子的非实特征值问题
拓扑空间中紧致子集的性质研究
一类带强制位势的p-Laplace特征值问题
基于一类特殊特征值集的扩散算子逆谱问题
单圈图关联矩阵的特征值
关于奇数阶二元子集的分离序列
完全二部图K6,n(6≤n≤38)的点可区别E-全染色
Kmeans 应用与特征选择
联合互信息水下目标特征选择算法
基于特征选择聚类方法的稀疏TSK模糊系统