基于扩展孤立森林的个性化跌倒检测研究
2023-04-07熊文滔郑建立
熊文滔 郑建立
关键词:跌倒检测;扩展孤立森林;个性化;异常检测;可穿戴设备
中图分类号:TP391 文献标识码:A
1引言(Introduction)
根据国家统计局2021 年发布的第七次全国人口普查结果显示:全国人口共14.11亿,其中60岁以上的人口为2.64亿,大约占总人口的18.7%,与2010 年相比上升了5.44%[1],中国正逐步迈入老龄化社会。在过去的几年里,所有与老年人健康相关的研究都得到了极大的关注,跌倒检测就是其中的一个热门的研究领域。随着年龄的增长,老年人的身体机能、认知能力和感官功能逐渐衰退,因此极易发生跌倒事件。据统计,约1/3的老年人每年会发生一次意外跌倒[2],跌倒也成为老年人因伤致死的重要原因[3]。如果老年人在跌倒后能尽早地被发现并治疗,将对其后期的康复有很大的帮助[4]。因此,设计一个准确且高效的跌倒检测算法十分必要。
2研究现状(Research status)
目前的跌倒检测算法主要分为三大类:基于视频的跌倒检测算法、基于环境传感器的跌倒检测算法和基于可穿戴设备的跌倒检测算法。基于视频的跌倒检测算法主要依靠安装在屋内或者室外的摄像头对老年人的行为图像数据进行采集,并通过机器视觉的方法判断老人出现的行为是否为跌倒行为[5]。该算法的优点是准确率高,但是运算开销大,有应用盲区。基于环境传感器的跌倒检测主要是指在老年人的活动场所内安装红外线[6]、超声波[7]等环境传感器,通过判断老年人周围环境状况的變化进而判断其是否跌倒。该算法对设备使用者的隐私侵犯风险较小,但由于需要在环境中安装大量的传感器,因此系统的便捷性不够,使用场景受限。基于可穿戴设备的跌倒检测算法是指通过穿戴在身体某个部位的传感器收集原始数据后,使用跌倒检测算法进行处理,并判断设备使用者是否跌倒。与基于视频和环境传感器的跌倒检测算法相比,可穿戴设备易安装、成本低,并且受应用场景限制小。
基于可穿戴传感器的跌倒监测算法按照检测方法的不同可以分为两大类:阈值法和机器学习法。阈值法是通过比较特征值和选定阈值的大小关系判断是否出现跌倒行为。这种方法的漏报误报率较高,检测结果不准确。基于机器学习的算法将跌倒检测看作一个分类问题,使用机器学习算法构建跌倒检测模型。季祥[8]基于惯性传感器计算人体的俯仰角与横滚角,结合足底压力,利用支持向量机判断是否出现跌倒行为。段美玲等[9]、赵举等[10]利用加速度传感器结合双向长短期记忆网络算法进行特征提取与分类判别。YACCHIREMA等[11]使用加速度计和陀螺仪数据,设计了一个基于决策树的跌倒检测模型。虽然目前研究人员已基于可穿戴传感器提出了多种跌倒检测算法,但是这些算法仍然存在以下问题:一是缺乏老年人的跌倒数据。目前,被大量使用的监督学习算法主要针对跌倒行为进行建模和检测,这对跌倒数据的质量要求较高。老年人跌倒是一种高危的行为,因此在现实中很难获取老年人真实的跌倒数据,大部分实验都是采用年轻志愿者参与跌倒实验获得的数据进行训练,这必然导致实验结果与真实情况出现偏差。因此,被大量使用的监督学习算法只是在理论上取得较好的结果,但是在实际应用中的效果不佳。二是使用通用模型,不考虑不同个体之间的差异。由于不同人的身高、体重及行为习惯不同,即使在做出相同的跌倒动作时,也会有很大的差别[12]。图1展示了三个志愿者模拟“走路时不小心向后滑倒”这一动作时三轴合加速度的变化情况,其中横轴表示时间,纵轴表示合加速度数据,虚线框内部为跌倒时采集的数据。从图1中可以清晰地看出,不同的人在做出相同跌倒行为时,加速度的极值、方差和跌倒持续时间具有很大的差异,如果忽略这些差异,那么跌倒检测的准确率很难得到保障。
为解决以上问题,本文提出了一种基于扩展孤立森林的跌倒检测算法。针对老年人跌倒数据获取困难的问题,研究人员使用数据挖掘中的异常检测技术,将跌倒检测看作一个二分类异常检测问题,使用扩展孤立森林算法对大量易于采集的正常行为数据进行建模,当数据不符合正常行为数据特征的时候,即可判定出现跌倒行为。针对个性化适配问题,本文使用无监督的建模方式,为每个人采集到的正常行为序列数据建立不同的跌倒检测模型,解决了不同个体的个性化适配问题。本文在公开数据集SisFall上验证了算法的可行性和优越性。
3相关方法(Correlation method)
3.1扩展孤立森林算法
孤立森林(Isolation Forest, IForest)算法是由TING等[13]提出的一种基于集成学习的无监督异常检测算法,其主要依赖于特征选择和循环随机分割;它并不是直接处理所有的数据点,而是使用超平面对数据进行随机分割,这就使得其具有线性的时间复杂度以及较低的内存需求。算法将异常数据标记为“少数且容易被孤立”的数据,即分布稀疏且离群的点,这与跌倒数据发生少且与正常行为数据差异较大的特征相符。
尽管标准的孤立森林算法的计算效率很高,但由于其切割超平面是轴平行的,这就导致在具有多个聚类中心的数据集中,算法会因为切割条件的重叠而难以检测到局部异常点,从而导致模型的检测精度下降[14]。HARIRI等[15]提出了一种扩展孤立森林(Extended Isolation Forest, EIF)算法,其使用具有随机斜率的超平面替代轴平行的超平面,克服了标准孤立森林的局限性。
在一个二维空间中的EIF算法切割方式如图2所示。对于图2(a)中的异常点x0,只需要少数几次切割就能到达二叉树的叶子节点,而对于图2(b)中的正常点x1,则需要更多的切割次数。
从图5中可以看出,由于个体存在差异性(身高、体重、行为习惯等),所以使用个性化模型的分类结果要好于使用非个性化的模型。具体来说,平均准确率从91.89%提升到了96.76%,平均敏感度从93.84%提升到了97.91%,平均特异度从88.44%提升到了94.72%。
表4展示了其他常见的无监督异常检测算法与本文使用的EIF算法在跌倒检测模型中的性能对比。从表4可以看出,在跌倒检测任务中,EIF算法的准确率、敏感度和特异度均是最高的。
5 结论(Conclusion)
本文提出了一种基于扩展孤立森林算法的跌倒检测模型,利用佩戴在人体腰部的三轴加速度传感器采集人的日常活动数据,使用滤波算法对原始数据进行降噪处理,通过滑动窗口进行特征提取,对每一个人提取好的特征数据使用无监督的EIF算法进行个性化建模。解决了传统监督学习算法获取老年人跌倒数据困难以及个性化适配的问题。该模型在公开数据集SisFall上进行实验,验证了算法的有效性,同时与其他算法相比具有更高的识别精度。
作者简介:
熊文滔(1998-),男,硕士生.研究领域:数据挖掘.郑建立(1965-),男,博士,副教授.研究领域:医学信息系统与集成技术.