APP下载

基于K-means聚类算法的行走姿势分类标准研究

2018-04-24徐伟穆小旭郭威

现代计算机 2018年7期
关键词:两臂躯干质心

徐伟,穆小旭,郭威

(中国人民公安大学研究生院,北京102623)

0 引言

在传统足迹分析中关于行走姿势只有通过观察然后用语言叙述的形式对行走姿势进行分类,例如:躯干前倾、正常或后仰;头部的抬头、平视和低头等[1]。此类描述要求人们具有丰富的经验和相关的专业知识,而对于没有从事相关研究或专业的人在描述行走姿势时,对行走姿势的描述差别很大。因此,如果能对行走姿势进行量化表示,通过数据的形式对不同的行走姿势进行分类,再结合经验对量化后的行走姿势分类标准进行调整,制定出一个统一的分类标准,就能使大部分人对不同行走姿势的分辨更加准确,让传统足迹的研究更加科学。目前对行走姿势进行量化分类的研究很少,借助计算机技术对传统足迹学进行研究,不仅丰富了相关的研究方法而且让研究内容更加科学。

K-means聚类算法是聚类算法中的一种,将离散的数据点通过k个质心进行聚类,分成k簇相似性较小的数据点的集合[2]。采用欧氏距离作为相似性的评价指标,即两个样本之间距离越近其相似性就越大。K-means算法的具体步骤:预先设定k值并且将每个类的数据的中心作为初始质心;根据初始质心对所有数据点进行距离计算逐个归类,将数据点归为离它最近的聚类点,归入新的数据点后更新此类的均值;通过划分后的均值进行数次迭代达到最优分类效果[3-4]。

从生理学上来看,人体行走姿势是在大脑中枢的调节下,调动身体各部位肌肉群相互配合,通过从年幼到成年的长期行走锻炼,形成个体特有的行走习惯,这些行走习惯一旦形成就会很难改变,最终形成运动动力定型。所以人体行走时,身体各部位形成的行走姿势具有一定的稳定性[5-6]。因此对具有相似行走姿势的不同人,对相似姿势所采集的人体角度数据会分布在相近范围内,通过对角度数据进行分类,就会得到不同行走姿势的分类标准。而K-means聚类算法的聚类核心就是通过对研究对象进行相似度计算,把性质相近的对象进行分类。因此使用K-means聚类算法对角度数据进行分类可以达到较好的数据分类效果。

1 实现过程

1.1 数据采集和处理

借助海康威视的视频采集仪对公安大学年龄段在18~20岁之间的共317名学生进行正常情况下侧面和正面的行走姿势进行录制。侧面录制摄像头和行走方向垂直即与图像成90°,正面录制摄像头和行走方向在同一直线上。侧面和正面的视频同时对一趟行走视频进行录制。视频录制结束后,使用MATLAB对录制的视频进行分帧处理。

行走姿势主要部分涉及身体躯干、头部和两臂。对于分帧后的侧面图片选取位于镜头视野中部,且左腿或右腿垂直支撑阶段的一帧图片,正面图像则选取视频中视野适中双臂张开最大时的一帧图片作为实验数据图片。

所选图片用Photoshop软件进行处理。侧面照片用于生成头部数据和躯干数据。身体躯干为人体侧面髋关节到肩关节。由于实验条件限制,所拍摄的视频中人物衣物宽松,无法确定髋关节的位置。因此,选取人行走时的垂直支撑阶段即支撑腿和躯干成一条直线的状态为躯干,此时取水平线与脚跟到肩关节连线的夹角α作为躯干姿势的数据。人体头部侧面取耳朵最高点与眼睛的连线与地面垂线的夹角β作为头部姿势的数据。人体行走正面图取头顶最高点垂线与最高点与其中一个手臂的夹角γ作为手臂姿势数据。收集到躯干角度、头部角度和两臂角度数据。见图1。

图1

1.2 聚类过程

(1)采集317名学生的躯干、头部和两臂角度数据。

(2)选择欧氏距离进行样本数据计算得出距离矩阵进行聚类。距离公式

(3)通过观察数据的散点图,分析数据分布情况,并且用层次聚类来确定初始类别数。

(4)画出聚类图,展示分类效果。

(5)头部数据、两臂数据处理过程同步骤(1)-(4)。

2 结果与分析

2.1 实验结果

做出角度数据的散点图和层次聚类图。散点图的纵轴表示学生序号,横轴表示角度数据,见图2。层次聚类树,见图3。

在确定初始分类k值时,一种方法可以通过传统足迹里对躯干、头部和两臂的分类来确定k值;另一种方法通过层次聚类法来确定初始k值。层次聚类通过相似度计算,即使用欧氏距离计算出样本之间的距离矩阵,再用平均值算法计算出系统聚类树[7-8]。层次聚类一般有两种聚类方式,自下而上和自上而下。本文采用自下而上的方式进行。

表1 传统足迹行走姿势分类

传统足迹分类中对躯干、头部和两臂的分类多种多样,在此采用多数资料中统一采用的行走姿势分类即躯干、头部和两臂的分类数均为3,见表1。使用层次聚类时,x轴表示样本编号,纵轴表示层次树高度,由于编号太多x轴上不予全部显示。做与x轴平行的水平线,从上到下平移,与聚类树相交,有几个交点表明可以将数据分为几类。由于类别可以有很多种选择,因此可以根据自己需要选择合适分类个数。由图3可以看出可以将躯干分为3类,头部分为2类或4类,两臂分为3类较为合适。综合以上两种方法,将躯干初始设置为3,头部设置为2或3,两臂设置为3。其中通过多次实验将头部在初始k值设置为3时,可以达到很好分类效果,因此头部聚类结果选取类别为3时作为展示。

图2

经过K-means聚类运算,得出躯干、头部和两臂中三类各自的聚类结果以及聚类后的质心数据,见图4。

图3

表2 分类后质心角度数

通过对数据的分类结果分别确定躯干、头部和两臂的角度分类标准。见表3,表4,表5。

表3 躯干角度分类标准

表4 头部角度分类标准

表5 两臂角度分类标准

2.2 结论与误差分析

(1)躯干、头部和两臂的分类标准见表5。

(2)自然行走状态下躯干正常时质心值为90.5°,此数值符合人体正常行走时躯干与地面垂直的行走状态,躯干正常的角度分布范围在88.4°≤α≤92.4°之间,在于正常行走状态下身体不可避免的略微向前或向后摆动,符合人体行走正常状态下的容差范围。头部平视时质心值为 87.1°,角度分布范围为 78.4°≤β≤94.5°。正常情况下,平视时眼睛水平线应与地面成90°角。但是实际行走过程中,我们会注意前行路况,因此实验质心值小于90°。双臂前后摆动时质心值为8.1°,角度分布范围为4.9°≤γ≤10.8°,质心值与范围起点相差较大因为采集数据的学生来源为警校生,长期的训练使他们在行走时双臂自然向体前收缩,因此测量出的正常行走双臂角度数据偏向体前摆动。

(3)对分类后所在类别的人数进行统计,得出自然行走状态下躯干正常的人数为216人,头部平视人数196人,两臂前后摆动人数231人。数据显示在317名

青年人中大部分人行走姿势正常。前倾中有3人前倾程度大于正常值,一方面原因在于行走速度过快,另一方面由于自身身体习惯性佝背导致的测量数据异常。头部仰头和低头数据未有大偏差。两臂角度数据中有2人行走过程中显示未摆臂,原因在于这两名实验对象日常行走两臂摆动幅度较小,在运用Photoshop进行角度标注时,不能对小幅度摆动进行精确的角度测量。

(4)在运用Photoshop对图像进行角度数据测量时,人工标点连线时存在选取点不准,同时角度数据特别敏感,容易造成大的测量误差,影响分类标准的范围确定。此类误差可以通过对相同对象图像进行多次的角度测量取其平均值来减小误差。

图4

3 结语

本文通过对自然行走状态下的人体各部位进行划分,利用Photoshop软件对各部位角度进行数据收集,使用传统足迹中行走姿势分类标准和层次聚类的方法确定初始k值,最后通过K-means聚类算法对角度数据进行聚类,得到了一种通过角度数据对行走姿势进行分类的标准。此标准有助于我们将来对行走姿势下包含的各类因素进行深入研究。由于实验条件限制,采集实验样本人数小,年龄段集中在18~20岁之间,角度测量工具误差大,且采集数据过程中实验对象在视频录制下难以保持正常行走状态,实验结果无法适应所有年龄段行走姿势分类标准,但是在对青年人行走姿势研究方面还是具有相关参考价值。本文下一步将就从身高、性别、胖瘦和扩大样本采集量等方面进行深入研究,并且优化聚类算法同时使用其他算法进行数据处理,以便得到更加科学的分类标准。

参考文献:

[1]史力民.足迹学[M].中国人民公安大学出版社,2007.

[2]Hartigan JA,WongM A.Algorithm AS 136:AK-Means Clustering Algorithm[J].Applied Statistics,1979,28(1):100-108.

[3]李飞,薛彬,黄亚楼.初始中心优化的K-Means聚类算法[J].计算机科学,2002,29(7):94-96.

[4]Selim SZ,IsmailM A.K-Means-Type Algorithms:AGeneralized Convergence Theorem and Characterization of Local Optimality[J].IEEE Transactions on Pattern Analysis&Machine Intelligence,1984,6(1):81-7.

[5]钱竞光,宋雅伟,叶强,等.步行动作的生物力学原理及其步态分析[J].南京体育学院学报(自然科学版),2006,5(4):1-7.

[6]乔晓晓.人体行走运动与行走姿态的影响[J].产业与科技论坛,2016,15(5):63-64.

[7]吴帆,李石君.一种高效的层次聚类分析算法[J].计算机工程,2004,30(9):70-71.

[8]胡学钢,王东波,吴共庆.一种基于层次树的高效密度聚类算法[J].合肥工业大学学报:自然科学版,2008,31(2):187-190.

猜你喜欢

两臂躯干质心
重型半挂汽车质量与质心位置估计
基于GNSS测量的天宫二号质心确定
慢性阻塞性肺气肿患者常练呼吸保健操
树与人
角度法评价躯干冠状面失平衡
正常成人躯干皮肤温度觉阈值测定
预防肌肉萎缩健身法
家庭体操十节
一种海洋测高卫星质心在轨估计算法
仰卧起坐,使你躯干更有力