舞蹈视频图像中动作识别方法研究

2020-10-21支桂衡

科学导报·学术 2020年7期

关键词：方法

支桂衡

摘要：现代社会的飞速发展使得信息技术发展越发成熟，视频观看已经成为人机交互领域的重要话题。利用计算机视觉来对舞蹈视频中的舞者动作做出准确识别的意义极为深远。将舞蹈视频图像动作作为核心切入点，而后从灰度转化、背景去除、降噪处理等方面着手，对舞蹈视频图像中的动作识别方法做出了简要探析，以求能够为有关工作者提供借鉴作用。

关键词：舞蹈视频;动作识别;方法

人类的视觉系统对于信息的获取存有诸多局限之处，无法对多样信息做出统一处理，而计算机视觉则能够帮助人们更加清晰地捕获信息，其能够借助于视频来实现对人类思维形态的模拟，处理多样并且较为复杂的视觉任务。就目前来看，计算机视觉已经被广泛应用在诸多领域，无论是在交通、农业、军事领域都具有极为广阔的发展前景。近几年，舞蹈视频图像逐渐发展成熟，其已然成为开展舞蹈教育的重要工具，能够全面识别视频中的舞者的姿态，用以为相关人员提供更具针对性的建议，带来更为良好的互动体验效果。

一、舞蹈视频图像中的动作预处理技术

（一）将视频图像转化为灰度图像

舞蹈视频图像多数为彩色，如果不予以直接转换便将其直接输入到计算机系统，那么将会大幅增加色彩信息计算量。而如果能够预先对视频做灰度处理，那么便可以降低计算量，提高动作识别质量。灰度处理的核心是将色彩空间RGB的三维通道做降维处理，使其成为一维。灰度化处理的方法有许多种，诸如最大值法、单分量法以及全局映射法等等，不同方法适用于不同的处理对象，能够造成完全不同的灰度处理结果。

（二）对视频图像做阈值化处理

图像视频阈值化处理的核心是将舞蹈图像做分割处理，主要是为尽可能地压缩图像的数据量，避免后续图像计算步骤过于复杂。其主要是通过灰度集来区分出相应的像素集，存在于集合中的各个子集对应着部分舞蹈动作。在对舞蹈视频图像做阈值化处理的过程中，首先需要明确当下阈值是多少，其将会直接关系到当下图像中的像素位置，当阈值足够合理，那么才能够产生相对合理的二值图像。一般来讲，阈值会通过下述方法表示：

在本公式中，f（x，y）主要表示像素点（x，y）位置的灰度值，而p（x，y）则表示点（x，y）的灰度梯度函数值。

（三）对视频图像做分割处理

之所以会对视频图像做分割处理，根本原因在于这种方法能够有效改变舞蹈图像的基本的表达方式，使得图像能够更为有效地被计算机视觉系统所应用。此种方法主要是对舞蹈动作的边界做出有效判断，然后对其进行分割，保证每个图像中的像素都能够拥有自身的独特标签，最终集合成为一个巨大的像素集合。在对视频图像作出阈值化处理之后，此时便需要把舞者的动作从场景工作分离处理，此时就需要利用分割的方法，寻找最为使用的阈值，用以更为有效地绘制出轮廓的边缘位置。

（四）对视频图像做背景去除以及降噪处理

在舞蹈视频图像中，舞者作为前景目标存在，而剩余背景目标则是场地、器材、灯光等等，此类背景的出现将会使得计算机视觉系统的计算量大幅增加，同时也会导致舞者的动作无法被有效识别，在将背景去除之后，则只剩下舞者这一前进目标，剩余目标则全部消失，在此种情况下将会有效降低动作识别的难度。就目前来看，关于背景去除的研究相对较多，本文主要从舞蹈视频图像的特征着手，利用高斯混合模型来去除背景。其工作远离是利用K个搞死模型来表达视频图像中的多个像素点的特征，如果高斯模型能够与各个像素点相互匹配，那么就说明其为背景点，反之则说明其为前景点，这样便能够实现舞者和背景的分离。

二、舞蹈视频图像中动作姿态提取

（一）利用姿态特点来提取分类

舞者所做出的舞蹈动作，与其生活中的各种动作的差距较大，许多情况下需要手脚并用才能够完成，在针对性地选择目标区域的过程中，必须要清晰的掌控舞者的全身运动情况，才能够更为精准的识别其动动作。舞者所做出的动作大致有以下几种：静态特性，主要用于观察舞者目标的体积、身体轮廓以及其颜色深浅等等，其能够清晰地传递舞者的轮廓表征;动态特性，主要用于观察舞者肢体动作的走向，各个关节的运动轨迹，其能够清晰地映射出舞者的移动情况。此类特性的有效应用将会帮助计算机更为清晰地计算出舞者的运动情况，为后续建模提供支撑作用。

在利用姿态特征提取舞者的运动姿势的过程中，需要通过传感器来完成，此种方式尤其常见与机器人视觉领域，能够更为精准地断定舞者的运动方向。借助于相应的光流数值来对图像中所存在的多余背景做出有效脱离处理，精准定位舞者的关节点位，并针对性地创造出相应的坐标轴，接触因患者衣物所带来的遮挡影响。

（二）利用Kinect来识别舞者的关节节点

通过Kinect方法的有效运用，将会更为有效地明确舞者关节的活动情况，简单来讲，其能够将人体看作是以25个节点所构成的坐标轴，共同构成人体的骨骼部分。

其中的25个节点主要分布在舞者的四肢部位，分别包括舞者的踝关节、指关节等，此外则是分布在舞者的肩部、头部、颈部以及脊椎等，这些关节点的应用将会帮助计算机更为快速地构件模型，其作用原理是舞者在做出各种动作的时候，关节活动情况将会被有效记录，而后经过计算则能够明确舞者的具体动作情况，进而获得动态的舞者运动骨架，当有了骨架之后便能够极大程度地提高计算效率。

结束语：

总之，舞蹈视频图像识别不仅仅需要考量服装背景等重要元素的影响，而且还需要考量到舞者自身动作上的影响，需要利用更为精准全面的记录方式才可以，以此来更为清晰地获取舞者的动作情况，只有这样才能更为精準地计算出舞者的静态信息以及动态信息，为后续数据应用提供相应的支撑作用。

参考文献

[1] 耿君.基于轮廓图像空频域特征的舞蹈翻腾姿态识别模型[J].现代电子技术，2019，42（24）：146-149+153.

[2] 邹军军. 基于生成对抗网络的舞蹈生成系统设计与实现[D].华中科技大学，2018.

[3] 邢占伟. 基于多特征融合的舞蹈动作识别方法研究[D].辽宁大学，2017.

基金项目：本文为2018年度广西高校中青年教师基础能力提升项目《广西花山岩画图像元素在壮族师公舞编排中的应用与研究》阶段成果项目编号：2018KY0376