基于Cauchy模型的行人轮廓提取及目标检测

2021-08-04唐艳凤林俊强马振丰

计算机测量与控制 2021年7期

唐艳凤，林俊强，马振丰

(广东工业大学华立学院，广州 511325)

0 引言

Cauchy模型全称柯西弹性模型，描述了全量应力条件下的数据应变关系，具备较强的高阶非线性弹性，也可用来表示增量应力的实际应变行为，既可以与变形能函数匹配，也可与非变形能函数匹配[1]。在该模型的应用过程中，必须假设应力与应变始终保持一一对应关系，且这种应变行为应该是可恢复的、与应力实施路径无关的。在应变能实施方面，Cauchy模型能够较好适应弹性变形的能耗状态，当能量信息以应变或应力状态贮存于材料势能中时，材料结构首先会因为受力而出现弹性形变，然后会在屈服于塑性变形条件的同时，将外力做工划分为塑性变形功与弹性变形功两部分，最后弹性变形功直接贮存于已变形的材料结构之中，而塑性变形功却只能存在于材料表面。

人体运动目标检测是图像序列识别中的重要处理环节，可清晰掌握目标人体的运动位置与姿态过程，当前一帧图像与后一帧图像保持对应提取关系时，待测目标的索引文件就会自发进入既定识别状态[2]。然而随着待监测行人目标跟踪稳定性的下降，既定参量的提取精度值水平也会持续降低。为避免上述情况的发生，传统Kinect型检测算法借助3D摄像头记录视野范围内的人体目标编号，再利用最小外接矩形框，实现对行人轮廓的信息的标记与处理。然而与此方法匹配的PTR实测指标水平过低，很难使检测精度值达到理想化数值标准。为解决此问题，引入Cauchy模型，设计一种新型的行人轮廓提取及目标检测方法，在最大似然值估计条件的支持下，建立完整的卷积神经网络，再借助图像分割原理，实现对目标行人轮廓信息的识别与标记。

1 Cauchy模型对行人目标的统计建模

Cauchy模型对行人目标的统计建模处理由Cauchy分布、最大似然值估计、第二类统计量计算3个应用环节共同组成，具体操作方法如下。

1.1 Cauchy分布

由于高分辨率状态下目标行人轮廓图像的成像机理可直接导致提取区域的不均匀性分布，传统Kinect统计方法不能很好描述行人轮廓图像的系数条件，而具有厚尾及尖峰特性的Cauchy模型则可以对原始目标行人轮廓图像进行高精度水平的建模[3]。Cauchy模型的概率密度函数定义如下：

(1)

图1 Cauchy分布的概率密度函数(γ=1)

图2 Cauchy分布的概率密度函数(x0=0)

分析图1可知，Cauchy模型具有明显的尖峰及厚尾统计特性，高分辨率目标行人轮廓图像的统计模型总表现出冲击型特性，因此，Cauchy模型完全适合对原始行人轮廓图像系数进行建模。分析图2可知，当x0=0时，即为不同γ取值条件下的Cauchy模型概率密度函数。x0可决定Cauchy模型概率密度函数在x轴方向上的提取偏移量，γ可决定Cauchy模型概率密度函数关于原始行人位置参数的离散化程度，γ实值越小，Cauchy模型概率密度函数中的提取参数也就越集中，尖峰特性条件也就越明显。

1.2 最大似然值估计

在统计学概念中，矩估计、相似性估计是两种最为经典的数值推算方法，它们通过目标行人轮廓数据样本来估计Cauchy模型中的各项提取信息位置参数项，但是这些经典的数值估算方法始终只能适用于一些简单的数学分布模型[4]。对于Cauchy模型来说，上述两种估计策略不能完全与数据样本的高斯分布行为适配，因此，该模型不同于常规概率处理方法，需要遵循全新的最大似然值估计法则。最大似然值估计可面对目标行人轮廓数据的遍历样本，确定与提取常数值相关的信息密度条件。在实际应用过程中，最大似然值估计法能够明确与目标行人轮廓数据相关的原始概率模型，且随着提取信息条件的改变，数据样本的发生概率树也会逐渐产生变化[5]。总的来说，最大似然法是一种完全遵循数据树重建法则的应用行为。设i代表Cauchy分布条件下与变量x相关的最小数值限定条件，n代表最大数值限定条件，联立公式(1)，可将目标行人轮廓数据的最大似然值估计条件表示为：

(2)

1.3 第二类统计量

由最大似然值估计原理可知，Cauchy模型具有明显的代数拖尾特性，在有限的目标行人轮廓数据提取空间内，不存在均值和方差系数，因此常用的矩参数估计法很容易直接失效，这也是第二类统计量出现的直接原因。在Cauchy模型的作用下，由于最大似然值估计条件的存在，目标行人轮廓数据的提取精度值不会太高，而随着第二类统计量实值条件的出现，数值估计精度与提取指令运行时间的不对等关系得到平衡，从而实现对均值方差系数条件的准确计算。若不考虑其他干扰条件对目标行人轮廓数据提取结果的影响，第二类统计量可直接由Cauchy模型进行定义，当数据概率密度函数被定义在正半轴区间上时，则可利用其他变量值替换原有的普通数据统计量，从而降低旁系干扰条件对最终数据提取结果的影响[6-7]。

定义xδ代表Cauchy分布条件下具有第二类统计特征的目标行人轮廓数据，δ代表第二类统计特征值，s代表基于最大似然值估计原理的统计特征值，Ψ(s)代表常用的矩参数估计定义式，联立公式(2)，可将Cauchy模型的第二类统计量定义为：

(3)

式中，N代表既定的第二类统计特征值数量，e′代表与目标行人轮廓数据相关的特征系数指标。

2 行人轮廓特征提取

在Cauchy模型统计建模原理的支持下，按照卷积神经网络搭建、卷积化与反卷积处理、Gabor特征提取的操作流程，实现对既定行人轮廓特征的实时化提取。

2.1 卷积神经网络

由于卷积层结构的存在，卷积神经网络可在Cauchy模型的作用下，直接实现对目标行人轮廓数据的提取处理。换句话说，卷积层结构是整个卷积神经网络的核心组成部分，卷积神经网络结构如图3所示。

图3 卷积神经网络结构图

输入层作为目标行人轮廓数据首先经过的图像处理路径，可在卷积核组织的促进下，按照Cauchy模型的实际应用需求，对个别特征参量值进行初步提取，并最终导出清晰的输出特征图像。每一个卷积层结构都必须采用相似于滑动窗口的形式对整张目标行人轮廓图像进行遍历处理，并且可对每一个待检测窗口内的小块数据包组织进行单独卷积操作[8]。一般情况下，卷积层结构与输出层结构之间存在一个明显的池化单元，也就是下采样层及全连接层。下采样层的主要功能是对上一层得到的目标行人轮廓图像进行压缩处理，并可同时缩短关联卷积层之间的数据连接距离。全连接层可执行目标行人轮廓图像的分辨率拟合指令，能够在合理压缩卷积神经网络中目标行人轮廓数据的同时，提高网络结构体内部的信息训练效率[9]。随着全连接层作用能力的增强，目标行人轮廓数据可在A节点与a节点之间自由转换，从而实现既定神经节点之间的无误连接。

2.2 卷积化与反卷积

经过卷积化处理之后的目标行人轮廓数据能够长期保持二维向量特征，并且在Cauchy模型的协调下，最终输出的提取图像信息也能够始终维持轮廓化应用状态。一般情况下，卷积化处理作用后的行人轮廓提取图像能够直接成为热图存在状态，但由于多次的池化操作处理，一部分特征信息极易出现丢失，且未丢失的信息尺寸也相对较小，很难满足最终的行人目标检测需求，造成轮廓边界清晰度的不断下降[10]。在卷积化原理的作用下，卷积神经网络虽能使目标行人轮廓图像长期维持原定输出状态，但总体提取效果较差，在实际检测过程中不能得到较为理想的处理效果，因此还需在卷积化的基础上加入反卷积过程。

通常情况下，卷积化与反卷积作用的目标行人轮廓提取节点完全相同，但排列顺序完全相反。卷积化与反卷积处置原理如图4所示。

图4 卷积化与反卷积处置原理

图4中，E0～E2为卷积化处理的目标行人轮廓提取节点，E2～E0为反卷积处理的目标行人轮廓提取节点。考虑实用性，在同一卷积神经网络中，随着Cauchy模型作用能力的增强，目标行人轮廓数据的待提取数量也会不断增大，从而导致个别提取节点出现混乱排布状态[11]。而由于卷积化与反卷积作用行为的存在，这些已移位节点能够得到明显的固位处理，从而为后续检测处置提供足量的图像数据信息。

2.3 Gabor特征提取

Gabor特征实质上是一个经过Cauchy模型核函数调制的复式数据正弦谐波，Gabor滤波器具有方向选择、空间频率、几何特性等多项特性。从信息提取的角度来讲，对于一个特定的行人轮廓图像，目标视觉系统中提取主机的所有神经元结构都能长期保持明确分工的状态，单个神经元仅负责处理行人轮廓图像的某一特定局部区域，最后再借助提取主机将所有局部区域整合起来[12-13]。而Gabor特征提取与目标视觉系统中神经元的视觉刺激响应行为极为类似，在此情况下，提取主机擅长捕获目标行人轮廓数据的频域信息与局部空间，因此可对目标图像的边缘信息参量保持相对敏感的处理状态。在Cauchy模型的支持下，Gabor特征能够同时提供目标行人轮廓数据的尺度选择特性与方向选择特性，在视觉信息理解方面具备较强的实际应用价值。设d1、d2分别代表两个不同的Gabor特征神经元提取系数，联立公式(3)，可将基于Cauchy模型的目标行人轮廓数据Gabor特征提取表达式定义为：

(4)

式中，μ代表与目标行人轮廓数据相关的特征参量定义系数，e1、e2分别代表两个不同的数据信息尺度选择条件。

3 行人轮廓目标检测

联合行人轮廓特征提取结果，按照行人目标识别、目标图像分割、行人目标标记的处理流程，实现对行人轮廓目标数据的实时检测与应用。

3.1 行人目标识别

行人目标识别是对轮廓目标数据节点的打散与重新整合，可在已知Cauchy模型作用强度的基础上，确定相关提取信息所处的实时位置，再通过关联系数参量计算的方式，实现节点与节点之间的数据共同传输。初始情况下，行人轮廓目标图像中的噪点信息总量相对简单，由于Cauchy模型的存在，一部分噪点可能会对常规数据节点进行覆盖，从而导致图像清晰度的大幅下降[14-15]。为避免上述情况的发生，在已知目标行人轮廓数据提取结果的基础上，对所有噪点进行识别处理，一方面可控制噪点信息在原始图像中的扩散行为，另一方面可使识别后图像呈现黑白分布状态，实现对行人目标参量的有效分析。

3.2 目标图像分割

当Cauchy模型作用范围内存在多个行人轮廓目标时，根据目标识别图像中的深度距离信息原理，可从根本上，对原有行人目标进行三维空间上的分割处理，即在深度方向上对待处理目标图像进行自适应距离分层处理。利用Cauchy模型对已提取的行人轮廓目标图像进行自适应分割处理，具体分割原理如图5所示。

图5 待检测行人轮廓目标图像分割原理

图5中的波谷与波峰均是在理想情况下的表示结果，实际情况中由于运动行为的存在，所有目标节点都不可能始终处在原有起止位置上[16-17]。假设在目标检测视野中有若干个人体轮廓数据，分别处于三维空间不同的深度层组织之中，统计出每一段等距离路线上占据的所有像素点个数。再假设多个行人轮廓目标，也分别占据不同的深度层组织。

3.3 行人目标标记

完成行人轮廓目标区域提取之后，对所有数据信息进行标记处理，标记的目的就是为了区分不同的行人目标信息，以便于后续的检测与跟踪。最小外接矩形，是用二维坐标形式来表示二维行人轮廓形状的最大范围区间，它是由二维形状各个顶点最大横、纵坐标和最小横、纵坐标组成的边界矩形[18]。所谓最小外接矩形是最小数据外接框的二维表现形式，对行人轮廓目标绘制最小外接矩形，必须在三维空间自适应距离分层及水平分割的前提条件下进行。至此，完成各项指标参数的处理及各项理论原则的验证，在Cauchy模型的支持下，实现对行人轮廓的提取及目标检测。

4 实验分析

为验证基于Cauchy模型行人轮廓提取及目标检测算法的实际应用价值，设计如下对比实验。选取人流量相对适宜的区域作为实验数据提取区间，将所有图像信息导入核心检测主机中，利用软件分析功能，确定行人目标轮廓检测精度值在既定实验时间内的变化情况，其中实验组检测主机搭载基于Cauchy模型行人轮廓提取及目标检测算法，对照组检测主机搭载Kinect型检测算法。

行人目标轮廓检测精度值能够反应控制主机对待监测目标的实时稳定跟踪能力，一般情况下，精度值越大，控制主机所具备的稳定跟踪能力也就越强，反之则越弱。表1记录了实验组、对照组行人目标轮廓检测精度值在既定实验时间内的具体变化情况。

分析表1可知，随着实验时间的延长，实验组行人目标轮廓检测精度值基本能在小幅上升状态后，开始逐渐趋于稳定波动的变化形式，整个实验过程中的最大值能够达到93%，但却并不能保持长期稳定的存在状态。对照组行人目标轮廓检测精度值则可在小幅上升状态后，逐渐趋于稳定的数值表现形态，全局最大值仅能达到60%，与实验组极值相比，下降了33%。综上可知，应用基于Cauchy模型行人轮廓提取及目标检测算法，可促进行人目标轮廓检测精度值的大幅上升，从而加强控制主机对待监测目标的实时稳定化跟踪能力。

表1 行人目标轮廓检测精度值对比表

PTR实测指标也能在一定程度上反映控制主机对行人目标轮廓参量的实际提取精准度数值，通常情况下，前者的指标参量越小，后者的提取精度值也就越高，反之则越低。图6为实验组、对照组PTR指标的实际变化情况。

分析图6可知，随着实验时间的延长，实验组、对照组PTR实测指标均呈现上升、下降交替出现的变化趋势，整个实验过程中，实验组最大值仅能达到3.97，与实验组极值5.00相比，下降了1.03。综上可知，应用基于Cauchy模型行人轮廓提取及目标检测算法，可有效控制PTR指标的实际上升趋势，能够加强控制主机对行人目标轮廓参量的提取精度值水平。

图6 PTR实测指标变化对比图

5 结束语

与Kinect型检测算法相比，基于Cauchy模型行人轮廓提取及目标检测算法可在确定Cauchy分布行为的同时，实现对行人轮廓特征的实时提取，且在行人目标识别理论的作用下，目标图像能够得到有效分割，从而完成对行人目标的标记与处理。从实用性角度来看，PTR实测指标水平的下降，可促进行人目标轮廓检测精度值的大幅上升，最终加强应用主机对待监测目标的实时稳定跟踪能力。