一种改进的毫米波雷达聚类算法

2021-08-11鞠夕强孟祥印谢江鹏

科学技术与工程 2021年20期

鞠夕强，孟文，孟祥印*，谢江鹏

(1.西南交通大学机械工程学院，成都 610031; 2.轨道交通运维技术与装备四川省重点实验室，成都 610031)

毫米波雷达，因其能够全天候使用，获取目标径向速度，对天气敏感度低，成本较低等优点，是当前汽车辅助驾驶系统与无人驾驶实验中必不可少的传感器之一[1]。但雷达仍有角分辨率低；杂波、虚假目标和噪声影响目标识别；数据输出稀疏，均匀性差等缺点[2]。根据毫米波雷达特性，需要针对性开发数据处理算法，尤其是数据聚类算法。

目前数据聚类方法主要有划分法[3-4]、层次法[5-6]、基于密度的方法[7-8]、基于网格的方法[9-10]。结合雷达特性分析：以K-means[11]算法为代表的划分法虽然简单快速，但仍需预先选定K值且对噪声及离群点敏感，无法实时处理雷达数据；以AGNES算法为代表的层次法，簇间距离容易定义，不需要预先制定聚类数，但该方法计算复杂度高，实时性不强；基于网格的聚类方法[12]聚类速度快，对高数据量数据处理效果好，但毫米波雷达数据量小、点数稀疏，应用该方法聚类精度不高；以DBSCAN[13]算法为代表的基于密度的聚类算法对噪声不敏感，能发现任意形状的簇，缺点是对数据均匀性要求较高，数据的稀疏程度影响聚类效果。针对雷达特性，中外学者提出许多雷达聚类算法。Scheiner等[14]对雷达数据进行二次聚类，第一次聚类使用自适应调整点数阈值，并扩充速度维度的DBSCAN算法；第二次聚类仍使用DBSCAN算法，但参数不同，取得了较好的数据聚类效果。但该算法仅自适应调节点数阈值参数，未能优化雷达均匀性问题。Haag等[15]提出了一种利用跟踪先验信息最小化聚类误差的自适应聚类方法，使用卡方检验得到某个目标的先验知识来针对性设置聚类参数；若无先验知识，使用基于网格方法进行初步划分，并使用 DBSCAN 算法在网格内进行聚类。该算法在噪声及特定场景下跟踪效果较好，但由于引入先验知识，可能引起误差时域传递[16-17]。蒋留兵等[18]利用卡尔曼滤波算法对DBSCAN进行改进,实现聚类算法参数自适应和增量聚类, 提高了聚类实时性。但改进算法仍有误差时域传递问题。Kuang等[19]根据船用雷达使用场景，提出一种自适应水上舰艇聚类方法：首先利用先验知识进行初步聚类，得出聚类估计目标数目，并作为二次聚类中K-means聚类算法的初始聚类个数。最后使用经验规则对二次聚类后目标进行合并，在杂波环境下取得较好的聚类结果。

针对上述问题，并结合雷达数据特性，提出一种基于DBSCAN的自适应雷达聚类算法，能够根据K近邻距离和雷达散射截面面积(radar cross section, RCS)自适应调整聚类半径，提高对不同反射强度、不同稀疏程度目标的聚类效果。

1 雷达目标点云特征

对雷达数据输出的点云特征进行分析总结，根据数据特征设计聚类改进算法。选用Continental公司生产的ARS408-21型雷达作为实验雷达，实验雷达安装在实验车辆前方中网中心左25 cm处。实验平台及雷达安装位置如图1红框所示。毫米波雷达经过恒虚警检测(constant false alarm rate, CFAR)[20]后，通过CAN(controller area network)总线在上位机接收到的目标数据如图2(a)所示，实时图像记录数据如图2(b)所示。

图1 实验平台及毫米波雷达安装位置

图2 上位机接收数据

该型号雷达角度分辨率为1.6°，固定的角分辨率会导致在笛卡尔坐标系中采样密度变化[21]。统计得到目标点数与距离关系如图3所示，统计选取小型客车和行人两类目标，考虑到同目标同距离帧间点数不同，选取连续7帧数据并计算平均值得到该数据。由图3可知，虽有一定幅度波动，同一目标在雷达中获取点数随距离提高而减小。

图3 目标点数与距离的关系

毫米波雷达探测动态行人与动态车辆点云分布情况及实时图像记录如图4所示。该场景为行人向雷达方向行进，车辆横向及转弯运动。其中，雷达静止，行人在纵向相对速度vx为0.75～1.25 m/s，车辆vx与横向相对速度vy均为0～1.25 m/s。在图4中，图4(a)中绿色框选为行人目标，红色框选为车辆目标，图4(b)为作为参考的实时图像记录。由此可得出：行人目标点云间距小，密度大，车辆点云间距大，密度相较行人偏小。

图4 雷达探测数据显示

根据上述雷达目标描述，可得出雷达点云目标特征：雷达由于角度分辨率固定，雷达数据存在不均匀性；不同目标反射强度、形状、体积不同，在雷达中显示的点云密度不同。

2 改进的聚类算法

2.1 经典的密度聚类算法-DBSCAN

基于密度的聚类方法一般思想是：搜索空间中每一个点，使用适合的距离度量来确定邻域目标个数，如果一个点的邻域范围内目标数超过某一阈值，则形成一个聚类簇，对应的目标点为核心点。若一个核心点位于另一个核心点的聚类簇中，则认为两点直接密度可达。多个点由直接密度可达串联起来，则点与点之间为密度可达。从一个核心点开始，不断向密度可达的区域生长，最终得到一个包括核心点及其邻域目标的最大化区域，形成最终聚类。不满足核心点定义且不包含在聚类簇中的目标点被认为噪声点。

DBSCAN算法需给定两个参数：距离半径Eps和点数阈值minPts，原始算法中该参数均为固定值。

2.2 K最近邻算法

K最近邻算法[22]主要应用于分类以及非线性参数统计，该算法思路是：在特征空间中，若一个样本附近的k个最近邻样本属于某一个类别，则这个样本属于这个类别。借鉴k最近邻算法的思路，通过限定k的取值，计算得到目标第k个最近点的距离，来判断该点处的密度，并作为Eps取值的决定因素之一。

2.3 改进的聚类算法

提出一种聚类参数自适应调整的毫米波雷达聚类算法。通过提取并组合K近邻距离和雷达反射截面半径，自适应确定聚类半径。同时，解决了因聚类半径不同产生的对称性问题。针对雷达型号，调整聚类算法参数，实现更好的聚类效果。与其他雷达聚类算法[14,18-19]相比，提出的改进算法更适应不均匀的毫米波雷达数据，包括因雷达角分辨率固定造成的沿径向数据不均匀，因目标体积不同造成的数据不均匀。

改进算法在DBSCAN算法基础上改进，使Eps值能够自适应调整，该值的决定变量有：通过K最近邻距离计算的距离半径Eps,K；根据目标在雷达处的反射截面计算得到的距离半径Eps,RCS。Eps计算公式为

Eps=Eps，K+Eps，RCS

(1)

式(1)中：Eps为某点采用的聚类半径；Eps,K为通过K最近邻距离计算得到的值；Eps，RCS为利用雷达提供的RCS值转换得到的雷达假象面积半径。公式的含义为：以Eps,K作为基础值，Eps,RCS作为增量确定Eps取值。

通过提取雷达散射截面作为Eps自适应取值的补充量。雷达散射截面是度量目标在雷达波照射下产生的回波强度的一种物理量，是目标的假象面积。由于雷达照射目标的回波强度随形状、物理截面大小、材质、方向等有很大关系，但车辆与行人差异较大，文献[23]给出行人与车辆平均反射强度差值为9 dB/m2，故可作为补充增量。

式(1)中Eps，K的求解思路为：对感知目标进行分析，确定K最近邻距离中设置的k参数，并求出每一个目标第k个相邻点的距离，与已设置阈值进行比较，函数可表示为

(2)

式(2)中：α1、α2、α3为提前给定的距离阈值；xk为目标离第k个相邻点的距离；ε1、ε2为判断阈值。

在改进算法中假设目标假象面积为圆形，通过面积计算目标的假象半径，该半径与Eps，RCS的关系为

Eps,RCS=rRCS

(3)

式(3)中：rRCS为假象半径，由雷达的RCS值通过圆形面积公式计算获得。

(4)

式(4)中：ωRCS为目标的假象面积，m2。本文中采用雷达输出目标的RCS使用另一种更通用的表达方式，即使用雷达散射截面的对数值的10倍来表示，单位为dBsm，其与ωRCS的关系公式为

RCS=10lgωRCS

(5)

改进的聚类算法中，参数Eps由目标点自适应确定，由此产生初始点选择不同，聚类结果不同的问题。图5展示了一种聚类可能的情景：首先目标点具有不同的Eps，在图5中表现为各点所属圆的半径不同。假设各点均为核心点，蓝点到红点能够进行密度传递，各核心点之间满足密度相连，但是从红点到蓝点不能进行密度传递，不能满足密度相连条件。为解决改进算法引起的上述问题，在本文算法中添加一条规则：核心点之间密度可达需满足对称性。图5中红蓝核心点密度可达不满足对称性，认定为不同聚类簇。

图5 一种聚类传递示意图

3 聚类参数设定及聚类过程

3.1 聚类参数设定

根据改进算法定义，需要输入的参数有k、α1、α2、α3、ε1、ε2共6个参数。

选取行人和车辆目标作为研究对象，通过统计目标点云个数，得出k值。根据图3所示，探测目标在小于80 m距离处目标点个数大于等于2，故k值选定为2。

在改进算法中，α1、α2、α3分别表示类行人目标聚类阈值，体积介于行人与车辆间的目标聚类阈值，类车辆目标聚类阈值。α1、α3由式(6)计算得到，其中δ为阈值放大系数，本文算法中δ=1.2，Δmax1、Δmax3分别为行人目标聚类点间隔最大值与车辆目标聚类点间隔最大值。考虑到α2阈值介于行人体积与车辆体积之间，选择式(7)计算得到α2。

αn=δΔmaxn,n=1,3

(6)

式(6)中：Δmaxn为设定的目标聚类点间隔最大值，由Δmax1和Δmax3构成，根据式(6)及对各变量的取值，计算得α1=0.54，α3=2.412，α2满足：

(7)

计算可得α2=1.476。

行人目标与车辆目标在同一帧数据中，点间隔最大值随距离变化的统计如图6所示。其中，图6(a) 是对行人目标的统计，图6(b)是对小型客车目标的统计。行人统计场景为图4，小型客车统计场景为图2。由图6可见，行人目标点间隔最大值在0～50 m范围内基本保持稳定，在26 m处和 42 m 处有偏离点。考虑Eps,RCS增量效果及对多行人的分辨能力，将两偏离点作为异常点进行剔除。取剩余目标中点距最大值作为Δmax1取值，可得Δmax1=0.45 m。

图6 距离与同一聚类点间隔最大值曲线

车辆目标在0～80 m处基本保持稳定，而在大于等于80 m范围处距离大幅提高，这与该型号雷达特性相关：该型号雷达优先保证近距离目标的传输。若近处目标繁多复杂，雷达探测超过100 m的目标，仅会显示一到两个目标点。因此，选取80 m范围内，车辆聚类点间隔最大值作为Δmax2取值，可得Δmax2=2.01 m。同时规定了改进算法在本雷达的适用范围：行人目标≤50 m；车辆目标≤80 m。

选择具有行人与车辆目标的数据，计算所有目标的k=2近邻处目标距离，统计场景与图4一致，统计结果如图7所示。其中，图7(a)为统计获得的条形图，图7(b)为该帧数据的图像记录。图7(a)以0.2 m为间隔将数据离散化，统计落入间隔内的点数，其中有3处峰值，根据点属性及距离推算，分别对应人车混合点，人车混合点，车辆点。选取(0.4,0.6]上界作为τ1，(1.0,1.2]上界作为τ2。τ1、τ2与判断阈值ε1、ε2的关系为

图7 第k个最近点距离统计

ε=στ

(8)

式(8)中：σ为峰值放大系数，选取σ=1.3，得出ε1=0.78，ε2=1.56。

根据上述计算过程，完成改进算法中所有参数设置。

3.2 实验数据与设计

算法需要输入的数据包括雷达单帧运动(相对速度不为0)数据集D={d(1),d(2),…,d(N)}共N个目标，数据集D的组成元素d(i)有以下属性d(i)={x(i),y(i),RCS(i)}，算法运行所需参数：k、α1、α2、α3、ε1、ε2。输出数据为F={f(1),f(2),…,f(M)}，数据集F的组成元素f(i)有以下属性f(i)={x(i),y(i),RCS(i),label}，其中label为聚类簇数据标签，表示该目标类别。改进聚类算法具体步骤如下。

步骤1雷达数据预处理，将相对速度为0的目标剔除，形成数据集D。

步骤2对数据进行遍历，利用上述改进过程计算目标Eps。

步骤3执行改进聚类算法，生成最终聚类结果。

毫米波雷达可以检测相对速度为0的目标，但考虑到本文算法主要应用到动态车辆的目标检测且毫米波雷达对动静(相对速度是否为0)目标成像差异较大，故将相对速度为0的目标剔除。

4 实验分析

4.1 实验数据与设计

对改进聚类算法及其选定参数进行评估。实验选用DBSCAN算法与本文算法进行对比。重点比较不同密度数据的聚类效果。DBSCAN算法参数选择方面，根据雷达属性及过往聚类经验值，聚类半径Eps选取0.5、1.0、1.5，minPts选取为2[minPts为DBSCAN聚类参数中的点数阈值，如果聚类半径(Eps)划定的范围内点数超过设定的点数阈值(minPts)，则认为构成一个聚类簇]。分别记录改进聚类算法与对比算法在行人目标与车辆目标的聚类效果，并根据聚类评价指标进行聚类效果量化评价。

所有实验基于真实的数据集。该数据集特征为：实验车辆静止，复杂场景下探测车辆与行人目标，将静止(相对速度为0)目标滤除以模拟具有相对速度的场景。数据处理平台软件采用Ubuntu16.04系统下ROS Kinect开源平台进行处理。硬件配置为INTEL i5-6300 4核处理器，8 G内存。

4.2 聚类评价指标

为了评估改进算法及对比算法，引入2个评价指标：聚类精确度(accuracy,AC)和聚类正确率(accuracy rate，AR)。聚类精确度用于比较输出聚类簇标签和数据提供的标签，计算公式为

(9)

式(9)中：

分别为数据f(i)所对应的改进聚类标签与真实标签；N表示雷达目标点个数；τ表示的函数为

(10)

聚类正确率用于比较正确聚类簇数与实际探测对象个数。目标聚类正确的定义为：目标聚类形成的聚类簇与实际探测对象一一对应。聚类正确的量化标准为：单目标AC≥80%。同步记录图像与未聚类雷达数据作为真实场景进行验证。聚类正确率公式为

(11)

式(11)中：P为实际探测对象个数；S为目标聚类正确个数。

4.3 实验结果

测试实验分析了该场景下378帧数据，其中行人目标793个。车辆目标71个。摘取一帧数据及聚类效果如图8所示。图8(a)为未聚类原始数据，图8(b)为改进算法聚类结果，图8(c)、图8(d)、图8(e)为Eps参数0.5、1.0、1.5 m的DBSCAN算法聚类结果，图8(f)为实时采集到的图像。根据图8可知，改进算法将车辆目标和行人目标完整聚类。相较DBSCAN算法，聚类效果提升明显。其中，聚类出的虚警目标可由目标验证算法剔除。该类目标不影响正常目标识别。

图8 改进算法与对比算法聚类结果

DBSCAN算法与改进算法聚类量化结果如表1和表2所示，其中，表1为行人聚类量化统计结果，表2为车辆聚类量化统计结果。根据数据可得出：相较对比算法，改进算法在行人目标和车辆目标中聚类正确率AR均为最高，分别为96.60%，70.42%。行人的聚类精确度最高，达到98.15%，车辆聚类精确度稍逊与Eps=1.5 m的DBSCAN算法。考虑到车辆聚类正确率高于该对比算法，并结合两种量化指标定义，可以得出结论：改进算法更适应于点数稀疏的车辆目标。以实际应用中较为可行的，Eps=1.5 m的DBSCAN聚类算法对比，改进聚类算法对行人目标识别准确率提高4.18%，对车辆目标识别准确率提高5.63%。

表1 行人聚类效果量化统计结果

表2 车辆聚类效果量化统计结果

值得注意的是，车辆目标在Eps=0.5 m的 DBSCAN 算法中聚类正确率为0，Eps=1.0 m聚类正确率为7.04%。因为上述两种参数无法将车辆目标完整聚类，或者完成大部分聚类，故目标聚类正确个数S极小甚至为0，使得聚类正确率较低。总的来说，相较于DBSCAN聚类算法，改进算法能够较好的适应毫米波雷达场景，提高聚类精准度。