APP下载

加权距离判别分析及其在模式识别中的应用*

2013-09-12朱世根

组合机床与自动化加工技术 2013年8期
关键词:直线度马氏评判

丁 涛,丁 浩,朱世根

(东华大学机械工程学院,上海 201620)

0 引言

目前基于数字图像处理的在线检测、检验技术因其具有速度快、操作简单、精度高、非接触等特点,在制造加工行业得到了广泛的应用。文献[1-3]讲到基于图像处理技术分别在轴类零件直线度、手机面板表面质量以及汽车轴套类零件尺寸的在线检测、检验。但是,将图像处理技术应用于在线检验还有一些问题需要解决,例如因为图像采集工况的不同、具体图像处理实施算法的差异以及检验结果完全依靠单因素指标来评定的缺陷,使得评判结果的重复性、精确性及可靠性都不高。以轴类零件变形量的在线检验为例,其具体的执行步骤为:图像采集→图像去噪→图像二值化→目标图像边缘提取→单一指标的拟合计算→与预设评判阈值比较→输出结果,在这一过程中,图像采集时轴的位置重复性、图像去噪算法选择的适合性、图像二值化时阈值确定的有效性以及单一指标算法的准确性等这些环节都会对最后的评判结果带来影响,使得检验系统的重复性不高,检验结果的可靠性不强。因此必须综合评价每一个环节的影响因子对评判结果的影响。

事实上对零件的检验实际上是属于对零件合格与否的分类判别问题。本文通过课题组搭建的一套用于微小扁平零件直线度在线检测系统,通过考虑整个系统中影响最后评定结果的几个因子,利用一种新的计算影响因子权重的算法,来综合评判零件合格与否,此方法一方面弥补了常规靠单指标评判结果的不足,另一方面又利用不同的权重有区别的对待各个影响因子对检验结果的影响,获得很好的检验效果。

1 判别分析的理论基础及其改进

1.1 判别分析的理论基础

判别分析是根据多指标来判断个体所属类别的一种多元统计分析方法,其本质是利用多指标进行综合判断。根据提出的不同假设前提和判别准则,可以有不同的数学模型。常用的是最小距离判别分析法、Fisher判别分析法以及Bayers判别分析法,其中以最小距离判别法中的马氏距离比较常见,以下重点讨论马氏距离判别分析的理论。

设有k个总体:

它们都是p维总体,其数量指标为:

且Gi的均值向量为:

协方差矩阵是:

有待判别样本 x=(x1,x2,…,xP)T,样本x与总体 Gi的马氏距离定义为x与Gi重心间的距离:

马氏距离判别分析的基本思想是:比较样本和每个总体的马氏距离,并将其判定属于马氏距离最近的那个总体。对于多个总体的距离判别,假定有k个p维总体,其判别准则如下:

如果满足(3)式,则x∈Gl。

马氏距离判别法中,每个指标在决定马氏距离大小时是同等重要的文献[4]在对裂纹的识别中就是无区别的对待每一个指标。实际上,这些指标在判定样本x归属于总体G的哪一种类型时所起的作用是不尽相同的。尤其是在模式识别系统中检验零件变形合格与否时,零件的直线度指标因子明显要大于图像质量因子和图像处理算法因子。因此马氏距离夸大了一些微小变化指标的作用。特别是当指标较多而且差异较大时,如果不对指标的重要性进行区分,可能造成较大误判。为此,赵 琳等[5]在马氏距离中加入指标权重,建立了加权马氏距离,但是在确定指标权重时采用主成分分析方法,这种方法只适用于因子间具有一定相关性的计算,而对因子间相互独立的情况没有考虑;闫长斌等[6]提出的三标度法,主要是依据主观认识或经验来对各个因子进行重要性比较,从而分别赋予不同的权值,这种方法也具有很大的主观随意性,对于人的主观认识要求很高。鉴于此本文提出了一种基于样本数据的“分布均匀度”来计算各因子权重的新方法。

1.2 马氏距离判别分析的改进

这里首先引入一个测度叫分布均匀度Π,用于描述一组数据分布均匀性的程度。假设一组数据它的跨度为L,其几何中心为O,重心为C,重心偏离几何中心的程度用Δ=|O-C|来表示,则数据的分布均匀度表示为:

设有来自上述某一个母本Gi的某一个维度Xi观测样本{a1,a2,…,am}T,则这个样本的跨度为:

重心和几何中心分别为:

分布均匀度为:

继而推出各影响因子权重比为:

对于每一个Gi对应的权值Wi,有如下关系:

联立式(4)、(5)得:

2 检验模型的建立

2.1 检验系统的评判因子及分类体系的确定

基于数字图像处理的扁平细小零件变形量的检验主要是检验零件的直线度,其大致过程是:图像采集→图像去噪→图像二值化→目标图像边缘提取→直线度指标的拟合计算→综合利用各评判因子判别直线度合格与否→输出结果。显然此处的判别种类只有合格与不合格两类,这里分别用Ⅰ、Ⅱ来分别表示合格类和不合格类零件。

根据以上的检验过程,这里提出了以下三个影响评判结果的关键步骤,并用相应的评判因子将其量化,具体为:图像二值化过程中的阈值选取有效度EM,对目标图像二值化是这个系统的关键,如果二值化阈值选择不好,对后面的边缘提取以及直线度测算都会有影响,因此这里用二值化阈值的有效度EM来度量这个因子对检验结果的影响;待测零件摆放位置对后续判断结果也有影响,实验得出,对于同一个零件,因为零件与行扫描方向所成角度θ的差异使得测得的直线度值有很大不同,因此用采集图片时零件和行扫描方向的角度θ来表征这一影响;第三个就是反应零件变形量的测度直线度s本身。

2.2 检验系统评判模型及其实施流程

前面已经确定了检验模型的指标体系{EM,θ,s}和分类级别Ω∈{Ⅰ,Ⅱ},其对应的数学模型可以表示为:

对于任何一个 xi=(EMi,θi,si),通过准则 F 将 xi带入式(6)求出F(xi),从而判别出xi属于哪一类。这里需要确定判别准则F,为此引入前面已经建立的加权马氏距离计算公式,同时确定F的准则,具体为:

其中Ω1、Ω2表示第Ⅰ类和第Ⅱ类;u1、u2表示Ⅰ、Ⅱ的样本均值向量;∑1、∑2表示Ⅰ、Ⅱ的样本协方差矩阵;Λ1、Λ2表示Ⅰ、Ⅱ的样本权值对角阵。

如果两个总体Ⅰ、Ⅱ的协方差矩阵相等,即∑1=∑2=∑时,可以把上式(7)归一化为:

至此可以得出基于改进的加权马氏距离判别分析在图像处理在线检测系统检验零件合格与否的步骤如

图1 改进的距离判别分析法的分析步骤

3 应用实例

3.1 实验过程

为了检验上述所建立模型的效果,我们利用课题组一套基于数字图像处理的在线检验系统采集了75枚合格零件以及56枚不合格零件的三个指标数据,对上述建立的数学模型进行效果验证,同时对50枚“未知类别”的零件进行数据采集,验证此种加权距离判别分析结果的有效性,如图2所示是分好类别的零件样本三个指标在三维空间分布的散点图,表1为部分检验模型数据。

图2 已知样本类别的散点图

表1 检验系统评价模型数据

注:表中编号为1-75的为合格零件数据,用Ⅰ类型表示;编号为76-131的为不合格零件数据,用Ⅱ类型表示;编号为132-181的为待判别零件数据,用X类型表示。

3.2 实验结果及分析

表2和表3给出了用传统的马氏距离判别分析法和本文提出的加权马氏距离判别分析法分别对上述实例运行的结果。

表2 不同方法的回代结果

从表2中可以看到利用马氏距离判别分析的回代误判率为3.82%,而用本文提出的加权马氏距离判别分析法的回代误判率为0。从表3中可以看到用本文的判别分析法对“未知”零件进行合格与否的判别的准确率为100%而用马氏距离进行判别的准确率只有90%。从以上结果可以得出本文提出的算法具有很好的适用性。

表3 不同方法的判别结果

4 结论

本文在对传统马氏距离存在不足进行改进的基础上,结合基于数字图像处理零件变形量在线检测系统的特点和检验原理,利用改进的加权马氏距离判别分析法对系统的检验算法进行了改进,获得如下结论:

(1)基于数字图像处理的零件变形量在线检验系统的检验结果的有效性除了与单一指标直线度有关以外,还受采集图像时零件的位置因子和图像处理算法中阈值选择有效度因子的影响,因此在做最后变形量合格与否判断时需要把这些因子考虑进去。

(2)针对常规马氏距离判别分析法没有考虑各判别指标重要性的缺陷,本文提出了一种基于“分布均匀度”的测度来量化评价各指标重要性程度。这种算法充分利用了样本数据所给的信息,首先对给定样本数据进行均匀性评判,然后计算出各指标的权重系数,从而有区别的对待各个指标对判别分析结果的影响,通过实际验证,证明此方法可行。

(3)此方法在实际的应用中可以不断将已经检验好的零件数据指标加入到训练样本中,丰富训练样本的数据,使检验系统具有“自我学习”的功能,从而更加准确的去判定未知零件类型。

[1]张云辉,谭庆昌,等.基于数字图像处理测量直线度的方法研究[J].微计算机信息,2008,24(9-3):274-275.

[2]张岩,王宝光.手机面板表面质量在线检测系统的研究[J].传感器与微系统,2010,29(4):52 -54.

[3]黄杰贤,徐杜,等.一种轴套类零件尺寸高精度图像检测方法的研究[J].光学与光电技术,2008,6(2):86-87.

[4]Wei-Cheng Lai,Ta-Peng Chang.An evaluation of Mahalanobis Distance and grey relational analysis for crack pattern in concrete structures[J].Computational Materials Science,2012,65:115 -121.

[5]ZHAO Lin,LUO Han,LIU Jing.Weighted Mahalanobis distance and the weighted-determining method the arithmetic of tourism information recommender system[J].Mathematics in Economics,2007,24(2):185 -188.

[6]闫长斌,路新景.基于改进的距离判别分析法的南水北调西线工程TBM施工围岩分级[J].岩石力学与工程学报,2012,31(7):1447-1451.

猜你喜欢

直线度马氏评判
长导轨直线度分段测量拼接方法研究
核燃料组件直线度、垂直度垫片矫正返修分析
不要用街头小吃来评判北京
基于学习的鲁棒自适应评判控制研究进展
基于西门子840D数控系统的直线度自动计算程序研究
基于MATLAB的直线度测量不确定度评定程序设计
《封神演义》中马氏形象的另类解读
抱琴
评判改革自有标准
基于马氏距离的舰船装备修理价格组合预测