线性判别分析在表征抛光布抛光效果中的应用研究*
2018-08-23赵登超黄宇星
赵登超,刘 明,周 超,黄宇星
(福州大学 机械工程及自动化学院,福建 福州 350116)
0 引 言
表面微观形貌影响制件的使用寿命[1-3]。近年来科技发展对制件表面精度提出了越来越高的要求[4-5]。由于表面形貌对表面的耐磨性、耐蚀性、润滑等方面具有重大的影响[6-8],准确表征表面形貌有着至关重要的意义。不同加工工艺获得的表面形貌存在结构差异[9]。零件在加工后,表面会留下反映其加工方法特点的表面形貌[10-11]。针对不同加工表面,正确选用评定参数对工程应用至关重要[12]。但由于目前粗糙度参数众多,评定参数选取没有统一标准,单纯采用某一粗糙度参数来表征不同加工过程的表面质量是不合理的[13]。吴乙万等人[14]分析了当前超精密光学镜片表面评定方法的不足,提出引用表面三维粗糙度参数来表征精密光学镜片三维表面形貌,发现其中的粗糙度参数中Sq、Sdr、Sdq可以很好地表征超精密光学表面性能;杨洁等人[15]运用机器视觉选取12个三维粗糙度参数,结合端铣、刨、车等加工工艺,发现Sq、Ssk、Sds这3个参数可以作为三维表面粗糙度评价的可靠参数。
抛光作为一种表面精加工工艺[16],广泛应用于集成电路、光学玻璃、各类机械系统等领域[17-18]。但影响表面抛光质量的因素众多,如抛光液的浓度、磨粒种类、大小,抛光布的材质、机械性能等[19-20]。由于抛光布是输送抛光液的关键部件[21-22],对表面抛光质量起着重要作用。目前,大多采用传统的一维粗糙度参数来表征表面抛光质量作为评价抛光布的抛光效果,其一维评定参数不能反映整个抛光表面空间上的信息分布[23]。随着表面测量技术的进步,测量精度的提高,人们获得了更多的表面形貌细节。为准确表征这些细节,评定参数进入三维表征时代。
本文将采用2012年颁布的ISO 25178中的高度类、空间类、混合类中的12个粗糙度参数[24-26],结合铜的抛光实验,并利用机器学习中的“监督”学习算法[27]—线性判别分析,对抛光后所获得的铜表面粗糙度参数进行聚类、降维分析,为选取合理粗糙度参数表征抛光布抛光效果方面提供解决方案。
1 线性判别分析
线性判别分析是机器学习中的“监督”学习算法[28]。这一方法最早由FISHER R A[29]于1936年提出,最初用于二分类问题降维分析。后来RAOC R[30]于1948年将其推广到多分类线性判别分析中。与LDA方法十分相似的另一种方法是主成分分析法(principal component analysis,PCA)[31],都是常用的线性变换降维方法。不同的是,PCA是一种“无监督”学习算法,它不需要类别标签,致力于寻找使全部数据方差最大化的坐标轴成分。LDA则关心的是能够最大化类间区分度的坐标轴成分。
LDA方法如图1所示。
图1 LDA示意图
定义“类内散度矩阵”如下式所示:
Sω=∑0+∑1
(1)
定义“类间散度矩阵”如下式所示:
Sb=(μ0-μ1)(μ0-μ1)T
(2)
同时考虑二者,则可得到欲最大化的目标J如下式所示:
(3)
式中:J—Sb和Sω的“广义瑞利商”[33]。
这就是LDA二分类求解方法。对于多分类求解,假定存在N类,且第i类示例数为mi。定义全局散度矩阵St为:
(4)
式中:μ—所有示例的均值向量。
LDA方法四分类问题示意图如图2所示。
图2 LDA方法四分类问题示意图
将类间散度矩阵Sω重新定义为每个类别的散度矩阵之和,即:
(5)
其中:
(6)
由式(4~6)可得:
(7)
为得到欲最大化目标,使用3者中的任何2个即可,目前常用的优化目标为:
(8)
式中:W∈Rd×(N-1);tr(·)—矩阵的迹。
矩阵的迹可通过如下广义特征值问题求解:
SbW=λSωW
(9)
2 logistic回归
为确保所建立LDA模型的准确性,笔者选择logistic回归对模型进行交叉验证[34]。
logistic回归是针对线性可分问题的一种易实现的模型。定义几率比P,它指特定事件发生的几率,如下式所示:
(10)
式中:p—所要预测事件的发生几率。
更进一步,定义logit函数,它是几率比的对数函数,如下式所示:
(11)
logit函数的输入值范围介于区间[0,1],它能将输入转化到整个实数范围内,由此可以将对数几率记为输入特征值的线性表达式,如下式所示:
(12)
此处是在给定特征的条件下,某一个样本属于类别1的条件概率。当预测某一个样本属于特定类别的概率时,它是logit函数的反函数,也称作sigmoid函数,这就是逻辑斯谛回归模型,如下式所示:
(13)
式中:z—净输入,也就是样本特征与权重的线性组合。
其计算公式为:
z=ωTx=ω0x0+ω1x1+…+ωmxm
(14)
3 实验材料及方法
3.1 材 料
本研究将直径1.5 cm的紫铜棒切割为高1.5 cm的12个圆柱,并用80、120、240、360、600、800、1 000、1 200、1 500、2 000号砂纸对试样表面依次进行打磨。每道砂纸打磨后在显微镜下观察其表面,直至其表面划痕均匀、方向一致后进行下一道砂纸打磨,至2 000号砂纸打磨完毕后进行抛光实验。
抛光布选取丝绒、真丝绒、平绒和呢绒4种抛光布,如图3所示。
图3 实验所用的4类抛光布(从左至右依次为真丝绒、丝绒、呢绒、平绒)
抛光液选取粒度为7 μm的氧化铝过饱和液。抛光后用无水乙醇进行表面清洗,吹干备用。
3.2 实验方法
本研究采用P-2抛光机,4种抛光布对金属铜进行抛光实验,每抛光5 min进行一次表面形貌扫描。抛光机的研磨盘直径200 mm,抛盘转速1 400 r/min。表面形貌扫描采用法国产的STIL共聚焦轮廓仪,其采样率100 Hz~30 kHz,最小分辨率为2 nm。
STIL共聚焦轮廓仪如图4所示。
本次实验中,扫描分辨率为4 μm,扫描面积为1 mm×1 mm的正方形区域。实验样品基于ISO 25178选取12个三维粗糙度参数中的6个高度类参数Sa、Sq、Sku、Ssk、Sv和Sp,3个空间类参数Str、Sal和Std,2个混合类参数Sdq和Sdr。
将获得的金属铜抛光表面三维粗糙度数据制成数据集,摘录其中部分测量数据,每个样本代表数据中的一行,如表1所示。
图4 共聚焦轮廓仪
样本Sa/umSq/umSkuSskStr…Std/(℃)Sdq类别11.642.072.07-0.1440.583…980.925丝绒…281.602.052.050.5460.505…1570.855真丝绒…550.911.151.150.0240.505…1760.527平绒…821.291.643.620.380.595…1740.763呢绒…1081.111.431.430.5230.406…3.250.627呢绒
为了方便机器学习算法对数据识别并学习,笔者对108个样本(每类抛光布27个样本)的12个特征记作108×12维的矩阵X∈R108×12,如下式所示:
(15)
类似的,对于目标变量(4类抛光布),可用一个108行的列向量y表示:
(16)
式中:y(i)取值分别为1、2、3、4。(1—丝绒;2—真丝绒;3—平绒;4—呢绒)
4 分析与结果
为避免数据抽样不合理所造成模型精确度低,训练效率低[35],笔者将数据的训练集和测试集按6∶4的比例进行分层抽样,保证训练集和测试集同分布,并对训练集和测试集进行标准化处理。
LDA训练模型结果在二维子空间的可视化展示,及模型所得各参数对区分四类抛光布的区分率及累计区分率,如图5所示。
图5 LDA模型训练结果可视化展示
从图5(a)中可以看出:在运用LDA降维后,数据在LD1、LD2二维特征子空间上除呢绒与平绒外,整体判别情况较好,呈线性可区分状态,且主要集中在LD1方向呈线性可区分;结合图5(b)中前两个线性判别Sa、Sq单个特征对区分4类抛光布的区分率分别为64.3%、30.6%,累计区分率为94.9%,几乎获取了区分4类抛光布的全部有用信息。由此可知:LD1为Sa,LD2为Sq。对于呢绒数据包围着平绒呈现出线性不可分,可能原因是平绒和呢绒的抛光效果接近,差异不显著造成的,也可能是由于算法的误判造成的,需做进一步分析。
本研究取对抛光布区分率最大的粗糙度参数Sa,并运用单因素方差分析法,分析4类抛光布之间的显著性关系。
4类抛光布间显著性关系如表2所示。
表2 4类抛光布之间显著性关系
从表2中可以看出:4类抛光布仅平绒和呢绒之间不存在显著性差异(p>0.05),其余两者之间均存在显著性差异。
为检验模型的准确性,本研究对丝绒、真丝绒、平绒,丝绒、真丝绒、呢绒分别进行logistic回归分析,结果如图6所示。
图6 logistic回归交叉检验结果
从图6中可知:对于丝绒、真丝绒、平绒,其logistic回归交叉验证结果显示所建立的LDA模型仅误判了丝绒类别中一个样本点,各类别间线性区分度很好。对于丝绒、真丝绒、呢绒,LDA模型仅误判了两个样本点。Logistic回归交叉验证结果表明该LDA模型比较精确。
4类抛光布抛光后金属铜的表面三维形貌如图7所示。
图7 4类抛光布抛光后金属铜的表面三维形貌
从图7中可以看出:4类抛光布中,丝绒、真丝绒抛光的表面凸峰高度分布不均匀性较大,平绒和呢绒的表面凸峰分布相对均匀,丝绒、真丝绒与平绒和呢绒相比表面平坦化程度较差,抛光效果不如平绒和呢绒。
5 结束语
本文对抛光后所获得的铜表面粗糙度参数进行了聚类、降维分析。线性判别分析结果表明:不同抛光布对所选取的三维粗糙度参数中的部分参数的影响具有差异性。
研究发现:Sa、Sq几乎获得了区分4类抛光布抛光效果的全部有用信息,其中,Sa包含区分4类抛光布抛光效果的信息量最大,原因可能是其磨抛本质为磨料颗粒对抛光表面进行微小切削作用[36-37]。由于不同种类的抛光布对抛光液的存储及抛光液中抛光颗粒送入抛光表面的能力不同,造成对抛光表面微小切削的强度不同,反应在表面形貌上为高度变化的不同[38-39]。Sa作为机械表面常用的形貌高度综合评价参数,可以更好地表征这一变化过程。
在评价不同种类抛光布抛光效果是否具有显著性差异方面,与采用传统的单因素方差分析法相比,线性判别分析可以4提供各分类之间是否具有显著性差异的可视化展示,使结果更加直观。