APP下载

偏最小二乘法在加工热误差中的建模分析

2018-01-25吴桂梅施晓佳

价值工程 2018年36期
关键词:多元线性回归

吴桂梅 施晓佳

摘要:通过采用偏最小二乘回归方法,首先测量加工系统的温度场和热误差数据,然后建立两者的多元线性回归模型,并对各个测温点的温度变化与热误差之间的量化关系进行了定性研究。经研究分析表明,该模型能够达到较好的预测能力和精度,可满足加工热误差实时补偿的需要。

Abstract: By using the partial least squares regression method, the temperature field and thermal error data of the machining system are measured firstly, and then the multiple linear regression model of them is established. The research and analysis show that the model can achieve better prediction ability and accuracy, and can meet the needs of real-time compensation of machining thermal error.

关键词:偏最小二乘法;热误差;多元线性回归;交叉有效性

Key words: partial least square method;thermal error;multiple linear regression;cross-effectiveness

中图分类号:TG659                                        文献标识码:A                                  文章编号:1006-4311(2018)36-0144-02

0  引言

多元统计数据分析主要有模型式和认识式两种方法。传统的模型式方法普遍采用最小二乘回归方法,然而在用最小二乘法得到回归模型时,回归系数的一般解释作用不适用于自变量高度相关条件。而认识式方法的不足是原始数据中没有自变量与因变量的区别以及解释作用。[1-2]

偏最小二乘法与传统的多元线性回归方法相比:每一个自变量的回归系数容易解释其实际意义;回归建模的条件允许自变量间存在多重相关性、允许变量个数多于样本点个数;回归模型在原有所有自变量基础上建立完成;系统信息和噪音便于在回归模型中识别[3]。

基于以上分析,本研究采用偏最小二乘方法建立回归模型,以测量加工系统的温度场和热误差数据为基础,以期获得最佳模型。在试验结果的基础上,建立温度场与热误差的多元线性回归模型,实现软件预报热误差检测并对误差实施补偿优化。

1  实验数据分析

通过改变主轴转速200,500,800,1000,1200r/min,测量得到5组实验数据,在此基础上建立温度场与热误差模型。在主轴组件相应位置安装32个温度传感器来检测其温度变化情况,在相同时间间隔进行数据采样,采用五点法测量Y方向的主轴位移热误差[4]。观察测量可得主轴轴承是主要热源之一。

2  建模方法

偏最小二乘回归方法会进行标准化数据处理,即中心化—压缩处理试验数据。中心化处理数据的原则是坐标只进行平移变换,压缩处理数据则可以消除由量纲不同所引起的虚假变异信息。

已知偏最小二乘算法的收敛速度是极快的,算法迭代的次数m一般总小于R(X),在m=1~3时,即可得一个满意的计算结果[5]。

其中PRESSh体现了第h步拟和方程的预测能力[7],并能确定最优模型。

3  建立并分析模型

3.1 优化变量

通过对实验数据存在问题的初步分析:①自变量一共有32个,个数较多;②而样本个数只有5个,远远小于自变量个数。可得如何有效将变量系统优化,降低多重相关性的影响,是急需解决的问题。

传统的变量系统优化方法,不能解决数据存在严重多重相关性的情况。而偏最小二乘法得到的拟和方程系数实际意义较为明显,自变量的回归系数实际反映了对因变量的解释作用。所以决定应用偏最小二乘法本身来筛选数据。

3.2 建模

对误差实施补偿优化的原则是每一种误差确定每一个方程,在此基础上,对Y方向的主轴位移热误差进行偏最小二乘法的回归建模。依照变量系统优化思路,对全部原始数据运用偏最小二乘法建模,每一步计算的PRESS值如表1。

由表1可知,第二步拟和方程的预测误差平方和最小,故选择成分t1拟和方程。拟和方程的F值为26.3422,通过了F检验,自变量与因变量之间线性关系显著,测定系数R=0.9815。其对应的原始数据回归方程系数如表2。

观察表2的数据,发现测温点x1,x2,x3,x5的系数相对较小,均小于0.01,即以上变量对Y向误差的解释作用较弱,因此將其删除。而环境温度的变化较小时,对热误差影响也较小,即可删除。将筛选后的数据重新进行偏最小二乘拟和,可得PRESS值如表3。

由表3可知,第二步拟和方程的预测误差平方和最小,故选择成分t1和t2拟和方程。其模型值如表4。

模型的F值:F=32.1136;测定系数R=0.9848。可知自变量与因变量具有显著的线性关系,且模型值与观测值相关程度较高。

为了考察所得模型的精度和预测能力,作预测图如图1所示。

当样本点均匀分布或者靠近对角线时,能够得到模型的预测能力和拟和精度均较好。

从影响热误差的物理意义角度进行分析,变量x1,x2,x3表达的信息重复,是可以删除的。而变量x5离主轴位置很远,对Y向误差的影响可以忽略不计。从热误差的拟和结果来看,模型的预测能力和拟和精度均达到了令人满意的效果,可以满足加工中心热误差实时补偿的需要。

4  结论

本研究将偏最小二乘回归方法应用到热误差的建模分析中,取得了较好效果。同时在将模型的预测能力作为评价回归效果的首要因素时,提出了一种新的变量系统优化方法,建立实验并通过了验证。偏最小二乘法广泛应用于各个领域,区别于其他线性回归方法会更加理想。最小二乘回归法在系统优化尺度等方面需要进一步探讨,从而实现效果最优。

参考文献:

[1]方开泰.实用多元统计分析[M].上海:华东师范大学出版社,1989.

[2]S.Weisberg.APPLIED LINEAR REGRESSION[M].王静龙等译.北京:中国统计出版社,1998.

[3]满蛟,王新,等.利用偏最小二乘回归法对主轴热误差数值建模的研究[J].组合机床与自动化加工技术,2005,11.

[4]穆塔里夫,等.加工中心主轴热误差实验分析与建模[J].组合机床与自动化加工技术,2002,9.

[5]王惠文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.

[6][美]Edward B.Magrab,等.MATLAB原理与工程应用[M].北京:电子工业出版社,2002.

[7]武娇.偏最小二乘回归模型及其在教育统计中的应用[D].陕西师范大学,2002.

猜你喜欢

多元线性回归
基于灰色关联和线性规划的粮食种植面积影响因素分析
宏观经济变量对上证指数影响的实证研究
微观尺度下商品房价格的影响因素
武汉市空气污染对社会经济发展的影响