总体最小二乘算法在矿山测量数据中的应用
2019-11-14陶延林山中雪
张 明,陶延林,山中雪
(青海省第一地质勘查院,青海 海东 810699)
为了获得精确、实时的矿区空间地理信息,测量人员需要采用多种方法对测量数据函数模型进行研究,随着测量技术及数据处理理论的不断发展,测量数据的处理精度也在不断提高,目前,采用总体最小二乘算法来解决变量中的误差以及模型参数估值问题受到科技工作者的广泛关注[1]。
国内外学者对最小二乘算法在矿山测量数据中的应用进行了大量的研究,王乐洋采用总体最小二乘算法对大地测量数据进行了反演理论及应用研究[2];汪奇生等研究了总体最小二乘算法的线性回归迭代算法,针对线性回归模型的特点,以一元线性回归为例,运用拉格朗日原理推导了线性回归迭代算法,该算法推导过程简单且易于实现,通过算例验证了该算法的正确性[3]。
1 总体最小二乘算法函数模型求解
本文主要运用基于拉格朗日函数与奇异值分解函数两种算法对总体最小二乘算法函数模型参数进行求解,在无加权条件下,采用奇异值分解函数算法对等权条件下的总体最小二乘算法对测量数据进行求解;在加权条件下,则采用拉格朗日函数算法更适合对测量数据进行求解,并对测量数据进行迭代处理[4]。
1.1 基于奇异值分解算法
采用矩阵奇异值算法对解决最小二乘问题以及最优化问题起到重要作用,奇异值分解定义如下[5]:
(1)
BCrm×n
(2)
式中:σi为矩阵B的奇异值,r为矩阵B的秩,BTB的特征值为λ1≥λ2≥…≥λr=…=λn。
根据推导可得出基于奇异值分解的参数向量总体最小二乘解为:
(3)
(4)
1.2 基于拉格朗日函数的迭代算法
由于等权条件下利用奇异值分解函数的总体最小二乘算法能够有效解决矿山测量数据中模型参数的求解问题,但是在大多数情况下,该方法不能满足测量精度的要求,因此,为了解决不等精度条件下模型参数的求解问题,研究了基于拉格朗日函数的迭代算法,该算法模型[6]:
f(v,b,λ,x)=vTQ-1v+bTQB-1b+2λT(l+v-Bx-EBx)
(5)
式中:λ为拉格朗日乘数;Q为权矩阵P的协因数阵。
经过推导可得出:
(6)
对式(6)整理可得到各个变量的函数值:
(7)
(8)
(9)
式中:P与PB的关系为:vTPv+bTPBb=min,r为多余观测,通过采用改正后的系数矩阵迭代和观测向量,从实现对模型参数的求解。
2 模型参数求解计算
以某矿区为例,对其高程点进行高程异常拟合试验,在试验区内布置控制点27个,采用三等高程控制测量方法得到控制点高程(h),通过使用全球定位系统C级控制网,采用三维无约束平差方法得到大地高(H)与平面坐标(x,y),其中大地高(H)是地面点沿参考椭球面法线到参考椭球面的距离。试验采用WGS-84坐标系统的参考椭球面作为投影面。高程异常δ的取值:
δ≈H-h
(10)
控制点点位分布如图1所示,采用二次多项式模型对描述的高程异常与模型变量进行统计性规律[7]。
图1 控制点的点位分布
把观测值看作为等权观测,采用总体最小二乘算法(基于奇异值分解)、最小二乘算法,对模型参数进行求解,选取控制点(2,4,5,7,9,11,12,15,16,18,19,20,22,23,25)作为已知点,把其余控制点作为检核点,对拟合模型参数(α0,α1,α2,α3,α4,α5)进行求解,总体最小二乘算法与最小二乘算法求解的参数见表1。
表1 总体最小二乘算法与最小二乘算法求解的参数
通过使用总体最小二乘算法与最小二乘算法,对已知点的拟合残差与检核点的拟合残差进行求解,结果见表2。
表2 模型拟合残差 mm
已知点的拟合残差与检核点的拟合残差如图2所示。
图2 已知点与检核点的拟合残差
根据上述分析的拟合残差,对外符合精度与内符合精度分别进行了计算模拟,把单位权重误差δ0作为衡量模型内符合精度的依据,把检核点拟合的残差值中的误差作为衡量模型外符合精度的依据[8]:
(11)
表3 模型拟合的精度
由表3可知:当采用总体最小二乘法进行模拟参数推估时,其拟合精度并不是显著高于最小二乘法,但是算法的几何意义与理论意义表明,总体最小二乘算法处理数据的精度要远远高于最小二乘法[9]。推断原因可能为:矿区测量数据的精度受数据自身特征以及模型的适应性影响,因此对矿区高程异常拟合进行加权下的研究,对模型的观测量向量进行定权:
(12)
式中:di为控制点间的平面距离;Pi为元素的权值,[]表示取不大于元素的整数,根据元素的权值对角权矩阵P进行确认,利用加权最小二乘算法对模型参数进行推估;采用总体最小二乘法,对模型参数进行4次迭代,得到的参数估值见表4。
通过加权条件下的模型对模型参数进行求解,拟合点的残差见表5。
通过使用检验点拟合的残差来实现对总体最小二乘算法和最小二乘短发的方差,模型拟合精度见表6。
从表6分析可知:在加权条件下,采用总体最小二乘算法计算出的模型参数的精度要高于最小二乘算法计算出的模型参数的精度,而且在加权条件下,计算出的模型参数的精度较高,但是并不是很显著。
当对矿区高程异常进行拟合时,根据现在矿区测量要求(对观测值的精度),采用加权条件下的总体最小二乘算法,对拟合模型参数求解出的数据在精度上是远远满足要求的。
表4 加权条件下总体最小二乘法和最小二乘算法模型参数
表5 加权条件下模型拟合残差
图3 加权条件下已知点与检核点的拟合残差
表6 模型拟合的精度
3 结 语
本文总结了基于拉格朗日函数算法与奇异值分解函数的总体最小二乘算法的函数模型,分析了函数本身的特点,然后在某矿区进行应用与对比,应用得出,当对矿区高程异常进行拟合时,根据现在矿区测量要求,采用加权条件下的总体最小二乘算法对拟合模型参数的求解出的数据在精度上是远远满足要求的,研究为解决矿山测量数据存在的问题提供一定理论依据。