基于马尔科夫链的曲线拟合法在尾矿坝沉降预测中的应用
2021-10-25汪宏宇龚循强鲁铁定陈志平
汪宏宇,龚循强,2,鲁铁定,陈志平
(1. 东华理工大学 测绘工程学院,江西 南昌 330013;2. 东华理工大学 放射性地质与勘探技术国防重点学科实验室,江西 南昌 330013)
尾矿坝是矿山生产中的重要组成部分,也是矿山中潜在的重大事故源之一(魏勇等,2009;冯大福,2011;关联合,2014;许延春等,2018)。尾矿坝承担着囤积尾料,保证矿山正常作业并保护周边环境的重要角色。受温度、降雨等诸多因素的影响,尾矿坝在运作过程中会出现不同程度的坝体变形。当尾矿坝变形达到一定程度时,容易引起溃坝事故,从而造成尾矿流失,严重破坏下游地区的生态环境,并对人民群众的生命财产安全带来极大危害(魏勇等,2009;周振民等,2012)。因此,针对尾矿坝这一安全屏障进行实时监测,并做出有效的预报,能够较好地保障尾矿坝的正常运作与维护。
目前,针对尾矿坝的沉降预测方法主要有曲线拟合法、马尔科夫模型、灰色预测法和神经网络法等,其中曲线拟合法主要有指数曲线法、Logistic曲线法、三点法和双曲线法等(龚循强等,2014;黄定川等,2016;Gong et al.,2018;Uy et al.,2018)。灰色预测法是通过对数据进行累加处理,削弱数据自身波动性的影响,以此反映数据的变化趋势,但因其无法考虑系统的随机性,在中长期预测中表现较差(周清等,2015;吴定邦,2017;Zhou et al.,2020)。而神经网络有良好的自学习能力,能较为准确地反映输入与输出变量之间的关系,拟合效果好,但其结果受原始数据精度制约,也更为复杂(He et al.,2018;薛光辉等,2019;张帆等,2019)。
虽然指数曲线法和Logistic曲线法等曲线拟合法建模过程简单,易于操作,但是预测结果往往过分依赖于实际数据,容易陷入局部最优(刘传立等,2013)。尾矿坝沉降是一个复杂的过程,因此采用组合预测模型能够改善单一预测模型的拟合效果。马尔科夫链(MC)具有无后效性及不过分依赖历史数据等特点,在多因素引起的预测中有着较好的表现(杨峰峰等,2019;El-Khawaga et al.,2020)。因此,笔者结合曲线拟合法与马尔科夫链的特点,提出一种基于马尔科夫链的曲线拟合法,以使预测方法简单易用和提高预测精度。通过实际工程案例,与传统的曲线拟合法、后向传播(BP)神经网络(郭昊坤等,2012;Zhang et al.,2019)和基于遗传算法(GA)的BP神经网络(GA-BP神经网络,冯绍权等,2019)的比较分析,验证了提出方法的准确性与可靠性。
1 基于马尔科夫链的曲线拟合法
1.1 曲线拟合法
本研究选取曲线拟合法中较有代表性的指数曲线法与Logistic曲线法进行拟合(张吉春等,2016)。
1.1.1 指数曲线法
指数曲线法是假定所给的时间样本序列满足指数函数的形式对其进行曲线拟合,其表达为:
St=(1-Ae-Bt)Sm
(1)
式中,A、B为待解算参数,Sm为最终沉降量,St为t时刻沉降量。
1.1.2Logistic曲线法
Logistic曲线模型,又称其为Logistic生长模型,常用于表达系统的生长演化过程,函数曲线总体呈“S”形。Logistic曲线的“S”形能很好地表达研究对象从“出生”,到“生长”,最终“成熟”直至趋于平稳的过程,Logistic曲线的积分公式为:
(2)
式中,a、b、c为待解算参数。
1.2 马尔科夫修正模型
马尔科夫链是一种无后效性的随机过程,具有这种未来状态只依赖于当前状态的过程称为具有马尔科夫性质。多数时间样本序列都具有马尔科夫性质,利用这种性质通过目标不同的起始状态与状态转移概率预测未来状态,可以提高预测模型的精度(Zhang et al.,2019)。
1.2.1 状态空间划分
指数曲线法、Logistic曲线法得到预测结果后,根据预测结果相对误差的大小,将相对误差区间划分为n个状态(即S1,S2,…,Sn),其计算公式为:
(3)
(4)
式中,EVEN(·)函数是沿绝对值增大方向取最接近的偶数,ε是残差序列,d是最大残差与最小残差之差。
1.2.2 状态转移概率矩阵
相对误差从Si经k时步状态转移到状态Sj的概率为(冯绍权等,2019):
(5)
式中,Mij(k)是Si经k时步状态转移到状态Sj的次数,Mi是相对误差在状态Si出现的次数。
由转移概率组成的矩阵称为转移概率矩阵,转移概率矩阵能反映状态一步转移或多步转移中的潜在规律,根据已知状态预测未知状态。转移概率矩阵满足元素非负性、并且各行元素之和为1。其矩阵形式为:
(6)
假设当前状态为Si,在转移概率矩阵的第i行中,Pij为该行中的最大值,那么下一时刻状态Sj出现的可能性最大,将其作为相应的预测结果。
1.2.3 修正预测值
通过所得预测状态区间对曲线拟合模型的预测值进行修正,选取区间中点进行计算,其公式为:
(7)
式中,f(x)为原始模型预测值,Δmax、Δmin分别为相对误差状态区间的上下限值。
1.3 精度评定
为了直观反映指数曲线法、Logistic曲线法的马尔科夫修正结果的拟合精度,采用误差绝对值均值(mAE) 、平均绝对百分误差(mAPE) 和均方根误差(rMSE)作为精度评定的指标。
mAE的计算公式为:
(8)
mAPE的计算公式为:
(9)
rMSE的计算公式为:
(10)
式中,M为样本总数,zi为实测值,yI为预测值。
2 算例分析
本文以文献(黄定川等,2016)中某尾矿坝的沉降监测数据为例,此尾矿坝共布设了8个水准点,尾矿坝垂直沉降监测采用水准仪按一定的周期完成。本研究选取观测数据中具有代表性的2个监测点,即沉降量最大的A7点,沉降量最小的A1点。将这2个点前16期的沉降数据作为研究对象。将1至12期数据作为模拟数据,预测13至16期数据,4种单一预测方法的模拟值如表1所示,其误差如表2所示。
表1 四种单一预测方法的模拟沉降值Table 1 Simulated settlement values by using four single prediction methods
表2 四种单一预测方法在模拟区间上的误差Table 2 Errors of simulated values by using four single prediction methods
以指数曲线法预测A1点的沉降数据为例,具体介绍基于马尔科夫链的曲线拟合模型的建模过程。根据指数曲线法计算出1至12期模拟值,并由式(3)将相对误差区间划分为4个状态空间,即S1(-10.53%,-5.53%)、S2(-5.53%,-0.53%)、S3(-0.53%,4.47%)和S4(4.47%,9.47%)。划分状态后,根据式(5)和式(6)得到状态转移概率矩阵P。再根据第12期模拟值所处状态为S2与一步转移概率矩阵可判断第13期数据最有可能处于状态S3,即由式(7)可得第13期马尔科夫指数曲线预测值。同理,可得第14、15和16期预测值。将建立的2种基于马尔科夫链的曲线拟合法和其他4种单一预测方法的结果与实际监测值进行比较,6种预测方法的预测结果见表3。
表3 各种预测方法的预测值Table 3 Predictive values by using various prediction methods
从表3可以看出,采用了马尔科夫链的组合预测模型的预测值更接近实际监测值,2种基于马尔科夫链的曲线拟合法预测效果都要优于单一的曲线拟合法。此外,GA-BP神经网络的预测结果优于BP神经网络。为更客观地比较曲线拟合法(即指数曲线法和Logistic曲线法)、基于马尔科夫链的曲线拟合法、BP神经网络和GA-BP神经网络的预测结果,分别计算各种预测方法的mAE、mAPE、rMSE,结果见表4。
表4 各种预测方法的预测精度对比Table 4 Comparison of prediction accuracy by using various prediction methods
由表4可得,基于马尔科夫链的曲线拟合法和GA-BP神经网络的预测精度均比其单一的传统模型更好,其中MC-Logistics曲线拟合法的3个精度指标都优于GA-BP神经网络,MC-指数曲线法总体上优于GA-BP神经网络,但A1点的rMSE指标稍差于GA-BP神经网络。综合分析6种沉降预测方法可以得出,基于马尔科夫链的曲线拟合法的预测值更接近于实际监测值,精度明显优于单一的曲线拟合法。尾矿坝沉降是一个受多因素影响复杂过程,而马尔科夫链在随机波动大的时间序列预测中有一定的优势,利用这种优势对曲线拟合模型的预测结果进行修正,实现模型间的优势互补。进一步分析发现,MC-Logistic曲线拟合法在A1和A7点的两组监测数据中预测精度均优于GA-BP神经网络,mAE、mAPE和rMSE这3个精度指标在A1点分别提高了21.239%、19.373%和13.333%,在A7点则提高了37.825%、38.274%和30.889%,可见采用马尔科夫链能够有效提高曲线拟合法的预测精度。
3 结论
为了建立尾矿坝沉降预测方法,通过分析现有方法的不足,结合马尔科夫链优化传统曲线拟合法,提出一种基于马尔科夫链的曲线拟合法,实现组合预测模型的优势互补。采用实际工程数据,进行尾矿坝沉降的模拟与预测,通过与传统曲线拟合法以及BP神经网络、GA-BP神经网络的比较分析表明,在短期预测中基于马尔科夫链的曲线拟合法在保留原始模型建模简单、易于操作的特点的同时,预测精度也得到了有效地提高,验证了提出方法的准确性。