基于因子分析的GA-ELM模型岩溶地面塌陷预测*
2021-06-10谢静峰焦玉勇邹俊鹏毛仲敏
谢静峰 谭 飞 焦玉勇 邹俊鹏 毛仲敏
(中国地质大学(武汉)工程学院, 武汉 430074, 中国)
0 引 言
在岩溶发育地区,岩溶孔隙、洞穴等提供土颗粒运移通道和(或)储存空间,外部诱发因素直接或间接地产生的作用力将导致土体“黏粒团”坍塌、砂颗粒漏失或软弱土流失,从而引起的地面沉降变形现象,即发生岩溶地面塌陷(罗小杰等, 2018)。经调查发现,我国可溶性碳酸盐岩分布范围十分广泛,分布面积占国土面积1/3以上(蒋忠诚等, 2012),这为岩溶地面塌陷发育提供了必要的条件,加上人类工程活动的加剧,使我国成为存在严重岩溶地面塌陷问题的国家之一。我国绝大部分省市都存在岩溶地面塌陷灾害,其中桂、黔、湘、川、滇、鄂等省份尤为发育(李海涛等, 2015)。例如, 2012年5月10日上午,广西壮族自治区柳州市柳南区帽合村上木照屯发生岩溶地面塌陷灾害,此次灾害的受灾面积约100亩,造成多栋房屋倒塌(图1~图2)。
图1 5.10广西柳州岩溶地面塌陷灾害
图2 受灾现场
岩溶地面塌陷灾害频发,使各种工民建、水利水电、交通等基础工程设施受到破坏,甚至威胁人类的生命安全,带来了大量的财产损失及人员伤亡。另外,岩溶地面塌陷受各种地质因素、自然因素以及人类活动的影响,是多种因素共同作用的结果,具有突发性和隐蔽性的特点(黄强兵等, 2019),能否对其进行准确预测,将在塌陷防治中起着至关重要的作用。
岩溶地面塌陷的研究由来已久(张寿越等, 2018),各位专家学者们分别采用了理论分析(王飞等, 2017)、模型实验(张少波等, 2019)以及数值模拟(肖尧等, 2019)的方法对其进行研究,获得了较多研究成果。随着对岩溶地面塌陷形成条件、影响因素、成因机理等认识的加深,各种岩溶地面塌陷预测定性模型被提出(曾玉莹等, 2007; 高宗军等, 2009; 王滨等, 2011; 罗小杰, 2015; 罗小杰等, 2017)。随着统计学、运筹学、系统学以及计算机科学的发展,逐渐建立了岩溶地面塌陷的半定量、定量方法,如判别分析法(姜春露等, 2012)、层次分析法(王恒恒等, 2016; 苏生瑞等, 2019)、模糊分析法(陈学军等, 2017)、灰色系统理论法(蒙彦等, 2009; Ding et al.,2019)、BP神经网络法(包惠明等, 2002)、熵权云模型(陈学军等, 2019)等。这些方法都能在一定范围内对岩溶地面塌陷预测获得不错的效果,但也存在一定的不足。例如层次分析法当指标过多时,数据统计量较大,各指标权重难以确定,且具有较强的主观性; 模糊综合评判法计算较复杂,对指标权重矢量的确定主观性较强; 灰色系统理论法对历史数据有很强的依赖性,没有考虑各个指标之间的联系,误差偏大; BP神经网络结构和参数的选择复杂,同时算法收敛速度较慢。
本文综合利用因子分析、遗传算法(GA)和极限学习机(ELM)三者优势,构建基于因子分析的GA-ELM岩溶地面塌陷预测模型。首先,对选取的8个岩溶地面塌陷影响因素进行因子分析,提取出5个公因子,达到数据简化、降维的目的; 然后,将提取的5个公因子作为输入参数,构建ELM岩溶地面塌陷预测模型; 由于ELM模型的权值矩阵和偏置矩阵的随机性会对预测结果产生偏差,采用GA对ELM中的权值矩阵和偏置矩阵进行优化,构建GA-ELM岩溶地面塌陷预测模型; 最后,以实际案例进行训练及测试,证明该方法在岩溶地面塌陷预测的有效性。
1 基于因子分析的GA-ELM模型
1.1 因子分析理论
因子分析通过研究数据内部关系,对原始数据所包含的信息进行重新组合,以尽量少的公因子表征原始多变量数据的绝大部分信息,达到数据简化、“降维”的效果。每个公因子都是由原有变量线性组合而成,其相关系数由各自因子得分所决定,能有效地避免人为赋值的主观随意性。
因子分析的数学模型表达如下(张尧庭等, 2013):
xi=ci+ai1fi1+ai2fi2+…+ailfil+ei
(1)
式中:xi为样本原始数据标准化后的变量,满足零均值、单位方差的条件;ci为常数;aij称为因子荷载,是第i个变量与第j因子的相关系数,荷载越大则表示相关性越强;fi为不可观测的随机变量,表示出现在各个变量中的共同因子,即公因子;ei为残差。
1.2 ELM理论
极限学习机是一种前馈神经网络学习算法,具有单一隐含层(Huang et al.,2006)。其核心思想是随机地选取输入层权值矩阵和隐含层偏置矩阵,并在训练过程中保持不变,仅需优化隐含层神经元节点数来提高学习预测能力。传统的前馈神经网络学习算法(如BP神经网络),常因学习步长设置不当,导致算法收敛速度较慢,容易产生局部最小值,精度不够,相比之下ELM模型具有实现简单、学习速度极快、泛化能力极强和人为干预较少等显著特点(徐睿等, 2019; Huang et al.,2011)。
Hβ=T
(2)
式中:
(3)
(4)
式中:H†表示隐含层输出矩阵H的Moore-Penrose广义逆。
表1 样本原始数据
1.3 GA优化的ELM预测模型
遗传算法是模拟自然界生物进化过程中的基因交叉、组合、变异等过程(Holland, 1992),以适者生存、不适者淘汰的思想来实现对最优解的搜索,具有鲁棒性优良、全局索引能力强等优点。鉴于权值矩阵和偏置矩阵对ELM模型的预测精度影响较大,本文用遗传算法对权值矩阵和偏置矩阵进行优化,使其预测效果达到最佳。具体步骤如下:
(1)遗传算法参数的确定:种群大小、染色体长度、交叉概率、变异概率等会对GA的性能产生很大的影响,例如种群大小将影响计算速率,染色体长度影响着最优解的精度,交叉概率影响着收敛速率,变异概率决定了GA的局部搜索能力。合理的参数组合是挖掘遗传算法潜能的关键,可提高遗传算法运行效率、克服“早熟”以及尽量减小模型参数分散性(金群等, 2006)。目前常用的最优参数范围是种群大小为20~200,交叉概率为0.5~1.0,变异概率为0~0.05。
(2)初始种群的产生:在网络结构确定之后,随机产生输入层权值矩阵和隐含层偏置矩阵,作为GA的初始种群。
(3)适应度函数的计算:将随机产生的初始种群带入样本数据中,创建ELM网络,然后进行仿真测试,计算得到预测正确率,并将预测正确率的倒数作为个体适应度函数。
(4)遗传优化:以适应度函数最小为标准选择最优解,然后对初始种群进行选择、交叉、变异等操作来产生下一代种群,重复上一步骤,以此迭代直至精度达到要求或达到最大遗传代数,最后得到最优的权值矩阵和偏置矩阵。
(5)ELM模型的确定:当网络结构、权值矩阵和偏置矩阵都确定之后,ELM模型也就唯一确定。
基于因子分析的GA-ELM岩溶地面塌陷预测模型的分析流程如图3所示。
图3 预测模型流程图
2 基于因子分析的数据降维
2.1 原始数据的选择与处理
根据文献(姜春露等, 2012),桂林市岩溶地面塌陷主要影响因素有8个,包括塑性指数X1、液性指数X2、天然孔隙比X3、黏聚力X4、内摩擦角X5、覆盖层厚度X6、覆盖层厚度减高水位埋深X7、覆盖层厚度减低水位埋深X8,本文选取文献(姜春露等, 2012)中20组数据作为训练测试样本(表1)。首先对原始数据进行KMO和Bartlett检验,若KMO值大于0.6,则满足因子分析的前提条件; 若Bartlett检验对应显著性P小于0.05,则说明适合进行因子分析。通过SPSS软件计算得到原始数据KMO为0.682,P为0.000,故适合因子分析。
2.2 因子个数的确定
为了消除原始数据各变量之间不同量纲的影响,需要将数据进行标准化,使其满足零均值、单位方差的条件。将原始数据导入SPSS,对数据标准化,进行因子分析,得到各变量相关系数矩阵(表2)、各公因子方差贡献率(表3)以及表征协方差矩阵特征值随公因子变化的碎石图(图4)。由图4可知当公因子数从1~5时,特征值从3.458减小到0.341,当公因子数达到5之后,随着公因子数增加,特征值减小趋于平缓,即公因子数为5时,为特征值变化拐点,表明5个公因子已经能够反映初始变量绝大部分信息。同时,由表3可知,当公因子个数为5时,特征值累计方差贡献率达92.498%,反映出初始变量的绝大部分信息。为了以尽量少的公因子描述原始变量的绝大部分信息,所以本文将公因子个数定为5,分别定义为Y1、Y2、Y3、Y4、Y5。
表2 各变量相关系数矩阵
表3 各因子的总方差贡献
图4 碎石图
表4 公因子得分系数矩阵
2.3 因子分析的数据降维
将公因子个数设为5,利用SPSS软件计算可得公因子得分系数矩阵(表4)。各公因子是各原始变量的线性组合,由公因子得分系数可计算每个公因子的因子得分,其因子得分函数见式(5)~式(9)。
由因子得分函数可求出20个样本的因子得分情况(表5),使原本拥有8个变量的原始数据由5个公因子表征出来,以相对较小的数据维度表征了原始数据绝大部分信息,达到数据降维的效果。
表5 因子分析降维后数据
Y1=0.499X1+0.095X2+0.626X3-0.136X4+
0.010X5+0.065X6-0.001X7-0.056X8
(5)
Y2=0.049X1+0.425X2-0.118X3+0.108X4+
0.195X5-0.025X6+0.759X7+0.490X8
(6)
Y3=-0.089X1-0.750X2-0.185X3+0.488X4+
0.041X5-0.045X6-0.254X7+0.048X8
(7)
Y4=0.065X1-0.093X2-0.027X3-0.039X4+
1.004X5+0.022X6+0.213X7-0.075X8
(8)
Y5=-0.113X1-0.550X2+0.412X3-0.526X4
-0.049X5+1.164X6-0.336X7-0.453X8
(9)
3 岩溶地面塌陷预测
3.1 ELM岩溶地面塌陷预测
将因子分析后的样本中前12组数据作为训练集,后8组数据作为测试集,利用ELM模型进行岩溶地面塌陷预测。
在ELM算法中,隐含层神经元节点数会影响模型学习和预测效率,节点数过少会导致“欠拟合”,过多则会产生“过拟合”,从而对预测精度有显著影响,所以隐含层神经元节点数的确定十分重要。另外,输入层权值矩阵和隐含层偏置矩阵随机产生,故模型的单次预测结果具有一定的偶然性,较难反映真实预测精度。考虑上述两方面原因,分别以因子分析后Y1~Y55组数据、原始数据X1~X88组数据、X1~X55组数据、X2~X65组数据、X3~X75组数据、X4~X85组数据为输入层,进行了6组预测实验。每组实验中分别设置了隐含层神经元节点数从5~1000的独立实验。另外,对每次实验又独立重复进行了1000次,以消除随机性影响。分别得到训练集和测试集平均预测正确率,如图5、图6所示。
图5 训练集预测正确率
图6 测试集预测正确率
由图5可知在ELM预测模型中随着隐含层神经元节点数的增加,训练集预测正确率逐渐增加。在因子分析后,当隐含层神经元节点数为22时,训练集预测正确率即达到100%。而用原始8组变量数据和5组变量数据进行ELM预测,训练集预测正确率达到100%时需要隐含层神经元节点数分别为37和42。另外,在相同的隐含层神经元节点数的情况下,因子分析后的训练集预测正确率最大,说明因子分析不仅能使数据降维,减少输入层神经元个数,还能减少所需隐含层神经元个数,使得网络结构简化,同时在相同的情况下提高训练集预测正确率。
由图6也可以看出随着隐含层神经元节点数的增加,测试集预测正确率整体呈现增加的趋势。且在相同的隐含层神经元个数的情况下,因子分析后的测试集预测正确率明显最大,说明因子分析显著提高了测试集预测正确率。另外,当隐含层神经元节点数达到600左右,测试集正确率基本稳定,其中因子分析后的测试集预测正确率最大,达到87.5%,即基于因子分析的ELM模型测试集预测正确率最高只能到87.5%,未达到期望的100%预测正确率。通过分析认为,主要是因为权值矩阵和偏置矩阵随机性的影响,另外,训练集样本数目较少也是其中一个重要原因。
3.2 GA优化下的ELM岩溶地面塌陷预测
为了消除权值矩阵和偏置矩阵的随机性对测试集预测正确率的影响,基于因子分析后的数据,采用遗传算法(GA)对权值矩阵和偏置矩阵进行优化,以达到提高测试集预测正确率的目的。
遗传算法参数的选择对GA性能影响很大,结合前人论文经验以及实际情况,考虑计算收敛速率以及最优解精度等问题,经过多次试验,参数设置为:种群大小20,最大遗传代数100,染色体长度100,遗传代沟0.85,交叉概率0.7,变异概率0.01。另外,由前面分析可知当隐含层神经元节点数为22时,在ELM模型下训练集预测正确率达到100%,而测试集正确率约60%。考虑到网络模型的复杂程度和计算速率问题,将GA-ELM模型中的隐含层神经元节点数也设置为22。
随机产生输入层权值矩阵和隐含层偏置矩阵,作为GA的初始种群。然后创建ELM网络,以因子分析后的数据进行训练测试,计算得到预测正确率,并将预测正确率的倒数作为个体适应度函数。以适应度函数最小为标准选择最优解,然后对初始种群进行选择、交叉、变异等操作来产生下一代种群,重复上一步骤,以此迭代直至预测正确率达到要求或达到最大遗传代数,最后得到最优的权值矩阵和偏置矩阵。通过计算每次迭代预测正确率,得到其遗传进化图(图7)。由图可知,在第1代的时候,随机生成的权值矩阵和偏置矩阵,其测试集预测正确率为62.5%,与ELM模型下60%相近,随着遗传代数的增加,测试集预测正确率逐渐增加至75%、87.5%,最终在第22代之后正确率一直稳定在100%,此时的权值矩阵和偏置矩阵达到最优。
图7 遗传进化图
将最优权值矩阵和偏置矩阵代入GA-ELM模型进行岩溶地面塌陷预测,训练集预测正确率达到100%。测试集预测结果如图8所示。从图中可以看出,测试集共8个样本,ELM模型预测正确5个,正确率62.5%,GA-ELM模型预测正确8个,正确率100%,说明遗传算法优化的GA-ELM模型预测精度和泛化能力都优于单一的ELM模型,并能在样本数据较少、初始权值矩阵和偏置矩阵随机产生的情况下得到非常好的预测结果。
图8 ELM和GA-ELM测试集预测对比图
综上所述,基于因子分析的GA-ELM模型综合了因子分析、遗传算法和极限学习机模型这3种方法的优势,具有不受人为主观影响、网络结构简单、学习速度极快、泛化能力强、预测精度极高的特点,是对岩溶地面塌陷预测的一种行之有效的方法,具有一定的工程价值和推广意义。
4 结 论
本文提出了一个基于因子分析的GA-ELM岩溶地面塌陷预测模型,通过数据测试证明其是一种简单、准确、高效的预测方法,并得到以下结论:
(1)因子分析数据降维后,使得ELM网络结构简化、计算速度提高,而且在相同的隐含层神经元节点数的情况下预测正确率能显著提高。
(2)在一定范围内,随着隐含层神经元节点数的增加,ELM模型预测正确率整体呈增加的趋势,训练集正确率最高能达到100%,而测试集正确率最高只能达到87.5%。在训练集样本数较少的情况下,可以适当提高隐含层神经元节点数来提高测试集预测正确率,但这也将会造成结构复杂、计算缓慢以及“过拟合”的问题。
(3)用遗传算法对ELM模型的权值矩阵和偏置矩阵进行优化,可以在较小的隐含层神经元节点数的情况下获得较高的测试集预测正确率。相对于ELM模型,GA-ELM模型的拟合效果和泛化能力更好,预测正确率更高。