人工神经网络技术及其在岩土工程领域的应用
2021-04-28张杨杨隋天雨崔敏睿李奕臻
张杨杨,隋天雨,裴 俊,崔敏睿,李奕臻
(1.中国矿业大学,江苏 徐州221116;2.中国石油大学(北京)克拉玛依校区,新疆 克拉玛依834000)
实现人工智能(Artificial Intelligence,AI)是人类长期以来共同追求的目标[1]。特别是21世纪以来,人工智能领域持续升温[2]。作为AI的一个重要分支,人工神经网络(Artificial Neural Network,ANN)是基于模仿生物大脑的结构和功能而构成的一种信息处理系统,可以代替人脑有效地处理一些复杂问题,从而推动AI的发展。ANN是由大量处理单元即神经元互连而成的网络,也常简称为神经网络或类神经网络[3]。
本文首先介绍了反向传播(Back Propagation,BP)与径向基函数(Radial Basis Function,RBF)两种发展较成熟、应用较广的ANN模型理论;其次介绍了与机器学习、深度学习有关的卷积神经网络(Convolutional Neural Networks,CNN)相关的ANN模型理论;再次介绍了ANN在岩土工程领域的应用,包括预测与监控等;最后给出对ANN的总结与展望。
1 BP与RBF神经网络模型
1.1 BP神经网络原理与设计过程
BP神经网络是最传统的神经网络,也是目前应用最广泛的神经网络。其模型的拓扑结构包括输入层、隐含层和输出层。相邻层之间各神经元全连接,而同一层各神经元之间无连接[4]。图1为BP神经网络模型的拓扑结构示意图。
图1 BP神经网络模型的拓扑结构示意图
该神经网络的原理是先通过激活函数,结合阈值修正的线性加权和将各层连接起来;再根据所给的训练样本输入向量和输出向量,不断学习并调整神经元之间的连接权值与阈值,使网络不断逼近样本输入向量和输出向量之间的映射关系。其训练过程实质上是信息正向传播与根据误差逆向修正权值和阈值的过程。
网络的设计过程无非是数据的输入与输出及反馈修正参数。输入的数据常为对系统模型关键影响的自变量,在输入前通常要进行标准化处理和归一化处理。
各层之间数据输入与输出的过程以第i个神经元为例,说明数据输入与输出的具体步骤。设x1,x2,…,xi为神经元的输入,ω1,ω2,…,ωi为对应连接权值,θi为阈值,y=f(x)为激活函数(常采用sigmod()函数)。则该神经元的输出表达式为
根据BP神经网络原理,数据从输入层传递到隐含层再传递到输出层,这时就可以得到神经网络的训练输出为y'=(y1',y2',…,yi'),y'是权值的函数。假设真实的输出是y=(y1,y2,…,yi),则可得到训练误差ε,通常用最小二乘法进行表示,其表达式为
可知ε也是权值的函数。接着采用梯度下降法,常借助编程,多次迭代使误差ε最小。在实际操作中,可设置误差小于一定值时终止递归,也可以设定迭代次数。这样,BP神经网络的设计就完成了。但是面对一些复杂的问题,BP神经网络收敛速度慢,需要的训练时间可能非常长,还有可能会陷入局部极小值,这时通常要对原模型进行修正,RBF神经网络就是解决方法之一。
1.2 RBF神经网络原理
严格来说,RBF神经网络是BP神经网络的一种特例,同样包括输入层、隐含层、输出层。但从输入层到隐含层的变换采用了RBF,是非线性的;从隐含层到输出层则采用线性加权和,是线性的。RBF是一种局部非线性逼近的神经网络[5]。
RBF是一个取值仅仅依赖于离原点距离的实值函数,标准距离一般使用欧氏距离(也叫做欧式RBF),通常采用高斯核函数,其表达式为
式中:xc为核函数中心;σ为函数的宽度参数,控制了函数的径向作用范围。RBF神经网络最大的特点是用RBF作为隐单元的“基”构成隐含层空间,这样就可以将输入向量直接映射到隐含层空间,而不需要通过权值的连接。RBF的作用就是采用核函数的思想,将低维数据转化为线性可分的高维数据。通过这种变换,神经网络仅有隐含层、输出层间的权值,且可通过线性方程组直接求解,这样可大大加快学习速度,进一步避免局部极小值问题。
1.3 BP与RBF神经网络的区别
1)结构上,BP神经网络可以有多个隐含层,而RBF网络只有一个隐含层。
2)理论上,已经证明RBF神经网络是连续函数的最佳逼近,而BP神经网络不是[6]。
3)实际运算上,RBF神经网络的训练速度比BP神经网络快,原因如下:一是因为隐含层只有一层;二是因为局部逼近可以简化计算量。当输入数据时,只有该输入局部的神经元会有响应,故其他权值通常可近似为0,大大简化计算。
2 卷积神经网络(CNN)模型
2.1 CNN的概念
CNN是一类包含卷积计算且具有深度结构的神经网络,是最重要的流行深度学习算法之一[7]。CNN同普通ANN一样,要经过数据正向输入、判断、输出以及逆向参数调节进行训练。但是CNN特有的结构,包括隐含层的卷积层、池化层以及全连接层,使其具备了局部感知、权值共享的特性,从而极大地减少了参数数量,进一步可以高效率地进行高维数据运算,广泛应用与各行业的图像识别领域。图2为卷积神经网络模型的拓扑结构示意图。
图2 卷积神经网络模型的拓扑结构示意图
其中,隐含层的卷积层、池化层是保证卷积神经网络特征功能实现的核心结构。CNN隐含层的前半部分的由卷积层与池化层交替组成;后半部分则采用全连接层。输出层的前半部分通常也采用全连接层,对于图像分类问题,输出层使用逻辑函数或归一化指数函数即softmax()。卷积及池化作用理论较为复杂,下节具体展开;全连接层主要作用则是将上一层提取到的特征结合在一起,再进行分类。
2.2 CNN卷积计算与池化层理论
卷积层的作用是提取输入数据的特征,通过不同卷积层的不同卷积核,可以提取原数据不同方面的特征。要理解卷积运算并非易事,可以先将卷积运算视为图像处理中的滤波器运算。卷积运算作用是提取或捕捉原输入数据的特征。
假设输入数据为一个m×n的矩阵X,卷积核为一个i×j的W(i≤m,j≤n)。则运算的过程为:卷积核W中的每一个权值ω分别和输入矩阵X中所对应的x相乘后再求和,计算公式为
卷积运算的全部过程由很多上面的运算组成:卷积核以一定的间隔滑动,并对所覆盖的区域进行运算,得到输出y,直到遍历矩阵X。
某一卷积运算为例,输入矩阵X=,卷积核],输入矩阵]。其卷积核W的9个元素与输入矩阵X的16个元素中的9个元素进行卷积运算,滑动4次则运算完成,输出一个二维矩阵。
池化层的作用是在卷积层的基础上,进一步提取特征。运算方法较为简单,分为两类最大池化层和平均池化层,前者以矩阵的最大值为特征值,后者以平均值为特征值。
3 岩土工程领域ANN的应用
岩土工程领域作为基建支柱型行业,在如今AI飞速发展的时代迫切需要进行产业升级。神经网络技术应用到岩土工程领域是中国AI前进的重要一环。目前神经网络应用已在岩土工程领域逐步开展,主要应用于岩性识别、地质预警、基坑工程沉降变形预测(采用BP,RBF)、隧道识别检测(采用CNN)等。本文重点介绍基坑和隧道的应用。
3.1 基坑变形神经网络预测模型
基坑的研究在岩土工程领域极为重要。通常要保证施工周期内基坑的围护结构变形与周围地表沉降在安全范围内。施工时,一般要对围护结构进行位移监测,对周围地表进行沉降监测。但只依靠监测工作是远远不够的,这只属于事中控制,如果等到监测值达到控制值时再寻求解决变形值过大的办法就已经太晚了[8],这就要求事先进行预测。
影响基坑变形的因素非常复杂,难以使用传统的力学方法对施工周期内的变形进行准确预测,神经网络的发展一定程度上解决了这个问题。早在1993年,Abedi H等[9]在将BP网络应用于软土基坑支护结构位移的预测上并起到了很好的作用。1999年,同济大学的冯紫良等[10]也成功地利用BP神经网络完成了基坑施工中的预测工作,开启了神经网络在基坑预测应用的先例,并解决了大量难题。2009年,王宁等采用RBF神经网络进行预测,也取得了不错的结果。
目前,基坑预测神经网络结构的输入常取基坑开挖深度、土体的内摩擦角、土体粘聚力、土体重度、地下水位等,根据实际情况选取隐含层神经元数目;输出通常采用围护结构位移和地表沉降量。同时,有些学者为了验证神经网络的训练精度,常采用有限元模拟检验。
3.2 隧道神经网络模型
目前我国已成为修建隧道最多的国家,随之而来的也包括一系列的超欠挖、塌方等难题。传统的检测方法费时费力,故在深度学习兴起之后,CNN模型迅速应用于隧道掘进机(Tunnel Boring Machine,TBM)与钻爆法等隧道施工中,常用于地层识别和隧道检测。
在TBM隧道施工中,地层识别的方法有观察掌子面、岩渣识别等。一方面,采用CNN对掌子面进行观察评价具有耗时短、反馈及时的优点;另一方面,可建立对岩渣自动识别的CNN模型,借助其强大的图像识别功能来获取前方的地层地质特性,进一步判断前方地质有无塌方、断层等风险。
在钻爆法隧道施工中,岩体本身的裂隙及爆破的参数对隧道安全性有很大影响。刘春等[11]研究表明,通过建立CNN模型可更加科学、高效地提取岩土裂隙形态参数,为隧道岩体裂隙的定量分析和评价提供了可靠依据。张万志[12]通过炮孔图像采集、改进CNN、现场监测等方法,实现了爆破参数的智能优化,并进行了工程应用,取得了较好的效果。
4 结束语
本文介绍了BP,RBF,CNN一系列ANN技术,并着重阐述了相关网络的基本理论及其在基坑、隧道中的应用。在未来发展中,可以根据实际工程问题,采用各种优化算法继续改进ANN模型,或者通过ABAQUS等有限元软件建模检验ANN模型的精确性。希望ANN技术能够进一步发展,在岩土工程领域得到更广泛的应用,推动中国AI的前进。