基于物理驱动深度迁移学习的薄板力学正反问题
2023-08-16唐和生何展朋廖洋洋谢丽宇
唐和生,何展朋,廖洋洋,谢丽宇
(同济大学结构防灾减灾工程系,上海 200092)
力学正反问题普遍存在于各类工程问题中,其求解方法一直为学术及工程界所关注。正问题是指已知受力状态、边界等条件来求解其力学响应;反问题是某些边界条件或者参数未知,通过获取力学物理信息来反向推演相关未知参数[1−2]。
这是一个新陈代谢的速度超乎寻常,使人稍不留神,就在熟悉的地方迷路的年代。但是一个村庄,无论如何变迁,都得留着一些标识,留着一些老树、古塔、老房子、老路、老桥和老店铺。如果这些都渐渐消失了,村庄就只是村庄,而不是与一个人骨肉相连的故乡了。
随着计算机技术的快速发展,深度学习在固体力学问题中的应用越来越广泛。江守燕等[3]基于数据驱动的神经网络实现大体积混凝土结构中缝深的无损检测,通过考察波经过带缝结构传播的信号进而预测裂缝深度。韩小雷等[4]基于RC 梁低周往复试验数据,对模型本构骨架参数和滞回参数进行辨识,并建立塑性铰RC 梁构件参数深度学习预测模型。赵林鑫等[5]基于机器学习的缺陷反演模型,建立薄板的结构动力响应和缺陷参数的映射关系,用于预测薄板结构的缺陷位置和大小信息。
物理信息神经网络是一类将物理信息(边界条件、初始条件和物理方程等)嵌入到网络结构中的深度学习模型。该模型最大的特点是在对训练数据的处理中利用了物理信息先验知识,进而使得模型具有更好的可解释性和扩展性。物理信息的存在不仅减轻了模型对大量训练数据的依赖性,同时也为模型提供了物理约束,进而提高预测精度。RAISSI 等[6]提出物理信息神经网络(Physicsinformed Neural Network, PINN)以实现常微分方程和偏微分方程系统问题的求解和参数的识别。SUN 等[7]提出了一种不使用任何标记数的流体模拟代理模型,并通过最小化流体质量和动量守恒定律损失函数来训练该模型。研究表明该模型能很好地定义和解决偏微分方程。MAO 等[8]基于PINN 来模拟高速气动流动的欧拉方程,其结果表明PINN 在传统方法难以解决的反问题上更具有优越性。SHUKLA 等[9]基于PINN 实现了金属板中表面裂纹的识别和表征问题的求解。侯龙锋等[10]基于PINN 构建了低雷诺数下的槽道流数值模型,并对槽道流的流动参数进行预测,验证该方法具有较高的模拟精度。陆至彬等[11]以具有内热源的二维稳态导热方程和平板间二维稳态对流传热方程为案例,基于软边界和硬边界两种设定方法构建PINN,验证代理模型的可信度较高。在PINN 的基础上,国内外学者相继提出了不同的改进模型,典型的有守恒型PINN(cPINN)、变分型PINNs(vPINNs)等。PINN 也因此在流体力学、材料力学等领域得到了广泛的应用[12−13]。KARNIADAKIS 等[14]研究表明PINN 模型适用于各类基础科学学科。
可以看出,对高校决算报表分析的重要性认识比较一致,这也是当前中国高校要解决好如何提供具有参考和应用价值的数据的通性问题。
力学正问题的损失函数为预测结果的损失值Lossu和物理信息约束损失值Lossr之和,如式(16)所示:
本文基于网络迁移学习策略,建立了一种基于迁移学习增强的物理驱动神经网络模型来求解矩形薄板力学正反问题。首先以深度神经网络为基础,将对应的边界条件、初始条件和控制方程等嵌入网络结构中,建立物理信息深度神经网络;其次使用源域的样本对设计好的神经网络进行预训练,保存预先训练好的网络模型;然后基于迁移学习策略,调用预训练模型及参数(权重和偏差),冻结部分网络层及参数,以保留在源域模型中的特征知识;最后通过目标域中小样本集重新训练模型,实现目标任务的求解。深度迁移学习使得模型训练更加高效,且可有效避免小样本训练过程中网络过度拟合。通过不同边界矩形薄板力学正反问题的求解,表明该方法具有良好的适应性和鲁棒性。
1 物理信息神经网络
1.1 神经网络框架
物理信息神经网络的基本框架包括神经网络逼近函数和物理信息约束两个部分(图1)。输入数据通过全连接神经网络逼近函数获得预测值。利用自动微分算法获取预测结果的物理信息残差,将其作为正则项约束放入损失函数中,利用梯度下降算法训练神经网络连接权重参数和偏差向量,直到残差达到收敛条件停止训练,进而实现对模型参数的求解和结果的预测。
图1 物理信息神经网络基本框架Fig.1 The framework of physical-informed neural network
式中:w为薄板挠度;q为薄板上均布荷载大小;D为薄板抗弯刚度;E为薄板弹性模量;δ 为薄板厚度;ν为薄板泊松比。
因此,PINN 的损失函数可表示为:
隐藏层中激活函数采用双曲正切函数,如式(4)所示:
对于所求解的偏微分方程(式(5)),需要考虑参数λ 和u(x)的共同影响:
对于不同的力学偏微分方程问题,其对应的解应满足边界条件,如式(6)所示:
对于非线性偏微分方程,利用PINN 所预测的结果应满足下式:
式中:u(x,y)为偏微分方程的解;N(•, λ)为参数λ 的非线性微分算子;Ω为欧式空间RD的子集;x和y为空间变量。
1.2 损失函数
传统物理模型是通过给定任意点(x,y)的初始状态、边界状态和物理参数λ 来求解偏微分方程。在无法获得解析解时,通常采用有限差分、有限体积等数值方法进行求解。PINN 以深度神经网络为基础,将物理信息嵌入到网络框架中,进而建立物理信息神经网络来逼近u(x,y)。其中,模型残差包含两部分:预测结果的残差(式(8))和物理信息约束的残差(式(9)):
沈侯尝了一口,“不错!你们女生可真能折腾,我们男生就用开水泡一泡。”因为锅很小,一次只够煮一包面,颜晓晨开始给自己下面,沈侯一直等着。颜晓晨说:“你怎么不吃?方便面凉了就不好吃了!”
周作人对《对话集》的深度关注,一个显在的理由是,《路吉阿诺斯对话集》所表现出的“非圣无法”的“疾虚妄”的精神。这一点周作人已在《关于路吉阿诺斯》中略有说明,他指出这二十篇译作的主题主要包括讽刺权力、宗教、迷信,以及哲学、财富等“人类欲望的空虚”等,一言以概之便是“疾虚妄”。作为一部译作,《路吉阿诺斯对话集》不仅仅具有文化价值或文学价值,应该说周作人更为看重的是它别具一格的思想价值。《路吉阿诺斯对话集》的思想驳杂,兼具健全的物理与深厚的人情之思想,和周作人的思想多所契合,构成周作人的思想核心的许多关键词在这里均可以找到,其中最关键的即是“疾虚妄”。
基于 PINN求解力学正反问题的过程如下:
1)使用参数λ 构造神经网络参数;
(1)钻进中将抓斗缓慢下放,避免泥渣淤泥积、堵死;若停止钻进应将抓斗提出孔外,钻进中控制好泥浆指标,防止塌方。
2)通过边界条件和初始条件建立损失函数;
3)通过对偏微分方程和边界条件残差求和,确定损失值;
4)通过最小化损失函数L(x; λ)求解uˆ(x,y)和λ*。
2 迁移学习
2.1 迁移学习分类
力学反问题的损失函数为偏微分方程表示的物理信息损失函数和边界条件识别的损失函数之和,如式(19)所示:
图2 迁移学习示意图Fig.2 The schematic diagram of transfer learning
根据源域和目标域之间的相关性,迁移学习方法可分为四类[22]:基于实例迁移、基于特征迁移、基于模型(参数)迁移和基于关系迁移。其中基于实例迁移是根据一定的权重生成规则,对数据样本重用进行迁移学习。基于特征迁移是通过特征变换的方式互相迁移[23]。基于模型迁移是在源域和目标域中寻找共享的模型信息,从而实现模型的迁移。基本模型迁移的基本条件为:源域任务中的数据与目标域任务中的数据可以共享部分模型的参数[24]。基于关系迁移是关注源域和目标域的样本之间的关系,借助于马尔科夫逻辑网络来挖掘不同领域之间的关系相似性[25]。
因此,医院迫切需要建立创新诊疗模式和运营模式,以应对新医疗体制改革带来的冲击和影响,通过研究新诊疗模式下的病种成本核算,以期实现提高医院精益化管理的目标。
2.2 迁移学习增强的神经网络
本文采用基于模型参数的迁移学习策略,其实现过程如图3 所示。该方法在较低层次的网络中,提取普适和共性的特征,这些特征具有高度的可迁移性[26−27]。在较高的层次中,模型特征往往具有高度特性,因此需要学习更具体的高级特征。为实现模型层面的自适应,首先利用源域数据训练模型得到原有模型的结构,在源域数据训练的模型基础之上,冻结特征提取的网络层,选择较低层次网络的参数进行保留。利用目标域数据对原有模型进行微调更新,实现释放层的重新训练,在目标域中学习新行为样本的特征,进而获得解决目标域问题的模型。
图3 迁移学习增强的神经网络示意图Fig.3 The schematic diagram of physical-informed neural network enhanced by transfer learning
将弯曲产生的应力作为力学正问题的物理信息,基于物理信息部分的损失函数如式(15)所示:
1)准备源域数据和目标域数据;
2)利用源域数据训练获得源域模型;
3)提取源域模型的神经网络层参数,冻结源域模型的参数,释放全连接层并修改输出类别;
4)利用目标域样本数据更新释放层参数,用于解决目标域问题。
3 基于深度迁移学习求解矩形薄板力学正反问题
通过PINN 解决工程领域的力学问题的一个主要瓶颈在于需要为不同的问题采集大量的数据,训练成本巨大。为了解决这个问题,本文提出迁移学习增强的PINN。首先,冻结源域问题的前L-1层网络结构,保留其参数和权重,释放第L层的参数进行训练。其次,第L层训练得到的预测结果,计算其物理信息,将模型数据驱动的损失值和物理信息的损失值求和得到总的损失值。最后,将损失值进行反向传播继续训练释放层的参数,直至模型精度达到要求。以两边简支两边固支的物理信息神经网络为源域模型,采用迁移学习的方法对四边简支、四边固支的目标域问题进行求解。其中,薄板的挠度预测为力学正问题,对于边界的识别为力学反问题。
3.1 力学正问题
基于弹性薄板理论建立矩形薄板弯曲基本方程[28],如下:
ICR小鼠64只,5周龄,在标准小鼠笼内饲养,给予标准食物和水,饲养温度(22±2)℃。动物由北京维通利华实验动物技术有限公司提供,医学动物合格证书号:SCXK(京2012-0001)。
如图1 所示,该模型是一个 Rdin→Rdout的L层神经网络,由输入层、隐藏层和输出层组成。第一层为输入层,输入训练数据如式(1)所示;隐藏层的第L层有N个神经元,第L层权重矩阵和偏差向量是wI∈RNT×NT−1和bI∈RNT,损失值通过前反馈算法进行传递,每一层通过式(2)为下一层创建数据;输出层为全连接层,通过式(3)生成预测结果:
矩形薄板各点的本构关系如式(13)所示:
力学正问题的研究是通过已知参数和相应边界条件求解结构的力学响应。本文将应力-应变本构关系引入到损失函数中,基于PINN 求解矩形薄板力学正问题,网络模型的输出值为矩形薄板各点挠度大小。结合薄板弯曲基本方程式(11),基于数据驱动部分的损失函数为Lossu,如式(14)所示:
式中:w*为矩形薄板挠度的精确值;w为矩形薄板挠度的预测值。
基于迁移学习的求解过程如下:
还有个有趣但并不严谨的统计,那就是在遇见她的日子里,我考试的平均分数比较高。这或许意味着让我成绩进步的最佳解,便是提高上学时遇见她的机率。
尽管如此,基于PINN 方法实现工程结构设计优化过程中物理场的快速仿真(正问题)与精确反演(反问题)仍是一项具有挑战性的任务,其主要原因是关于复杂结构系统的有效实验数据数量十分有限。迁移学习是深度学习中的一项重要技术,其通过将源域任务的特征知识迁移至目标域任务,从而使目标域任务具有更高的效率和精度。该方法可用于解决小数据问题(源域中有足够的标记数据,而目标域中只有少量标记数据的情况)和增强神经网络的鲁棒性[15−16]。CHAKRABORTY[17]基于迁移学习和物理-数据驱动的深度学习技术,成功将求解低保真度问题所获得的特征知识转移并用于求解高保真度问题。HAGHIGHA 等[18]基于有限元模型划分稀疏网格生成小数据集,通过再次训练预训练网络模型实现数据解和参数的快速收敛,验证了迁移学习在物理信息神经网络框架中的适用性,并发现在网络再培训过程中大大加快了收敛速度。GAO 等[19]基于神经网络的迁移学习,利用相对较少的图像标记建立起结构损伤识别方法,实现包括结构部件类型确认、剥落状态检查、损伤等级评估和损伤类型的判定。
3.2 力学反问题
力学反问题是已知部分解的信息,来确定模型中部分未知参数,即对结构的未知参数进行识别。假设矩形薄板的力学反问题识别参数为λ,对未知参数的识别可以表示为下列最优化的问题:
本文利用矩形薄板在均布荷载作用下若干点的挠度和已知的材料参数,识别薄板的四条边界条件。为了对边界进行有效的识别,引入四个参数α1、α2、α3、α4,分别代表矩形薄板四边支撑的边界条件,损失函数采用交叉熵损失函数,通过对四个未知参数的识别实现对矩形薄板边界条件的识别(式(18)):
式中:i为四个边界条件;j为训练边界上各点位移的样本数。
设数据对象In经过n个处理步骤Pr1,Pr2,,Prn,演变为数据对象Out,则Out从In开始的数据世系可表示为
在传统机器学习场景中,对于两个相关领域,通常需要两个标记数据集来分别训练两个模型。该方法忽略了领域之间的相似性,导致计算效率较低。工程领域中的标记数据具有样本小、维度高、稀疏等特征,易导致传统机器学习模型过度拟合,且泛化能力较差、适用范围有限。通过迁移学习,将一个领域已存“知识”运用到一个新的相关领域,对不同但相关领域问题进行求解,放宽了传统机器学习必须具有足够的训练样本才能得到一个好的训练模型的限制[20−21]。迁移学习的实现过程如图2 所示,首先利用大量的标记数据训练源域模型,将训练源域模型获得的特征知识迁移至目标域模型中,使用少量的标记数据对目标域进行训练,从而避免了获取大量数据的成本。
以柠条塔煤矿S1200-Ⅲ综掘工作面为对象,运用Fluent软件进行流体分析[16],得到风流场的原始场数值模拟下的运移分布,如图2所示。
4 算例分析
4.1 矩形薄板力学正问题
以矩形薄板在均布荷载q作用下的问题为例,选取材料参数:弹性模量E=1000 GPa、泊松比ν=0.25、均布荷载q=1 kPa、面板长度a=b=1 m,厚度取单位尺寸。x表示横轴,y表示纵轴,空间坐标系建立如图4 所示。
图4 矩形薄板受均布荷载作用示意图Fig.4 Schematic diagram of rectangular thin plate under uniformly distributed load
基于PINN 求解矩形薄板的力学正问题,训练数据为20×20 均匀划分薄板的挠度数据,神经网络一共四层隐藏层,每层隐藏层40 个神经元,每批次训练样本大小为32,优化器采用Adam,学习率为0.001,迭代次数为1000 次,求解力学正问题的网络结构如图5 所示。
图5 力学正问题的网络结构示意图Fig.5 The schematic diagram of the neural network for solving forward mechanics problems
对于两边简支两边固支矩形薄板问题,利用20×20 数据集进行模型训练,训练迭代过程如图6 所示,其中模型在500 代左右逐渐迭代收敛。矩形薄板的精确结果和预测结果如图7 所示,预测结果的挠度分布规律与精确结果一致。精确结果和预测结果的误差值如图8 所示,最大误差为0.08%,模型的预测精度较高。
图6 迭代收敛曲线(两边简支+两边固支板)Fig.6 The curve of iterative convergence (Simply supported plates on both sides and fixed plates on both sides)
图7 挠度预测值与精确值对比(两边简支+两边固支板)Fig.7 A comparison between the predicted value of deflection and its exact value (Simply supported plates on both sides and fixed plates on both sides)
图8 误差分布(两边简支+两边固支板)Fig.8 The distribution of error (Simply supported plates on both sides and fixed plates on both sides)
采用迁移学习方法求解矩形薄板的力学正问题,通过20×20 的数据训练得到两边简支两边固支矩形薄板的模型(源任务),其网络结构共有四个隐藏层。四边简支和四边固支力学正问题(目标任务),训练数据为划分网格10×10 点的挠度,数据量为源域模型的四分之一。源任务和目标任务的训练数据分布不同,训练数据集的规模不同,但两者的输出预测指标相同。采用模型迁移策略[26],冻结隐藏层之间的偏置和权重,释放最后一个网络层和全连接层参数,使用少量数据求解目标任务。
基于迁移学习模型求解四边简支问题的迭代收敛曲线如图9 所示,迁移学习方法的初始损失值较小,模型的迭代收敛速度更快;薄板的挠度精确结果和预测结果如图10 所示,挠度的分布规律基本一致;预测结果的损失值如图11 所示,迁移学习训练输出的目标域模型误差为0.3%。
图9 不同网络模型迭代收敛曲线(四边简支板)Fig.9 Iterative convergence curves of different network models (Simply supported plates on four sides)
图10 挠度预测值与精确值对比(四边简支板)Fig.10 A comparison between the predicted value of deflection and its exact value (Simply s upported plates on four sides)
图11 误差分布(四边简支)Fig.11 The distribution of error (Simply supported plates on four sides)
基于迁移学习模型求解四边固支问题的迭代收敛曲线如图12 所示,薄板的挠度预测如图13所示,薄板预测的损失值如图14 所示。
图12 不同网络模型迭代收敛曲线(四边固支板)Fig.12 Iterative convergence curves of different network models (Four sided fixed support plate)
图13 挠度预测值与精确值对比(四边固支板)Fig.13 A comparison between the predicted value of deflection and its exact value (Four sided fixed support plate)
图14 误差分布(四边固支板)Fig.14 The distribution of error (Four sided fixed support plate)
经过收敛情况和计算结果的对比,可以看出基于迁移学习求解板的正问题,训练数据量为原来源域模型的四分之一,迭代的初始损失值较小,迭代收敛效果良好且模型预测精度不下降,这表明迁移学习方法对于解决小样本数据的矩形薄板力学正问题具有良好的精度和泛化能力。
2.1 实用性和可操作性 即确定的指标应能切实反映护理质量的核心,能合理解释护理质量现象,同时应考虑到质量管理的成本因素。指标的概念和原理要便于理解,指标的计算公式、运算过程也要简单实用。
4.2 矩形薄板力学反问题
以受均布荷载作用的矩形薄板问题(两边简支+两边固支)为例(源任务),基本的物理参数与正问题的相同。考虑到反问题的边界条件和挠度分布等比较复杂,选择隐藏层为8 层,每层40 个节点的网络进行训练。固支边界理论值为0,简支边界理论值为1。取薄板固支边界为x=0、y=0,简支边界为x=a、y=b,设定四个边界参数的初始值均为0.5。边界条件示意图如图15 所示。
图15 两边简支两边固支薄板示意图Fig.15 The schematic diagram of simply supported plates with fixed supports on both sides
划分20×20 的网格挠度数据训练并预测矩形薄板各点挠度和四条边界条件(源任务),模型的训练迭代过程如图16 所示,该模型的迭代收敛速度较快,矩形薄板的边界参数识别结果如表1 所示,边界识别结果较为准确。
表1 矩形薄板边界参数预测结果(两边固支两边简支板)Table 1 Predicted values of boundary parameters for the thin rectangular plate (Simply supported plates with fixed supports on both sides)
图16 模型挠度迭代收敛曲线(两边固支两边简支板)Fig.16 The curve of iterative convergence (Simply supported plates with fixed supports on both sides)
四边简支和四边固支薄板的识别问题(目标任务),划分网格10×10。基于模型参数迁移的方法,释放源域模型的最后一个网络层和全连接层,对目标任务进行求解。对四边简支矩形薄板的四个边界参数进行初始化,其初始值均为0.5,利用10×10 的数据训练并预测矩形薄板四条边界条件。四边简支板的反问题迭代过程如图17 所示,边界条件的识别结果如表2 所示,基于迁移学习的训练模型损失值更小,迭代收敛速度更快,且精度不发生下降。
表2 矩形薄板边界参数预测结果(四边简支板)Table 2 Predicted values of boundary parameters for the thin rectangular plate (Simply supported plates on four sides)
图17 不同网络模型挠度迭代收敛曲线(四边简支板)Fig.17 Iterative convergence curves of different network models (Simply supported plates on four sides)
基于迁移学习模型求解四边固支板的反问题迭代收敛过程如图18 所示,边界条件的识别结果如表3 所示。
表3 矩形薄板边界参数预测结果(四边固支板)Table 3 Predicted values of boundary parameters for the thin rectangular plate (Four sided fixed support plate)
图18 不同网络模型挠度迭代收敛曲线(四边固支板)Fig.18 Iterative convergence curves of different network models (Four sided fixed support plate)
通过收敛情况和计算结果的对比,基于迁移学习求解力学反问题过程中,使用的数据量为原来的四分之一。在满足模型预测精度的要求下,模型的初始损失值减少,模型的收敛速度提高。
4.3 模型能力对比
本文以两边简支两边固支物理信息神经网络为源域模型,基于模型参数迁移方法求解四边简支、四边固支目标域问题。源域模型采用20×20的数据进行训练,基于迁移学习对目标域问题采用10×10 的数据进行训练,表4 对比两种方法求解力学正问题的结果,可以看出,目标域问题在训练数据样本减少的情况下,训练输出的模型精度不发生下降。表5 对比两种方法求解力学反问题的结果,唐明建等[29]采用20×20 的数据求解得到两边简支两边固支力学反问题的平均误差为4.93%,迁移学习训练输出的目标域误差在5%以内,模型的预测精度较高且泛化能力较强。
利用二极管的寄生电容,通过增加电路系统方程的维数从而实现整体电路系统方程的建模,进而对提出的电路进行动力学分析,研究系统随控制参数变化下的动力学行为。
表4 力学正问题计算误差对比 /(%)Table 4 Comparison of calculation errors of mechanical forward problems
表5 力学反问题计算误差对比 /(%)Table 5 Comparison of calculation errors of mechanical inverse problems
5 结论
本文建立了一种基于迁移学习增强的物理驱动深度网络模型,用于解决数据稀疏的力学正反问题。在此基础上利用PINN 和迁移学习方法,对不同边界条件的矩形薄板力学正、反问题进行了求解。通过对矩形薄板挠度响应的预测及其边界条件的识别,验证了PINN 的有效性和准确性。基于迁移学习构建目标域问题的预测模型,采用少量训练数据求解了四边简支和四边固支矩形薄板的力学正反问题。研究结果对于解决训练数据量不足的实际问题具有重要意义。本文的主要结论如下:
德国足球长期居于世界领先地位,不仅与德国足球的技战术水平有关,也与德国长期注重青少年校园足球运动的开展相关。德国足协采用了学校、俱乐部、地方足协三方合作的模式来开展青少年足球运动。德国足协一共建立了 380 多个校园足球基地。为了提高实际成效,德国足协并非采取均等资助的方式,而是对德国东北部地区的部分学校给予重点资助。足协与学校密切协作,制定特别的选拔制度,对青少年的运动技术水平和竞赛潜能进行科学、动态的测量评定。同时,对不同年龄、学段的青少年学习均有相应的标准要求。完善的政策制度保证了青少年足球人才培养的科学与合理。这些政策经验对我国校园足球政策的完善有积极的启示价值。
(1)以两边简支、两边固支边界的PINN 模型为源域模型,基于迁移学习方法对四边简支、四边固支的目标域问题进行求解。建立的代理模型预测结果与真实值吻合度良好,挠度预测的最大误差绝对值为4.84%,表明PINN 模型具有较高的精度,证明了PINN 具有构建高精度代理模型的能力。
(2)使用迁移学习将源域的模型参数迁移到目标域的模型,采用源域模型四分之一的数据实现了挠度预测和边界识别。对于四边简支和四边固支的力学问题,训练的数据量大大减少,预测效率提高且精度不下降。这表明模型具有良好的精确性、鲁棒性和泛化能力。对于解决数据收集成本高、数据采集困难的工程问题具有重要意义。