基于物理信息神经网络的光波衍射问题求解
2024-05-15陈旭早袁利军
陈旭早 袁利军
摘要: 用物理信息神经网络方法数值求解间断系数光波衍射问题. 结果表明: 用光滑函数近似间断系数可大幅度提高物理信息神经网络求解精度; 用物理信息神经网络求解散射场比直接求解总场效果更好. 最后通过数值实验验证理论结果的正确性.
关键词: 物理信息神经网络; 光波衍射; 间断系数; 光滑函数
中图分类号: O436文献标志码: A文章编号: 1671-5489(2024)02-0423-08
Solving Light Wave Diffraction Problem Based onPhysics-Informed Neural Networks
CHEN Xuzao, YUAN Lijun
(School of Mathematics and Statistics, Chongqing Technology and Business University, Chongqing 400067, China)
Abstract: We used the physics-informed neural networks method to numerically solve the problem of discontinuous coefficient light wave diffraction. The results show that approximating the discontinuous coefficient with a smooth function can significantly improve the accuracy of the physics-informed neural network solution. Using physics-informed neural networks to solve the scattered field is better than directly solving the total field. Finally, the correctness of the theoretical results is verified through numerical experiments.
Keywords: physics-informed neural network; light wave diffraction; discontinuous coefficient; smooth function
物理信息神经网络(PINN)方法广泛用于数值求解偏微分方程[1]: Mao等[2]用物理信息神经网络解决了高速空气动力学流动模型的正问题和反问题; Fang等[3]利用物理信息神经网络解决了频域Maxwell方程和超材料设计问题; 陆至彬等[4]基于软边界和硬边界两种设定方法构建了神经网络求解传热方程; Lu等[5]提出了一个通用的深度学习框架DeepONet, 用于学习各种连续非线性算子.
与传统偏微分方程数值求解方法相比, 物理信息神经网络方法有如下优点: 1) 不需进行网格离散化[6], 传统方法如有限差分法和有限元法均需进行网格离散化, 从而增加了计算复杂度和计算时间, 而物理信息神经网络不需网格离散化过程, 且可并行处理, 从而提高了求解效率; 2) 物理信息神经网络方法可处理高维问题[7], 有效避免了“维数灾难”问题; 3) 物理信息神经网络方法在求解非线性方程中具有优势[8], 由于物理信息神经网络通过引入物理约束条件学习数据中的非线性关系进行求解, 因此物理信息神经网络可有效解决非线性方程的求解任务; 4) 损失函数结构简单易于构造.
光波衍射在实际中应用较多[9-11], 可用一个具有间断系数的Helmholtz方程的边值问题描述. 由于方程解在间断点不存在二阶偏导数, 因此用物理信息神经网络求解时, 損失函数在间断点处无法定义, 效果较差. 当介质介电常数变化较大时, 物理信息神经网络训练效果极差. Jagtap等[12]提出了守恒性物理信息神经网络cPINN, 该方法将原始求解区域划分为多个子区域, 并在损失函数中强化相邻子区域界面通量的守恒约束, 在模拟激波面等光滑性较差甚至间断的情况下可提高精确度; Kharazmi等[13]对PINN方法进行了改进, 提出一种基于区域分解的变分物理信息神经网络(hp-VPINNs)方法, 该方法采用变分原理描述偏微分方程问题, 使用域分解处理复杂的网格结构, 从而实现高效求解.
本文针对间断系数边值问题无法训练的问题, 引入光滑函数近似间断系数, 并将光波衍射问题分为总场和散射场的边值问题分别进行求解. 结果表明: 该方法对损失函数的改动较小, 并提高了计算效果; 物理信息神经网络方法求解散射场的边值问题效果更好.
1 一维光栅衍射问题
1.1 理 论
将求解总场且不进行光滑化的解u(x;θ)记为方法1, 求解散射场且不进行光滑化的解u(s)(x;θ)记为方法2, 求解总场并进行光滑化的解uδ(x;θ)记为方法3, 求解散射场并进行光滑化的解u(s)δ(x;θ)记为方法4. 对4种方法进行比较, 取训练集观测点数为N=400, 选点方式为均匀选点, 光滑函数δ=10-4, 神经网络结构为8层, 每层40个神经元, 迭代次数为3×105. 由于方法3和方法4所求结果为散射场, 因此需用u=u(s)+u(i)计算总场. 在传播过程中没有能量损耗, 若反射系数R2和透射系数T2之和越接近1, 则表示数值计算结果越精确. 各方法的数值结果与总场真解L2误差、 数值计算的反射系数R2和透射系数T2之和、 数值计算的反射系数R2与真实解R2之差的绝对值以及数值计算的反射系数T2与真实解T2之差的绝对值列于表1, 损失函数以及数值解的实部分别如图2和图3所示.
由表1、 图2和图3可见: 方法2计算散射场的误差比方法1计算总场小, 并且方法2损失函数曲线下降更快, 由于间断系数不可导, 因此两种方法的计算结果误差较大; 进行光滑化后方法3和方法4的损失函数曲线下降更快, 振荡更少, 训练效果更好, 并且解的误差更小; 方法4为所有方法中误差最小且反射系数R2和透射系数T2之和最接近1, 并且R2误差和T2误差均最小, 因此在一维光栅衍射问题中, 用方法4求解散射场并进行光滑化的训练方法最有效. 在仅改变神经网络结构、 网络层数和每层神经元数量的条件下, 利用方法4进行数值实验, 结果列于表2.
由表2可见, 随着网络层数的增加, 模型的误差越来越小, 由于神经网络层数从8层增加到10层误差变化较小, 因此本文选取神经网络层数为8层.
3.1.2 选取δ
由于光滑函数中的δ是一个超参数, 因此需寻找最优的δ. 在10层介质的基础上进行实验, 选择网络结构为8个隐藏层, 每层神经元数量为40个, 其他条件不变, 仅改变δ, 利用方法4进行实验, 结果列于表3.
引入光滑函数后的物理信息神经网络方法与真解的误差可表示为uδ-u≤uδ-uδ+uδ-u,(17)其中u为原方程的解, uδ为光滑后的真解, uδ为光滑后神经网络求得的近似解. 由表3可见, δ越大函数越光滑, 但δ太大会导致光滑函数εδ(x)与原介电函数ε(x)差距过大, 导致uδ-u增大, 而δ太小会使光滑函数在间断点处导数过大不够光滑, 导致uδ-uδ增大, 因此为保证uδ-u和uδ-uδ都足够小, 超参数δ应选取适中的值才能使误差最小, 在该问题中δ=10-3误差最小.
3.2 二维光栅衍射
用物理信息神经网络对二维光栅问题进行求解, 取ω=0.55(2πc/L), ε0=1, ε1=10, L=1, a=0.3L, n=2, 介电函数ε(x)为ε(x,y)=ε0,/(x,y)ΩD,
二维与一维命名方法相同. 取训练集观测点数为N=3 200, Nbx=80, Nby=40, 选点方式为均匀选点, 光滑函数δ=10-3, 神经网络结构为8层, 每层80个神经元, 迭代次数为2×105. 将有限元的解作为参考解, 各方法的数值结果与总场参考解L2误差、 反射系数R2和透射系数T2之和、 数值计算的反射系数R2与参考解的R2之差的绝对值以及数值计算的反射系数T2与参考解T2之差的绝对值列于表4, 损失函数以及各方法解与参考解之差的模分别如图4和图5所示.
由表4、 图4和图5可见: 方法1和方法2的损失函数曲线下降较慢, 进行光滑后方法3和方法4[KG*6]的损失函数曲线下降更快; 方法1,2,3的误差均较大, 计算效果较差, 其中方法2虽然R2+T2接近1, 但R2和T2的误差均较大; 方法4[KG*6]为所有方法中误差最小, 并且R2+T2最接近1, 因此在二维光栅衍射问题中, 用方法4求解散射场并进行光滑化的训练方法同样最有效.
与一维情形类似, 在仅改变神经网络結构、 网络层数和每层神经元数量的条件下, 利用方法4进行数值实验, 结果列于表5.
由表5可见, 增加神经网络层数和神经元数量即增加网络结构的复杂程度均可降低误差. 与一维问题的结果相比, 二维问题需更复杂的网络结构才能达到较好的精度.
综上, 本文将物理信息神经网络方法用于求解光栅衍射问题. 结果表明, 将间断系数近似为一个光滑函数可提升计算效果, 并且计算散射场比总场的结果更好. 通过一维和二维光栅衍射的数值实验验证了结论, 并在多组对照实验中找到合适的超参数(神经网络层数、 每层神经元数量和光滑函数δ值)以达到最小的误差.
参考文献
[1]李野, 陈松灿. 基于物理信息的神经网络: 最新进展与展望 [J]. 计算机科学, 2022, 49(4): 254-262. (LI Y, CHEN S C. Physics-Informed Neural Networks: Recent Advances and Prospects [J]. Computer Science, 2022, 49(4): 254-262.)
[2]MAO Z P, JAGTAP A D, KARNIADAKIS G E. Physics-Informed Neural Networks for High-Speed Flows [J]. Computer Methods in Applied Mechanics and Engineering, 2020, 360: 112789-1-112789-26.
[3]FANG Z W, ZHAN J. Deep Physical Informed Neural Networks for Metamaterial Design [J]. IEEE Access, 2019, 8: 24506-24513.
[4]陆至彬, 瞿景辉, 刘桦, 等. 基于物理信息神经网络的传热过程物理场代理模型的构建 [J]. 化工学报, 2021, 72(3): 1496-1503. (LU Z B, QU J H, LIU H, et al. Surrogate Modeling for Physical Fields of Heat Transfer Processes Based on Physics-Informed Neural Network [J]. CIESC Journal, 2021, 72(3): 1496-1503.)
[5]LU L, JIN P Z, PANG G F, et al. Learning Nonlinear Operators via DeepONet Based on the Universal Approximation Theorem of Operators [J]. Nature Machine Intelligence, 2021, 3(3): 218-229.
[6]RAISSI M, PERDIKARIS P, KARNIADAKIS G E. Physics-Informed Neural Networks: A Deep Learning Framework for Solving Forward and Inverse Problems Involving Nonlinear Partial Differential Equations [J]. Journal of Computational Physics, 2019, 378: 686-707.
[7]HAN J Q, JENTZEN A E W N. Solving High-Dimensional Partial Differential Equations Using Deep Learning [J]. Proceedings of the National Academy of Sciences, 2018, 115(34): 8505-8510.
[8]RAISSI M, KARNIADAKIS G E. Hidden Physics Models: Machine Learning of Nonlinear Partial Differential Equations [J]. Journal of Computational Physics, 2018, 357: 125-141.
[9]朱磊, 邵晓鹏. 散射成像技术的研究进展 [J]. 光学学报, 2020, 40(1): 77-91. (ZHU L, SHAO X P. Research Progress on Scattering Imaging Technology [J]. Acta Optica Sinica, 2020, 40(1): 77-91.)
[10]查显昊, 胡真. 基于Dirichlet-to-Neumann映射计算太赫兹频段旋电光子晶体带隙结构 [J]. 吉林大学学报(理学版), 2023, 61(2): 400-406. (ZHA X H, HU Z. Computing Bandgap Structures of Gyroelectric Photonic Crystals in Terahertz Band Based on Dirichlet-to-Neumann Map [J]. Journal of Jilin University (Science Edition), 2023, 61(2): 400-406.)
[11]洪亮, 高尚, 李翔. 基于网络特征的分层剪枝方法 [J]. 吉林大学学报(理学版), 2022, 60(6): 1407-1415. (HONG L, GAO S, LI X. Layer-Wise Pruning Method Based on Network Characteristics [J]. Journal of Jilin University (Science Edition), 2022, 60(6): 1407-1415.)
[12]JAGTAP A D, KHARAZMI E, KARNIADAKIS G E. Conservative Physics-Informed Neural Networks on Discrete Domains for Conservation Laws: Applications to Forward and Inverse Problems [J]. Computer Methods in Applied Mechanics and Engineering, 2020, 365: 113028-1-113028-27.
[13]KHARAZMI E, ZHANG Z Q, KARNIADAKIS G E M. hp-VPINNs: Variational Physics-Informed Neural Networks with Domain Decomposition [J]. Computer Methods in Applied Mechanics and Engineering, 2021, 374: 113547-1-113547-25.
[14]CHEW W C. Waves and Fields in Inhomogenous Media [M]. New York: John Wiley & Sons, 1999: 22-24.
[15]WANG Z F, BAO G, LI J Q, et al. An Adaptive Finite Element Method for the Diffraction Grating Problem with Transparent Boundary Condition [J]. SIAM Journal on Numerical Analysis, 2015, 53(3): 1585-1607.
(責任编辑: 王 健)
收稿日期: 2023-05-16.
第一作者简介: 陈旭早(1997—), 男, 苗族, 硕士研究生, 从事深度学习的研究, E-mail: 407250764@qq.com.
通信作者简介: 袁利军(1982—), 男, 汉族, 博士, 教授, 从事深度学习和科学计算的研究, E-mail: ljyuan@ctbu.edu.cn.
基金项目: 重庆市自然科学基金(批准号: CSTB2022NSCQ-MSX0610).