点源反演问题的神经网络方法研究
2022-11-12张平孟品超尹伟石
张平,孟品超,尹伟石
(长春理工大学 数学与统计学院,长春 130022)
反源问题是指通过远场数据识别未知点源的某些参数,如位置和强度等,目前已成为医学成像、环境污染、层析成像和天线合成等领域中的重要问题[1-2]。
研究单频反源问题的一个难点是解的不唯一性,为此,人们通常需要对源施加额外的约束[3]。文献[4]和其中的参考文献给出了反源问题的稳定性估计。目前求解单频反源问题的方法主要有迭代法、直接采样方法和贝叶斯方法等[5-6]。传统方法在求解反演点源位置的问题时往往会限制点源之间距离[7-8]。此外,对于单频的反源问题,在许多实际应用中往往只能在有限孔径情况下观测点源位置[9]。
近年来,神经网络方法发展迅猛,能够弥补信息的缺失,对非线性映射有着较好的逼近效果,一些学者将其用以求解反问题[10-12]。本文针对单频声波反源问题,构建基于神经网络和门控思想的点源位置参数反演模型,利用单频远场数据,确定点源位置信息。
1 声波反源问题
考虑在如下Helmholtz系统中通过远场模式u∞反演点源S的问题:
其中,δ表示Dirac分布,且N表示单极源的个数,为正整数;zj是单极源S的位置,这里,点源位置zj是互不相同的;λj表示单极源的强度,是一个标量。反源问题是:给定单极源S的强度和固定频率的远场数据u∞,确定单极源S的位置。
2 神经网络模型
建立求解均匀介质中固定频率声波点源位置反演问题的神经网络模型。首先给出以下假设和定义:
假 设1:观测方向d=(c os(α),sin(α)),观 测角α均匀分布于观测孔径(α1,α2),即:
其中,n为观测方向个数。
因此,给定n个观测方向,得到远场数据:X=(x1,x2,...,xn)。为方便计算,将每个远场数据xt=at+i·bt改写成xt=(at,bt)T,t=1,2,...,n。这里i表示虚数单位。
定义1:假设点源的位置有如下形式:
其中,M=2N表示位置参数的个数。于是,可将利用均匀介质中固定频率的远场数据u∞反演点源位置zj转化为反演位置参数y=(y1,y2,…,yM)的问题。
定义 2:令A=(aij)为n×m维的矩阵,且B=(bij)为一个p×m矩阵,则矩阵运算[A;B]表示矩阵拼接:
定义3:令A=(aij),B=(bij)为n×m维矩阵,则定义:
定义4:令F为激活函数,A=(a1,a2,…,am)T为m维向量,则F(A)为一个m维向量:
下面利用可在时间维度上传播信息且具有“记忆”功能的神经网络,构建位置参数反演模型,反演点源的位置参数y=(y1,y2,…,yM)。
2.1 构建模型
构建一个位置参数反演模型,其结构如图1所示,分为特征提取和参数反演两部分。
图1 位置参数反演模型
用st表示t时刻提取的远场特征,t=1,2,...,n,随机初始化s0。构造映射F:Rm×2×R2→Rm×2,对st-1和xt进行特征提取,并将其记作st=F(st-1,xt),t=1,2,…,n。其中st=(ht,ct),ht=(h1t,h2t,…,hmt)T,ct=(c1t,c2t,…,cmt)T,ht为t时的短时远场特征,ct为t时的长期远场特征,经过n个时间步后可得X的远场特征:C=sn。
图2给出了映射F中变量之间的关系,为方便描述,本文令偏置为零向量,即b=(0 ,0,…,0)T。
图2 映射F中的变量关系
其中,ft=σ(wf·[ht-1,xt])为遗忘门,决定保留多少ct-1中的信息并使其继续传播。类似的,输入门it=σ(wi·[ht-1,xt]),决定zt中有多少信息保存到长期远场特征ct,输出门ot=σ(wo·[ht-1,xt]),决定ct中有多少信息输出到ht。tanh表示双曲正切函数,σ为Sigmoid函数。wf,wi,wo,wz∈Rm×(m+2)分别表示遗忘门、输入门、输出门和候选向量的权重,[ht-1,xt]∈Rm+2,ot,ft,it,zt∈Rm。
至此,模型提取了远场特征C=sn=(hn,cn),下面进行参数反演。
与特征提取阶段相似,在图1参数反演阶段,用ST=(HT,CT),表示T时的参数特征,T=1,2,…,M,其中HT∈Rm为短时参数特征,CT∈Rm为长期远场特征。初始化0=0,构造映射L:Rm×2×R→Rm×2,将ST-1=(HT-1,CT-1)和位置参数T-1映射成,其计算过程如下:
因为HT∈Rm,且∈R,因此本文通过一个输出维度为1的全连接将HT反演为第T个位置参数=WDT·HT,其中WD∈Rm为与时间步T对应的全连接权重。经过M个时间步,可反演出全部M个位置参数。
2.2 模型参数更新方法
由于每个位置参数∈R,即“连续”,因此本文使用均方误差作为损失函数E。
定义 3:令Yj为模型的真实输出,为模型的预测输出,定义损失函数为:
式中,J为样本总数。
更新模型就是更新模型中的权重和偏置,用W表示模型中的权重wo,wf,wi,wz,Wo,Wf,Wi,Wz,WD,这里随机初始化权重W(0),然后利用Adam算法更新权重W(l),l=1,2,…,n。更新规则如下:
其中,gl为损失函数相对于权重W的梯度矩阵;ql和rl分别为gl的一阶和二阶有偏矩估计,且q0,r0均初始化为零向量;ρ1,ρ2∈ [0,1)为矩估计的指数衰减速率;和l分别为修正的一阶和二阶矩估计;η为学习率;δ为数值稳定常数。本文令ρ1=0.9,ρ2=0.999,η=10-2,注意在计算ΔW(l)时需对矩阵l和l逐个元素执行相应运算,即。
至此,本文构建了反演点源位置参数的神经网络模型,下面进行数值实验说明该模型的有效性。
3 数值实验
通过数值例子说明位置参数反演模型能够解决有限孔径和点源之间距离较小等限制的反源问题。
3.1 实验设置
对于点源位置表达式:
将数据集划分为训练集与测试集,其中测试集中样本数据量固定为l=100,在测试集中随机选取测试样本。在模型训练过程中进行批量训练,批量大小满足1<v<J。
表1给出了模型所用超参数,这些参数是通过多次实验得到的。
表1 模型超参数
3.2 模型的鲁棒性
实验一:远场数据不加噪声。
点源个数N=2时,令n=8,10和12,远场数据无噪声。为了比较位置反演的精度,表2列出了精确和预测的数据。反演位置参数的均方误差如表3所示。
表2 两个点源的位置反演效果
表3 参数反演的均方误差
表2和表3说明:随着观测方向的增加,获得的远场信息增多,损失函数减小,点源位置的反演效果提升。
点源个数N=3时,令n=15,16和 17,远场数据无噪声。为了比较位置反演的精度,表4列出了精确和预测的数据。反演位置参数的均方误差如表5所示。
表4 三个点源的位置反演效果
表5 参数反演的均方误差
表4和表5同样说明:随着观测方向的增加,获得的远场信息增多,损失函数减小,点源位置的反演效果提升。
实验二:远场数据加噪声。
在实际测量中远场数据经常含有一定的测量误差,为说明模型在此种情形下的反演效果,本实验以两个点源为例,取观测点n=12,远场数据含不同水平的高斯噪声ε。为了比较位置反演的精度,表6列出了精确和预测的数据。反演位置参数的均方误差如表7所示。
表6 远场数据加噪声的点源位置反演效果
表7 参数反演的均方误差
由表6和表7可知,在使用含有乘性高斯噪声的测量数据反演点源位置参数时,模型可较好地反演点源位置参数,这是因为该方法使用含测量误差的远场数据与真实位置参数进行训练,逼近了二者之间的映射,进而降低了测量误差对反演效果的影响,该实验说明模型具有一定的鲁棒性。
3.3 有限观测孔径
表8 有限观测孔径下的点源位置反演效果
表9 参数反演的均方误差
由表8和表9可知:当观测方向数目不变时,随着观测孔径的逐步缩小,观测方向间的夹角减小,观测到的远场数据相似度上升,导致从远场数据中获得的点源位置信息减弱,使得位置参数的反演误差增大,反演效果下降。
3.4 点源间距有限
表10 参数反演的均方误差
4 结论
本文针对单频远场信息反演点源位置的声波反源问题,构建了基于神经网络和门控思想的位置参数反演模型,反演点源的位置。实验结果表明该模型反演效果良好,在噪声干扰下模型具有一定的鲁棒性和泛化性,点源之间距离的大小对该模型的反演结果影响较为微弱。三维立体空间中移动点源位置的反演,是更有现实意义的问题,而近场问题涉及到精确度与更微观层面的问题,这将是下一步的工作。