基于经验知识遗传算法优化的神经网络模型实现时间反演信道预测*

2019-09-21院琳杨雪松王秉中

物理学报 2019年17期

院琳杨雪松王秉中

(电子科技大学物理学院, 成都 610054)

1 引言

近年来, 各国学者对时间反演(time reversal,TR)电磁波特性及其应用进行了深入研究[1,2], 表明TR电磁波具有时-空同步聚焦[3,4]、超分辨聚焦[5,6]等许多优良特性.这种波以其独特的聚焦特性, 在远场超分辨成像、能量传输、无损检测等领域取得了令人瞩目的成就[7-10].此外, 数值仿真和实验结果均表明, 在通信中采用TR技术可以补偿密集多径信道的时延, 汇集并利用由多径信道传递的信息, 不仅提高了系统的性能, 同时简化了接收设备[11,12].因此, TR技术在无线通信领域存在巨大的潜力, 得到了越来越多的重视[13,14].

信道的性能直接决定着通信质量的好坏.为了在有限频谱资源上尽可能高质量、大容量地传输有用信息, 设计者需要清楚地了解信道特性, 预测电波在信道中的传播规律, 即建立无线信道模型.目前, 无线通信信道建模主要采用两种方法: 统计性建模[15]和确定性建模[16].统计性建模主要从大量的测试数据中归纳出信道重要的统计特性.Naqvi等[17,18]利用IEEE 802.15.3a推荐的超宽带室内通信模型, 研究了室内TR通信的鲁棒性.但利用统计性模型进行信道研究, 存在着无法针对具体的环境提供准确信道特性的不足.随着电磁仿真技术和计算机技术的发展, 具有更高精度的确定性建模越来越多地应用于TR信道特性的研究[13].确定性建模是采用某种相对确定的方法, 例如电磁场数值仿真, 来模拟信号在信道中的传播情况.文献[13]利用数值仿真验证了采用TR技术可有效地利用多径效应, 确保通信系统具有高水平的安全性.但对于时变环境, 比如当终端的位置发生变化时, 就需要重新进行仿真计算才能获取信道特性.而利用电磁仿真软件进行一次信道的电磁仿真, 所占计算机内存多、耗时长.为了避免多次进行复杂耗时的仿真, 如何快速、准确地获取TR信道特性是TR信道研究亟待解决的问题.

近年来, 人工智能技术快速发展.由于人工神经网络具有卓越的学习能力, 利用它进行信道建模已经成为传统无线信道建模方法的有效补充[19,20].文献[19]提出了基于人工神经网络的高速信道的建模方法, 用于精确预测信道参数矩阵.文献[20]采用尼日利亚拉格斯-巴达格里高速公路的1800 MHz商业基站平均接收信号强度数据, 对单隐层前馈神经网络和极限学习机进行训练和测试.人工神经网络通过对样本数据的学习, 能够模拟复杂环境下的任意非线性系统, 因此可以实现准确的建模.

基于人工神经网络在信道建模中的可行性, 为快速、准确地获取TR信道特性, 本文提出了一种利用人工神经网络对TR电磁信道进行建模的方法.在神经网络的训练过程中, 增加所需的训练样本数, 往往可以提高建模的精度.但考虑到通过电磁仿真获取大量样本数据非常耗时, 因此本文致力于在保证训练样本数量不变的情况下, 提高TR信道建模的精度.本文将TR信号的传播特性作为经验知识, 用于计算遗传算法的适应度, 并用其对神经网络的权值及阈值进行优化.在保证数据集样本数量不变的情况下, 准确地获取了TR信道特性,提高了建模的精度.对一种简单的室内TR信道进行建模, 获取了信道冲激响应(channel impulse response, CIR)的最大幅值、多径数目以及平均时延三个信道特性.与采用时域有限差分法(finite difference time domain, FDTD)仿真的结果进行对比, 误差极小, 证明了本建模方法的有效性.

2 算法模型

2.1 时间反演信号传播特性

TR是对信号在时域内的一种逆序操作, 我们首先从理论推导出发, 来了解TR信号传播特性[21,22].对于TR通信, 首先终端需要发射出一个用于测试信道的电磁脉冲d(t) , 经过信道传输之后,时间反演镜(time reversal mirror, TRM)天线会接收到这个测试信号:

其中符号⊗代表卷积运算,h(t) 为CIR.

对于实际的多径信道模型, 其h(t) 的离散表达式为

其中 Δ(t) 表示狄拉克函数,α(l) 和τ(l) 分别表示多径的幅度衰减和时延,L为可分辨多径数目.

将TRM天线接收到的信号波形进行TR处理, 得到新的信号a(-t) :

随后, 将需要传输的信号s(t) 与a(-t) 进行卷积并发射, 经过信道传播终端接收信号rTR(t) 为

我们用TR等效信道冲激响应heq(t) 表示h(t)⊗h(-t), 并结合(2)式, 可以得到:

对于(5)式, 等式右边的第一求和项RTR(t) 是各个不同传播路径的多径信号自相关函数的叠加,在t=0 时刻, 它取得最大值, 并且最大值与各多径分量的时延τ(l) 无关; 等式右边的第二求和项是各个不同传播路径多径信号的互相关函数之和, 大量非相关的多径信号由于时延扩展和幅度衰减各不相同, 叠加在一起会相互抵消, 因此对接收信号rTR(t)的大小没有明显影响.所以信号经过复杂多径信道之后, 多径分量会在特定时刻发生聚焦, 此时接收信号的幅度达到最大.

对于固定天线在自由空间中的辐射, 信道对发射信号s(t) 在t时刻的远区电场响应可以表示为[23]

其中 (r,θ,ψ) 是空间中的电场测量点U,r为发射天线到点U的距离,θ和ψ分别表示天线指向点U的天顶角和方位角, 常数c为光速,αs(θ,ψ,f) 为发射天线以频率f工作时在方向 (θ,ψ) 的辐射强度.

结合(6)式和(7)式可以发现, TR通信接收信号的峰值与r和αs(θ,ψ,f) 有关.为了得到较为准确的函数关系, 对已获得的不同终端位置数据进行处理, 提取 TR通信接收信号的峰值、r和αs(θ,ψ,f).随后利用最小二乘法进行多项式拟合,表征函数关系.利用拟合函数, 我们可以估计终端在不同位置所接收到信号的峰值, 并将其作为经验知识用于随后的神经网络优化过程.

2.2 神经网络模型

反向传播(back propagation, BP)神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络.因其具有非线性映射能力强、网络结构简单等特点, 是目前应用最广泛的神经网络, 因此本文使用BP神经网络进行信道建模.x为N维输入向量, 表示终端位置坐标;y为M维输出向量, 代表终端接收到的信号.不同终端位置坐标与接收信号的函数关系可以用下式表示:

利用仿真软件获得样本数据集{(xk,yk)|xk∈RN,yk∈RM}, 其中k(k=1,2,···,J) 为样本指数,J为总样本数.但由于维数M通常极大, 若将yk直接用于神经网络的训练, 对计算机的性能就要提出更高要求, 并增加训练时间.主成分分析技术(principal component analysis, PCA)可以用来降低数据维度.通过线性投影, 即把原始数据的特征用数目更少的新特征取代, 但同时尽可能多地保留住原始数据的特性, 可降低数据维度.我们采用PCA技术对M维数据yk进行处理, 得到降维后的m(m＜M) 维数据pk作为新的输出向量:

其中u1,u2,···,um为M维列向量, 是样本集协方差矩阵按从大到小排序的前m个特征值对应的特征向量.前m个特征值之和占所有特征值之和的95%.

通过PCA处理, 得到J个样本数据 (xk,pk).取K(K＜J) 个能够充分表示原始函数关系的样本(xk,pk)作为训练样本, 用于神经网络的训练.剩下的样本作为测试样本, 用来验证模型的精度.

BP神经网络模型可以表示为

结合PCA技术的神经网络模型结构如图1所示.利用训练样本 (xk,pk) , 对BP神经网络进行训练.通过不断优化ωANN, 使误差函数不断减小.误差函数如下:

图1 结合PCA技术的神经网络模型结构Fig.1.Structure of the neural network model combined with PCA.

其中pki是相应样本数据输出pk的第i个元素,是神经网络输出的第i个元素,Tr是所有训练样本指数的集合.

当误差函数满足精度要求时, 神经网络完成训练.此时神经网络的输出近似等于PCA处理后的信号数据p.

2.3 遗传算法优化神经网络

BP神经网络的训练算法往往基于梯度下降原理, 因此存在陷入局部最优的缺陷.为了提升模型的精度, 可以采用全局优化算法对神经网络进行优化, 以避免BP神经网络陷入局部最优.遗传算法(genetic algorithm, GA)是一种常用的全局优化算法, 具有较强的全局搜索能力.因此我们利用遗传算法来优化BP神经网络, 得到GA-BP神经网络模型.遗传算法种群中的每个个体都包含了一个网络所有的权值和阈值, 通过适应度函数计算每个个体的适应度值.在每次迭代中, 通过选择、交叉和变异操作对个体进行调整, 最终找到最优适应度值对应的个体, 实现神经网络的优化.建立GABP神经网络模型的流程图如图2所示.

通常, 用遗传算法优化神经网络时, 其适应度函数为

其中b为系数.

由于信号往往包含着大量不需要的噪声, 准确的信道特性才是关注的重点.因此, 我们对遗传算法的适应度函数进行改进, 不考虑神经网络模型输出噪声的准确性, 使遗传算法的优化朝着所关注的信道特性的方向进行.根据2.1节, 通过利用训练样本数据进行多项式拟合, 可以获取不同终端位置接收信号峰值的估计值.考虑到其他信道特性不易获取, 因此我们将不同终端位置接收信号峰值的估计值作为已知的经验知识, 用于计算GA-BP模型的适应度函数.新的适应度函数如下:

其中, pulsefit为利用拟合函数得到的终端位置接收信号估计峰值, pulseANN为通过神经网络得到的终端位置接收信号峰值.

2.4 信道特性的获取

基于经验知识的GA-BP模型获取TR电磁信道特性的流程图如图3所示.首先利用训练样本的数据进行多项式拟合, 并得到不同终端位置xk所对应的接收信号峰值估计值, 将其作为经验知识用于计算遗传算法的适应度函数.随后利用训练样本对GA-BP神经网络进行训练.通过遗传算法的迭代优化, 不断调节神经网络的权值和阈值, 使神经网络误差函数不断减小, 最终确定模型内部参数.最后利用模型得到对应于不同终端位置xk的m维输出数据.将这些m维数据利用特征矩阵, 恢复为M维数据, 即获得对应终端位置的接收信号.利用CLEAN算法[24,25]对接收信号进行处理, 即可获得对应的TR信道特性.

3 应用实例

图2 建立GA-BP模型的流程图Fig.2.Flowchart of the GA-BP model development process.

图3 信道特性获取流程图Fig.3.Flowchart of the proposed model to obtain channel characteristic.

图4 仿真场景俯视图Fig.4.Top view of the simulation scene.

为了验证上述方法的有效性, 同时减少获取样本所耗的内存和时间, 对一个简单的室内场景进行信道建模, 场景如图4所示.尺寸为100 cm ×100 cm × 100 cm的室内空间, 边界是相对介电常数为8、厚度为20 cm的材料, 用来模拟混凝土墙壁.在室内放置4个TRM天线, 位置坐标如表1所列.终端天线首先发射正弦调制高斯脉冲, 其中心频率为f0=5.5GHz.TRM天线将接收到的信号进行时间反演处理, 随后再发射, 最后在终端天线获得聚焦信号.终端天线的位置如表2所列.

表1 TRM天线位置Table 1.Location of the TRM antennas.

表2 终端天线的位置Table 2.Location of the terminal antenna.

利用全波电磁仿真软件FDTD Solutions获得了44个样本数据, 将其中36个数据作为训练样本来训练神经网络, 剩下8个数据作为测试样本,用来验证方法的有效性.对36个训练样本数据进行处理, 随后采用最小二乘法获取多项式系数, 最终用11阶多项式近似表征了终端接收信号的峰值与距离r和辐射强度之间的函数关系, 如图5所示.考虑到仿真所采用的理想偶极子天线的辐射特性以及TRM天线具有对称性, 我们用 s inθ函数来近似表征偶极子辐射方向图, 其中,θ为坐标原点指向终端天线的天顶角.

图5 11阶多项式拟合结果与仿真数据的对比Fig.5.Comparison of the results of 11th order polynomial fitting and simulation data.

随后利用拟合函数对测试样本中的接收信号峰值进行粗略估计, 并将其作为经验知识用于遗传算法中.采用单隐层神经网络, 并用Hecht-Nelson方法[21]根据输入向量维数N确定神经网络的隐层节点数为 2N+1.利用训练样本对模型进行训练,完成训练后, 获得测试样本对应位置的接收信号.

图6为采用本方法与采用电磁仿真软件得到的两个测试样本接收信号的对比.可以看出本模型获得的波形与仿真波形存在一定的时移, 但整体波形基本一致.此外, 因为PCA技术具有一定的降噪效果, 利用本模型获得的接收信号受到的噪声影响比仿真结果小.

图6 利用本模型获得接收信号与仿真获得信号的对比 (a)测试样本1; (b)测试样本2Fig.6.Comparison of the signals of the proposed model and simulation: (a) Test sample #1; (b) test sample #2.

表3 CPU时间及计算机性能Table 3.CPU time and computer performance.

利用CLEAN算法对8个测试样本的接收信号进行处理, 提取信道冲激响应, 进一步得到信道冲激响应峰值、15 dB多径数目以及平均时延这三个信道参数.为了直观地衡量本模型的精度, 用平均绝对误差百分比(mean absolute percentage rrror, MAPE)来表示利用本模型得到的接受信号提取的信道参数与仿真信号提取的信道参数之间的误差, 其计算公式如下:

其中,ok和分别表示对应于第k个测试样本采用电磁仿真和本模型获得的结果;n为测试样本总数.

采用本模型数据提取的三个信道参数, 与采用仿真数据提取的三个参数之间的误差都小于10%(冲激相应峰值, 2.74%; 15 dB多径数目,6.25%; 平均时延, 9.01%), 且信道冲激响应峰值的误差仅为2.74%, 表明采用本模型能够准确地获得信道参数.表3是使用本模型与使用仿真软件获取接收信号所耗时间及所用计算机性能的对比.可见利用本模型获取接收信号, 能极大地节省时间, 且对计算机性能的要求更低, 从而降低了获取TR信道参数的成本.

最后, 我们用这36个训练样本, 分别对BP神经网络和(不结合经验知识的)GA-BP神经网络进行训练, 并用同样的8个测试样本进行测试.将不同模型获取的TR信道冲激响应进行对比, 结果如图7所示.可以发现, 在只有36个训练样本的条件下, BP神经网络以及GA-BP神经网络并没有得到良好的训练, 导致测试样本误差较大.显然,在训练样本数量不变的情况下, 本模型能达到更好的精度.

图7 采用不同模型得到的信道冲激响应峰值对比Fig.7.Comparison of different modeling methods for the channel impulse response peaks.

对于异常复杂的环境, 其散射环境更加丰富.研究表明[5,26], 在多径丰富的环境中, 其TR信道更接近于理想TR信道, 具有更好的聚焦效果, 因此我们依然能够利用2.1节的方法获取TR信号的峰值特性来作为经验知识.我们有理由相信本文提出的方法不仅适用于简单室内环境的TR信道建模, 也适用于多径更丰富的复杂环境的TR信道建模.

4 结论

本文提出了一种针对时间反演电磁信道的神经网络建模方法.首先利用时间反演信号的传播特性, 通过多项式拟合获取经验知识, 用于计算遗传算法的适应度函数, 然后用遗传算法对神经网络模型的权值及阈值进行优化, 提高了模型的性能.最终建立的神经网络模型和作为经验知识的拟合多项式相比, 具有更高的精度, 且能提供更多的信道参数.

通过对一种简单的室内时间反演信道进行建模, 并与另外两种模型进行对比, 验证了本方法的有效性及其优势: 它能在相同的样本数量下, 达到较好的精度.