采用通道注意力机制的RIS辅助MIMO级联信道估计

2024-05-30喻赟张静

上海师范大学学报·自然科学版 2024年2期

喻赟张静

摘要：可重构智慧表面（RIS）辅助多天线毫米波无线通信系统的级联信道有直传和反射两条链路，系统维数大且复杂，获取信道状态信息（CSI）困难. 针对RIS辅助下的大规模多输入多输出（MIMO）通信系统应用场景，提出了基于通道注意力机制的SE-ResNetV2网络来获取CSI，在残差网络（ResNet）中引入了通道注意力模块，通过挤压和激励策略来提高噪声特征的捕捉能力. 仿真结果表明，相比于最小二乘（LS）估计算法和常规的注意力机制深度ResNet，所提出的深度学习网络具有更好的去噪效果和估计精度.

关键词：可重构智慧表面（RIS）；多输入多输出（MIMO）；信道估计；深度残差网络（ResNet）；注意力机制

中图分类号： TN 929.5 文献标志码： A 文章编号： 1000-5137（2024）02-0228-08

Channel estimation for RIS assisted MIMO cascaded channels via attention mechanism

YU Yun， ZHANG Jing^*

（College of Information， Mechanical and Electronic Engineering， Shanghai Normal University， Shanghai 201418， China）

Abstract： The cascaded channel of the reconfigurable intelligent surface （RIS） assisted multi-antenna millimeter-wave communication system had two links， the direct one and reflection one. The channel dimension was large and received noise feature was unpredictable which was a great challenge to obtain the channel state information （CSI） for application scenarios for massive multiple input multiple output （MIMO） communication system. An SE-ResNetV2 network based on channel attention mechanism was proposed to obtain CSI. SE-Net modules was introduced into the residual network （ResNet） to capture noise features through squeezing and excitation strategies. The simulation results showed that， the proposed deep learning network had better denoising effect and estimation accuracy compared to the least squares（LS） estimation algorithm and the conventional attention-mechanism deep ResNet.

Key words： reconfigurable intelligent surface （RIS）； multiple input multiple output （MIMO）； channel estimation； deep residual network （ResNet）； attention mechanism

可重构智慧表面（RIS）是一种可调控入射波相移的超材料，由多个无源反射元件组成，在无线通信领域中，可被视为大规模多输入多输出（MIMO）的扩展，受到学术界和工业界的广泛关注^［¹^］，在无人机通信^［²^］、提高能量效率^［³^］和重定向信号反射^［⁴^］等领域具有广泛应用. 然而，由于RIS只能被动地反射信号，无信号处理能力，在接收端获取级联信道状态信息（CSI）的复杂度通常很高，无法直接获得从用户设备（UE）到RIS以及从RIS到基站（BS）的CSI.

為了在有限的导频开销下有效地估计RIS辅助级联信道，在直传链路被遮挡，仅有辅助链路时，利用RIS的可变相移和三线性平行因子分解，可运用交替最小二乘（LS）估计或改进方法获取CSI^［⁵^］. 为了提高获取CSI的能力，KUNDU等^［⁶^］提出了近似线性最小均方误差信道估计器，以增强通道估计（CE）性能，但并未降低复杂度和导频开销. 为了减少导频开销，YANG等^［⁷^］和YOU等^［⁸^］将相邻单元格分组，每组使用相同的反射系数，但这会降低CE精度. 因此，需要将分组后的信道估计矩阵恢复为完整的信道矩阵，以提高通信性能.

深度学习凭借着计算机算力的进步，为通信领域的研究提供了新思路. SOLTANI^［⁹^］和ZHANG等^［¹⁰^］提出了基于深度学习的信道估计方法，通过学习信道中导频和数据点的频域相关性，还原CSI. LIAO等^［¹¹^］在多输入多输出-正交频分复用（MIMO-OFDM）信道估计中使用了深度学习网络. WANG^［¹²^］等利用深度学习的自编码网络对CSI进行压缩和发送，在接收端解压和恢复. BAEK等^［¹³^］将深度学习用于解决信号检测等问题. 利用卷积神经网络（CNN）在图像处理领域展现出的强大特征提取能力，将线性LS信道估计的结果比拟为含有噪声的图像，利用CNN网络能够较好地改善RIS辅助系统的信道估计结果.

本文作者针对RIS辅助大规模MIMO系统，提出了一种基于通道注意力机制的SE-ResNetV2网络，用于进行信道估计. 由于该系统的信道估计需要大量的导频开销，所产生的数据特征也较为复杂. 基于通道注意力机制的SE-ResNetV2网络能较好地捕捉噪声特征，丰富了神经网络对噪声特征的关注度. ResNetV2作为经典的残差网络（ResNet）能够解决梯度消失或梯度爆炸等问题. 将ResNetV2网络模块与SENet网络模块联合运用后，可使得信道估计的精度更高.

1 傳输模型

考虑一个RIS辅助的大规模毫米波MIMO传输系统的上行链路，如图1所示，它由用户-基站的直传链路和用户-反射面-基站的反射链路组成. 接收信号为两条链路信号的叠加信号. 假设基站端配备了R根天线，用户端配备了M根天线，RIS反射单元的个数为N，每个反射元件都具有互相独立的反射系数，其中，和分别是第个反射元件的幅度衰减因子和可控相移，通常为的离散值.

再假设RIS 级联信道为准静态平坦衰落信道，系统采用时分双工的通信模式. 基站到用户的信道可以表示为：

，（1）

其中，表示基站到用户的直传链路；表示RIS到用户的链路；表示基站到RIS的链路；表示RIS反射单元的反射系数矩阵.

基站接收到的信号为：

，（2）

其中，表示用户向基站发送的导频向量；是基站的接收信号；是导频符号的平均功率；是在基站端的加性高斯白噪声（AWGN）向量，是基站的平均噪声功率维单位矩阵.

为了减小多天线之间的干扰和码间干扰，把导频时隙分成组，，相同的導频向量在每个组持续时间为个时隙，，采用离散傅里叶变换（DFT）矩阵作为导频图案，用户的根天线在个时隙分别用的前列作为导频，并且使不同组的导频向量之间相互正交. 再设RIS反射单元的反射系数：，那么针对第个导频向量，基站端在个时隙的接收信号可以表示为：

（3）

其中，

，（4）

（5）

，（6）

，（7）

其中，包括了用户的个天线与基站所形成的个直传链路和个反射链路的信道复衰落；包括了RIS反射单元的反射系数和用户处发射的导频的共同影响；符号表示Kronecker积；I_T表示维单位矩阵积；表示噪声向量.

根据式（3）～（7），得出的LS估计值

，（8）

其中，，，. 從式（8）可以得出，LS估计得到的信道包括了噪声数据.

2 采用通道注意力机制的深度残差神经网络

SE-ResNetV2网络的具体模型如图2所示，由卷积层和SE-ResNetV2模块组成. 其中，SE-ResNetV2模块由SE-Net模块和ResNetV2组成，在每个残差模块后方连接了一个SE-Net模块.

2.1 深度ResNet模型

随着神经网络层数的增加，常规卷积神经网络会导致部分浅层特征信息丢失，引发梯度爆炸和消失等问题. 在实际应用中，深层模型在训练和测试达到饱和状态后，性能会下降明显，产生模型退化问题. 深度残差学习框架通过预先训练浅层模型，并增加卷积层恒等映射，解决了深层模型的退化问题.

残差单元的结构如图3所示. 残差经过两个网络层的映射，得到残差. 在进入第二层激活函数单元之前，需要将残差与最初的残差相加，即：

. （9）

如果神经网络包含个残差块，且激活函数与跳跃连接均为直接映射，那么整个ResNet的输出可表示为：

. （10）

通常使用梯度下降法更新网络参数. 在链式法则的导数计算下，损失函数对输入数据的导数可以表示为：

（11）

在式（11）中，存在梯度为1的常数，可避免梯度消失问题，通过累加，缓解了梯度爆炸. 系数用来传递深层梯度至浅层. 当网络层数增加时会出现退化等问题，为此将ResNet的初始参数设置为，这样调整比设置更加容易.

ResNet需要依据实际提取特征的复杂程度，改变自己的网络层次和深度，能够在参数较少的情况下，得到更好的训练效果. 采用多个卷积层、批量归一化（BN）层和ReLU激活函数构成网络结构，BN层可以让每层的输入服从标准正态分布，能有效提升网络的效率和准确率. 在增加网络层数时，会不可避免地改变特征图的属性. 当使用大小为1×1、步长为2 的卷积核进行采样时，能够得到ResNetV1网络，该网络能保证相同的输入和输出维度. 在此基础上，依靠大量算法试验后，可得到ResNetV2神经网络，如图4所示.

2.2 通道注意力机制模块

SE-Net模块是通道注意力机制模块，如图5所示. 通过网络结构对通道上的相互依赖关系进行建模，捕捉通道的空间相关性，以此计算出不同通道的重要性程度，提升模型对于通道之间的特征感知能力，只增加少量的计算，就可以从整体上提升模型的性能.

SE-Net模块首先对卷积得到的特征进行挤压操作，以此得到通道的全局特征；然后再对全局特征进行激励操作，学习各个通道之间的相互关系，从而得到不同通道在特征提取上的权重分布；最后乘以原来的特征图得到最终的特征. 从本质上来讲，SE-Net模块是在通道维度上做了注意力机制的操作，一方面可以让模型更加关注信息量最大的特征通道，另一方面也抑制了某些不重要的通道特征. 在提升模型效率的同时，减少了模型的计算复杂度.

3 RIS辅助信道估计中的SE-ResNetV2网络

3.1 数据预处理

由于神经网络通常处理实值数据，而原始的复信道衰落数据是复数形式，需要将其拆分为实部和虚部，输入神经网络. 将式（3）改写为：

，（12）

其中，···和分別表示实部和虚部. 再运用LS估计得到的实部和虚部.

在离线训练前，根据其输入输出确定数据集结构，并构建网络架构的输入输出维数，分别准备数据集和网络架构，以适应直传链路和反射链路的需求. 在数据收集过程中，要确保所有RIS反射单元被激活，利用基站接收到的导频信号作为输入，同时将直传链路和级联链路的信道矩阵作为两个独立任务的标签数据.

利用Matlab模拟生成大量的莱斯衰落随机信道和随机接收噪声，通过LS估计获得粗略的信道估计值，作为神经网络的训练样本.

3.2 前向信息传输

输入数据先通过3×3×64的卷积层，得到尺寸的特征图. 随后进入SE-ResNetV2模块. 在该模块中，先经Res-NetV2网络传输，再通过SE-Net模块. 在SE-Net模块中，对特征执行全局平均池化，产生向量. 该向量再送入双层全连接网络.在每层中，分别经过含Cr神经元的隐层和ReLU激活层，其中，C是神经元的个数；r是一个可调参数，代表着可以设置的压缩比例.然后经过Sigmoid函数激活层，形成通道注意力图. 此注意力图乘以原特征图，再赋予权重后，与原输入噪声作合并处理，最终用3×3×64卷积核输出，以保持维度一致.

3.3 网络运行方式

网络运行分为离线训练和在线训练两个阶段，各自独立进行，如图6所示.

在离线训练阶段，用Matlab仿真得到足量的莱斯衰落信道参数、导频符号以及接收信号，再采用LS估计算出含噪的信道模型参数，然后送入SE-ResNetv2中. 通过迭代优化损失函数来更新网络参数，直至模型收敛，得到的神经网络即为训练成熟的模型，用于预测实验. 在预测环节，向该模型输入未曾出现的数据集，从而获得所需的信道估计结果，完成整个信道估计过程的模拟和验证.

在训练中，优化器的选择对模型的训练速度至关重要. Adam自适应优化算法结构简单，计算速度快，能在考虑梯度一阶矩和二阶矩估计的基础上，自动调整更新步长，适用于大数据量的网络. 此算法在更新收敛幅度时表现出色，能加快模型训练速率. 因此，选择Adam优化器进行研究.

3.4 优化损失函数

通常，在信道估计这样的回归拟合问题中，基于L₂型和L₁型范数的优化指标为比较常用的损失函数.在信道参数稀疏时可采用L₁型优化指标，其梯度会在极值点发生跃变，不利于学习. L₂型优化指标在信道参数非稀疏时，可放大差异并指导优化，且L₂范数与归一化均方误差（NMSE）相关.由于时域的RIS信道模型通常为非稀疏模型，在网络模型训练时，采用了L₂型损失函数

，（13）

其中，表示模型估算的结果；是真实信道模型；K是每次训练模型所用的训练样本数量.

在测试阶段，以NMSE评估信道估计的准确度：

. （14）

4 仿真和分析

讨论天线数=16的用户，基站为32，RIS反射元件为128. 毫米波频段为28 GHz和73 GHz. 路径衰落模型包括，和，其中，为参考距离1 m处的损耗. 路径损耗指数设为，，. 每用戶生成60 000组数据，随机分成训练集（70%）、测试集（15%）和验证集（15%）. 训练集的信噪比（SNR）取值范围为［-5，0，…，25］dB.采用Adam优化算法，批量处理大小为64，训练周期为1 000.

采用LS算法、交替最小二乘（BALS）^［⁵^］法、注意力机制网络（ADNet）^［¹⁴^］作为对比算法，论证实验的可靠性. 仿真参数如表1所示.

圖7展示了，，情况下，SE-ResNetV2算法与ADNet，LS，BALS算法在不同信噪比下NMSE性能的对比. 可以看出，SE-ResNetV2算法的性能在整个SNR范围内明显优于传统算法.由此可见，随着网络深度增加，SE-ResNetV2网络成功地解决了梯度消失、梯度爆炸和浅层信息丢失等问题，有效提升了估计效果.

图8为，，SNR=20 dB情况下，各算法的均方误差（MSE）随天线个数的变化曲线.可以看到，随着的扩大，系统噪声同步上升，进而导致各算法的NMSE也呈比例增长. 尽管如此，SE-ResNetV2算法总体上仍旧胜过其他传统算法，特别是在处理更深层网络结构时，有效避免了梯度消失或爆炸的情况，展现出更卓越的性能.

图9展示了在，以及SNR=20 dB条件下，算法性能随着RIS反射元件数量变化的NMSE曲线.可以观察到，随着RIS反射元件数量的增加，传统算法的性能出现较大波动，这是因为增加RIS的数量会引入更多的系统噪声和冗余信息，而传统方法无法有效解决噪声问题. 然而，采用深度学习方法的SE-ResNetV2算法展现出更好的性能及更平稳的表现，这表明深度学习方法对于噪声的处理更彻底，能够适应各种不同数量的RIS硬件系统，在实际应用中展现出更大的灵活性.

5 结语

针对RIS辅助通信系统的信道估计问题，为克服LS估计方法精度不足的局限，研究了基于通道注意力机制的SE-ResNet2信道估计方法，基于现有的注意力机制深度ResNet，引入通道注意力模块，通过挤压和激励策略来增强噪声特征的捕捉能力. 仿真结果表明，相比于传统估计算法，所提出的深度学习网络对信道估计的归一化均方误差性能改善明显，性能也有较大改善.

参考文献：

［1］ JIAN M N， ALEXANDROPOULOS G C， BASAR E， et al. Reconfigurable intelligent surfaces for wireless communications： overview of hardware designs， channel models， and estimation techniques ［J］. Intelligent and Converged Networks， 2022，3（1）：1-32.

［2］ FANG S， CHEN G J， LI Y H. Joint optimization for secure intelligent reflecting surface assisted UAV networks ［J］. IEEE Wireless Communications Letters， 2021，10（2）：276-280.

［3］ CAO C J， LIAN Z X， WANG Y J，et al. A non-stationary geometry-based channel model for IRS-assisted UAV-MIMO channels ［J］. IEEE Communications Letters， 2021，25（12）：3760-3764.

［4］ WU Q Q， GUAN X R， ZHANG R. Intelligent reflecting surface-aided wireless energy and information transmission： an overview ［J］. Proceeding of IEEE， 2022，110（1）：50-170.

［5］ WEI L， HUANG C W， ALEXANDROPOULOS G C， et al. Channel estimation for RIS-empowered multi-user MISO wireless communications ［J］. IEEE Transactions Communications， 2021，69（6）：4144-4157.

［6］ KUNDUN K， MCKAYM R. Channel estimation for reconfigurable intelligent surface aided MISO communications： from LMMSE to deep learning solutions［J］. IEEE Open Journal Communications Society， 2021，2：471-487.

［7］ YANG F， ZHENG BX， ZHANG S W，et al. Intelligent reflecting surface meets OFDM： protocol design and rate maximization ［J］. IEEE Transaction Communication， 2020，68（7）：4522-4535.

［8］ YOU C S， ZHENG B X， ZHANG R.Wireless communication via double IRS： channel estimation and passive beamforming designs ［J］. IEEE Wireless Communications Letters， 2021，10（2）：431-435.

［9］ SOLTANI M，POURAHMADI V， MIRZAEI A， et al. Deep learning?based channel estimation ［J］. IEEE Communications Letters， 2019，23（4）：652-655.

［10］ ZHANG Y H， MU Y F， LIU Y， et al. Deep learning?basedbeamspace channel estimation in mmWave massive MIMO systems ［J］， IEEE Wireless Communications Letters， 2020，9（12）：2212-2215.

［11］ LIAO Y， HUA Y X， CAI Y L. Deep learning based channel estimation algorithm for fast time?varying MIMO?OFDM systems ［J］， IEEE Communications Letters， 2020，24（3）：572-576.

［12］ WANG T Q， WEN C K， JIN S， et al. Deep learning?basedCSI feedback approach for time?varying massive MIMO channels ［J］.IEEE Wireless Communications Letters， 2019，8（2）：416-419.

［13］ BAEK M S， KWAK S， JUNG J Y， et al. A supplementary explanation for experimental environment of “implementation methodologies of deep learning?based signal detection for conventional MIMO transmitters” ［J］. IEEE Transactions Broadcasting， 2021，67（1）：356-357.

［14］ TIAN CW， XU Y F， LI ZY， et al. Attention-guided CNN for image denoising ［J］. Neural Networks， 2020，124：117-129.

（責任编辑：包震宇，顾浩然）

DOI： 10.3969/J.ISSN.1000-5137.2024.02.013

收稿日期： 2023-12-10

作者简介：喻赟（2001—），男，硕士研究生，主要从事RIS通信信号处理方面的研究. E-mail： 2603514476@qq.com

* 通信作者：张静（1971—），女，副教授，主要从事通信信号处理方面的研究. E-mail： jannety@shnu.edu.cn

引用格式：喻赟，张静. 采用通道注意力机制的RIS辅助MIMO级联信道估计［J］. 上海师范大学学报（自然科学版中英文）， 2024，53（2）：228?235.

Citation format： YU Y， ZHANG J. Channel estimation for RIS assisted MIMO cascaded channels via attention mechanism ［J］. Journal of Shanghai Normal University （Natural Sciences）， 2024，53（2）：228?235.