基于人工智能的大规模MIMO信道状态信息反馈综述*
2021-09-29陈成瑞何世彪
陈成瑞,程 港,何世彪,廖 勇
(1.重庆工程学院 电子信息学院,重庆 400056;2.重庆大学 微电子与通信工程学院,重庆 400044)
0 引 言
随着科技的快速发展,人们对无线设备的数量、数据传输速率以及可靠性等需求逐步增长,第五代(5G)移动通信技术也逐渐普及。为了达到5G高可靠、大容量的性能要求,大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)技术通过在基站(Base Station,BS)部署大规模天线阵列,成倍提高频谱效率和能量效率,已成为5G的关键技术之一[1]。
在大规模MIMO系统中,BS能够在低信噪比的情况下恢复从用户设备接收到的信息,同时为多个用户提供服务[2-3]。然而,BS需要获取瞬时信道状态信息(Channel State Information,CSI)才能获得这些增益,而获得的CSI的准确性直接影响到大规模MIMO系统的性能[4]。对于上行链路,只需要用户端发送训练导频,BS就可以很容易地通过终端发送的导频来准确估计CSI,而下行链路的CSI获取很难实现,这也是在当前大规模MIMO技术中需要解决的问题。在时分双工(Time Division Duplex,TDD)模式中,BS通过上行链路发送训练导频进行信道估计,再利用互易性就可以推断出下行链路的CSI[5]。而在频分双工(Frequency Division Duplex,FDD)模式中存在弱互易性,这使得通过观察上行链路CSI[6]来推断下行链路的CSI变得困难。在传统的MIMO系统中,FDD系统的下行链路CSI首先由用户端通过下行导频估计获取后反馈给BS,然后采用基于码本或者采用矢量量化的方法来减小反馈开销[7],但是这种方式在大规模MIMO中是不可行的,因为在BS处使用了大量天线,这将大大增加CSI矩阵的维数,码本的反馈量和设计复杂度会显著提升。
由于物理传播环境中存在共享的局部散射,多用户大规模MIMO系统在用户信道矩阵中表现出联合稀疏结构。因此,基于压缩感知(Compressive Sensing,CS)的CSI反馈方案被提出。在实际系统中,由于信道时间相关性的存在,分组衰落假设可以用来压缩CSI[8]反馈并获得稀疏性,在一定程度上减小反馈开销[9]。但是,大部分传统的基于CS的反馈方法还存在一些缺陷,体现在[10]:①当考虑如何以更少的反馈量来获取更精确的信道状态信息时,并未考虑到在实际应用中信道时延的问题,CSI 从反馈到基站端重构出来都有时延差,现代通信系统中信道一般都是快速变化的,较大的时延差将会使当前的信道信息与重构出的信道信息有较大的偏差;②没有考虑到在实际应用中移动端的信道估计误差以及反馈链路误差,这些因素对信道反馈有着严重的影响;③虽然是利用信道的相关性对其压缩,然后通过重构算法对其进行恢复,能有效减少反馈量,但是在考虑提高重构精度的时候并未考虑到计算复杂度的问题;等等。
目前基于传统通信理论设计的通信系统极大地限制了性能的进一步提高,导致了严重的瓶颈。近年来,人工智能技术特别是深度学习等已被认为是处理复杂通信系统的一种有前景的工具,其优化无线通信的潜力已被证明[11-12]。利用深度学习技术,通信系统可以根据大量训练数据和信道模型去适应新的信道条件,降低建模难度,这样在物理层基础理论和关键技术上都能有所突破,从而得到整体性能更优的架构。国内外的大量研究将深度学习技术引入基于大规模MIMO的CSI反馈方案中并取得了一些成果,为传统方法不能解决的难题提供了新的思路。
本文介绍了大规模MIMO系统下CSI反馈的研究背景和现状,阐述了国内外有关将人工智能技术融入CSI反馈中的代表性方案,给出了一些未来参考研究的方向,以方便后续研究者快速聚焦,进而开展更有针对性的研究。
1 系统模型
国内外基于深度学习的CSI反馈方案大多从FDD模式下大规模MIMO系统模型出发,因此本文主要研究此系统模型。
(1)
(2)
2 代表性研究方案
2.1 基于深度学习的CSI反馈架构CsiNet
在对基于神经网络的CS反馈方法与结构信号感知和恢复[13]的认知下,文献[14]提出了一种大规模MIMO下基于深度学习的新型感知和恢复机制,即CsiNet。CsiNet是可以用于扩展研究的基础架构,它的结构与自动编码器类似,都有编码器和译码器两个部分。其中编码器部分特性对应于感知机制,与使用随机投影不同,CsiNet从原始信道矩阵学习转换,通过训练数据压缩码字,直接从训练数据中学习有效利用信道结构特征;译码器部分的特性则是对应于恢复机制,CsiNet学习从码字到原始信道的逆变换。
CsiNet的网络结构如图1所示,编码器的第一层是一个卷积层,以信道矩阵的实部和虚部作为其输入,这一层使用尺寸为3 × 3的内核来生成两个特征图。在卷积层之后,将特征图重构为一个N×1的向量,并使用一个全连接层生成码字s,这是一个M维的实值向量。前两层模拟CS的投影,作为编码器。一旦获取到码字s,就使用多个层(作为解码器)将其映射回信道矩阵。解码器的第一层是一个全连接层,它将码字s视为输入和输出两个大小为Nc×Nt的矩阵,它作为信道矩阵实部和虚部的初始估计,然后将初始估计输入几个“RefineNet”单元,不断地细化重构。每个RefineNet单元由4层组成,第1层是输入层,生成2个特征图;剩下的3层都使用内核,第2层生成8个特征图,第3层分别生成16个特征图,最后一层生成最终重构的信道矩阵。
图1 CsiNet网络结构
表1 CsiNet与CS算法的NMSE性能比较
由表1可知,CsiNet的NMSE值最低(在表中进行了标红),并且在所有压缩比下都显著优于基于CS的方法。由于CsiNet不依赖于人们对信道分布的了解,直接从训练数据中学习有效利用信道结构特征,而且算法是非迭代的,比传统基于CS的算法要快几个数量级。即使在基于传统CS方法无法工作的低压缩率下,CsiNet也具有良好的重构性能,并且能有效降低时间复杂度。
2.2 基于双向信道互易性的CSI反馈
5G基站需要用户设备(User Equipment,UE)提供下行链路CSI反馈,为了应对快速变化的环境,终端需要频繁地反馈CSI,从而造成带宽资源浪费。文献[19]研究了FDD系统中上行链路和下行链路的相关性,通过上行链路CSI估计UE上的低速率CSI,然后恢复下行链路的CSI,以此提高恢复精度。
图2展示的是上行链路和下行链路CSI在不同置信区间(Confidence Interval,CI)水平上的相关系数分布。从图中可以看出,CSI的实部和虚部直接拆分出的原始形式中,其上行链路CSI和下行链路CSI之间的相关系数在正相关和负相关之间剧烈波动,非常不稳定。这会导致在恢复下行链路CSI时,难以有效利用信道互易性。不过,通过对不同载波频率下CSI的信道模型和物理原理的研究[20]可以了解到,在FDD系统中,随机相位差会因为两个不同的载波频率而产生。在MIMO多径信道模型中,延迟域中幅度的相关性比相位的相关性更强。
图2 上行和下行链路CSI在不同置信区间的相关系数分布
因此,需要将延迟域中的CSI元素转换到极坐标系中,再来分别考虑上行链路和下行链CSI的幅度和相位相关性。从图2中可以看到,上下行链路之间的CSI中表现出极强的幅度相关性,相应的相位相关性却不同,它们在正相关和负相关之间有着明显的浮动。把CSI的实部和虚部的符号进行分离,那么上下行链路信道系数的绝对值(Absolute Value,ABS)具有较强的相关性,而其符号间的相关性却不那么明显。这表明了幅度和绝对值这两个指标在CSI上行链路和下行链路的系数中是密切相关的,为了获取大规模MIMO系统中CSI的反馈增益,可以利用好延迟域中的上下行链信道之间的幅度相关性。
基于上述分析,文献[19]提出了两个用于大规模MIMO系统中CSI反馈的深度祌经网络结构DualNet-ABS和DualNet-MAG。DualNet-ABS和DualNet-MAG分别利用CSI的系数在绝对值和幅度上的双向信道相关性来优化CSI的重构精度。其中,DualNet是利用基站处的上行链路CSI当作译码器网络的辅助输入,从而使译码器从大规模MIMO系统中用户设备的下行链路CSI反馈中实现更高精度的CSI恢复。图3是DualNet-MAG的总体架构,DualNet-ABS的架构与其类似。从图3中可以看出,用户端需要将下行链路CSI的幅值和相位分离,分离后,CSI的幅度被送入深度自编码器网络,该网络由一个卷积层、形状重塑层和全连接层组成。第一层是卷积层,这一层使用尺寸为3×3的卷积核来生成一个特征图,用方形的数量来表示特征图的数量,在特征图上用X1×X2来表示其大小。经过卷积层之后,特征图被重塑成一个矢量,然后由全连接层生成维度为M的码字矢量s。当基站端接收到码字s后,它将帮助恢复上行链路CSI。接收到的s首先用一个全连接层映射成原始维度,然后上行链路CSI矩阵将被重塑为一个矢量。接下来,将拼接层重塑为2个特征图,以此作为残差网络的输入。DualNet-MAG中的残差网络包含两个残差块,可以有效地解决梯度消失问题[21]。每个残差块中的3个卷积层使用尺寸为3×3的卷积核分别生成8个、16个和2个特征图。最后,将幅值与其相对应的相位组合成完全恢复的CSI系数。
图3 DualNet-MAG网络结构[19]
2.3 基于时间相关性的CSI差分反馈
现代移动通信系统中,要想获得多天线带来的通信速率的提升,需要基于准确的CSI进行预编码来达到目的,这就使得针对时变CSI的及时反馈变得尤为重要[22-23]。在大规模MIMO系统中,采集的信道数据序列具有时间相关性,这是因为CSI反馈周期小于信道相干时间[24],而时间相关性是可以对信道矩阵进行高效压缩的。
文献[25]提出了一种基于深度学习的方法,使用深度循环神经网络学习时间相关性,并采用深度可分离卷积来收缩模型。通过研究不同结构的时空特征表示,设计了特征提取模块。实验结果表明,该方法在恢复质量和精度上有着良好的表现。
文献[26]提出了差分反馈的思想,利用先验CSI信息,用户设备和基站端可以借助它们之前存储的CSI估计来促进CSI的反馈和重构。其中,用户设备只是压缩反馈CSI变化的那一部分,并不是完整的CSI,这样可以在不丢失共有关键信息的前提下保证更大程度的压缩。
在简化反馈网络设计的同时要兼顾相邻时刻CSI的相关性,因此,需要使用一阶自回归模型来建立信道变化矩阵[27-29]:
Ht=γHt-1+Vt。
(3)
式中:Ht和Ht-1是t和t-1时刻的信道矩阵;Vt是一个随机矩阵,它的均值为0;γ是常数。如果给定Ht和Ht-1,那么可以对γ进行估计:
(4)
为了保证CSI反馈的精度,需要增加单次CSI反馈的数据量或者反馈的频率。基于一阶自回归模型,提出低复杂度的编码器的译码器模型如下:
(5)
(6)
通过此简化模型,可以建立差分反馈网络,它利用CSI的一阶自回归模型主动反馈相邻时隙之间的CSI预测误差,从而在大规模MIMO系统中进行高效率的CSI反馈以及重构。
图4 差分反馈网络结构
实验表明,差分反馈网络具有很多优势。与基于循环神经网络的CSI反馈比较,差分反馈网络可以利用之前时隙的训练模型来初始化以后时隙中的网络参数,并且可以直接当作未来时刻的反馈网络。而且,差分反馈网络中的CSI矩阵相对来说更加稀疏,这使得差分反馈网络在反馈的时候可以进行更高效率的压缩。此外,因为相邻连续时隙的CSI反馈有相似的数据特征,所以差分反馈网络早期时隙中的预训练模型是可以用于未来时隙模型的初始化的,以此来提高训练效率。差分网络在降低了神经网络的计算开销和参数量的同时,也明显降低了存储开销和复杂度,这些良好的表现更适用于大多数无线网络的应用。
2.4 基于长短期记忆网络的CSI反馈
文献[30]提出利用长短期记忆网络(Long Short-Term Memory,LSTM)扩展一个基于深度学习的CsiNet架构,图5是CsiNet-LSTM的网络结构。在进行角度时延域的特征提取以及恢复重构时,该结构采用了两种不同的压缩率。其中,高压缩率的CsiNet将第一通道的H1′转换为M1×1的码字矢量,该矢量保留了足够的结构信息以进行高分辨率恢复。由于剩余信道和第一个信道之间的相关性包含的信息量更少,所以低压缩率的编码器在剩余的T-1个信道矩阵上生成一系列M2×1的码字向量。在被送入低压缩率的CsiNet译码器之前,T-1个码字矢量都与第一个M1×1的码字矢量相连接,以便充分利用反馈信息,每个CsiNet都输出两个矩阵从角度时延域提取特征。图5中显示的所有低压缩率的CsiNet都共享相同的网络参数,即权重和偏差,这将大大减少参数开销。此外,如果T的值改变以适应信道变换的速率和反馈频率,那么该结构体系可以很容易地重新调整,以在具有不同T值的信道上继续执行。图5中的灰块来自原始CsiNet的载荷参数,作为整个结构体系端到端训练之前的预训练。接下来使用LSTM扩展CsiNet解码器进行时间相关的提取和最终重构。LSTM包含原始的内存单元,可以将之前提取的信息保存很长一段时间,以便之后进行预测。CsiNet解码器的输出在被送入三层LSTM之前形成一个长度为T的序列,每个LSTM含有与输出维度相同数量的隐藏单元,最后的输出被重构成最终的恢复矩阵。在每个时间步长,LSTM都会从之前的输入中学习时间相关性,然后将它们与当前输入合并,以提高低压缩率下的恢复质量。
图5 CsiNet-LSTM的网络结构[30]
2.5 基于DNNet去噪网络的CSI反馈
传统的压缩感知算法高度依赖于信道稀疏度,为了解决这个问题,可采用深度学习技术将CSI压缩成一个低维码字,在反馈链接完善的情况下,它比CS算法表现出更好的性能,但在实际应用中,存在各种干扰和非线性效应。因此,文献[31]提出了一种基于深度学习的去噪网络DNNet来提高信道反馈的性能。图6是DNNet网络的结构。DNNet的基本思想是通过噪声提取单元(Noise Extraction Unit,NEU)从码字中提取噪声,然后从码字中减去噪声。NEU采用L层的全连接神经网络,包括1个输入层、1个输出层和L-2个隐藏层。
图6 DNNet网络的结构
输入码字可以写为
(7)
在输入码字之前,首先进行批量归一化(Batch Normalization,BN),加速深度网络训练,避免输出饱和:
(8)
NEU的输出为从码字中提取的噪声,即
(9)
第l层的输出可以写成
(10)
式中:ζ(x)=(1+exp(-x))-1是加入非线性变换的Sigmoid激活函数。隐藏层的神经元数为1 024,一般高于码字的维数,这样更容易捕获噪声。为了避免高维网络的过拟合,需要在隐藏层中加入散度稀疏性约束:
(11)
(12)
(13)
然后,将去噪后的码字从DNNet输出到译码器中进行CSI重构。
在预训练阶段,分别训练自编码器模型和DNNet,得到下一个联合训练阶段的初始权重系数。以H的实部和虚部作为输入数据来训练自编码器模型,其大小为2×Np×Nt,Np代表信道矩阵的前p行。自动编码器模型的权重系数被初始化,这样就符合截断正态分布。
使用COST2100信道模型来生成数据集,配置天线数Nt=32,子载波数Nc=1 024,然后将其转化为角延迟域,分别生成100 000个样本作为训练集,30 000个样本作为验证集,20 000个样本作为测试集。学习率、批量分别设置为0.001和200。完成对自编码器模型的训练后,在码字中加入噪声,DNNet的数据集是由噪声层自动生成的,所以只需要生成自编码器模型的数据集。
仿真结果表明,联合训练阶段可以通过DNNet进一步提高CsiNet的性能。通过比较预训练阶段后CsiNet与DNNet、联合训练阶段后CsiNet与DNNet以及使用深度AE[32]和噪声[33]训练CsiNet后的NMSE性能发现,随着信噪比的增加,算法的NMSE逐渐减小。联合训练阶段后CsiNet与DNNet显著相关,所有信噪比均优于预训练阶段后的结果,说明联合训练阶段后DNNet增强了网络的抗噪性能。此外,联合训练DNNet的CsiNet在所有信噪比上都优于其他算法,联合训练DNNet的CsiNet表现最好。
2.6 其他方案以及改进
相较于传统的CSI反馈方案,深度学习技术的引入被用于更多复杂的场景,同时也降低了反馈开销,提升了恢复精度等。国内外的研究者也在持续不断地研究具有更高性能的方案。文献[19]研究了FDD系统中上行链路和下行链路的相关性,通过上行链路CSI估计UE上的低速率CSI,然后恢复下行链路的CSI以提高恢复精度。文献[30]在基于深度学习的CsiNet架构中引入LSTM网络,提升了CSI重构精度。这些方案都在不同程度上提升了性能,文献[26,34]在已有的反馈方案上对网络结构进行了一些优化和调整,采用深度可分离卷积来收缩模型,并研究不同结构的解耦时空特征表示,设计了特征提取模块,在低压缩比下也具有显著的鲁棒性。同时,在译码器网络中增加注意机制也能提升网络性能。
文献[31]提出了一种基于深度学习的去噪网络DNNet,联合训练DNNet的CsiNet在所有信噪比上都优于其他算法,同时,联合训练阶段后DNNet增强了网络的抗噪性能。另外,文献[14,19,33]提出的基于深度学习的信道反馈算法可与所提出的DNNet协同工作,进一步提高反馈性能。
3 展望
以上基于大规模MIMO的智能CSI反馈方案在不同方面、不同程度上为解决大规模MIMO系统中高精度、低开销等CSI反馈问题提供了思路。虽然基于人工智能尤其是深度学习技术的CSI反馈方案在一定程度上弥补了传统方法的不足之处,并且在未来移动通信系统的应用中有着极大的潜力,但是,未来对无线通信有着高可靠性和超高容量的强烈需求,将人工智能技术应用于CSI反馈仍然面临着巨大的挑战。
3.1 快速部署能力和泛化性
现有的大部分CSI反馈网络是根据不同具体场景下的训练集使得网络权重更新,由于大规模MIMO系统的无线通信配置和应用场景可能不同,如果每种场景都进行新的网络训练,那将耗费大量的计算资源,并且每种场景下都收集训练数据还会增加实际部署成本。如果能基于不同场景下信道数据的共性特征,结合迁移学习等方法把训练好的模型迁移到其他场景的模型中,就能实现CSI反馈网络对其他新场景进行快速调整。因此,需要设计并研究模型驱动的CSI反馈方案,提升快速部署能力和泛化性。
3.2 基于实测数据的CSI反馈
现有的基于大规模MIMO的CSI反馈方案基本都停留在仿真阶段,缺乏大规模MIMO系统信道实测数据的支撑。目前的研究工作仍然是基于特定仿真信道生成的数据集,尽管有相关的文献和标准表示信道模型能反映大规模MIMO信道的核心特征,但是实际信道场景是千变万化的,仿真得到的CSI数据集和实际场景下测得的数据集依然存在差异。因此,研究者可以通过收集实际信道的真实数据并建立典型场景下的大规模MIMO信道数据库,然后对网络架构再进行训练,从而针对真实数据中的差异特性对CSI反馈网络进行优化,为以后的部署打好基础。
3.3 信道估计和信道反馈联合优化
FDD模式下的大规模MIMO系统中,由于天线数目的增加,下行信道估计也会遇到导频开销增长的问题。因此,考虑到时间相关性、双向信道相关性和空频域相关性等信道特性带来的冗余,需要设计低导频开销的信道估计方案,根据现有的CSI反馈方案和信道估计方案进行联合优化。
3.4 新的网络结构或算法
现有的基于深度学习的反馈方案基本都采用基于自动编码器的网络架构,虽然比传统的压缩感知算法有所改进,但并没有实质性的创新,而其他方案又用不同的神经网络进行替换,无法进一步突破。因此,可以应用其他新型学习算法或网络结构,如联邦学习算法框架,让人工智能系统能够更加高效、安全、准确地使用数据和场景运用。
4 结束语
本文首先介绍了大规模MIMO系统下CSI反馈的研究背景和现状,构建了FDD大规模MIMO系统模型,然后阐述了国内外有关将人工智能技术融入CSI反馈中的代表性方案,包括基于深度学习的CSI反馈架构CsiNet、基于双向信道互易性的CSI反馈、基于时间相关性的CSI差分反馈、基于长短期记忆网络的CSI反馈、基于DNNet去噪网络的CSI反馈。这些方案从不同角度、不同程度上对传统方案进行改进,在提升CSI重构精度、降低反馈开销等方面取得了很好的成果。本文对智能CSI反馈遇到的挑战进行了归纳,给出了一些未来参考研究的方向。
虽然将人工智能技术应用于CSI反馈仍然面临着巨大的挑战,但未来对无线通信有着高可靠性和超高容量的强烈需求,它表现出的性能优势在许多应用前景中仍有极大的潜力。