基于分布式部分连接结构的多用户大规模MIMO 混合预编码
2022-03-01张雷王勤
张雷,王勤
(成都大学电子信息与电气工程学院,四川 成都 610106)
0 引言
贝尔实验室Marzetta 等[1]提出的大规模MIMO(massive multiple-input multiple-output)技术,通过在基站配置大量天线,并结合发射预编码和接收合并处理,能极大提升系统频谱效率和功率效率,不仅成为5G 的关键技术之一[2],在后5G 及6G 移动通信中还将继续发挥重要作用[3-4]。
在下行传输中,大规模MIMO 理论上可采用全数字预编码以获取最优性能。然而,基带的数字化处理要求每个天线具有独立的射频链路。相较于传统MIMO,大规模MIMO 天线数量巨大,导致成本和功耗急剧上升(毫米波频段通信尤甚),从而制约了其实际应用。因此,学术界提出了射频链路数小于基站天线数的模数混合预编码方案[5-6],其基本思想是将预编码分解为基带低维数字预编码和射频高维模拟预编码2 个部分,且后者通常使用简单的移相器实现,从而以较小性能损失达到大幅降低成本和功耗的目的。
大规模MIMO 混合预编码的系统结构主要包括全连接和部分连接两大类。早期研究者通常采用全连接结构设计[5-7],即每个射频链路通过移相器与所有天线相连,所需移相器数等于天线数与射频链路数之积,导致成本和功耗仍然较高。因此,研究者又提出了部分连接结构[8-11],即每个射频链路仅与互不交叠的天线子阵列相连,所需移相器数等于天线数。在预编码器设计方面,由于最优的数字预编码和模拟预编码具有内在耦合关系且相应优化问题具有非凸性质,因此很难求得最优解。文献[8]考虑单用户的全连接结构,提出基于正交匹配追踪的求解算法,其性能接近最优全数字预编码,但复杂度极高。针对单用户的部分连接结构,文献[9-10]分别研究了单载波情形的串行干扰消除预编码算法和多载波情形的并行预编码处理框架,文献[11]设计了注水结合迭代算法的混合预编码器。上述研究表明,相比全连接结构,部分连接结构虽性能有一定损失,但成本、功耗和复杂度却更有优势,故成为近年来大规模MIMO 混合预编码的主流结构之一。然而,以上方案也存在两点缺陷:一是仅针对单用户系统研究,数字预编码采用的奇异值分解等方法难以推广至多用户情形,与存在大量少天线甚至单天线用户端的典型场景不太相符;二是多采用迭代等复杂算法,难以用于实际系统。
针对多用户的全连接结构,为降低计算复杂度,文献[7]摒弃了以上迭代求解的思路,提出基于相控迫零(PZF,phased zero-forcing)的混合预编码方案,首先直接提取信道系数的相位设计模拟预编码矩阵,然后对模拟预编码矩阵和信道矩阵之积构成的等效信道矩阵实施简单的迫零数字预编码。该方案能分别获得模拟域和数字域的简单闭合解,且能在模拟域获得类似传统等增益发送的子阵列增益,总体性能相对于全数字预编码损失不大。随后,文献[12]将文献[7]的相控模拟预编码环节应用于单用户的部分连接结构,提出“相控模拟预编码+奇异值分解数字预编码”方案;文献[13-14]将文献[7]方案推广至多用户的部分连接结构,提出“相控对角模拟预编码+迫零数字预编码”方案。文献[12-14]方案继承了文献[7]方案的优点,是部分连接结构中使用相控模拟预编码的典型代表。然而,文献[12-14]方案也存在不足:考虑的部分连接结构都为集中式,即每个射频链路仅连接一个子阵列,子阵列数必须等于射频链路数;固化了信道相位、子阵列和射频链路之间的匹配关系,未能充分利用不同子阵列增益存在的差异去优化设计模拟预编码。
针对上述问题,本文提出一种基于分布式部分连接结构的多用户大规模MIMO 混合预编码方案,主要工作如下。
1)设计分布式部分连接结构。在给定发射天线数和射频链路数条件下,突破传统集中式部分连接结构子阵列数等于射频链路数的限制,通过减少单个子阵列的天线数来增加子阵列数,以使每个射频链路能连接多个分布的子阵列,从而提供更高的空间分集增益。
2)分析相控模拟预编码对迫零数字预编码性能的影响。通过推导迫零数字预编码所得频谱效率上界与模拟预编码和等效信道矩阵之间的关系,得到“增大模拟域的子阵列增益有助于提升系统频谱效率上界”的结论,为相控模拟预编码设计提供了理论依据。
3)提出串行最大化用户总体子阵列增益的相控模拟预编码算法。该算法以最大化频谱效率上界为优化目标,生成的模拟预编码矩阵具有比传统方案的块对角结构更通用的块稀疏结构,能充分获得分布式部分连接结构的空间分集增益,且计算复杂度仅比传统方案略微增加。仿真表明,所提方案相较于传统方案能显著提升系统频谱效率。
符号说明:大小写黑斜体字母分别表示矩阵和向量;IN表示N阶单位矩阵;AT和AH分别表示矩阵A的转置和共轭转置;||A||表示矩阵A的Frobenius 范数;tr(A)表示矩阵A的迹;Cm×n表示m×n阶复数矩阵集合;CN(μ,σ2)表示均值为μ、方差为σ2的复高斯随机变量;χ2(n)表示自由度为n的卡方分布;E(X)表示X的数学期望;AB 表示集合B 关于集合A 的相对补集;Z+表示正整数集合;“”表示对x向上取整。
1 系统模型
考虑采用部分连接结构的多用户大规模MIMO 下行链路,如图1 所示。配有NTX个发射天线和NRF个射频链路的基站,每次调度K个单天线用户与之在同一时频资源通信,向每个用户发射一个数据流,且满足大规模MIMO 混合预编码基本要求K≤NRF≤NTX。基带数字预编码和射频模拟预编码分别用矩阵表示。通常FBB的幅度和相位都可调整,而FRF一般通过移相器实现以满足恒模要求。受总发射功率约束,需满足=K。
图1 基于分布式部分连接结构的大规模MIMO 混合预编码系统
与传统方案中子阵列数等于射频链路数的集中式部分连接结构不同,为提供更高的空间分集增益,本文设计新的分布式部分连接结构,即在保持发射天线数和射频链路数不变的条件下,通过减少单个子阵列的天线数来增加子阵列数,以使每个射频链路能连接多个分布的子阵列。一般根据距离就近原则将NTX个发射天线划分为N(N=DNRF,D∈Z+)个子阵列,各子阵列天线数为J=。例如,对均匀线性阵列(ULA,uniform linear array),设天线依次编号为1,2,…,NTX,则编号为(n-1)J+1~(n-1)J+J(n=1,…,N)的J个天线属于第n个子阵列。每个射频链路将根据FRF的求解结果通过分布式连接器与D个子阵列相连(D可视为分布阶数),即共连接M==DJ个天线。当D>1时,有N=DNRF,即子阵列数为射频链路数的整数倍,对应于本文所提分布式部分连接结构;当D=1 时,有N=NRF,即子阵列数等于射频链路数,退化为传统的集中式部分连接结构。无论何种结构,一个天线均对应于一个移相器,即移相器总数均为NTX。必须指出,在该结构中子阵列仅通过逻辑划分而得,不会改变基站天线的物理形态。分布式连接器的具体设计详见第4 节。
其中,s∈CK表示基站发送至K个用户的原始信号向量,满足 E(ssH)=(P/K)IK,P为基站总发射功率;n表示用户端独立同分布的噪声向量,其元素nk~CN(0,1)。因噪声平均功率为1,故系统平均信噪比在数值上等于P。由此,用户k的接收信干噪比γk为
其中,fBB,k为矩阵FBB的第k列,表示用户k对应的数字预编码向量。通常用如下的平均频谱效率R度量混合预编码系统的性能。
其中,Rinst表示瞬时频谱效率。
2 传统方案回顾
本文方案与文献[12-14]基于集中式部分连接的传统方案在模拟预编码环节均采用基于信道系数相位信息的设计框架,故有必要简要回顾该传统方案的相控模拟预编码处理流程。
记H的第(k,p)个元素为hk,p(k=1,…,K;p=1,…,NTX),表示基站第p个天线到第k个用户的信道系数,和φk,p分别表示hk,p的幅度和相位。设基站能通过上下行链路互易性(时分双工系统)或用户端反馈(频分双工系统)获得H。
在传统方案中,因N=NRF,即射频链路数等于子阵列数,每个子阵列天线数等于M。定义=1,…,NRF表示第个子阵列到第k个用户的信道向量。受部分连接结构约束,对子阵列,相控模拟预编码需根据一定准则从K个候选信道向量中选择一个合适的,并提取各元素的相位信息以构造子阵列对应的模拟预编码向量中元素m(m=1,…,M)的相位即天线对应移相器的移相值。同时,将射频链路通过相应移相器组和子阵列的各天线相连。由此,可认为通过该准则在用户k的信道系数与子阵列(射频链路)之间建立了一个匹配关系。传统方案中用户和子阵列(射频链路)的匹配关系固定,即用户k和子阵列(射频链路)(i-1)K+k(i∈Z+)匹配。相应子阵列(射频链路)的模拟预编码向量可表示为(上标C 表示传统方案)
整体的模拟预编码矩阵由所有子阵列(射频链路)对应的模拟预编码向量组成,具有如下块对角结构。
3 相控模拟预编码对迫零数字预编码的影响分析
由于文献[12]针对单用户情形设计,在用户端可进行集中式接收处理,可在发射端的数字预编码环节采用最优的奇异值分解。而多用户情形中不同用户只能进行分布式接收处理,故在发射端的数字预编码环节一般只能采用易于用户端分布式处理的算法。就多个单天线用户情形而言,迫零算法较成熟且得到广泛应用[7,13-14],故本文也采用迫零算法进行数字预编码。
给定FRF,在基带可得等效信道矩阵G=HFRF。对G求伪逆得
如前所述,传统方案固化了用户与子阵列和射频链路之间的匹配关系,未能探索模数预编码之间的联系和充分利用空间资源。接下来,将分析相控模拟预编码对迫零数字预编码的影响。
由于采用了迫零数字预编码,理论上各用户接收信号之间干扰可完全消除,则式(2)可化简为
故瞬时频谱效率Rinst=Klb(1+γ),可知Rinst是的单调递增函数。设A≜GGH=UΛUH,其中U和Λ分别为A的特征矩阵和特征值构成的对角矩阵。因(GGH)-1=UΛ-1UH,故,其中λk为A的第k个特征值。由不等式,…,aK>0,α<0<β[15],可知
由式(9)可知,tr(A)越大,则的上界越大,Rinst和R的上界也随之越大。因此,若能通过对模拟预编码优化设计而增加tr(A)值,则很有可能提升Rinst和R。
进一步分析tr(A)。因且K≤NRF,故K和NRF的关系一般可表示为NRF=(Q-1)K+。为分析方便,不妨假设NRF为K的正整数倍,即。由此,G可按列方向划分为Q个K×K阶子矩阵,即。记子矩阵Gq(q=1,…,Q)的第(k,i)个元素为gq,ki(k,i=1,…,K)。并进一步假设信道为独立同分布的Rayleigh 衰落,即hk,p~CN(0,1)(k=1,…,K,p=1,…,NTX)。根据A的定义,有
在传统方案条件下,若给定H,则A1和A2确定,即tr(A)和Rinst上界也随之确定。进一步分析A1和A2。
先考察1A。注意到是Gq的主对角元。因是均值为、方差为的Rayleigh 分布随机变量,而有限个Rayleigh 分布随机变量之和的概率分布函数准确闭合表达式并不存在,其近似表达式非常繁杂[16]。因此,gq,kk和1A的准确分布特性难以得到。不过,gq,kk本质上可视为第(q-1)K+k个子阵列提取其到用户k的信道向量相位信息以实施模拟预编码而获得的子阵列增益(形式上与采用等增益发送类似),对应的天线序号是(q-1)KM+(k-1)M+1~(q-1)KM+(k-1)M+M连续M个值。事实上,相控模拟预编码完全可突破传统方案的这种约束。设集合 D⊂{1,2,…,N}且D 的势为D,将gq,kk改写为,即变换为D个阵元数皆为J的子阵列增益之和。在分布式部分连接结构条件下,因总的子阵列数为N=DNRF≫D,即使给定H,若能引入某种机制,对每一个用户k,尽可能从其对应的N个子阵列信道向量中选择子阵列增益较大的D个与之匹配,则将增大A1。
再考察A2。注意到·是Gq的非主对角元,且为M个独立的均值为0、方差为1/M的复高斯随机变量之和,故gq,ki~CN(0,1),进而A2~χ2(NRF(K-1))。在典型的大规模MIMO 系统中,因参数NRF(K-1)值一般会达到数十甚至上百,由卡方分布性质知,前述基于子阵列增益的选择对A2影响很小。
当NRF不为K的正整数倍(即Kr>0)时,G可按列方向划分为Q-1 个K×K阶子矩阵和1 个K×Kr阶子矩阵,以上分析同样适用。综上,在给定H条件下,若能引入分布式部分连接,并在模拟预编码环节使用某种增大子阵列增益的动态相控匹配机制,则将增大A1且几乎不影响A2,从而增大tr()A,并最终提升Rinst和R的上界。此外,以上分析虽假设信道为独立同分布的Rayleigh 衰落,但第5 节仿真结果表明,此结论对毫米波大规模MIMO中采用较多的几何Saleh-Valenzuela(S-V)信道[7-8]等典型信道模型同样适用。
4 基于分布式部分连接结构的相控模拟预编码
根据第3 节分析可知,相控模拟预编码环节的相控匹配机制及可获得的子阵列增益将影响迫零数字预编码性能和系统频谱效率。受此启发,本文提出如下基于分布式部分连接结构的相控模拟预编码。
4.1 优化目标
所提分布式部分连接结构如第1 节所述,此时有D>1和N=DNRF>NRF。射频链路和天线子阵列之间的连接由分布式连接器动态调节,其本质是一个可编程的NRF:DNRF连接网络,具体连接关系和移相器的移相值均取决于相控模拟预编码的设计结果。设用户序号集合为 U={1,2,…,K},子阵列序号集合为 A={1,2,…,N}。将H按列方向划分为N个阶数为K×J的子矩阵,即
其中,Hn∈CK×J(n∈A)可视为第n个子阵列到K个用户的下行信道矩阵,并记Hn的第k(k∈U)行表示第n个子阵列到第k个用户的信道向量。
与传统方案类似,所提方案需根据某种准则从Hn的K个信道向量{h1,n,…,hK,n}中选择一个合适的hk,n,并提取hk,n各元素的相位信息以构造子阵列n对应的模拟预编码向量fk,n,即
并且,在模拟预编码向量fk,n和其对应信道向量hk,n的共同作用下,用户k对应的子阵列n的增益为
注意到,ηk(n)是关于n的函数,即对同一k但不同的n值,ηk(n)存在差异。如前所述,每个射频链路将基于该准则通过分布式连接器同时连接D个子阵列,并生成对应于用户k的D个模拟预编码向量集合{fk,n(k,1),…,fk,n(k,D)},进一步设这D个子阵列的序号构成集合 A(k)≜{n(k,1),…,n(k,D)}⊂A,则用户k对应的总体子阵列增益为
不难发现,ηk与第3 节的gq,kk等价。因此,为提升系统的频谱效率上界,可将相控模拟预编码的优化目标简化为
4.2 求解算法及分布式连接器设计
针对式(15)的最优设计应同时使所有ηk最大化,这需对所有用户和子阵列进行全局优化,其计算复杂度较高。考虑到部分连接结构要求不同k值对应的子阵列应互不交叠,本文提出如下次优的串行最大化用户总体子阵列增益的相控模拟预编码算法。其主要思想是依次对每用户在当前可选子阵列集合中选择满足式(15)的D个子阵列,且对后续用户操作时要从可选子阵列集合中剔除这D个子阵列。同时,该算法也建立了用户与射频链路和子阵列之间的匹配关系,从而决定了分布式连接器的连接关系。
由算法1 得到的FRF具有如下形式的结构
1)FRF的阶数为NTX×NRF,可视为由N个J维向量和(N-1)NRF个J维全零向量组成的块稀疏矩阵。位于FRF的第n(q,k,d)个块行和第(q-1)K+k列,第n(q,k,d)个块行的含义是FRF的第[n(q,k,d)-1]J+1至第n(q,k,d)J行,n(q,k,d)的具体值取决于算法1 的计算结果。
2)第n(q,k,d)个块行仅有一个非零块,即每个子阵列仅对应一个射频链路;第(q-1)K+k列有D个非零块,即每个射频链路对应D个子阵列。这表明FRF满足所提分布式部分连接结构。
3)每一列所有非零元素的模相等,这表明FRF只涉及相位变换,即可通过移相器实现。
4)每一列的Frobenius 范数都为1,这表明FRF不改变信号的功率。
5)FRF具有更一般的块稀疏结构,可视为式(5)块对角结构的推广。当D=1 且不采用算法1 时,式(16)即退化为式(5)。
与此同时,各移相器的移相值和分布式连接器的具体连接关系也由算法1 确定。具体而言,中元素m(m=1,…,J)的相位-φk,(n(q,k,d)-1)M+m即基站天线(n(q,k,d)-1)J+m对应的移相器的移相值。同时,将射频链路(q-1)K+k通过相应移相器与子阵列集合Bq,k相连。由此,可认为通过算法1 在用户k、射频链路(q-1)K+k和子阵列集合Bq,k之间建立了一个匹配关系。
算法1 以低复杂度提供了式(15)的次优解,从而能增大tr(A),并最终提升Rinst和R的上界。当然,由第3 节可知,由于tr(A)的表达式十分复杂,即使在Rayleigh 衰落信道条件下也难以获得其准确分布特性,因此,就作者目前所知,所研究系统的频谱效率与主要参数NRF、M、K和D等之间的定量关系仍是一个开放问题。不过,从所提方案“分布式部分连接结构+算法1”的基本原理知,其相较于传统方案“集中式部分连接结构+固定匹配相控算法”能提供更高的空间分集增益,且该增益将随分布阶数D增加而增大。第5 节的仿真结果对此提供了充分验证。
4.3 计算复杂度分析
本节主要比较所提方案与文献[12]传统方案1和文献[13-14]传统方案2 的计算复杂度。表1 列出了它们的特点和计算复杂度。在传统方案1 和传统方案2 中,求解模拟预编码矩阵只需对空口信道矩阵相应元素的相位取相反即可,其计算复杂度可忽略不计;求解等效信道矩阵的计算复杂度均为 O(KMNRF)次复数乘法;求解数字预编码矩阵的计算复杂度分别为 O(K2NRF+)[12]和 O(K2NRF)次复数乘法[14]。其中,因传统方案1 针对单用户系统设计,用K表示其用户端接收天线数。而所提方案与传统方案2 都针对多用户系统设计,求解等效信道矩阵和数字预编码环节的处理与传统方案2 相同,仅在模拟预编码环节增加了分布式连接器的有关处理(即算法1)。
算法1 的计算复杂度具体分析如下。
1)当q=1时,对用户k,需计算N-(k-1)D个子阵列增益,即(J-1)(N-(k-1)D)次实数加法;从N-(k-1)D个子阵列增益中查找最大D个值即经典的Top-k 查询问题,应用小顶堆算法[17],计算复杂度为 O((N-(k-1)D)lbD)次实数加法;计算复杂度合计为 O((J-1)(N-(k-1)D)+(N-(k-1)D)lbD)次实数加法。
2)当2≤q≤Q时,因q=1 时已计算出各子阵列增益,不需要再次计算。对用户k,需从N-((q-1)K+k-1)D个子阵列增益中查找最大D个值,计算复杂度为 O((N-((q-1)K+k-1)D)lbD)次实数加法。
累计以上所有环节,得到总计算复杂度约为O(KM(NRF-K/2)+D(-K(NRF-K/2)))次实数加法,即 O((KM(NRF-K/2)+D(-K(NRF-K/2)))/2)次复数加法。因-K(NRF-K/2)>0,故算法1 的计算复杂度与D呈单调递增关系。
表1 最后一行给出了典型参数NTX=256、NRF=K=16、D=2,4,8,16条件下3种方案的具体计算复杂度。考虑到实际不同软硬件约束条件,单次复数乘法的计算复杂度为单次复数加法的10~100 倍。即使假设单次复数乘法的计算复杂度约为单次复数加法的10 倍,该示例中所提方案相较于传统方案2 增加的计算复杂度最多(D=16 时)不超过5%。更多实例计算表明,在通常参数条件下,所提方案相较于传统方案2 增加的计算复杂度一般为1%~10%,且均低于传统方案1。
此外,在引言部分提及的迭代类复杂算法中,文献[8]和文献[9]方案是典型代表,其计算复杂度分别为 O(M2(NRFS+K))(S为迭代次数,通常取值为S≥5)和次复数乘法,即主要参数的4 次方或5 次方。而表1 中3 种直接提取信道系数相位的方案的计算复杂度则为主要参数的3 次方。因此,迭代类方案的计算复杂度一般比后一类方案高1~2 个数量级。
表1 所提方案与传统方案的特点及计算复杂度
综上,所提方案的计算复杂度略高于传统方案2,低于传统方案1,远低于迭代类方案。
5 仿真结果与分析
对不同参数下所提方案与表1 所列传统方案1和传统方案2 的频谱效率性能进行Monte Carlo 仿真评估,多用户情形的用户端均为单天线接收。其中,所提方案与传统方案2 系统结构更接近,因此将传统方案2 作为主要比较对象,主要区别在于所提方案采用了分布式部分连接结构且在模拟预编码环节采用了算法1。同时,注意到传统方案1 系针对单用户情形设计,因单用户系统在用户端可进行集中式接收处理(优于多用户系统的分布式接收处理),使传统方案1 可在发射端的数字预编码环节采用最优的奇异值分解,故在相同条件下可将其视为用户端总天线数一定时(将K个单天线用户替换为具有K个接收天线的虚拟单用户)多用户预编码的性能上限,因此,将传统方案2 作为参考对象。
仿真时考虑2 种信道模型。模型1 为理论研究普遍使用的Rayleigh 衰落(如本文第3 节和文献[7]有关理论分析),假设所有收发天线对之间为独立同分布的Rayleigh 衰落信道,且hk,p~CN(0,1)(k=1,…,K;p=1,…,NTX)。模型2 为几何S-V 信道[7-8]。因大规模MIMO 混合预编码经常应用于毫米波传播情形,而几何S-V 信道模型较好地刻画了毫米波传播环境的稀疏散射特性,在毫米波大规模MIMO 有关研究中采用较多。本文考虑二维几何S-V信道模型,基站到用户k的信道向量可表示为[7]
其中,L为基站到每用户的传播路径数,αk,l、φk,l和a(φk,l)分别为用户k第l径的增益、方位角和导向向量。仿真假设如下:使用均匀线性阵列;αk,l~CN(0,1);用户k的中心方位角φk,0在[0,2π]均匀分布,φk,l在 [φk,0-π/9,φk,0+π/9]均匀分布;,d和λ分别为天线间距和波长,且d=λ/2。
其他仿真参数统一设置为:基站天线数NTX=256,射频链路数NRF=16,所提方案中分布阶数D=2,4,8,16;未专门说明时,设基站能准确获取下行信道矩阵H。
5.1 仿真1:评估信道模型1 对应的频谱效率性能
图2 给出了用户数K=16 时3 种方案在不同信噪比时的频谱效率。从图2 中可以看出,在所示信噪比区域,所提方案比传统方案2 的频谱效率大幅提升,且提升比例随D增加而增大;同时,相较于传统方案1,所提方案在D=8 时性能与之相当,在D=16时则更胜一筹。这些结果表明,得益于“分布式部分连接结构+算法1”相较“集中式部分连接结构+固定匹配相控算法”对空间资源的更好利用,所提方案性能不仅显著优于同为多用户情形的传统方案2,还在高分布阶数时超过了作为集中式部分连接结构性能上限的传统方案1。
图2 用户数K=16时3 种方案在不同信噪比时的频谱效率
文献[7]在设计全连接结构的相控模拟预编码时要求接入用户数要等于射频链路数,而表1 所列3 种方案均支持接入用户数(单用户情形)或独立数据流数(多用户情形)少于射频链路数的情形。图3 和图4 分别比较了平均信噪比为0 和10 dB 时3 种方案的频谱效率与接入用户数(对传统方案1,假设独立数据流数等于用户端天线数,且都用K表示)之间的关系。从图3 和图4 中可以看出,当信噪比固定时,无论接入用户数多少,所提方案的频谱效率在所有分布阶数条件下均高于传统方案2,在高分布阶数条件下也高于传统方案1;且所提方案和传统方案2 的频谱效率都呈现出随用户数增加而先升至一定峰值再降低的特点,而传统方案1 的频谱效率与用户数呈单调递增关系。具体而言,同一参数条件下,信噪比越高,3 种方案频谱效率峰值对应的最佳用户数越大;分布阶数越大,所提方案频谱效率峰值对应的最佳用户数越大。以所提方案在D=16 时与传统方案1 和传统方案2 为例具体说明:当平均信噪比为0 时,三者频谱效率峰值对应的最佳用户数分别为11、16 和7,前者频谱效率峰值比后两者分别提升了约46%和65%;当平均信噪比为10 dB 时,三者频谱效率峰值对应的最佳用户数分别为15、16 和11,前者频谱效率峰值比后两者分别提升了约24%和60%。以上表明,所提方案相较于2 种传统方案,提供了更高的分集增益(在高分布阶数条件下尤其明显),从而可支持更多的接入用户并获得更高的频谱效率峰值。
图3 3 种方案的频谱效率与接入用户数之间的关系(平均信噪比为0)
图4 3 种方案的频谱效率与接入用户数之间的关系(平均信噪比为10 dB)
5.2 仿真2:评估信道模型2 对应的频谱效率性能
在几何S-V 信道中,传播路径数L刻画了信道的稀疏特性,是影响系统频谱效率性能的重要参数。本组仿真将验证L=4(路径较稀疏)和L=16(路径较稠密)2 种情形下3 种方案的性能。
图5 给出了用户数K=16 时3 种方案在不同信噪比时的频谱效率。从图5 中可以看出,对L=4 和L=16这2 种情形,在所示信噪比区域,所提方案相比传统方案2 的频谱效率仍有较大提升,但提升比例不如Rayleigh 信道情形;同时,L=4 时所提方案性能略逊于传统方案1,L=16 时所提方案在高分布阶数和高信噪比条件下略优于传统方案1。其主要原因在于,相较于Rayleigh 衰落信道,L=4时的S-V 信道较稀疏,导致不同子阵列对应信道之间具有较强的空间相关性,从而减小了所提方案提供的空间分集增益;当L增大至16 时,S-V 信道稀疏性减小,不同子阵列对应信道之间空间相关性降低,导致所提方案获得的空间分集增益有所增加,与Rayleigh 衰落信道的差距进一步减小。大规模MIMO 混合预编码在几何S-V 信道中的性能随传播路径数L增加而逐渐接近Rayleigh 衰落信道的特点在文献[12]等其他研究中也有所报道。
图5 用户数K=16时3 种方案在不同信噪比时的频谱效率
图6 和图7 分别比较了平均信噪比为0 和10 dB时3 种方案的频谱效率与接入用户数之间的关系。3 种方案的频谱效率随用户数增加呈现的变化规律与Rayleigh 衰落信道情形类似。总体而言,给定传播路径数和信噪比时,所提方案的频谱效率在所有分布阶数和接入用户数条件下均高于传统方案 2,在高分布阶数和大多数接入用户数条件下也高于传统方案 1。以下具体分析所提方案在D=16 时与传统方案1 和传统方案2 的频谱效率峰值。
1)L=4 时,如图6(a)和图7(a)所示。当平均信噪比为0 时,三者频谱效率峰值对应的最佳用户数分别为9、16 和7,前者频谱效率峰值比后两者分别提升了约18%和38%;当平均信噪比为10 dB 时,三者频谱效率峰值对应的最佳用户数分别为13、16和11,前者频谱效率峰值比后两者分别提升了约4%和34%。
图6 3 种方案的频谱效率与接入用户数之间的关系(平均信噪比为0)
图7 3 种方案的频谱效率与接入用户数之间的关系(平均信噪比为10 dB)
2)L=16 时,如图6(b)和图7(b)所示。当平均信噪比为0 时,三者频谱效率峰值对应的最佳用户数分别为10、16 和7,前者频谱效率峰值比后两者分别提升了约28%和49%;当平均信噪比为10 dB时,三者频谱效率峰值对应的最佳用户数分别为14、16和11,前者频谱效率峰值比后两者分别提升了约11%和44%。可以发现,随着L由4 增大至16,所提方案相对于2 种传统方案的增益有所提升,但仍小于Rayleigh 衰落信道情形,其主要原因与图5分析相同。
最后,考虑到实际情形中基站获取的信道状态信息(CSI,channel state information)一般是非完美的,有必要评估CSI 误差对所提方案的影响。与许多文献相仿,将非完美的信道矩阵建模为
其中,E表示误差矩阵,其元素服从独立同分布的CN(0,1);ε表示信道均方误差。
图8 给出了不同ε值条件下所提方案在D=4时和传统方案2 的频谱效率对比,其他参数设置同图5。从图8 中可以看出,在中低信噪比区域,CSI误差对2 种方案的性能影响很小;在高信噪比区域,CSI 误差对2 种方案的性能有所恶化;在所有信噪比区域,信道均方误差相同时所提方案相较于传统方案2 仍有明显增益。具体而言,即使在信噪比为20 dB 时,L=4 条件下所提方案在ε=0.10和ε=0.05时仍能分别获得完美CSI 情形频谱效率的约84%和94%,而L=16 条件下所提方案在ε=0.10和ε=0.05时则分别提升至完美CSI 情形频谱效率的约86%和96%,这表明所提方案对CSI 误差具有较强的稳健性,且在高L值条件下更是如此。
图8 不同ε 值条件下所提方案在D=4 时和传统方案2 的频谱效率对比
从以上仿真可以看出,对Rayleigh 衰落和几何S-V 这2 种典型信道模型,在给定基站天线数和射频链路数条件下,无论固定接入用户数改变信噪比,还是固定信噪比改变接入用户数,所提方案的频谱效率较同为多用户情形的传统方案2 均有显著改善,在中高分布阶数时较单用户情形的传统方案1也有一定优势,性能改善幅度随分布阶数增加而提升;在几何S-V 信道中,所提方案相对于2 种传统方案的优势随传播路径数增加而增大,且CSI 误差对所提方案的性能影响较小。
6 结束语
本文面向部分连接结构的多用户大规模MIMO 混合预编码系统,在不改变统基站天线数、射频链路数和基站天线物理形态的前提下,基于相控迫零混合预编码框架,通过分析相控模拟预编码对迫零数字预编码的性能影响,提出了基于“分布式部分连接结构+串行最大化用户总体子阵列增益的相控模拟预编码算法”的新方案,并分析了所提方案的计算复杂度。所提方案比使用“集中式部分连接结构+固定匹配相控算法”的传统方案能获得更高的空间分集增益。典型场景下仿真表明,所提方案相较于传统方案能大幅提升系统频谱效率而几乎不增加计算复杂度,改善幅度随分布阶数和传播路径数(几何S-V 信道)增加而增大,且对CSI误差较稳健。未来将进一步深入研究系统频谱效率与发射天线数、射频链路数、接入用户数和分布阶数之间的定量关系。