APP下载

K均值聚类的大规模MIMO导频分配策略

2022-03-18李贵勇梁泽乾

关键词:均值聚类基站

李贵勇,于 敏,梁泽乾

(重庆邮电大学 通信与信息工程学院,重庆 400065)

0 引 言

在移动通信领域,需要通过增加系统容量和频谱效率的新技术来满足用户不断增长的数据速率需求,现有的长期演进(long term evolution-advanced,LTE-A)系统的一项关键技术——多输入多输出(multiple input multiple output,MIMO)可以在不增加任何无线带宽的情况下提高系统容量[1]和系统可靠性,但MIMO技术无法满足未来移动通信系统的需求。大规模MIMO技术可以通过在基站侧配置大量天线在极大程度上增加系统容量,由于大规模MIMO能带来高频谱效率和高能效[2-3],被视为第五代(5th-generation,5G)无线通信系统的关键技术之一。大规模MIMO系统因显著提高系统容量和频谱利用率而备受关注,而大规模MIMO系统的这些益处依赖于正确解析信道状态信息(channel state information,CSI),在时分双工(time division duplex ,TDD)大规模MIMO系统中,由于上下行信道具有互易性,可以先对上行信道进行精确估计获得CSI,下行信道状态信息可以通过信道互易性获得。若要对上行信道进行精确估计,终端应使用相互正交的导频序列。但由于天线数量的激增,正交导频数量受限于信道相干时间,相干时间有限导致正交导频数量有限,导频序列不可避免地在相邻小区之间复用,而由于复用非正交导频序列带来的干扰称为导频污染(pilot contamination,PC)。导频污染问题极大地限制了系统性能的提升。因此,研究如何降低导频污染对大规模MIMO系统性能的影响尤为重要。

为了解决导频污染问题,许多学者做了很多研究,目前针对解决导频污染的研究主要集中在以下3个方面:信道估计算法、导频序列设计与分配策略和多小区预编码算法。文献[4]提出了导频时移方案,通过相邻小区间的异步传输来抑制导频污染,但该方法需要复杂的控制机制协调各小区之间导频发送的时隙,不适用于工程实现;文献[5]考虑了小区扇区的划分,将正交导频分配给相同小区扇区中的不同用户,在不同小区扇区之间复用导频,从而达到缩短导频长度和提高频谱效率的目的,同时使用贝叶斯估计算法消除导频污染;文献[6]提出了一种位置感知的导频分配算法,利用用户之间的视距干扰大小,为视距干扰小的用户分配相同导频序列,可以在一定程度上抑制导频污染;文献[7]采用复杂预编码的方法来降低小区间导频污染,虽然对抑制导频干扰有一定效果,但算法复杂度太高;文献[8]依据空间位置的不同,在每个小区依据一定的准则分成中心区域以及边缘区域,处于边缘区域的用户分配相互正交的导频序列,中心区域的用户复用导频序列,这样虽然可以减轻导频污染问题,但是导频复用增益会变小;文献[9]提出机器学习进行导频分配,利用穷举法获得最优导频分配方案作为训练序列,利用训练序列得到导频分配模型,根据用户的大尺度衰落因子匹配最优的导频序列,但该方法的复杂度较高;文献[10]提出CPA算法进行用户分组,对低干扰组的用户和非同源小区的用户分配相同导频序列,对同源小区的用户分配正交导频序列,有效地提高导频效率并降低导频污染对系统性能的影响;文献[11-12]通过大尺度衰落因子构建干扰图进行导频分配,该方案对系统整体考虑进行导频分配,但是当小区内用户数量较大时,算法复杂度较高。对于现有的基于用户分组的导频分配思想,高干扰组的用户全部分配正交导频,没有考虑到实际导频资源有限的情况,本文结合用户分组和聚类思想更加细化用户分组,更好地解决导频开销过大的问题,利用适合海量数据处理的非监督机器学习算法——K均值聚类算法,在一定程度上降低算法复杂度。

本文提出一种基于K均值聚类算法的大规模MIMO导频分配策略。基本思想:首先,利用用户的大尺度衰落因子信息设置干扰门限将用户分为高干扰组和低干扰组;然后,对高干扰组的用户利用K均值聚类算法根据用户的位置信息进行二次分组,将高干扰组的用户继续分为干扰组与非干扰组;最后,对不同组别的用户分别进行相应的导频分配方案。本文利用K均值聚类算法这种适合大量数据处理的非监督机器学习算法进行导频分配可以降低复杂度,更适用于大规模MIMO系统。

1 系统模型

本文系统模型为一个时分双工(time division duplex,TDD)模式下,由L个小区组成的多小区多用户大规模MIMO系统,系统模型见图1。

图1 系统模型Fig.1 System model

对于系统中的每个小区而言,小区中心分布着一个基站,基站侧部署着M根天线,每个小区内分布着K个单天线的用户终端且K≪M。

向量h(i,k)j∈CM×1为第i小区的第k个用户到第j小区基站的信道向量,利用均匀线性大规模MIMO阵列中阴影衰落对信道进行建模,基于相关的阴影衰落系数计算海量的信道矩阵元素,可表示为[13]

(1)

(1)式中:g(i,k),j表示信道小尺度衰落因子,且满足g(i,k),j~CN(0,IN);d(i,k)j为大尺度衰落系数,包括路径损耗和阴影衰落,可表示为

(2)

(2)式中:r(i,k)j表示第i小区的第k个用户到第j小区基站之间的距离;∂表示路径损耗衰落系数;z(i,k)j表示阴影衰落。令hi,j=[h(i,1)j,h(i,2),j,…,h(i,K),j]T,hi,j∈CK×M,则

(3)

(3)式中,G,D同理可得

D=diag(d1,d2,…,dL)。

为保证单个小区内没有污染,每个小区内部采用相互正交的导频,导频长度为τ≥K,第k个用户发送导频序列φk∈Cτ×1,满足

(4)

(5)

(5)式中:ρr为用户发送的平均功率;h(l,k)i为第l小区内第k个用户到第i小区基站的信道向量,l=1,2,…,L;ni是加性高斯白噪声,且满足ni∈Cτ×M~CN(0,1)。

则第i个小区内基站接收信号可表示为

(6)

(6)式中,hi,l∈CK×M,表示第l小区所有用户终端到第i小区基站的信道矩阵。

Pi=[φ1,φ2,…,φK]T,Pi∈Cτ×K

(7)

(8)

利用最小二乘(least squares,LS)信道估计算法得到第i小区基站对于第i小区内用户的信道估计矩阵为

(9)

由(9)式可以看出,基站对本小区用户进行信道估计得到了本小区用户的CSI和其他小区发送相同导频用户的CSI,其他小区发送相同导频用户的CSI即为导频污染。在上行数据传输阶段,大规模MIMO系统中,所有用户向其对应小区的目标基站发送导频,基站端使用破零检测方法,检测所得数据表示为

(10)

(10)式中,l=1,2,…,L。

(11)

(11)式中,Al=[a(l,1),a(l,2),…,a(l,K)]T,a(l,i)∈CM×1,则有

Datal=Alyl

(12)

l小区k用户的检测数据U(l,k)为

(13)

用户U(l,k)的SINR可表示为

(14)

当基站端天线数M趋于无穷大时,用户U(l,k)的SINR可近似地表示为

(15)

则U的上行可达速率可表示为

R=E{lb(1+SINR)}

(16)

第l小区的频谱效率可以表示为

(17)

μ表示因上行导频传输所导致的频率效率损失,表示为

(18)

(18)式中:τ为导频长度;T为信道相干时间。导频效率定义为

(19)

2 导频分配策略

2.1 本文导频分配方案

本文提出了一种基于K均值聚类算法实现用户多次分组的导频分配策略。首先,基于大尺度衰落因子衡量用户之间的干扰量大小,设置干扰门限,并根据干扰门限对UE进行第一次分组,将用户分为高干扰组和低干扰组;再为低干扰组用户随机分配导频序列;然后对高干扰组的用户继续利用K均值聚类分簇算法对用户进行聚类分簇;最后,分别对K均值聚类分簇结果中不同类别的用户分别采用对应的导频分配方案。本文导频分配方案分为4个模块,分别是门限分组模块、第一导频分配模块、聚类分簇模块以及第二导频分配模块。实现对用户进行多次分组,利用多次分组减少每次处理的用户数量,在很大程度上降低每个模块处理的算法复杂度,并利用K均值聚类这种适用于海量数据处理的非监督类机器学习算法进行聚类处理,进一步在一定程度上减少算法的复杂度,使得本文方案适用于大规模MIMO系统。

1)门限分组模块。假设系统中所有小区的基站都连接在同一个中心控制单元,并且中心控制单元已知系统内所有用户的大尺度衰落因子,由中心控制单元为系统内所有用户分配导频。门限分组模块根据用户的大尺度衰落因子衡量用户的干扰量,并设置门限对用户进行分组。基于用户的大尺度衰落因子,目标用户与干扰用户之间的干扰强度可以表示为

(20)

(20)式中:∀l,m=1,2,…,L;∀k,n=1,2,…,K,目标用户受到系统内干扰用户的干扰强度参数为

(21)

(21)式中:∀l=1,2,…,L;∀k=1,2,…,K,将分组阈值ρ设置为平均干扰强度,则

(22)

中心控制单元根据分组阈值对系统中的用户进行第一次分组:若用户的干扰参数η大于分组阈值ρ,则将用户UE分为高干扰组,高干扰组用户数量记为Nhigh;反之,将用户UE分为低干扰组,低干扰组用户数量记为Nlow。第l小区的用户可表示为

Kl=Nl,high+Nl,low

(23)

2)第一导频分配模块。系统中用户进行了基于干扰门限的第一次分组后,第一导频分配模块会对干扰门限分组后的低干扰组用户随机分配导频序列,高干扰组的用户则继续进入聚类分簇模块。

3)聚类分簇模块。聚类分簇模块包括3个单元:用户空间位置获取单元、聚类中心计算单元以及收敛判决单元。首先,中心控制单元获取用户的空间位置信息;聚类中心计算根据当前簇内用户之间的位置信息计算聚类中心;收敛判决根据用户与当前聚类中心之间的位置关系以及用户与上一聚类中心之间的位置关系与门限值对比结果判断是否输出当前的分簇作为聚类分簇的结果。具体伪代码见算法1。

算法1:K均值聚类算法

1.输入:K,ε,高干扰组中的N个样本集;

2.初始化:聚类中心C1=(X1,Y1,Z1),…,CK=(XK,YK,ZK);

3.计算各样本相对于聚类中心的距离:i表示小区索引,j表示用户索引

4.将距离最小的用户归于一个集合:Dj=min(d[i])∪(Xj,Yj,Zj);

7.停止迭代条件:|Ei+1-Ei|<ε;

8.输出:聚类分簇结果的聚类中心Cj。

K均值聚类分簇具体步骤如下。

步骤1从目标小区的所有相邻小区高干扰组的用户中,选择K个用户的空间位置信息作为初始聚类中心,优选的每个蜂窝小区的相邻小区数量为6,即将K的值设置为6,从目标小区的所有相邻小区高干扰组的N个样本集中随机选取6个对象的空间位置信息(x1,y1,z1),(x2,y2,z2),(x3,y3,z3),(x4,y4,z4),(x5,y5,z5),(x6,y6,z6)作为初始的聚类中心。

步骤2根据高干扰组内用户与聚类中心的距离进行分簇,将用户分到距离最近的聚类中心所在的簇,即分别计算所有高干扰组内对象的位置信息与初始聚类中心的空间距离d,表示为

(24)

选取最小距离的簇,将用户对象分入该簇,根据每个簇内用户之间的位置信息,重新计算聚类中心。

步骤4判断2个聚类中心是否收敛,若收敛,则结束聚类;否则,返回步骤2重新根据当前的聚类中心进行分簇,即

C={C1,C2,C3,C4,C5,C6}

(25)

将用户分为6个簇之后,目标函数E表示为

(26)

(26)式中:ui为簇Ci的均值;‖x-ui‖2为每个样本点到均值点的距离。ui表示为

(27)

步骤5判断两次目标函数|E2-E1|<ε是否成立,其中,ε是一个极小值,两次迭代的目标函数之差小于一个极小值说明簇内的误差平方和已经收敛,结束聚类。

文献[13]指出,若目标用户的到达角为θi,干扰用户的到达角为θj,信号波长为λ,基站端天线数量为M,天线间距为D,目标用户在第P条路径到达角θi的导向矢量具体值为

(28)

干扰用户在第P条路径到达角θj的导向矢量具体值为

(29)

目标用户与干扰用户之间的空间距离为

dij=‖xi-xj‖

(30)

定义代价函数为

(31)

(32)

(33)

(34)

(35)

图2 干扰量随距离变化图Fig.2 Variation of interference with distance

从图2可以看出,当d≈1 000时,用户之间的干扰量J≈0.002,几乎可以忽略不计。基于上述结果,将K均值聚类的结果基于簇与簇的聚类中心之间的相对空间距离对用户进行再次分组,分别对K个簇的用户进行分组,将簇聚类中心之间相对空间距离大于1 000 m的簇分为非干扰组,否则为干扰组,接下来对于不同组的用户分配导频序列,完成二次导频分配模块。

4)二次导频分配模块。由中心控制单元进行二次导频分配,通过K均值聚类算法得到干扰对组和非干扰对组,中心控制单元为位于干扰对组的用户分配正交导频,位于非干扰对组的用户复用导频。本文所提方案整体流程图见图3。

图3 导频分配策略整体流程图Fig.3 Overall flowchart of pilot allocation strategy

一方面,基于K均值聚类的多次用户分组能对高干扰组的用户进一步聚类分簇,减少了导频开销;另一方面,基于K均值聚类的多次用户分组方案,进行了干扰门限分组,减少了K均值聚类算法处理的用户对象数目以及后续模块处理的用户数量,在一定程度上降低了算法的复杂度。

2.2 算法复杂度分析

本文所提导频分配算法主要分为2个部分:门限分组和K均值聚类分簇,其中,门限分组模块算法复杂度为O(K(L-1))。K均值聚类分簇i次迭代的主要算法复杂度:步骤3为O(4iN);步骤5为O(6iN);本文所提算法复杂度为O(K(L-1)+10iN)。其中,N为高干扰组用户数目,K为一个小区用户数目,L为多小区大规模MIMO系统中的小区数目,i为K均值聚类算法迭代次数。从算法复杂度可见,本文所提方案算法复杂度更适用于大规模MIMO系统,且实现较为简单。

3 仿真结果及分析

3.1 仿真场景及参数设置

为了更好地分析本文所提出的导频分配方案性能,本文基于MATLAB仿真平台进行仿真分析,仿真采用TDD模式下由L个小区组成的大规模MIMO蜂窝网络系统,每个小区中心有一个配置了M根天线的基站,并包含K个随机分布的用户,仿真参数设置见表1。

表1 仿真参数Tab.1 Simulation parameters

3.2 仿真结果分析

图4为系统中蜂窝小区内用户位置分布图,本文方案假设用户在小区内的位置服从随机分布以更好地模拟实际情况,并验证算法的普适性。

图4 用户分布图Fig.4 User distribution

图5给出了不同天线下不同导频分配算法的导频效率。从图5可以看出,本文提出的导频分配算法在基于大尺度衰落信息的干扰门限分组的基础上,进一步对高干扰组用户进行K均值聚类分簇,并对不同组的用户分别进行不同的导频分配方案,相较于基于大尺度衰落信息分组的导频分配方案,有更高的导频效率,减少了导频开销。本文提出的方案相较于文献[10]提出的CPA算法,CPA算法将用户分为同源小区用户和非同源小区用户,本文提出的K均值聚类分簇算法将高干扰组的用户分为优选的6个簇,再划分干扰组和非干扰组,在一定程度上减少了导频开销提高了导频效率。

图5 不同导频分配算法在不同基站侧天线数下的 导频效率Fig.5 Pilot efficiency of different pilot allocation algorithms with different numbers of antennas

图6为用户最小上行可达速率随基站侧天线数目变化的曲线。为了可以直观对比,仿真实验将本文提出的导频分配方案与随机导频分配方案、基于大尺度衰落信息的导频分配方案、文献[10]所提CPA算法进行仿真结果对比。从图6可以看出,随着基站端天线数目的增加,用户最小上行可达速率会随之增加。当天线数目在100~200时,用户最小上行可达速率几乎随着天线数线性增加。之后,当天线数目逐渐增加时,用户最小上行可达速率增长速度放缓。大规模MIMO系统的性能不会随着基站端天线数目的增大而无限提升,最终大规模MIMO系统性能会趋近于一个固定值。在相同天线数目的条件下,随机分配导频方案上行最小可达速率最小,其次是利用K均值聚类的导频分配方案和文献[10]所提的CPA算法,基于大尺度衰落因子的导频分配方案最小上行可达速率最大。这是因为一方面,本文提出的方案在基于大尺度衰落信息用户分组的前提下,进一步对高干扰组的用户进行聚类分簇,将高干扰组用户分为干扰组和非干扰组,并对非干扰组的用户再一次复用导频序列,减少了导频开销;另一方面,相较于文献[10]所提CPA算法将高干扰组的用户分为同源小区用户和非同源小区用户,本文所提方案利用K均值聚类算法将其分为6个簇再进行导频分配,进一步减少了导频开销,在减轻导频污染,提升系统性能与减少导频开销这2个方面做了折中处理。在可接受的系统性能损失的情况下有效地提升了导频效率,减少导频开销。

图6 用户最小上行可达速率随基站天线数目变化曲线Fig.6 Minimum uplink reachable rate of a user as a function of the number of base station antennas

图7给出了用户的上行可达和速率随基站天线数目变化的曲线。从图7可以看出,当存在导频污染时,基于大尺度衰落信息的导频分配方案的上行可达和速率最高,其次是文献[10]所提CPA算法和本文提出的导频分配方案,随机导频分配方案的上行可达和速率最低。当基站天线数较少时,导频污染占据总干扰信号的比重较小,其他干扰因素占据总干扰信号比重较大,此时降低导频污染对系统性能提升不明显。随着基站端天线数的增加,导频污染在总干扰信号中的比重越来越大,此时降低导频污染对系统性能提升更加明显。与此同时,当天线数逐渐增加时,本文所提方案将基于大尺度衰落信息导频分配方案中高干扰组用户再分组,进一步减少导频开销。相较于文献[10]提出的CPA算法,本文提出的K均值聚类分簇算法将高干扰组的用户分为优选的6个簇,再划分干扰组和非干扰组,更加细化用户分组,导频复用率更高,以可接受的系统性能损失换取导频效率有效提升。本文提出的导频分配方案相较于随机导频分配方案减轻了导频污染对系统性能的影响,提高了目标小区的上行可达和速率。在系统性能和导频开销方面做有效折中,改善了大规模MIMO系统导频短缺和导频污染情况。

图7 目标小区上行可达和速率随基站天线数目 变化曲线Fig.7 Uplink reach rate of the target cell as a function of the number of base station antennas

4 结束语

本文提出一种基于K均值聚类的导频分配方案。方案包含门限分组、第一导频分配、聚类分簇、第二导频分配。方案首先根据用户大尺度衰落因子判断用户的干扰程度,并设置门限,对用户进行首次分组,将用户分为高干扰组和低干扰组;接着利用K均值聚类算法对高干扰组用户进行聚类分簇,并对不同组的用户依次分配导频。通过多次分组分别对不同组的用户进行导频分配来降低用户间的导频污染。仿真结果表明:①本文所提方案相较于随机导频分配方案可以有效抑制导频污染问题对大规模MIMO系统性能的影响,有效提升系统性能;②本文所提方案相较于基于大尺度衰落的导频分配方案和文献[10]的基于CPA算法的导频分配方案能有效提高导频效率,减少系统内导频开销,适用于导频资源极度紧张的大规模MIMO系统。后续可以结合信道估计和预编码方式设计导频分配方案进一步减轻导频污染,提高系统性能。

猜你喜欢

均值聚类基站
一种傅里叶域海量数据高速谱聚类方法
基于NETMAX的基站网络优化
基于知识图谱的k-modes文本聚类研究
一种改进K-means聚类的近邻传播最大最小距离算法
5G基站辐射对人体有害?
基于模糊聚类和支持向量回归的成绩预测
5G基站辐射对人体有害?
5G辐射比4G小
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用