面向高阶调制的低复杂度MIMO 检测技术
2015-12-10仇晓颖余观夏吴迪
仇晓颖 余观夏 吴迪
摘要:针对高阶调制下多输入多输出(MIMO)接收机检测算法复杂度高的问题,提出了一种面向高阶调制的低复杂度非线性MIMO检测算法。该算法采用分层处理方法,支持并行硬件电路实现,有效提高了检测效率。在建立系统仿真模型的基础上,分析几种算法的误码率性能及复杂度,同时实现该算法的参数选择。仿真结果表明,提出的低复杂度MIMO检测算法能以较低的运算复杂度,达到逼近最大似然译码算法的误码率性能,从而获得性能和复杂度的折衷。该算法为MIMO无线通信接收机的超大规模集成电路实现提供了理论基础,具有较高的应用价值。
关键词:多输入多输出检测; 低复杂度检测算法;高阶调制;分层处理;球形译码
中图分类号:TN919 文献标识码:A 文章编号:1009-3044(2015)26-0185-04
Low Complexity MIMO Detection for High-Order Modulation Schemes
QIU Xiao-ying1, YU Guan-xia2, WU Di3
(1. College of Information Science and Technology, Nanjing Forestry University, Nanjing 210037, China;2. College of Science, Nanjing Forestry University, Nanjing 210037, China;3. School of Electronic and Information Engineering, Soochow University, Suzhou 215006, China)
Abstract: Aiming at the high complexity of detection for multi-input multi-output (MIMO) systems using high-order modulation schemes, a low complexity nonlinear detection algorithm for high-order modulation was proposed. Based on a layered approach, the algorithm proposed can effectively improve the detection efficiency. Based on link-level simulation, the bit error rate performance and the complexity of several algorithms were analyzed. The simulation results show that the proposed low complexity MIMO detection algorithm can achieve similar performance of maximum likelihood detection with much lower computational complexity,thus obtaining a good trade-off between performance and complexity. The detection algorithm is straightforward to implement in hardware, which makes it valuable for practical application.
Key words: multi-input multi-output detection; low complexity detection algorithm; high-order modulation scheme; layered approach; sphere decoding
多输入多输出(MIMO, multi-input multi-output)技术被广泛应用于最新的无线通信标准(如3GPP LTE 和802.11ac)中。MIMO技术为系统提供分集增益和空分复用增益,可以在不增加功率和带宽的情况下极大提高通信系统的容量和频谱效率。然而,MIMO技术提高无线通信性能的同时,也增加了信号处理复杂度。尤其是采用高阶调制的MIMO系统接收机,其高复杂度给无线通信基带处理带来了重大挑战。
虽然最大似然算法(ML,maximum likelihood)是最优的检测算法,能够完全获得接收分集增益,但其需要遍历所有可能的发射向量,复杂度与发射天线数和调制阶数的乘积成指数关系,在实际中不易实现。为了降低检测算法的复杂度,近年来各种复杂度相对较低的MIMO检测算法相继涌现。其中线性算法有迫零算法(ZF,zero forcing)和最小均方误差算法(MMSE,minimum mean square error),这两种线性算法运算复杂度较低,但是性能相对较差。非线性检测算法有球形译码(SD,sphere decoding)[1],最小均方误差串行干扰消除算法(MMSE-SIC,MMSE successive interference cancellation)等。SD通过log-max近似和动态调整搜索半径来降低运算复杂度,其接收性能逼近ML。但是,SD的复杂度随发射天线数成指数增长,随星座图点数成多项式增长。MMSE-SIC在MMSE的基础上采用优化排序,按照一定的顺序依次检测每一层的发射信号,并从接收向量中消除这一层信号造成的干扰,逐次迭代,最后完成检测。这种检测算法需要反复进行排序和矩阵求逆操作,因而复杂度也较高。文献[2]采用对信道传递矩阵进行QR分解的信号检测算法,该算法的优点是用迭代运算代替矩阵求逆运算,减小了计算量,在每步迭代中都选择信噪比最大的层进行优先检测,从而降低误差传播。
为了在性能和复杂度之间取得折衷,本文提出了一种新的算法,该算法采用分层处理方法,不仅大大降低了检测的运算复杂度,而且达到逼近SD的检测性能,其并行结构可提高检测的效率。
本文其他部分内容安排如下:第1节介绍MIMO系统模型;第2节描述提出的低复杂度MIMO检测算法;第3节针对该算法进行了复杂度分析并给出Matlab仿真结果;最后是结论部分。
1 MIMO系统模型
贝尔实验室垂直分层空时码[4][5](V-BLAST,Vertical Bell Lab Layered Space Time Code)是MIMO 系统常用的基于空间复用的空时编码结构,V-BLAST通过串并转换实现数据的并行传输,可以有效地提高频谱利用率。以V-BLAST系统为例,设发射天线数为[Nt],接收天线数为[Nr][(Nr≥Nt)],发射端的信息比特经过信道编码后,根据调制方式映射到星座图上变成符号(symbol)。假设星座图点数为M(如64、256等),[s=[s1,s2,…,sNt]T]表示[Nt]个发射天线的发送符号向量,其系统信道模型如下:
[r=Hs+n] (1)
其中,[r=[r1,r2,…,rNr]T]为接收信号矢量;[H]为频域的[Nr×Nt]的复数信道矩阵[H=[h1,h2,…hNt]],每个列向量[hi]可表示为[hi=[h1i,h2i…hNri]T],其中[hij]表示发射天线j与接收天线i之间的信道,[n=[n1,n2,…,nNr]T]为零均值的加性高斯白噪声(AWGN, additive Gaussian white noise),噪声功率为[σ2]。[(?)T]表示矩阵的转置。
2 MIMO检测算法
对于MIMO系统来说,接收端的符号检测是一项重大挑战。由于无线通信协议中使用了信道编解码(如Turbo、Viterbi、低密度奇偶校验码LDPC),因此,MIMO检测需要计算软比特,即对数似然比(LLR,log-likelihood ratio)。ML算法是最优的MIMO检测算法:
[L(bi|r)=logs:bi(s)=1exp(-1σ2||r-Hs||2)s:bi(s)=0exp(-1σ2||r-Hs||2)] (2)
式中,[s:bi(s)=α] 表示所有的第[i]个比特为α的[s]的集合。计算式(2)需要枚举所有可能的接收向量,其复杂度为[Ο(MNt)],当[M]为64或256时,其复杂度导致ML在实际电路实现中是不可行的。
2.1 线性算法
常见的线性检测算法有ZF和MMSE,其定义如下:
[sZF∧=(HHH)-1HHr] (3)
[sMMSE∧=(HHH+σ2I)-1HHr] (4)
其中,[(?)H]表示矩阵的共轭转置。两者的唯一区别就是MMSE考虑了噪声功率[σ2],而ZF未考虑噪声功率,因此MMSE比ZF性能稍好。线性算法的实现分为信道处理和符号解调两部分。相对于其他先进MIMO检测算法,线性检测实现简单,复杂度和成本较低,但是性能差,适用于成本低且对性能要求不高的通信系统。式(3)和式(4)表明,线性检测需要计算[Nr×Nt]的复数矩阵求逆,随着发射天线数的增长,矩阵求逆的复杂度也会增加,文献[3]提出了一种基于利用排序QR分解法(SQRD,sorted QR decomposition)的MMSE算法,利用SQRD来取代传统的矩阵求逆,从而降低MMSE的VLSI实现复杂度。
2.2 球形译码
球形译码[6]可达到近似ML的检测性能,采用树型搜索结构,首先选择搜索的球半径R,然后从根节点开始搜索整个树。搜索到某个节点,当累加度量大于R时,则不再继续向下搜索该节点的分支。因此,SD遍历所有在球半径R之内的叶节点,即
[||r-Hs||2≤R] (5)
如文献[7]所述,SD算法可以通过修剪枝叶(pruning)的方法来减少复杂度:当到达一个叶节点,累加度量为D,若[D 2.3 分层结构低复杂度算法(Layered Low-Complexity Soft-Output) 在文献[8][9][10]中描述了一种改进的固定复杂度的软输出检测(MFCSO,Modified Fixed-Complexity Soft-Output)算法,并分析比较了64-QAM下MFCSO及固定复杂度软输出检测[11](FCSD,Fixed-Complexity Soft-Output)的性能和复杂度,数据表明MFCSO在性能逼近FCSD和SD的情况下,能有效地降低复杂度。 MFCSO将发送向量的每个符号当作一层,每次处理只选一层作为顶层,并只对顶层做精确搜索,而其他层采用判决反馈均衡器(DFE,decision-feedback equalization)来求解。 为了针对更高阶的调制方式(如256-QAM),需要设计一种合理的区域搜索机制,确定初始向量的搜索邻域[Γs?Γ]([Γ]为整个星座图),设[Γs]包含N个星座点。 以256-QAM为例,分层结构低复杂度算法步骤如下: (1) 在坐标轴上以[±8]为线将星座图分为16个区域,并以一定的规则确定每个区域要枚举的包含N个符号的星座子集,即确定查找表(LUT,look-up table)。 (2) 根据式(4)用MMSE预估初始解向量[x]。 (3)变量[k]代表当前选第[k]个符号为顶层[(k∈1,2,…Nt)],设定变量[k]的初始值为[k=Nt]。
(4) 对信道矩阵[H]变换,使[k]层对应的发射符号变成发射符号向量的最后一个元素,则可以得到
[Hk=[h1,…,hk-1,hk+1,…,hNt,hk]] (6)
当[k=Nt]时,[Hk=H]。按同样的规则对初始解向量[x]进行变换,得到[xk=[x1,x2,…,xNt]T]。
(5) 对[Hk]进行QR分解,即
[Hk=QkRk] (7)
其中,[Qk]为酉矩阵,即满足[QHkQk=I],[Rk]为上三角矩阵,[Rij]表示[Rk]中第i行j列个元素。
(6) 由系统方程(1)及步骤(5)中的矩阵特性可知:[QHkr=Rkxk],由于需要采用DFE计算其他层的符号,因此要计算
[yk=QHkr] (8)
其中,[yk=[y1,y2,…yNr]T]。
(7)根据[xk]中最后一个符号[xNt]确定其落在哪个区域,从而确定星座子集[Γs]。对于子集中第n个星座点[ξn∈Γs(n∈1,2,…N)],使[xNt]遍历子集[Γs],即[x∧Nt=ξn],对每个n需计算出欧式距离[pdistNt= ||RNtNtξn-yNt||2],消除其对[yk]中其他符号的影响,并采用DFE计算出其他估计的发射符号及欧式距离:
[for i=Nt-1:-1:1 yi=yi-RiNtxNt∧ for j=Nt-1:-1:i+1 yi=yi-Rijxj∧ end DFE:xi∧=argminxi∧∈Γ||xi∧-yiRii||2 pdisti=||Riixi∧-yi||2end ]
最终得到重新估计的发射符号向量[x∧=[x1∧,x2∧,…xNt∧]T]以及总的欧式距离[pdist=i=1Ntpdisti],可以根据和比特符号映射表求出某个比特为0和为1的概率,从而求出LLR。
(8) 令[k=k-1],并重复步骤(4)到(7),最终完成MIMO检测过程。
3 算法及性能分析
3.1 算法结构及复杂度分析
分层结构低复杂度MIMO检测算法包含信道预处理(Channel Preprocessing)单元和符号软解调[12](LLR Demapping)单元两部分,算法结构如图1所示。
图1 算法结构框图
信道预处理单元主要计算MMSE系数矩阵[W]并对不同的[Hk]做QR分解,[H]变化一次,则需要执行一次。符号解调单元主要分层处理线性预估的发射向量,从而得出软比特值,对于每个接收向量,均需要执行符号解调单元。算法将每个符号作为一层,则共有[Nt]层,每层搜索初始解周围N个星座点,共需进行[NNt]次运算,因此复杂度相对SD大大降低。
表1给出256-QAM调制时,不同场景下,提出的低复杂度算法和SD算法的复杂度比较。由于SD算法动态调整搜索半径,因此其复杂度不固定,表1中给出的SD复杂度为一些样本的数学平均值。
表1 256-QAM算法复杂度比较
[天线配置\&操作\&SD\&MFCSO
(N=36)\&MFCSO
(N=49)\&[2×2]\&复数乘\&79162\&416\&546\&实数除\&4\&6\&6\&[4×4]\&复数乘\&239846632\&2688\&3468\&实数除\&8\&20\&20\&]
3.2 仿真性能分析
为了评估不同MIMO检测算法的性能,用Matlab和C搭建了MIMO系统仿真链。仿真了采用64-QAM和256-QAM高阶调制时,在不同天线配置下,比较SD、MMSE-SIC和分层低复杂度算法的性能。由于ML检测算法复杂度过高无法用硬件实现,提出的算法将和SD算法作比较来验证是否达到接近ML的性能。
3.2.1 搜索邻域选择
如2.3章节所述,算法中要确定检测所需的搜索邻域LUT,并确定每个区域星座子集[Γs]中包含的星座点数N的大小。图2和图3分别为[2×2]MIMO系统未编码(uncoded)和编码(1/2编码率LDPC)情况下,N取值以及集合设定规则不同时,误码率(BER,bit error rate)与信噪比(SNR,signal noise ratio)性能曲线。
图2 不同N和设定规则下BER-SNR曲线(uncoded)
图3 不同N和设定规则下BER-SNR曲线(1/2 LDPC)
如图2所示,在不编码系统中,当N=25和N=36时,集合设定规则对性能有很大影响,第二种设定规则明显优于第一种。当N达到49以上时,性能相对稳定。而如图3所示,在1/2码率LDPC编码的系统中,信道编码与MIMO技术结合使BER随SNR的增加而更加迅速地降低,曲线更为陡峭,展现了高数据速率下良好的性能优势。随着N的增大,系统性能逐步提升,当N=25和N=36时,第一种设定规则下计算出的软比特结合LDPC译码器的性能更加优越,同样,在[N≥49]时,性能较好且趋于稳定,受设定规则影响不大。综合以上分析,考虑性能和复杂度,取N=49且第一种设定规则为较好选择。
3.2.2 不同算法仿真性能分析
图4和图5所示分别为[2×2]MIMO系统中,在未编码和编码情况下几种检测算法的性能比较。由图4和图5性能曲线可知,提出的分层低复杂度算法性能与SD算法近似,较MMSE-SIC算法有很大改善,BER达到[10-5]时,在未编码情况下,64-QAM时有16dB左右的增益,256-QAM时有12dB左右的增益;在1/2码率LDPC情况下,64-QAM时系统性能提升4dB左右,256-QAM时系统性能提升2dB左右。
图4 [2×2] MIMO未编码情况下性能曲线
图5 [2×2] MIMO 1/2码率LDPC编码情况下性能曲线
当天线配置为[4×4]时,由复杂度分析可知,SD复杂度很高,不适用于硬件实现,因此,在这种场景下,只比较MMSE-SIC和分层低复杂度算法的性能。图6所示为[4×4]MIMO系统中1/2编码率LDPC情况下两种算法的性能曲线。
图6 [4×4] MIMO 1/2码率LDPC编码情况下性能曲线
仿真结果表明,分层低复杂度算法性能与SD算法接近,显著优于MMSE-SIC。
4 结论
针对MIMO系统中高阶调制的场景,提出了一种分层处理的低复杂度检测算法。复杂度分析表明,该算法显著减少了检测过程中复数乘法的运算次数,有效降低高阶调制下MIMO检测的复杂度。仿真性能显示,该算法性能逼近SD性能(即ML性能),较MMSE-SIC有显著提高,从而获得性能和复杂度的折衷。此外,提出的检测算法支持并行电路实现,大大提高了电路系统实现的效率,为高阶调制MIMO检测的硬件实现提供了理论基础,具有较高的应用价值。
参考文献:
[1] Burg A, Borgmann M, Wenk M, et al. VLSI implementation of MIMO detection using the sphere decoding algorithm[J]. IEEE Journal of Solid-State Circuits,2005,40(7):1566-1577.
[2] 邓晓燕,李红信,宋晓辉.一种基于MIMO-OFDM 系统的信号检测算法[J].通信技术,2008,41(03):1-2.
[3] Wubben D, Buhnke R, Kühn V, et al. MMSE extension of V-BLAST based on sorted QR decomposition [C]//IEEE Vehicular Technology Conference,2003.VTC 2003-Fall. 2003 IEEE 58th. USA: IEEE, 2003: 508-512.
[4] Wolniansky P W, Foschini G J, Golden G, et al. V-Blast: an architecture for realizing very high data rates over the rich-scattering wireless channel[C]//Signals, Systems, and Electronics, 1998. ISSSE 98. 1998 URSI International Symposium on.Pisa: IEEE, 1998: 295-300.
[5] Foschini G J. Layered space-time architecture for wireless communication in a fading environment when using multi-element antennas. Bell Labs Technical Journal,1996,1(2): 41-59.
[6] Agrell E, Eriksson T, Vardy A, et al. Closest point search in lattices[J]. IEEE Trans on Information Theory, 2002,48(8):2201-2214.
[7] Larsson E G. MIMO Detection Methods: How They Work[J]. IEEE Signal Processing Magazine,2009,26(3): 91-95.
[8] Wu D, Eilert J, Asghar R, et al. VlSI implementation of A multi-standard MIMO symbol detector for 3GPP LTE and WiMAX[C]// Wireless Telecommunications Symposium (WTS), 2010.Tampa,FL:IEEE, 2010: 1-4.
[9] Wu D, Larsson E G, Liu D K. Implementation Aspects of Fixed-Complexity Soft-Output MIMO Detection[C]// Vehicular Technology Conference, 2009. VTC Spring 2009. IEEE 69th. Barcelona:IEEE, 2009: 1-5.
[10] Wu D , Eilert J, Liu D K. Evaluation of MIMO symbol detectors for 3GPP LTE terminals[C]//Signal Processing Conference, 2009. 17th European. IEEE, 2009:2431-2435.
[11] Larsson E G, Jalden J. Soft MIMO detection at fixed complexity via partial marginalization[J].IEEE Transactions on Signal Processing,2008,56(8):3397-3407.
[12] 王小东, Poor H V .无线通信系统——信号接收与处理的高级技术[M].北京:电子工业出版社,2005: 269-275.