APP下载

一种低比特量化的OFDM 同步方法研究与实现

2023-05-10李林涛韩悦常争杨梅

北京理工大学学报 2023年5期
关键词:门限复杂度乘法

李林涛,韩悦,常争,杨梅

(1.北京科技大学 计算机与通信工程学院,北京 100083;2.北京理工大学 网络空间安全学院,北京 100081;3.北京服装学院 文理学院,北京 100029)

正交频分复用(orthogonal frequency division multiplexing, OFDM)技术是一种特殊的多载波传输方案,其核心思想是在频域内将信道分成多个正交的子信道,每个子信道上使用一个子载波进行调制,各子载波并行传输.该技术具有频谱利用率高的优点,同时具有良好的抗多径、抗频率选择性衰落能力,因此被应用于IEEE 802.11、LTE 等标准,并且在通信与计算相融合的B5G/6G 等未来通信系统中也具有广泛的应用前景,极具研究价值[1-3].与传统单载波系统相比,OFDM 系统对同步的要求更加严格,定时偏差会引入符号间干扰,引起较大的接收性能损失,因此符号同步是实现OFDM 可靠解调的重要前提和基础[4].

目前,基于训练序列的同步方法具有速度快、性能优异等特点,在实际系统中得到了广泛采用.但是该方法包含大量的复数乘法运算,同步算法的硬件实现存在复杂度高、资源消耗大等问题.因此,如何设计简化的同步算法和低复杂度的实现方法是一个研究热点.JIAN 等[5]设计了一种具有共轭对称特性的训练前导码,提出采用互为共轭的训练序列相关作为定时度量,将复数乘法次数减少了约1/2,加法次数减少了约1/3.BRIAN 等[6]提出了一种基于对称同步训练序列的定时度量方法,利用相邻训练序列的能量差值作为定时度量,避免了传统对称相关中基于采样点的乘积运算.但是由于需要计算每个采样点的幅度平方,仍需2 次实数乘法运算.李雪琨等[7]提出了一种时频联合符号同步方案,通过变换域的方法把相关运算变换为频域的并行处理,将复杂度由O(N2)级 降为O(Nlog2N)级.上述几种方法在不同程度上降低了计算复杂度,但仍存在乘法运算,硬件实现复杂度依然较高.为了避免乘法运算,HAO等[8]提出将同步训练序列的元素值量化为逼近2的整数次幂的定点数,把乘法运算转化为移位操作运算.但该方法仅考虑了复杂度的降低,没有充分考虑量化可能引起的性能损失情况.进一步地,文献[9 - 11]提出了基于1 bit 量化的同步技术与实现方法,把互相关中的乘法运算转化成1 bit 的加法运算,但是由于忽略了接收信号的幅度信息,同步性能存在较大损失.综上所述,目前的研究方法大多是从同步训练序列设计和定时度量函数优化两方面进行的,对于同步训练序列的量化方法、量化位宽等对同步性能和复杂度影响研究相对较少.

针对上述问题,本文提出一种基于2 bit 量化的低复杂度同步方法.采用1 bit 表示符号位、1 bit 幅度位的方法对接收信号和同步训练进行量化,基于1 bit 异或和1 bit 加法运算即可实现传统算法中的乘法运算,大大降低相关计算的复杂度;同时以量化后同步序列的峰均比最大化作为准则,提出一种基于遍历搜索的最优量化门限和幅度映射值的确定方法.最后,利用仿真和FPGA 实现的方法对所提算法的性能和实现复杂度进行了评估,验证了所提方法的有效性.

1 OFDM 符号同步原理

基于训练序列的定时同步的基本思路是,在有效数据载荷前插入一段已知的训练序列,利用训练序列良好的相关特性,在接收端对接收信号和已知的训练序列进行相关运算后可以得到尖锐的相关峰[12].通过相关峰与预设同步门限的比较,即可判断同步训练序列的准确位置.上述帧结构如图1 所示.

图1 符号同步帧结构Fig.1 Symbol synchronization frame structure

其中CP为循环前缀,由OFDM 符号的尾部信号构成,可以避免由于时延扩展带来的符号间干扰和载波间干扰.S为ZC(Zadoff-Chu)序列构成的同步训练序列,S*表 示S的共轭序列.ZC 序列是一种恒包络零自相关序列,由单位圆上的复数组成,对于给定的序列周期N,可定义为

式中:u为一个与N互质的数;q为任意整数,一般取0.ZC 序列的时域波形如图2(a)所示,可以看出ZC序列是个恒定幅度的复数序列,但是其I、Q 支路的幅度不是恒定的,因此不同的量化方式和量化位宽会带来不同程度的波形失真,进而影响同步性能.ZC 序列具有良好的相关特性,其归一化自相关如图2(b)所示,可以看出ZC 序列的自相关结果具有尖锐的相关峰,可以利用其良好的相关特性实现定时同步.

图2 ZC 序列的时域波形和归一化自相关函数Fig.2 Time domain waveform and normalized autocorrelation results of ZC sequence

上述训练序列经信道传输,时刻i的接收信号可表示为

式中:xi为 发送信号;yi为 接收端的接收信号;hl为信道响应函数;L表示多径数;wi表示均值为0,方差为 σ2的加性高斯白噪声.当L=1时,式(2)退化为加性高斯白噪声(additive white Gaussian noise, AWGN)信道.

对于任意时刻d,通过对接收信号yi与本地训练序列xi进行互相关运算,可以得到相应的相关性度量为

利用ZC 序列的自相关特性,如果接收信号中存在同步训练序列,那么通过Vd的计算可以得到一个尖锐的相关峰.通过将峰值与同步判决门限Vth进行比较,如果Vd≥Vth,则可判定当前位置d即为符号起始位置,完成符号同步.由式(3)可以看出,在相关性度量Vd的计算过程中,存在大量的复数乘法运算,实现复杂度较高.

2 基于2 bit 量化的同步算法

传统的均匀量化方法是把信号按照幅值等间隔的分割成 2λ份,λ为量化位宽.具体方式可描述为:yˆi=round(yi·(2λ-1-1)/|y|max) ,其中yi表示原始信号,yˆi表示量化结果,|y|max表 示yi的 最大幅值,round(·)表示取整运算.显然量化位宽 λ越大,量化造成的信号失真越小,但硬件实现过程中的资源复杂度越高.相反,量化位宽 λ越小,硬件实现复杂度越低,但量化引起的信号失真越大.非均匀量化的方法通过考虑原始信号的概率分布特性,将原始信号映射为有限多个离散幅值完成量化过程,有望在信号失真和复杂度之间取得量化折中.本文提出一种2 bit 的非均匀量化方法,从而将同步中的乘法运算转化为异或和加法运算,可有效降低硬件实现复杂度,同时减小量化引起的同步性能损失.

2.1 2 bit 非均匀量化方法

介绍了2 bit 非均匀量化方法对同步训练序列和接收信号进行量化的实现过程,给出了量化结果的表示方法;进一步地,给出了基于2 bit 量化完成序列相关运算的详细过程,阐述了利用异或、加法运算替代乘法运算的基本步骤.

本文所提出的2 bit 非均匀量化方法,不同量化门限和映射值的选择,会影响相关结果峰均比的大小,进而影响同步性能.为了获得2 bit 非均匀量化方法下最优的同步性能,需要对量化门限和量化值进行遍历搜索.

2.2 最佳量化门限搜索方法

结合2.1 节所描述的量化方法,本文围绕量化过程中涉及到的门限值Am和 幅度映射值A0、A1等参数的选取问题展开研究.通过分析相关参数对量化及同步性能的影响进行分析,提出了一种基于遍历搜索的参数优化方法.

与传统均匀量化方式不同,本文提出的非均匀量化的方法,不是基于等间隔进行的.其基本原理是将原始信号幅度与量化门限Am进 行比较,将小于Am的幅度统一映射为A0,否则映射为A1.由于同步是基于训练序列优异的相关特性实现的,其自相关函数可写为

式中:τ表示表示任意时刻;p表示训练序列.

同步训练序列的相关特性可以由相关函数的峰均比表示,峰均比值越高表示相关峰越尖锐,副峰越少,利用其进行同步性能越好.本文所提非均匀量化方法基于量化门限Am和映射幅度A0、A1进行,选择不同的量化参数可以得到不同的量化训练序列.这将导致不同量化训练序列的自相关函数特性也不相同,最终影响同步性能.因此可以通过比较不同的量化方式和量化位宽对相关特性的影响,得到具有最佳同步性能的量化门限Am以及映射值A0、A1.最佳量化参数的搜索步骤如下所述.

2.3 基于2 bit 量化的同步复杂度分析

为验证本文所提方法的有效性,本文从同步复杂度的角度,对基于2 bit 量化的同步算法复杂度进行量化分析,并将之与传统的互相关同步方法等进行对比.假设同步过程中,采用长度为N的训练序列进行同步.传统的滑动窗同步方法和均匀量化同步方法,完成式(5)中的复数乘法计算共需进行4 次乘法和3 次加法.采用基于1 bit 量化的同步方法,可对式(5)中的复数乘法进行简化,式(5)右端的4 个实数乘法运算可以简化为

完成一次复数乘法计算,只需要进行4 次异或运算和3 次加法运算,极大地降低了整体计算复杂度.

采用2 bit 非均匀量化方法可将复数乘法运算简化为式(6)所示的符号位计算和幅度位计算.完成一次复数计算,共需进行4 次异或运算和7 次加法运算,复杂度相对较低.因此,要采用长度为N的训练序列进行相关值的计算,算法复杂度约为前述计算量的N倍.表1 是不同量化方法下相关运算的计算复杂度比较.

表1 计算相关结果不同量化方法复杂度Tab.1 Computation complexity of different methods for correlation operation

通过比较可以看出:在OFDM 系统中,传统的滑动窗互相关同步方法的由于需要进行乘法计算,复杂度较大,不具可行性;基于均匀量化的同步方法,虽然减少了位宽,但是相关过程中仍需要进行乘法运算,复杂度较高;基于2 bit 非均匀量化的同步方法,可将乘法运算转化为加法运算,且计算复杂度相较于1 bit 量化只增加了 4N次加法计算,是一种可行的同步方法.

3 性能分析

3.1 峰均比仿真

本文基于所提最佳量化门限搜索方法,对不同量化门限下的峰均比进行了仿真分析,并分析了不同根指数对同步的影响.

仿真过程中设定门限搜索步进Astep=0.02、映射值搜索步进 ΔA=0.02.ZC 序列利用式(1)生成,取N=128,根指数u=77和u=127两种情况进行仿真.图3 给出了这两个序列的不同量化门限与可得到的最大峰均比之间的关系.可以看出,对应根指数为127 的ZC 序列,当Am=0.54且A0=0.2,A1=0.92时可得到最大峰均比为225;对应根指数为77 的ZC 序列,当Am=0.5且A0=0.22,A1=0.8时可得到最大峰均比为216.通过与原始浮点序列和均匀量化序列的峰均比进行对比可以看出,2 bit 非均匀量化序列的最大峰均比要略大于2 bit 均匀量化序列,具有较好的自相关特性.但是不同根指数同步序列对应的最佳量化门限Am和幅度映射值A0、A1选择略有不同,这是因为不同根指数序列下同步序列的幅度分布不同导致的,在具体的量化过程中应该充分考虑这一因素.

图3 不同量化门限 Am 下的同步训练序列自相关函数的最大峰均比Fig.3 Maximum peak to average ratio for self-correlation function of ZC sequence with different Am

图4 是采用本文所提非均匀量化方法,对不同根指数的同步序列进行量化,可得到的最大峰均比结果.可以看出,针对长度为128 的ZC 序列,2 bit 非均匀量化后序列的峰均比与3 bit 均匀量化后序列的峰均比相近.

图4 不同根指数同步训练序列最优2 bit 量化时的自相关函数峰均比Fig.4 Peak to average ratio for self-correlation function of different ZC root sequences in optimal 2 bit quantization

3.2 同步性能分析

为验证本文所提同步方法的性能,本文通过计算机仿真的方式将其与传统同步方法的性能进行比较分析.仿真过程中,采用长度为128、根指数u=127的ZC 序列,子载波间隔为480 kHz,因此对应ZC 序列的信号带宽为61.44 MHz.当接收信号中不存在同步训练序列时,采用互相关得到的相关性度量服从指数分布,其概率密度函数为[13]

假设采用恒虚警检测方法,且令虚警概率为Pfa=10-4.图5 是AWGN 信道条件下,不同量化方式的检测概率比较.图中理论性能是依据式(21)得到的数值分析结果,可以看出理论分析性能与未量化时的性能基本一致;同时,本文所提同步方法性能较传统均匀量化方法有显著提升,同步性能较1 bit 量化方法可提升大约2 dB,与3 bit 同步性能相比损失小于1 dB.

图5 AWGN 信道下不同量化方法的同步性能Fig.5 Synchronization performance of different quantization methods in AWGN channel

同时对多径信道条件下同步性能进行了分析比较,仿真中采用EPA 信道模型,多径信道参数如表2所示.

表2 EPA 信道模型参数Tab.2 Parameters of EPA channel models

图6 是EPA 信道无噪条件下同步训练序列的互相关结果,由于多径信道会产生信号能量的扩展,接收到的信号不再是单一路径的信号,还包括了与本地序列有一定相关性的多径信号的叠加,因此在与接收端的本地序列进行滑动互相关后,相关结果会得到多个相关峰值,造成错误的定时,从而会导致同步性能的下降,并且同步性能的恶化程度随着多径数量和归一化功率的增加而增加.

图6 EPA 多径信道下无噪声时的相关结果Fig.6 Correlation results in EPA multipath channel without noise

图7 是EPA 信道下的同步性能,可以看出在EPA 信道条件下的同步性能相较于高斯信道的同步性能有所下降.在EPA 信道下2 bit 非均匀量化性能与3 bit 均匀量化的性能相差不到1 dB,同时较传统1 bit 量化时的同步性能有显著提升,验证了所提方法在多径信道下的性能.综上所述,本文所提同步方法在AWGN 和EPA 信道条件下,均可获得较好性能.

图7 EPA 多径信道下不同量化方法的同步性能Fig.7 Synchronization performance of different quantization methods in EPA multi-path channel

3.3 基于FPGA 的实现结果

为验证所提同步方法的硬件实现复杂度,本章采用FPGA 对不同量化位宽的同步模块进行了设计实现与验证.图8 是同步实现的流程框图,首先需要通过A/D 将接收到的模拟信号转换为数字信号,然后将数据进行2 bit 非均匀量化,得到1 bit 符号位和1 bit 幅度位.将量化后的符号位和幅度位分别与本地序列经过2 bit 非均匀量化后的符号位和幅度位进行异或和加法运算并将运算结果送入逆映射模块得到相应的真值,最后将真值结果进行累加,得到相应的相关度量值,并进行门限判决.表3 是针对长度为128 的ZC 序列同步,基于Xilinx Spartan-6 XC6SLX150 芯片对同步模块进行实现,不同量化方式和位宽下的硬件资源消耗情况.可以看出,在相关长度相同的情况下,2 bit 非均匀量化方法通过对乘法运算进行简化,有效降低了实现复杂度.与性能相近的3 bit 量化方式相比,Slice 逻辑资源消耗减少大约31%,LUTs 和FF 资源分别减少23%和26%.实现结果表明,相关长度相同的情况下,2 bit非均匀量化方法通过节省乘法器,可有效减少硬件资源消耗.

图8 同步实现流程Fig.8 Flow chart of proposed synchronization scheme

表3 不同量化方式下资源比较Tab.3 FPGA resource utilization of different quantization methods

4 结 论

本文针对传统OFDM 符号同步过程存在大量复数乘法运算,实现复杂度高的问题,提出了一种低比特量化的高性能同步方法.通过符号位和幅度位2 bit 对同步序列进行量化,利用符号位的异或运算和幅度位的加法运算,替代传统方法中的乘法运算,极大降低了同步方法的实现复杂度.同时,本文提出了一种最优量化门限和幅度映射值的搜索算法,得到了不同根指数同步序列的最佳量化参数.

在AWGN 和EPA 多径信道环境下,对不同量化方式下的同步性能进行了比较分析,仿真结果表明:本文所提2 bit 非均匀量化方式,其同步性能可逼近传统3 bit 量化性能.利用FPGA 对同步模块进行了实现,实现结果表明,本文所提方法具有较低实现复杂度,硬件资源消耗要低于传统的3 bit 和2 bit 量化实现结果.

猜你喜欢

门限复杂度乘法
算乘法
基于规则的HEV逻辑门限控制策略
我们一起来学习“乘法的初步认识”
地方债对经济增长的门限效应及地区差异研究
《整式的乘法与因式分解》巩固练习
随机失效门限下指数退化轨道模型的分析与应用
把加法变成乘法
一种低复杂度的惯性/GNSS矢量深组合方法
求图上广探树的时间复杂度
某雷达导51 头中心控制软件圈复杂度分析与改进