APP下载

LFM脉冲压缩的FPGA时域实现

2018-05-23,,,

计算机测量与控制 2018年5期
关键词:滤波器脉冲分布式

,,,

(湖北大学 计算机与信息工程学院,武汉 430062)

0 引言

现代雷达对速度分辨力和距离分辨力性能均提出了较高的要求,为了兼顾这两项指标,常采用脉冲压缩技术, 即在发射端发射大时宽的线性调频(LFM)脉冲,在接收端进行匹配滤波实现脉冲压缩,以获得大带宽的回波信号,这样可同时获得较高的速度分辨力和距离分辨力[4]。脉冲压缩可采用时域法和频域法两种方式实现。频域法实现时速度较快,但需多次用到FFT和IFFT,硬件开销较大;采用时域法实现时电路结构简单,但运算速度较慢。

本文采用分布式算法设计FIR结构的匹配滤波器,并对通过对匹配滤波器窗函数进行改进,改善了脉冲压缩的效果,提高了目标距离分辨能力。基于FPGA完成了对LFM信号脉冲压缩的时域实现,具有节省硬件开销和运算速度快的双重优势。

1 LFM脉冲压缩原理分析及窗函数加权

1.1 LFM脉冲压缩原理

LFM(线性调频)信号表示为:

s(t)=rect(t/T)exp(jπkt2)

(1)

rect(t/T)表示信号的幅度。用sri表示第i个点目标的回波信号:

(2)

雷达发射端发射宽脉冲的LFM信号,在雷达的接收端对回波信号进行处理获得窄脉冲信号,这种由宽脉冲信号到窄脉冲信号的处理过程被称为脉冲压缩,其核心就是匹配滤波器。

匹配滤波器的原理:回波信号与滤波器传输系数进行时域卷积,并不断调整传输函数h(t),使匹配滤波器的脉压效果达到最佳,同时输出信号的信噪比达到最大值。设s(t)、h(t)分别是回波信号和滤波器的传输系数,得到匹配滤波器的输出为:

(3)

令h(t)=s(-t)*,则滤波器输出为:

(4)

K代表幅度归一化常数。匹配滤波器的核心:对回波信号s(t)与滤波器的传输函数h(t)进行线性卷积,滤波器的长度由发射脉冲的带宽B、时宽T,以及采样倍数n决定的。脉冲压缩后回波信号的主瓣宽度:τ=1/B,脉冲宽度比:D=BT=T/τ,D也称为发射脉冲的时宽带宽积。由式(4)可知,当h(t)为回波信号s(t)的镜像函数时,匹配效果最佳,由于回波信号是动态的、不确定的,观察图(a)发现,回波信号类似于带有波纹的LFM信号,所以可采用发射脉冲信号的复共轭近似代替匹配滤波器的传输函数。

发射脉冲的设计参数:T=3 μs,B=10 MHz时,距离分辨力δ=c/2B=15 m,c为光速,目标间距设计为20 m。图1 为双目标LFM回波信号脉冲压缩前后的仿真波形:其中(a)是脉冲压缩前的回波信号,该回波信号的波形近似于带波纹的发射脉冲,没有明显的目标信息,需要对该回波信号进行脉压处理;(b)为回波信号经脉冲压缩后的仿真结果,观察发现,脉冲压缩后信号的主瓣与旁瓣区分明显,过渡带更加陡峭,很容易提取目标的有效信息,通过对主瓣时间间距进行计算,可以获得较为准确的目标间距。

图1 两目标LFM回波信号脉压前后的波形

1.2 对匹配滤波器进行窗函数加权

对回波信号直接进行脉压得到的窄脉冲信号旁瓣比较大,信号能量不集中,造成能量的损失,要接收到信噪比较大的信号就需要发射端发射更大功率的信号,故需要一种方法使信号的能量尽可能集中在主瓣上。常见的抑制旁瓣的方式就是窗函数加权,不仅使信号能量集中在主瓣,也使目标信息的提取变得更加容易。常见的窗函数有矩形窗、三角窗、海明窗以及布莱克曼窗,且不同窗函数的频谱特性不同。采用窗函数加权的最终目的是抑制旁瓣、减小主瓣宽度,但是这两个目标相互矛盾,不能同时实现,所以窗函数的选择要根据实际需求。以经典Hamming窗为例先对匹配滤波器加权处理,窗函数表达式为:

(5)

其中:T为发射脉冲的时宽,Hamming窗加权后信号的旁瓣抑制较好,但是过渡带变得平缓。在实际数字滤波器中,受采样频率、数据位宽以及滤波器长度的限制,当目标距离较近时,目标识别的难度加大。虽然旁瓣受到了有效抑制,但是平滑的过渡带降低了目标的可识别性。为改善这种情况,对Hamming窗进行改进。

LFM信号的能量主要集中在低频,而回波信号与发射脉冲的波形相似,所以在匹配滤波器进行线性卷积时,主瓣的能量也主要来自低频部分,而且发射脉冲采用的是上变频LFM信号,故得到改进后的加窗函数为:

(6)

图2 窗函数时域仿真波形

对比改进前后的窗函数可以看出,改进窗只有Hamming函数的一半,也近似于LFM信号的第一个周期的一半。对滤波器进行加权就是对滤波器的传输系数进行加权,得到新的传输系数为:hh(t)=h(t)·w(t),带入式(4)得到加权后匹配滤波器的输出为:

(7)

其中:W(t)为w(t)或wh(t),回波信号经过窗函数加权后的匹配滤波器进行脉冲压缩(以间距d=20 m为例),对比Hamming窗改进前后的仿真结果,如图3所示。对比图1、图3看出,进行窗函数加权后的回波信号能量更加集中,降低了能量的损失,然而波峰间的过渡带变得平缓,目标识别难度加大。与传统的Hamming窗相比,使用改进窗函数进行加权可以获得较为陡峭的过渡带,提高目标的距离分辨能力,而且旁瓣进一步被抑制。

图3 窗函数改进前后的脉压波形

2 分布式算法原理和FPGA实现

2.1 分布式算法原理分析

时域数字卷积是通过N(N为采样长度)阶FIR结构的滤波器实现的[2],由上节可知滤波器的输入数据和匹配系数都是复数形式。实现一次长度为N的卷积运算需要4N次乘法器和4N-1次加法器[5]。当N取值64时,完成一次实时卷积运算就需要256个乘法器同时运行,然而一般的FPGA芯片没有如此多的嵌入IP核,所以在考虑实际成本和不降低运算速度的情况下,采用分布式算法,设计多条流水线并行执行的匹配滤波器,可以很好解决高阶滤波器设计受限于乘法器资源不足的情况。

分布式算法就是利用嵌入在FPGA芯片的存储模块和丰富的逻辑资源,采用数据存储、格式转换、地址查询的方式代替卷积运算中的乘法器。分布式滤波器设计是先将卷积运算结果的所有可能情况存储在RAM模块,接着将输入数据转换成存储模块的寻址数据,并进行查表输出,然后对存储器的输出进行移位求和就得到实际卷积运算的结果,该算法实现乘法到存储器、寄存器的转换,利用FPGA丰富的存储和逻辑资源代替稀有的IP核,使普通FPGA芯片设计高阶滤波器成为可能,节省了硬件成本。分布式算法具体如下:

首先对回波信号进行采样,得到滤波器的输入信号x(n),二进制表示形式为:

(8)

xk(n)表示x(n)的第k位,b是采样数据的位长,则匹配滤波器输出:

(9)

由式(9)看出,首先输入信号第k位的值(1或0)与滤波器系数进行与运算并求和,然后将上一步的累加和左移k位(2k相当于左移k位),再次求和最终得到y(n),此方法就是将卷积运算转变为逻辑运算和移位求和的过程。通过此方法可以看出,只要知道第一步的累加值,再进行移位求和就可以得到时域卷积的值。在实际设计中首先将第一步累计和的所有可能值存储在芯片嵌入的RAM块中,然后对输入数据进行变换,作为存储器的寻址数据,对存储器输出的数据进行移位求和,这就是分布式算法设计滤波器的大致流程。

为了改善脉冲压缩后信号的信噪比,需要对设计的滤波器进行窗函数加权,设w(n)为窗函数经采样后的数据,采样长度为滤波器的设计阶数,得到滤波器的传输系数变为:h(0)w(0),h(1)w(1),...,h(63)w(63)。

(10)

为了设计方便和节省资源,先将加权后的系数值带入式(9),即先对滤波器进行加权,此时滤波器的输出即为窗函数加权后的滤波结果。

2.2 分布式算法的FPGA实现

匹配滤波器的设计如图4,设计8条流水线并行处理的结构,此时每条流水线都为一个8阶FIR结构的滤波器,每条流水线的查找表大小为28单位,流水线设计将卷积运算的RAM使用量降到8×28单位,这使得一般的FPGA芯片都可以满足。甚至可以进一步采用16条流水线的进行电路设计,将查找表的使用量降为16×24单位,不过模块衔接复杂,硬件电路设计难度加大,需要注意更多的时序问题。本次设计采用8条流水线并行执行的FIR结构,匹配滤波器的具体设计框图如图5。

图4 匹配滤波器的结构

图4中k表示输入数据的第k位,每个ROM表存储8阶FIR结构采用分布式算法的所有可能乘积项,需要个存储单元,对输入数据进行转换并寻址存储器,接着将ROM表的输出数据进行移位(左移k位)求和,输出的值为图5 中的一个值。因为滤波器的输入数据是复数,由复数乘法可知,故需要4条图4的流水线设计。匹配滤波器整体设计结构如下图:

图5 匹配滤波的总体结构

由图5可知,首先将回波信号进行分解,然后对回波信号的实部和虚部进行采样、存储及数据转换,滤波器最终输出的是回波信号脉冲压缩后的模值。然而传统的求模方式依旧要用到乘法器和开方运算,实现开方运算非常复杂而且延时比较高,所以需要找到一种简单的模值估算方法求取信号的模值,且延时较低。设信号的模值为Y,估算算法[3]为:

Y=MAX{MAX(|I|,|Q|),7/8MAX(|I|,|Q|)+

1/2MIN(|I|,|Q|)}

(11)

据统计,采用该复数求模公式对信号的损失不超过0.13 db,其中7/8MAX(|I|,|Q|)可以采用移位寄存器与加法器的结合来实现。至此匹配滤波器的整体结构完成,整个设计完全使用寄存器和加法器资源,理论上只要FPGA的ROM和加法器资源足够,可以设计任意长度的滤波器。

3 匹配滤波器的FPGA设计与测试

3.1 基于FPGA设计匹配滤波器

采用ALTERA公司的FPGA器件EP2C35F672C8进行匹配滤波器的设计集成。图6是利用FPGA设计实现脉冲压缩功能的匹配滤波器的整体结构。ROM_real、ROM_imag模块存储的是回波信号经分解、采样、量化处理后的实部和虚部数据,在时钟CLK控制下,通过counter计数器计数作为存储模块的输入地址产生滤波器的输入数据;address模块对输入数据的第k进行转换作为分布式算法查找表模块的输入地址,通过该地址提取模块ROM_R0toR7、ROM_I0toI7模块中的数据(完成乘积项的提取),接着对输出的数据移位、求和得到图5中I1、I2、Q1、Q2的值;此时得到回波信号经过脉冲压缩后的实部、虚部,且都为有符号数据,需要进一步设计求模电路方便数据分析。

图6 匹配滤波器设计结构

图7是由式(11)设计的求模电路,采用xor2模块求取回波信号实部和虚部的绝对值(输入数据与其最高位逐位异或),通过比较器和加法器对输出信号求模,输出data4[17:0]为回波信号脉压后的近似模值。至此基于FPGA的匹配滤波器的整体硬件电路设计已经完成,进一步对设计好的电路添加时序约束并进行时序仿真分析,检测整个电路是否满足要求。首先编写Test Bench驱动文件,设计时钟精度并初始化电路,接着加载ROM模块存储的数据进入滤波器进行处理,最终将滤波器输出的是数据通过波形显示器显示,观察回波信号脉冲压缩后的波形。

图7 求模电路结构

3.2 滤波器测试结果

LFM信号设计参数:带宽,时宽,采样频率,时钟频率,距离分辨力δ=15 m。通过Modelsim加载滤波器的输出数据,Wave设置为Analog模式,观察脉冲压缩后信号的波形。图8是两目标回波信号脉压前实部和虚部的测试波形,与MATLAB仿真结果一致,直接对回波信号进行分析,是难以提取到目标信号的有用信息,需要进一步对回波信号进行匹配滤波。

图8 两目标脉冲压缩前的回波信号

图9分别为两目标间距20 m的回波信号。可以看出,与图3的Hamming窗加权仿真结果相比,经FPGA设计数字滤波器处理后,目标的分辨性能下降,这主要是由于采样频率与采样精度受限的影响。考虑FPGA硬件资源有限和成本的控制,过多地提高采样频率和采样精度的方法并不可取,故需要提高算法的有效性。对窗函数进行改进并加权,观察滤波器的输出波形如下所示,此时目标信号区分明显,虽然主瓣的宽度却有所增加,但是信号能量依旧集中在主瓣。对图9的测试波形进行分析,测得两主瓣间距Δt=16 ns,经计算测量间距Δd=fclk·cΔt/2fp=20 m,与设计的目标间距一致,这说明改进窗函数能够改善因采样频率、采样精度受限造成信息损失的影响。

仿真报告显示,该数字滤波器设计占用2 268个逻辑单元、1 573个寄存器、28 032字节存储器。可以看出使用寄存器和存储器代替卷积运算中的乘法器时,逻辑资源、存储资源的使用量都比较大。当采用级联结构设计匹配滤波器时,资源的使用量会成倍减小,但运算速度也会成倍降低,二者不能同时兼顾,具体选择要根据实际要求。

图9 两目标脉冲压缩后的测试结果

4 结束语

本次设计根据FPGA并行执行机制,采用分布式算法设计FIR结构的匹配滤波器。以寄存器和加法器代替乘法运算,不仅保证了数据处理的速率,而且打破了FPGA的乘法器资源的限制,可以设计高阶滤波器。通过对仿真结果进行分析,与直接对回波信号进行压缩相比,Hamming窗函数加权后,可以降低旁瓣,但目标距离分辨性能并不理想,使用改进窗函数加权后,目标的距离分辨能力明显改善。

本次设计采用64阶的FIR结构以及全流水线同步算法,虽然完全替代了乘法器的使用,但是资源的使用量依旧较大。若采用串行处理的方式,每削减一半的流水线,硬件资源的使用量就会减少1/2,所以如何考虑硬件成本和处理速度需要结合实际情况。

参考文献:

[1] 杜 勇. 数字滤波器的MATLAB与FPGA实现[M].北京:电子工业出版社,2015.

[2] Baese U M. 数字信号处理的FPGA实现[M]. 刘 凌译.北京:清华大学出版社,2011.

[3] 杨维明.一种基于EPLD技术的信号取模方法[J]. 湖北大学学报,1999,21(2):1-4.

[4] 丁智泉. 线性调频信号的脉冲压缩系统的设计与FPGA实现[D]. 成都:电子科技大学, 2006.

[5] 李文刚. 基于FPGA的高阶高速FIR滤波器设计[D]. 成都:电子科技大学, 2005.

猜你喜欢

滤波器脉冲分布式
基于多模谐振器的超宽带滤波器设计
脉冲工况氧气缓冲罐裂纹修复实践
浅析分布式发电对电力系统的影响
从滤波器理解卷积
Comparison of decompression tubes with metallic stents for the management of right-sided malignant colonic obstruction
一种微带交指滤波器的仿真
小型化Ka波段65W脉冲功放模块
基于预处理MUSIC算法的分布式阵列DOA估计
超音频复合脉冲GMAW电源设计
分布式并联逆变器解耦电流下垂控制技术