APP下载

基于GPU加速的雷达信号处理并行技术

2017-12-18谢登召

魅力中国 2017年47期
关键词:信号处理技术

谢登召

摘 要:软件雷达概括的说就是在雷达领域中应用软件无线电技术。就目前来说,软件雷达难以克服的困难就是软件雷达信号处理的实时性。本文在中央处理器-图形处理器异构系统中采用任务级、数据级和线程级三级并行策略的基础上设计了基于多GPU 的雷达信号处理并行算法,并取得了可观的成就。

关键词:软件雷达 信号处理 技术

软件雷达实现的瓶颈问题之一是信号的实时处理。为提高软件雷达信号处理的实时性,利用图形处理器的并行运算能力进行雷达信号处理的硬件加速。设计雷达信号处理在系统中的执行策略。对GPU并行计算特点对雷达信号处理算法进行优化。实验结果表明,通过与同期中央处理器(CPU)运算平台比较,GPU运算可实现20倍以上的加速比,并且可以实时完成雷达信号处理的整个流程,体现出良好的工程价值与应用前景。

1、频数字信号并行处理

将软件无线电技术应用于雷达领域的软件雷达,其硬件平台的组成成分一般包括通用处理计算机、高速模/数采样器件、变频组件和天线系统以及雷达显控终端部分。在变频组件内通过下变频转换的作用可以将通过雷达接收到的信号转换为中频信号,将中频信号传送至高速模/数采样器件并将其转换为数字信号,然后再将转换后的数字信号送至通用计算机平台实现对雷达接受信号的处理过程。基于多GPU 的异构计算机平台处理信号的调度以及流程等全部由由CPU 负责, 首先将单个子模块进行运算所需的内存空间以及显存空间开辟,在详细了解GPU 初始化参数的前提下通过创建主机端线程来实现对设备端管理,按照“主机-设备端-主机”的流程将获取的数据自计算机主机内存传输至设备显存,然后即可进行对数据的密集型计算。

2、软件雷达信号并行处理的计算模型

2.1 任务级并行。首先在软件雷达的主机端创建任务队列, 用以中频数据的采样, 并利用CPU 主线程实现对任务的划分和控制工作,使用CPU 并行线程实现任务调度以及配置设备端ID 的工作,并对任务队列进行按次序的访问。给基于多GPU 异构系统上的GPU 采取轮转的形式分配各个任务,将获取的第n 个数据以迭代的形式传输至第n mod q 个GPU,这样可以保证多块GPU 的工作获得负载平衡, 其中q 为并行GPU 的个数。

2.2 数据级并行。进行正交相位检波和脉冲压缩计算时,每个脉冲重复周期t内采样点在周期之间无关联性,对获取的采样数据实施数据级并行处理可获得接近几乎线性的加速比[1]。在数据级并行处理时为了得到较高的计算访存比,我们可以将整个脉冲压缩后的rn×k 的二维数组规划成q 个n×m 数据部分,其中的二维数组域中每一行均含有m=k mod q 个采样点,并行GPU 的每块GPU 对重构后的数据部分进行并行的计算,此时二维数据域对并行GPU 的映射为一个线程网格。在数据级并行处理时,并行GPU的单个GPU 只需对所属的重构数据域进行迭代计算。

2.3 线程级并行算法。线程级并行算法是根据信号处理的数学模型和GPU 并行计算的硬件特性,将数值计算映射到GPU 细粒度并发线程的具体实现过程。1)正交相位检波和脉冲压缩。在软件雷达处理信号时,进行正交相位检波可以把中频信号通过特殊方法转变为零中频的I、Q 两路正交信号。其实现过程为:通过高速模/数变换器的中频信号能够直接进行采样和变换过程得到数字信号, 将得到的数字信号与正交混频信号进行点乘、低通滤波处理即可得到零中频的I、Q 两路正交信号。在对正交混频信号与采样点进行点乘处理时,我们需要把正交混频信号以及整段脉冲重复周期内的采样数据全部输入到内核函数中才能进行点乘。由于内核函数与整段重复周期内的采样点线程网格是相互对应覆盖的,所以在将正交混频信号以及整段脉冲重复周期内的采样数据全部输入到内核函数时其中的每个线程块都可以进行n 维度的采样数据计算,并且可以将每个采样数据作为一个处理单元将其映射到相关的线程中。我们可以通过仿真计算得到数字低通滤波器的相关系数,并且可以根据纹理缓存将采样数据的读取速度不断提高。因此可以在纹理存储器存储以权库的形式表现的滤波器系数,当进行正交相位检波模块时即可进行读取过程。在软件雷达处理信号时所进行的正交相位检波、动目标检测以及频域脉冲压缩等计算时均需采用傅立叶变换(FFT)的方法进行变换处理。2)MTI/MTD,在工程领域中我们较为常用的固定二次对消器一般都是由两个固定的一次对消器级联而成的。在一般结果的固定二次对消器设计中,输入采样数据信号尺寸的级联倍数即为开辟的显存空间大小,开辟的显存空间可以存储脉冲压缩后产生的连续采样回波数据信号。其中在显存空间中存储每个脉冲压缩后的回波数据的形式为“先进先出”的形式。对脉冲重复周期内数字信号进行迭代运算时需要通过线程索引号并发执行来完成,其中每个线程分别维护采样值经延迟线加权与相同距离分辨单元采样点隔周期相减。动目标检测也是一项必要的工作,其实现动目标检测的原理为:在固定二次对消器(MTI)后串接一窄带滤波器组,通过窄带滤波器组实现对整个重复频率范围的覆盖,其工作的根本为相参积累不同通道,在对采样数据信号进行滤波处理时可采用FFT滤波器组完成。在进行MTD 运算时,将相邻m 个重复周期的数据作为一维数组存储起来,采用棋盘划分的方式实现矩阵转置,对其相同距离单元即矩阵每一行的数据进行FFT 運算。3)脉冲积累和恒虚警检测。如果要将算法效率有效提高,则需要对以共享存储器做为中间数据访存和线程通信载体进行合理地利用。在软件雷达对信号进行处理时, 在脉冲积累运算时将以棋盘划分的方式把数据域划分给并行GPU,首先把矩阵设置成为一个n 行m 列的矩阵,并将整个线程网格划分成n 个线程块,对应的单个线程块即可实现对m 个数据的处理运算,即得到一列的数据。然后将通过线程块处理所得到的的每一列数据从显存复制到线程块中的共享存储器,以并行归约的方式将这些数据作求和处理,调用_syncthreads()函数对求和处理后的数据进行栅栏同步,最后即可将每个线程块内运算得到的相关结果存入全局存储器(n 维)中。在进行均值类恒虚警检测算时,则需要对每个距离单元两侧各点的采样数据进行求和处理,此外,将运算数据分段复制到线程块内的共享存储器可以将从全局存储器中读取数据的频率降低。

基于多GPU 并行运算处理雷达信号算法,能够满足软件雷达标准化、模块化、开放性等的相关要求。通过仿真算法实例我们得知,基于多GPU 的多任务并行算法处理雷达信号时能够满足雷达工作的实时性。也很好的证明GPU 在加速雷达信号处理运算上的可行性,具有很重要的现实意义。

参考文献

[1]张波,薛正辉,任武.基于图形处理器的时域有限差分算法硬件加速[J].电波科学学报,

2015,(05).

[2]熊超.基于GPU 的连续波雷达频谱分析与谱峰搜索技术研究[D].长沙:国防科学技术大学,2014,(09).

[3]张波,薛正辉,任武,等.基于图形处理器的时域有限差分算法硬件加速[J].电波科学学报,2015.(09).

猜你喜欢

信号处理技术
大数据背景下的信号处理分析
探讨电力系统中配网自动化技术
移动应用系统开发
北京市中小企业优化升级
创维超级芯片VCT 3803彩色电视机电路分析(6)音频信号处理电路