FPGA实现的任意波形发生器的设计

2010-06-05封治华杜改丽

电子设计工程 2010年10期

封治华，杜改丽

（1.中国电子科技集团公司第二十七研究所，河南郑州 450047；2.河南职工医学院河南郑州 451191）

波形发生器广泛应用于电子电路、自动控制和科学试验领域，是一种为电子测量工作提供符合严格技术要求的电信号设备，和示波器、电压表、频率计等仪器一样是最普通、最基本也是应用最为广泛的电子仪器之一，几乎所有电参量的测量都要用到波形发生器。随着通信、雷达的不断发展，对信号源的频率稳定度、频谱纯度、频率范围和输出频率的个数以及信号波形的形状也提出越来越多的要求。不仅要求能产生正弦波、方波等标准波形，还能根据需要产生任意波形，且操作方便，输出波形质量好，输出频率范围宽，输出频率稳定度、准确度及分辨率高，频率转换速度快且频率转换时输出波形相位连续等。可见，研究制作高性能的任意波形发生器十分有必要，而且意义重大。

1 任意波形发生器的FPGA实现

系统框架如图1所示，上位机产生任意波形数据，经USB2.0控制器CY7C68013A与FPGA(现场可编程门阵列)相连。将数据下载到FPGA的RAM当中，再通过硬件电路依次从波形存储器中读取出来，经D/A转换及滤波后得到所需信号波形输出。

图1 系统整体框架图Fig.1 Framework diagram of system

关于DDS的基本原理与结构在这里就不再加以阐述[4]，用FPGA按照DDS的基本原理和结构设计和实现一个任意波形发生器，所以DDS的几个基本部分都是应当具备的。实现任意波形发生的关键在于把存放波形量化表的ROM换成了可以改写的RAM，这样通过与RAM的接口可以改变存放在波形RAM中的数据从而实现任意波形发生。这里主要介绍控制部分、相位累加器、波形RAM几个模块来叙述任意波形发生器的实现。

1.1 控制部分

这个部分主要是要解决DDS模块与单片机的接口问题。在FPGA的实现中，主要设计了2个模块，一个是输入寄存器模块，为了接收单片机写入的频率控制字。另外一个是地址分配模块，这样单片机就可以通过不同的地址来选通FPGA各个模块工作。设计中DDS采用了32位的相位累加器。这样对于一个频率控制字，单片机要分4次分别写入4个字节；基于这样的要求，设计了输入寄存器模块如图2，这个部分主要是要解决DDS模块与单片机的接口问题。

图2 输入寄存器模块图Fig.2 Block diagram of input register

din[7..0]是该模块与单片机数据线的接口，clr是低电平异步清零，en是高电平使能，clk为数据写入时钟，dout[31..0]是寄存器输出的32位频率控制字。该模块工作过程为：当en为高电平，clr也为高电平时，clk的上升沿将输入的8位数据锁存进该模块中，当锁存完4个字节的数据后，自动将该4个字节的数据按照先写入的在高位的顺序组合成一个32 bit的数据输出到dout[31..0]。

该模块的功能仿真图如图3所示，看到当clr=‘1’并且en=‘1’ 时，经过 4个时钟，dout上将前 4个时钟的值‘00’、‘01’、‘02’、‘03’组成 32 位的‘00010203’数值输出在 dout上。

地址分配模块采用一个3/8译码器来实现地址选通的功能，如图4所示。

由于累加器的清零是当“clr”=1的时候，所以在与门后加一个反相器，而频率寄存器清零的条件是“clr”=0，所以，就可以直接与门后相连即可。3/8译码器的使能端接VCC，G2AN和G2BN连起来接CS，作为整个任意波形发生器模块的片选信号，当低电平的时候选中，各模块才开始工作。

地址锁存模块主要解决单片机P0口的分时复用问题。本设计选用的单片机为51系列单片机，其P0口既作为数据口，又作为地址总线的低8位，因此在使用时，需要将地址信号从分时复用的地址/数据总线中分离出来。本设计选用8D锁存器74LS373来作为地址锁存器[6]。当74LS373用作为地址锁存器时，应使OEN为低电平导通输出，此时，锁存使能端G为高电平时，输出Q1～Q8状态与输入D1～D8状态相同；当G发生负跳变时，输入端数据D1～D8锁入Q1～Q8。因此在使用74LS373时，51单片机的ALE信号可以直接与74LS373的G相连。

1.2 相位累加器设计

相位累加器用于对输入频率控制字进行累加运算，输入频率控制字决定输出信号的频率和频率分辨率。因此相位累加器是整个DDS性能的关键部分。传统的相位累加器是用1个加法器加1个D触发器组成，调用其中的1个宏模块设置成32位数据相加，再加另一个32位的宏模块，就可以组成相位累加器。它在QuartusII软件中的最高编译频率只有262.12 MHz，显然不能满足设计要求。其时序仿真如图5所示。

图3 输入寄存器的功能仿真图Fig.3 Function simulation diagram of input register

图4 地址分配电路Fig.4 Address distribution circuit

通过仿真，当直接采用32 bit累加器的时候系统时钟最大只能达到大约25 MHz[3]，显然是达不到要求的。从设计上看，它实质上是一个带反馈的32位加法器，把输出数据作为另一路输入数据和从单片机传来的频率控制连续相加，产生有规律的32位相位地址码。一般位数小的累加器可以通过FPGA中的进位链得到快速高效的电路，但是进位链必须位于临近的LE（逻辑单元）或LAB（逻辑阵列块）中，长的进位链会减少供其他逻辑使用的布线资源，同时过长的进位链也会制约系统频率的提高，所以进位链不能太长[2]。因此，在相位累加器的设计中，要解决的难题是设法提高工作速度。为了解决速度难题，需从两个方面进行改进。

1.2.1 改进的流水线结构

在时序电路设计中为了提高速度，流水线结构是一种常用的设计方法。对于累加器来讲，流水线结构就是把一个位数很长的加法拆分成N个位数较短的加法，在N个时钟周期内做完然后输出运算结果，N就是流水线的级数。采用流水结构以后由于加法器的字长变短了，对于FPGA来讲加法器字长变短对工作频率的提高是相当可观的。当然，流水结构的使用并不能无限制地提高电路的工作速度。因此对于不同的器件来说，采用多少级流水对性能的提升比较大这个要经过仿真实验才能得到一个比较肯定的值。

本文运用流水线结构对相位累加器进行设计，当m=8、n=4的情况下，相位累加器的工作频率是最高的，达到了约70 MHz[3]。但是为了进一步提高工作频率，还需要结合下面的并行进位方法。

综上所述，本实验成功构建了LncRNA-GHET1过表达胃癌细胞株 MGC803，为进一步研究 LncRNA-GHET1基因过表达对胃癌细胞增殖、侵袭及转移等行为学的影响奠定重要基础。

1.2.2.并行进位加法器[6]

DDS累加器电路的设计采用了流水线结构，由8级4位加法器完成对32位控制字的累加。32位累加器的结果在送入相位幅度变化电路时，进行了高位截断，只取高12位数据进行查表。因而，在8级的流水线结构中，前5级4位加法器实际上只贡献了进位，在设计时，前4级加法器采用了超前进位链，而高位加法器不仅要给出进位值，还要获得加法的结果，因此采用了QuartusII自带的宏模块结构。通过每一位的Pi、Gi和Ci-1值很容易求得该位进位值Ci。再与该位的和（Ai+Bi）相异或就得到最后的结果 Si。即

采用上述结构，极大地提高了累加器的工作速度，其功能仿真图如图6所示，从图中可以看出，此4 bit超前进位加法器完全满足4位全加器的逻辑功能。

图5 传统结构相位累加器的时序仿真Fig.5 Timing simulation of the traditional structure phase accumulator

图6 4 bit超前进位加法器的功能仿真图Fig.6 Functional simulation diagram of the 4bit ahead adder

下面就将前5级采用超前进位加法器的32位累加器和宏模块中调用的4位全加器组成的32位相位累加器性能进行比较。

普通流水线累加器的模块是由4位D触发器，5位D触发器和4位全加器作为基本元件，采用原理图输入的方法设计FPGA的流水线累加器[7]。该模块的设计参照流水线累加器结构进行，不同之处在于：由于相位累加器只用高位寻址，所以低位上为了和高位结果同时输出而做延时作用的D触发器件均被去掉了。这样做的结果是，相位累加器输出的低20位会因为提前输出而混乱，但是由于高12位的输出一定是正确的，这样做既节省了资源，对结果又没有任何影响。仿真结果证明假如不用流水线结构，32 bit相位累加器工作频率最高达到约25 MHz。消耗的资源是82个LEs，而用了8级流水线结构后，编译工作频率最高达到了约317.79 MHz，资源消耗为186个LEs。可见在资源上的消耗换来了在性能上的极大提高。

流水线累加器的时序仿真如图7所示：可以看出当输入数据确定后，输出结果要经过8个时钟周期的延时后输出，这是因为采用了8级流水结构。采用多少级流水结构，输出就会延时多少个周期。同时也说明，对于输入数据切换来说，该系统会有8个时钟周期的延时，这是累加器采用流水线结构所不可避免的后果。事实上目前许多DDS专用芯片由于也采用流水线结构，所以本身也存在这样的问题。由于8个时钟周期的延时与系统时钟相比，实际上还是很小的，在一般的应用场合下也是可以接受的。由于输出的低20位未用，被省略了，只用了输出的高12位，所以仿真波形中只有高12位的输出结果。从输出结果来看，高12位的输出值是没有错误的，与设计思想吻合。

下面介绍超进位流水线累加器的构成，比较流水线累加器内部结构图和超前进位加法器的32位相位累加器的结构图，可以看出两个图的区别，经过编译以后的报告如图8所示，可以看出经过改进后，编译的最大工作频率提高到了336.7 MHz。比单纯的流水线累加器提高了将近20 MHz。

1.3 双口RAM设计

在设计波形存取电路时，首先应确定波形RAM的深度和字长。波形RAM的深度和字长与很多因素有关系。存储器内部存储的是一个或N个整周期的标准波形数据，存储器容量越大，存储的被采样波形点数就越多，采样效果就越好。存储器的读取速度是产生高频波形的重要保证，读取速度必须满足相位累加器的累加速度，这样才能保证直接数字合成过程的正常进行。同时，为了保证整个速度的同步性，选用一种同步RAM也是很必要的。

首先要确定波形RAM的深度和字长，由于任意波形发生器设计中选择的DAC的字长是12位，很明显波形RAM的字长也应该是12位；由于选择的地址线位数为12位（即相位累加器输出的高12位），寻址空间为4 K（4 096）个单元，即RAM存储空间应为4 096×12 bit=49 152 bits，由于本设计所选择的FPGA内部RAM最大可配置为119 808 bits，完全可以满足49 152 bits的RAM空间设计。所以波形RAM设计为字长12位，地址线12位。针对任意波形发生器与普通DDS的不同，波形RAM的设计主要要求RAM具有读写两个端口，这样可以通过两套地址系统，方便地进行RAM内容更新，即对RAM的写操作；波形幅度量化数据的输出，即对RAM的读操作。结合ALTERA公司FPGA的特点，选择了EP2C5F256C6这个芯片内部的双口RAM来实现这个功能，如图10所示。

图7 流水线累加器仿真图Fig.7 Simulation diagram of pipelined accumulator

图8 超前进位累加器的编译报告Fig.8 Compilation report of the accumulator-ahead

图9 超前进位累加器时序仿真图Fig.9 Timing simulation diagram of the ahead bit accumulator

图10 双口RAM模块Fig.10 Block diagram of dual-port RAM

芯片内部的双口RAM具有读地址和写地址两组地址线，数据线也分成了读数据线和写数据线两组。这样波形RAM的设计就非常简单了，将写数据线、写地址线和单片机的数据线、地址线相连，用单片机更新RAM中的数据；将读地址线和读数据线分别与相位累加器的输出和DAC的数据输入相连，读数据线上即输出了波形幅度量化数据。

2 结束语

本文详细阐述了产生任意波形数据和基于FPGA的硬件设计部分，以QuartusⅡ8.0软件平台作为开发工具，选用CycloneII系列的EP2C5F256C6 FPGA芯片实现DDS结构中的数字部分，其中相位累加器是DDS的核心部件，重点阐述了相位累加器部分的设计，采用8级流水线结构借助前5级的超前进位模块，编译的最高工作频率，由317.97 MHz提高到336.7 MHz，采用此种设计方法，节约了成本，缩短了开发周期，具有可行性。

[1]潘登.基于DDS技术的可编程任意波形发生器[D].武汉：武汉大学，2004.

[2]薛文.DDS任意波形发生器的设计与实现[D].南京：南京理工大学，2004.

[3]庞学文.任意波形发生器的研制[D].吉林：吉林大学，2005.

[4]许开华.DDS任意波形发生器数据生成与传输接口设计[D].成都:电子科技大学，2007.

[5]罗朝霞，高书莉.CPLD/FPGA设计及应用[M].北京:人民邮电出版社，2007:20-30.

[6]董长虹，余啸海.Matlab信号处理与应用[M].北京:国防工业出版社，2005:60-67.

[7]郭立浩.基于FPGA的直接数字频率合成器的研究与应用[D].西安:西北工业大学，2006.