APP下载

一种实时数据处理的软硬件算法研究

2010-03-17

关键词:压缩算法流水线解码

刘 虹

(厦门理工学院电子与电气工程系,厦门 361005)

一种实时数据处理的软硬件算法研究

刘 虹

(厦门理工学院电子与电气工程系,厦门 361005)

针对某中分辨率成像光谱仪遥感图像数据的特点,在研究基于局域纹理特征适合空间应用图像无损压缩技术的基础上,进行无损解压缩算法的设计,阐述了如何采用并行处理和流水线技术优化算法,实现算法到VLSI结构的优化映射,研制无损解压缩专用芯片,该芯片可以不低于16 Mbps的速率实时处理压缩数据,进行无损解压.

中分辨率成像光谱仪;遥感图像;纹理特征;无损压缩;CCSDS编码器;专用芯片;VLSI结构

用于某气象卫星的中分辨率成像光谱仪记录的是气象信息,气象观测技术需要对图像的原始数据进行某些计算和应用,不允许有信息丢失,所以必须进行无损压缩.气象信息是瞬间万变的,不仅要求实时压缩传输,还要求实时解压,这样就可及时地对气象数据进行分析处理,得到及时有效的信息.只有采用图像压缩解压专用芯片的硬件系统才具有最高的数据处理速度,满足实时处理的要求.本文着重介绍了实时无损解压缩硬件系统的设计.图像解压缩专用芯片是解压硬件系统的核心,而算法到VLSI结构映射是图像解压专用集成电路设计最重要的环节,优秀的VLSI结构应该使算法的并行处理特点充分表现出来;使并发操作和流水线处理得以最大化;使系统具有最大的数据吞吐量.所以本文将详细描述算法到VLSI结构的优化设计.

1 无损压缩算法

无损压缩算法一般包括图像压缩预处理和压缩熵编码两个步骤.预处理就是在空间域尽可能对图像去相关,以提高压缩比,同时将图像数据变换映射成适于熵编码的数据源.编码就是对预测的残留误差进行表达和进一步压缩.本文所采用的无损压缩算法也是基于这个基本理论框架.

1.1 基于局域纹理特征分析的适合空间应用的预处理器[1,2]

基于局域纹理特征分析的无损压缩方法,首先强调了局域纹理特征的一致性,所以在对相关预处理模型的研究中,结合分析图像的有意义范围内的局域纹理特征,利用多方向自适应的预测方案,寻找最佳预测模型,可得到好的去相关效果.结合本课题应用中遥感图像数据输入的特点,选取5×5的像素块为逐一处理单元,构造了两种基于局域纹理分析去相关的处理器[2].

1.2 CCSDS熵编码器的实现

本文的熵编码方案以CCSDS推荐的RICE编码为基础,根据本文所要处理的目标图像数据分辨率为12 bits,构造了12种编码选项,通过择优选取结果码长总和最短的一种编码方法.12种编码方案如下:

n=0(零块编码)1<<n<<10(分裂样本编码)n=11(无编码)Min(码长总和) 0 ∑((Eil,k>>n)+n+1) 25*12

分别计算出两种纹理结构预处理器前提下的最优编码相应的码长总和、,然后作择优判断:

2 解压缩系统设计

在设计硬件解压缩系统时,总体考虑了数据流动方式,即先将压缩数据流进行串并转换,然后以12bits为一个读取单位来进行解压缩处理,最后再将解压缩数据进行并串转换输出.为了增加数据吞吐量和保证压缩码流按恒定速率输出,在系统的输入与输出部分都加入缓存设备.整个解压缩系统的数据流驱动如图1所示.

图1 数据流驱动流程图

本文在比较了DSP、CPLD、FPGA[5]后,结合解压缩算法的特点,最终决定选择FPGA类型的芯片作为实现解压缩算法的专用芯片.即图1中所示的解压缩处理由一片FPGA芯片来实现.压缩数据缓存与解压数据缓存结构决定外置于FPGA以提高设计在不同器件间的可移植性能,而不必考虑目标器件的内置内存大小.

3 解压缩算法到VLSI结构映射

本节主要内容是改进解压缩算法,优化数据处理方式,使之更适合于VLSI所具有的并行处理特点,实现解压算法到VLSI结构的最优映射.为使算法转变到VLSI结构既简洁又能得到最大的处理速度,解压缩算法的最优VLSI结构应具有如下特征:

3.1 同步电路

同步电路即时序电路共用同一个时钟.最优VLSI结构必须采用同步电路.因为基于同步电路设计、功能单元数据通信链路中寄存器的存在,是形成流水线处理的必要条件.本文采用时钟下降沿触发,即各时序部件在全局时钟的下降沿由一个状态变换到另一个状态.

3.2 并行处理

要想获得高性能的VLSI结构,依靠的是大量简单的功能单元并行操作而不是单个大规模的处理器.把运算元件连接起来进行并行工作的基本方法有两种,流水线操作和并行阵列操作.

(1)流水线结构

流水线结构是把部件按顺序串联在一起,一个部件的输出和下一个部件的输入相连.将一个大任务分成一些复杂性大致相同的小任务,这些小任务都可以独立完成,相继的任务在流水线的各级上同时执行,整个任务的执行速度由执行时间最长的子任务决定,子任务的最长执行时间通常比整个任务的执行时间要短的多,所以采用流水线的并行系统可以具有很高的工作频率.

(2)并行阵列结构

并行阵列结构是将很多任务同时处理,可以是脉动式阵列:依次向系统中的每个模块送一个输入信息,每个模块以输入信息的速率周期性地输出信息;也可以是同步并行阵列:同时向这些并行模块输入信息,一旦一个完整的任务执行结束,所有模块同时产生输出.

图像解压缩专用芯片的处理能力,在本质上是由解压算法以及算法能否被映射到具有高度并发操作与高速流水线处理的VLSI结构决定的.流水线处理提高数据吞吐量,并发操作减少数据运算时间,两者是提高系统处理速度的重要因素,因此在解压算法最优VLSI结构的任何层次、任何模块中,都必须采用数据的并行运算与流水线处理.

3.3 输入操作与计算的平衡性

如图2所示,压缩数据的输出特点是:有时钟时有数据(n个时钟周期),每个时钟周期输出一个图像压缩比特DATA,下降沿采样有效,CLK为高时无数据.

图2 图像压缩数据输出时序

分析上述图像压缩数据输出时序可知,由于解压缩算法的复杂性,数据的运算次数将远远多于数据输入操作次数,对于最优VLSI结构而言,这不但要求在每次输入操作的同时,必须完成多个计算任务,而且必须确保每个时钟周期接收一个图像数据,完成一次输入操作,并且还要保证数据解压缩与m无关,这样才具有最广泛的适用范围与最高的数据处理速度.简单的说就是无论压缩系统输出的数据是怎样的一个时序,只要图像数据输出一个,具有最优VLSI结构的专用解压芯片都可以实时处理一个.

在一次输入操作时间内(即一个时钟周期),所需完成的运算量、运算时间、数据流的传递形式决定着系统最高工作频率.对图像压缩数据的连续接收、解压,对VLSI结构都提出了实时性要求,只有采用适量的存储器、合理安排每次输入操作时间内的运算量、在少量的输入操作与大量的计算次数之间取得平衡,才能减少每个像素的处理时间,提高数据处理速度,达到实时解压实时处理的要求.

依据上文所讨论的处理原则,必须把一个复杂的解压缩功能分为若干个简单功能单元的并行处理,这是由算法形成VLSI结构,获得高速数据处理的关键.并发操作与流水线处理体现在VLSI结构设计的各个层次,尤其在VLSI结构的系统框架规划、功能模块的结构设计方面至关重要.本文把解压缩算法划分为九个功能模块实现,结构框图如图3所示.

图3 解压缩逻辑电路功能分割示意图

限于篇幅,本文以RICE解码与后处理引入的并行操作与流水线处理为例进行介绍.对一个像素的处理需要以下步骤:

图4 解码与后处理的并发操作

由图4可得解码一个像素需要6个时钟,如果按照平常的处理方式,解码一个5*5的块需要25×6=150个时钟.设计中,只要RICE解码有输出就启动后处理操作,而同时RICE解码与后处理操作是并行的,继续接收下一个数据进行解码操作,即解码与后处理并发操作.本文同时还对解码与后处理操作设计了流水线技术,被连续时钟驱动时示意如图5所示.很明显,完成一个完整的RICE解码和后处理操作,只需要30个时钟,大大提高了解码效率.

图5 后处理操作流水线设计示意图

4 解压缩专用芯片研制结果

完成了解压缩算法的优化VLSI结构设计后,采用ALTERA公司的APEX20K系列的EP20K200RC240-3V芯片作为物理实现,芯片使用资源见表 1.该芯片配合着输入 FIFO与输出RAM,可以16 Mbps的速率实时处理压缩数据,进行无损解压.

表1 EP20K200RC240-3V芯片资源使用

[1]姜宏旭,周孝宽.基于局域纹理特征的图像无损压缩[J].北京航空航天大学学报,2003,(6).

[2]姜宏旭,周孝宽.CCSDS图像无损压缩标准在恒速信道中的应用研究[J].中国空间科学技术,2003,(5).

[3]王 彦.基于FPGA的工程设计与应用[M].西安电子科技大学出版社,2007.

Research on Software and Hardware Algorithm for Data Real-time Process

LIU Hong
(Electronic and Electrical Engineering Department,Xiamen University Technology,Xiamen 361005,China)

In this paper,in uiew of the feature of the compressed data of the MODIS,a new lossless image data compression algorithm named lossless image compression based on feature of local texture is presented and decompression algorithm is designed.It is mainly described in this paper that how the corresponded VLSI architecture is proposed by using the technique of parallel processing and pipe-line.The special integrated circuit of lossless data decompression has been manufactured.This card can decompress data realtimely and losslessly at the speed of 16Mbps.

moderate resolution imaging spectroradiometer;remote sensing image;feature of local texture;lossless compression;CCSDS encoder;special IC;VLSI architecture

TN409

A

1671-119X(2010)01-0024-04

2009-10-12

厦门理工学院教学改革基金资助项目(JG200704)

刘 虹(1978-),女,硕士,研究方向:信号处理及芯片设计应用.

猜你喜欢

压缩算法流水线解码
《解码万吨站》
流水线
解码eUCP2.0
基于参数识别的轨道电路监测数据压缩算法研究
NAD C368解码/放大器一体机
Quad(国都)Vena解码/放大器一体机
一种基于嵌入式实时操作系统Vxworks下的数据压缩技术
报废汽车拆解半自动流水线研究
PMU数据预处理及压缩算法
流水线生产杀死艺术