基于分块动态归一化的最优标量量化数据压缩
2014-02-09武亚丹罗小巧喻江波
武亚丹,罗小巧,喻江波
(1.华中师范大学,湖北 武汉430079;2.南京理工大学,江苏南京441001)
基于分块动态归一化的最优标量量化数据压缩
武亚丹1,罗小巧1,喻江波2
(1.华中师范大学,湖北 武汉430079;2.南京理工大学,江苏南京441001)
数据压缩的方法很多,实际应用中多采用变换加编码的方法,在允许一定的误差的范围内可以获得比无损压缩高得多的压缩率,而且常常大大简化处理算法。采用一种分块的动态归一化将需要压缩的数据收缩到[-1,1]的区间内,再采用Llyod算法对归一化的数据进行非线性标量量化编码降低每个采样点的比特位宽。算法简单,易于硬件实现,解码时只需查找码书和动态恢复。在50%压缩比情况下EVM值在1%以内。并针对该算法进行了MATLAB仿真和硬件代码的编写。
数据压缩 分块归一化 非线性量化 Matlab
0 引 言
针对LTE/LTE-A的BBU-RRH无线信号传输带宽问题[1],各种CPRI接口传输负载的数据压缩技术相继出现,包括时域压缩方案(如降采样率、非线性量化、IQ数据压缩等)和频域压缩方案(如子载波压缩等)。对于LTE 20 MHz系统带宽,BBU使用FFT/IFFT点数为2 048点,而有效子载波个数仅为1 200个,如果将FFT/IFFT放到RRH实现,在BBU与RRH之间的仅传输有效子载波数据,接口速率大约降低40%左右,但这种压缩导致IQ映射复杂,增加了接口逻辑设计和处理复杂度,实现难度大。采用降采样率方案,系统采样率为30.72 MHz,有效数据带宽为20 MHz,使用变采样速率方法去除频率冗余,可使接口速率降低30%左右,复杂度低,相对容易实现,但性能损失严重。频域的子载波压缩方案虽然压缩效率高,但大大提高了系统复杂度,难以处理。而采用非线性量化方案,可以得到较高的压缩率,算法简单,系统复杂度低,延时小,易于硬件实现[2]。文中给出了一种归一化的非线性量化方案,减少了每个数据的位宽,降低了传输速率。
1 压缩部分
压缩算法包括4个部分:选取块内缩放因子,块内数据归一化处理,非线性量化编码、并串变换。数据压缩框图如图1所示。
图1 数据压缩框Fig.1 Data compression block
1.1 分块归一化
数据分为均匀的块,每个块内数据个数为N,第i个块的数据表示为:xi1,xi2,…,xiN,缩放因子Si= max()数据归一化为:(yi1,yi2,…,yiN)=(xi1,xi2,…,xiN)/Si,选取适当的N可以使块内的数据归一化后相对均匀,这样可以减小小数据的量化误差[3]。
1.2 非线性量化编码
非线性量化编码部分,由于归一化处理后的数据是不均匀分布的,采用均匀的线性量化必然的不到最优的量化效果,采用非线性量化让量化电平与源数据分布相适应,可以减少量化误差,从而使量化效果达到最优[4]。
量化的过程是将采样的信号取值划分为有限个小区间,即量化区间{(z0,z1],(z1,z2],…,(zn-1, zn]},并对落入某个量化区间(zi-1,zi]内的所有样值赋予相同的量化值ci的过程,即ci=Q(y),y∈(zi-1,zi],表示量化操作。失真测度采用均方误差来描述,即D=E[(y-Q(y))2]。设码书电平C= {c1,c2,…,cN},N为量化电平数。量化电平和量化间隔划分的关系为:
每个量化电平都应该是电平所处的量化区间内概率密度函数的质心,也就是:
对某一序列的最佳标量量化就是在给定量化电平数的情况下,寻找码书C和量化间隔Z,使得D尽可能的小。
在实际情况下,待量化信号的概率密度函数常常很难找到易于分析的模型。而且,即使概率密度函数已知,用来计算质心的积分也可能没有封闭解。因此,通常采用数值积分方法来计算质心。设训练序列为S={v1,v2,…,vM},M为序列长度,序列中每个元素都有质量1/M。统计序列中相同元素的频数,作为它的概率,得到序列的概率分布,然后针对其概率分布用Llyod算法进行设计。算法流程如图2所示。
输入归一化数据(yi1,yi2,…,yiN),通过Llyod算法将归一化数据量化成L个电平。再均匀编码成位宽为Qq的数据Cik,其中L=2Qq。量化后的数据经过并串变换后输出,得到的是均匀压缩的数据,利于数据的传输。设每个块的数据个数N(xi1,xi2,…,xiN),编码后为(ci1,ci2,…,ciN)第i个块的缩放因子为Si,则传输的的格式如图3所示。
图3 数据传输格式Fig.3 Data transfer format
传输时Si在前,编码部分紧跟着缩放因子。每一个块原来的比特数为Qs·N(Qs为数据源位宽),压缩后所传输的比特数为Qs(Qq为压缩后的比特数),那么压缩率:
2 解压缩部分
解压缩是压缩的逆过程,在检测到同步后,将压缩传输的串行数据作串并变换,得到解压缩所需的缩放因子Si和传输码字cik,以码字cik为地址查找码书进行解码,然后根据Si和解码输出扩张成原始数据就完成了解压缩过程[5]。解压缩算法框如图4所示。
图4 解压缩框Fig.4 Unzip block
可以看到,该解压缩算法非常简单,只需进行一次查找和一次乘法就可以得到一个输出数据,硬件实现简单,延时很小。
3 仿真结果
3.1 Matlab仿真结果
取每个块的的数据个数为N=32.量化编码位宽为Qq。表1示出了该压缩算法在不同的Qq(Qq= 4,5…,10.Qs=15)的情况下的压缩率和EVM值[6]。
两载波数据量化位宽和EVM值的关系如表1所示(N=32,Qs=15),当量化位宽为7时,EVM约为约为1%。此时的压缩率为50.21%。
表1 两载波Table 1 Two carrier
3.2 FPGA仿真结果
FPGA硬件仿真是通过编写测试文件读取所要压缩的数据文件针对每一个功能模块进行相应的仿真。压缩部分综合框架如图5所示。
图5 压缩部分综合框Fig.5 Integrated part of the compression block
仿真过程中,设置并行时钟周期为60 ns,串行时钟周期为8 ns,源数据为16位,量化位宽为7位,数据块大小为N=32。压缩模块仿真如图6所示。
图6 压缩模块仿真结果Fig.6 Simulation results of the compression module
从有效数据输入到压缩的串行数据输出延时为4 680 ns,仿真的数据输入时钟周期为60 ns。延时78个时钟周期。串行输出时钟周期为8 ns。解压缩模块接收压缩模块产生的串行数据,经过串并变换得到7位位宽的编码码字和缩放因子,再以编码码字为地址查找ROM内的码书输出解码,再用缩放因子进行扩张得到恢复数据。总的延时时间为87个时钟周期。
4 结 语
文中针对CPRI传输数据的显著增加,提出了一种简单易行的数据压缩方法,延时小,而且有效控制了EVM值。压缩部分延时为78个时钟周期,解压缩部分延时仅为9个时钟周期。在50%压缩率的情况下,EVM值在1%以内。量化前对数据进行分块归一化处理提高了量化算法对数据的适应能力,利用Llyod算法进行非线性量化,使量化效果达到最优,减小了量化造成的EVM的增加,在解压缩时仅需查找码书,易于硬件实现。
[1] 郭彬,曹伟,陶安.LTE和LTE-Advanced系统中CPRI压缩算法研究.[J].信息通信技术,2013(02):64-68.
GUO Bin,CAO Wei,TAO An.LTE and LTE-Advanced System CPRI Compression Algorithm.[J].ICT.2013 (02):64-68.
[2] NIEMAN K F,EVANS B L.Time-Domain Compression of Complex-Baseband LTE Signals for Cloud Radio Access Networks[C]//IEEE Global Conference on Signal and Information Processing.Austin Texas USA:Wireless Networking and Communications Group,2013:112-116.
[3] 孙圣和,陆哲明.矢量量化技术与应用[M].科学出版社,2002(05):12-132.
SUN Sheng-he,LU Zhe-ming.Vector Quantization Technique and Application[M],Science Press,2002 (05):12-132.
[4] 刘凌云,弓美桃.移动通信的前沿展望.[J].通信技术,2013(03):95-100.
LIU Ling-yun,GONG Mei-tao.Forefront Prospects of Mobile Communications.[J].Communications technology,2013(03):95-100.
[5] SAMARDZIJA D,PASTALAN J,MACDONALD M,et al. Compressed Transport of Baseband Signals in Radio Access Networks[M].IEEE,2012(11):3216-3225.
[6] 陈奎林.C-RAN:The road towards green RAN[R].China:Mobile Research Institute,2011.
WU Ya-dan(1989-),male,graduate student,majoring in communications and information systems.
罗小巧(1972—),副教授,硕士生导师,主要研究方向为嵌入式系统应用、智能信息处理等领域的研究工作;
LUO Xiao-qiao(1972-),associate professor,master tutor,mainly engaged in the field of embedded system applications,intelligent information processing research.
喻江波(1989—),男,硕士研究生,主要研究方向为信号处理。
YU Jiang-bo(1989-),male,graduate student,majoring in signal processing.
Optimal Scalar Quantified Data Compression based on Block Normalization
WU Ya-dan1,LUO Xiao-qiao1,YU Jiang-bo2
(1.Central China Normal University,Wuhan Hubei 430079,China;2.Nanjing University of Science&Technology,Nanjing Jiangsu 441001,China)
There are many data compression methods,and transform coding is mostly adopted in practical applications,and it could achieve much higher compression ratio than the lossless compression within a certain allowed error range while the processing algorithms is greatly simplified.The compressed data is shrunk into the range of[-1,1]with a blocked dynamic normalization,then the normalized data is coded with non -linear scalar quantization by Llyod algorithm,thus to reduce the bit width of each sampling point.This algorithm is simple in hardware implementation,and only to look for codebook and conduct the dynamic recovery is needed for decoding.EVM value would be less than 1%at 50%compression ratio.Aiming at this algorithm,MATLAB simulation and hardware coding are carried out.
data compression;normalization block;non-linear quantization;Matlab
TP311
A
1002-0802(2014)03-0262-04
10.3969/j.issn.1002-0802.2014.03.006
武亚丹(1989—),男,硕士生研究生,主要研究方向为通信与信息系统;