APP下载

无线随钻测量系统的数据压缩协议研究

2014-07-24李忠伟崔学荣吴春雷

微型电脑应用 2014年12期
关键词:声波测井结点字符

李忠伟,崔学荣,吴春雷

无线随钻测量系统的数据压缩协议研究

李忠伟,崔学荣,吴春雷

在随钻测量系统中,目前采用的主要传输技术是泥浆压力波正负脉冲的方法,该方法所固有的缺点是信号传输速率低,因此,在低信号传输速率下,研究数据的压缩技术,从而提高信号的传输效率具有非常重要的意义。提出采用Huffman技术对数据进行压缩,从而实现随钻测量系统的高效传输。实验证明:压缩比可以满足实际应用需求,具有广泛的应用意义。

随钻测量;连续波;数据报协议;增量数据报;完全数据报;数据域定界

0 引言

从井下到地面的信息传输技术是导向钻进与定向钻进领域中研究的热点与难点问题,也是随钻测量系统应用和发展的技术“瓶颈”。目前的研究热点主要集中在传输设备硬件以及传输的编码方面,在数据的压缩传输方面少有研究。由于钻井液信道传输带宽有限、钻井液压力波信号的产生速率有待提高,因此,设计新型钻井液压力波信号发生器与引进数据压缩技术成为大幅提高井下信息传输效率的有效途径。

目前,国内井下数据压缩技术的研究主要集中在声波测井数据、成像测井数据、随钻地震数据等。例如,刘付斌等根据声波信号的特点,研究了基于字典的LZW压缩算法在偶极子数字阵列声波测井仪数据压缩方面的应用;张伟等引入了整数小波变换,采用最大幅值、最小阈值、最小输出位等多种方法,降低了 SPIHT算法的复杂度,提高了小波变换的速度,并设计了算法的并行实现结构,满足了声波测井数据高速实时处理的要求[4];贾安学等以正交多极子声波测井仪 MPAL专家模式的井下数据为测试数据,采用算术编码、预测编码、FLAC和APE压缩算法分别测试了对声波测井数据的压缩效果,其中FLAC和APE压缩算法具有较好的压缩率[5];严正国等利用小波变换的视频图像压缩技术,通过质量盒控制、背景对比度控制和场频控制等技术实现了井下图像数据的高度压缩[6]。

由于随钻测量数据参数在一定时间以及一定的地层下,许多参数具有一定的稳定性,而且仅仅使用有限的表示数字的符号(共11个),所以在对其进行压缩时,可以根据数字出现的频率,极大提高数据的压缩比,即压缩后的二进制数据的长度将更短,从而保证了其传输的高效性。

1 数据压缩的基本原理

数据压缩是指按照一定的算法对数据进行重新组织,从而减少数据的长度,进而减少信道中传输的二进制比特流。数据压缩可以分为无损压缩和有损压缩两种,前者在接收端可以完整恢复出压缩前的数据(例如WinRAR压缩软件),后者只能部分恢复出压缩前的数据(例如:视频、音频的压缩),在随钻测量数据传输中显然要使用的是无损压缩。

1.1 Huffman编码简介

Huffman编码是1952年由Huffman提出的一种无损数据压缩技术,是基于统计模型的数据压缩技术,是无损压缩当中最好的方法之一。它使用二进制来替换每个符号,长度由每个符号出现的频率(权值)决定。Huffman编码充分考虑了被编码的符号的统计特性,将出现概率大的符号转换为较短的二进制编码,将出现概率小的符号转换为较长的二进制编码,从而实现对字符的压缩,也转换为了二进制。Huffman压缩和解压缩是通过Huffman树来实现的。

1.2 Huffman树的构造

Huffman树,即带权路径长度最短的树。其构造步骤如下:

① 根据给定的n个权值{w1,w2,……wn},构造n棵只有根结点的二叉树,令其权值为wj;

② 在森林中选取两棵根结点权值最小的树作为左右子树,构造一棵新的二叉树,置新二叉树根结点的权值为其左右子树根结点权值之和;

③ 在森林中删除这两棵树,同时将新得到的二叉树加入森林中;

④ 重复上述② ③两步,直到只含一棵树为止,这棵树即Huffman树。

1.3 Huffman压缩

首先,要根据Huffman树获得Huffman编码表,方法是从根节点开始遍历树,左孩子的所有路径标注为0,右孩子的所有路径标注为1。然后,再根据生成的Huffman树对数据进行编码,方法是从叶子结点开始向根结点回溯,组合路径上所有的符号(0或1),即可得到该叶子结点对应的符号的编码。

1.4 Huffman解码

解码的过程本质上就是一个遍历二叉树的过程,一直遍历到叶子结点,此时完成第一个字符的解码;接着再重新从树根开始遍历二叉树,一直再遍历到叶子结点,此时完成第二个字符的解码;直到所有的二进制都遍历完毕为止。

2 随钻测量系统中压缩的实现

在随钻测量中从井下向地面传递的参数均为数值型数据,所以只用到10个数字、负号(-)、和小数点(.),共12个字符,所以只需要对这12个字符进行Huffman编码即可。随钻测量数据在某个时间段内具有一定的稳定性,即参数的取值变化不大。这样,字符出现的频率也就相对稳定。发送方在井下自动计算在某个周期内,各个字符出现的概率,如果符号出现的概率有了较大变化则择期将其发送到地面主控计算机,同时修改自己的 Huffman编码。其更新流程图如图1所示:

图1 Huffman编码表的更新过程

2.1 系统初始化

在第一次使用系统发送编号为i的数据报Pi时,需要对其参数进行初始化,主要包括:

1)权值和编码初始化

12个字符的权值都设置为1,这样生成的Huffman树的形状如图2所示:

图2 系统初始化时生成的Huffman树

各字符对应的Huffman编码如表1所示:

表1 系统初始化时生成的Huffman编码

例如,根据表1所示的Huffman编码,如果需要发送数值“0.34”,则压缩码为“00011100111000”;如果地面主控计算机收到的是“001010”,则解码结果为“12”。

2)设定时间周期

用户可以设定每类数据报的 Huffman编码的更新周期,只有自上次重构编码后的时间超过这个更新周期,系统才重新计算是否需要更新Huffman编码。

3)标准差阈值

只有当在新的一个发送周期内所有12个字符的概率标准差超过这个阈值,才更新 Huffman编码;否则如果在很长时间内字符的概率变化很少,即使到了更新周期,也不更新。

2.2 发送数据

在该模块内完成数据报的封装、压缩、校验和发送。

2.3 修改该序号的数据报的权值

每发送完一个数据报,系统都重新更新该序号的报文中所涉及到的所有字符的权值,注意只是更新权值,并不重新计算Huffman编码。

2.4 判断自上次重构编码后的时间是否大于设定时间周期

因为在很长一段时间内或者在某个地层上参数的取值都会保持相对稳定,而且考虑到尽量减少 Huffman权值表发送的次数,所以并不是每次发送完数据报都更新Huffman编码,只有在经过某个已经设定的时间周期后,才考虑是否更新Huffman编码,否则再转回第2步,继续发送后续数据。

2.5 计算所有字符的权值的标准差

标准差的计算公式为公式(1):

2.6 判断标准差是否大于设定阈值

如果计算出的标准差很大,说明各个字符的出现概率发生了很大的变化,此时就需要重新计算 Huffman编码。如果标准差变化不大,即使到了 Huffman编码更新周期,也不更新,此时再转回第2步,继续发送后续数据。

2.7 发送该序号数据报的Huffman权值表

Huffman权值表的数据报,采用如表所示的格式(假定数据报编号为99),其中:

(1)数据报类型标识:使用“1”,说明发送的是完全数据报,要求地面主控计算机使用支持重传的否定确认协议,确保井下和地面Huffman编码的一致性。

(2)数据域定界:表明后边各个域中字符的长度,其中第一位一定为2,因为数据报编号为99,长度为2。第2位为0、1或者2表示编号的长度,因为编号最大为99,所以长度最大为2。后边12个域的长度最大为2,即数据域定界后12位的取值只能是0、1、2。

(3)数据报编号:取固定值,99。

(4)编号:指定当前发送的权值表是属于哪个数据报的,即数据报的编号,如表2所示:

表2 Huffman权值表的数据报的格式

2.8 对本地该序号的数据报的字符重新进行Huffman编码

重新按照Huffman编码的规则,构造Huffman树,重新编码。该步骤在井下和地面主控计算机同时进行,这样保证下次发送的数据采用的是新的Huffman编码。

注意:如果地面接收站没有正确接收到该数据报,则地面主控计算机会发送一个否认帧,此时井下接收到该否认帧后,需要重新发送 Huffman权值表和随后已经发送的使用新的Huffman编码发送的所有数据。

3 验证分析

衡量数据压缩方法好坏的重要指标是压缩比,压缩比=压缩后代码长度/源代码长度×100%,其含义是被压缩后的代码占源代码的比例。为了对算法进行分析,本文选用胜利油田“高43-平51”井测深从993.81米到1079.7米的10条井史资料进行分析。假设Huffman权值表如表3所示,根据该表产生的Huffman树如图3所示:

图3 仿真中采用的字符的Huffman树

根据该Huffman树生成的各个字符的Huffman编码如表3所示:

表3 仿真中采用的字符的Huffman编码表

根据表3 Huffman编码表对仿真的数据进行Huffman压缩的结果如表4所示:

表4 仿真的数据报及Huffman压缩后的帧

被方框框起来的部分是数据报报头。

从整个数据报考虑:从表4中可以看出如果采用7位的ASCII码进行传输,其长度明显比Huffman压缩的长。所有10条数据的平均压缩比为43%。另外,因为第1、6条是完全数据报,其Huffman编码的长度明显比增量数据报长。

4 总结

根据无线随钻测量系统独特的特征设计了基于Huffman编码的无线随钻测量系统的数据压缩协议,通过对真实井史资料的仿真,发现该方法与传统的 ASCII码以及浮点数的表示方法相比,可以大大减少传输的二进制比特流的长度,从而提高无线随钻测量信道的数据传输效率。

[1] 张煜,熊轲,裘正定,王升辉. 基于压缩感知的随钻测井编码传输方法[J]. 地球物理学报,2013,01:335-347.

[2] 谢小勇. 基于网络传输测井数据无损压缩算法的研究[D].电子科技大学,2013.

[3] 刘付斌, 李艾华. 偶极子数字阵列声波测井仪中数据压缩的实现[J]. 设计与研发, 2007, 12: 58-61.

[4] 张伟, 师奕兵. 声波测井数据压缩的一种 SPIHT改进算法[J]. 电子测量与仪器学报, 2008, 22(1): 15-19.

[5] 贾安学, 乔文孝, 鞠晓东等. 声波测井井下数据压缩算法压缩效果测试[J]. 测井技术, 2011, 35(3): 288-291.

[6] 严正国, 张家田. 井下电视图像压缩技术[J]. 西安石油大学学报(自然科学版), 2007, 22(5): 94-97.

Study on Data Compression Protocol of Wireless Measurement While Drilling System

Li Zhongwei, Cui Xuerong, Wu Chunlei
(Department of Computer and Communication Engineering, China University of Petroleum (Huadong), Qingdao 266580, China)

In the measurement while drilling system, the main transmission technology currently used is the mud pressure wave of positive and negative pulse. The demerit of which is the low signal transmission rate. Thus in the low rate of signal transmission, to study the compression technology so as to improve the transmission efficiency of the signal is of great importance. The paper proposes Huffman technology to compress the data and consequently enable the drilling with the measurement system to transfer efficiently. The experiment shows that the compression ratio can meet the needs of practical application, and has wide application significance.

Measurement While Drilling; Continuous Wave; Datagram Protocol; Incremental Datagram; Complete Datagram; Data Domain Bound

TE243

A

2014.10.15)

1007-757X(2014)12-0015-03

中国石油科技创新基金项目(2012D-5006-0304)

李忠伟(1978-),中国石油大学(华东),计算机与通信工程学院,副教授,博士,研究方向:井下系统、信息与控制工程研究,青岛,266580

崔学荣(1979-),中国石油大学(华东),计算机与通信工程学院,副教授,博士,研究方向:UWB无线定位、随钻测量系统、位置服务、车联网,青岛,266580

吴春雷(1980-),中国石油大学(华东),计算机与通信工程学院,讲师,硕士,研究方向:UWB无线通信、随钻测量系统、60GHz无线通信,青岛,266580

猜你喜欢

声波测井结点字符
LEACH 算法应用于矿井无线通信的路由算法研究
基于八数码问题的搜索算法的研究
基于DDS的正交偶极子声波测井仪快检装置研究
字符代表几
一种USB接口字符液晶控制器设计
图片轻松变身ASCⅡ艺术画
HBM电子称与西门子S7-200系列PLC自由口通讯
关于声波测井技术的研究进展
利用阵列声波测井资料预测煤系地层压裂裂缝高度
多极子阵列声波测井在煤层气勘探开发中的应用