脉冲位置编解码方式映射模型及效率分析*
2024-03-16车卫勤杜晶郭子枫赵小勇傅余李宝鹏
车卫勤 杜晶 郭子枫 赵小勇 傅余 李宝鹏
1中国石油渤海钻探工程有限公司定向井技术服务分公司
2中国石油渤海钻探工程有限公司第四钻井工程分公司
随着各种无线随钻测量系统的发展,井下传感器数据及采集数据量的增加,需要应用更高效的井下数据编码方式,提高井下仪器数据传输能力[1]。目前脉冲信号的传输方式主要有电磁波、声波和钻井液脉冲,其中钻井液脉冲传输方式应用最为广泛。钻井液脉冲传输方式是通过一串预先编码的命令和受时间控制的泥浆脉冲信号对井下仪器测量参数进行传输的技术。泥浆脉冲无线随钻测量系统的高速发展对井下数据的传输和编解码技术提出了更高的要求。井下数据编码方式有很多种,现广泛使用的编码方式包括曼彻斯特码、脉冲时间间隔调制编码和脉冲位置调制编码等[2],其中脉冲位置调制编码技术使用最为广泛,但是,这种编码方式传输效率较低,且缺少对传输速率和编码效率的综合计算,现场使用时无法根据实际情况选择更适合的传输方式。因此,有必要从设计原理和框架方面出发,对脉冲位置调制编码方式进行分析,推算映射的数学模型并根据模型计算不同组合形式下的编码效率和传输速率,现场使用时可综合考虑选择更优化的组合形式。
1 泥浆脉冲信号编解码技术简介
在随钻测量系统设计时,测量参数的无线传输编解码方式是关键技术之一。需对测量的数据进行压缩提高数据的传输速率,压缩过程可针对不同精度要求进行量化去除数据时域冗余;采用编码技术对压缩后的数据进行编码,使井下控制系统驱使脉冲发生器动作产生相应的泥浆压力变化脉冲,地面的压力检测设备(如压力传感器、信号采集模块)通过采集、滤波和降噪等技术识别其压力变化,将其传输到地面编译系统进行解码,实现井下测量数据无线传输,其流程如图1所示[3]。
图1 无线随钻系统井下数据传输流程Fig.1 Downhole data transmission flow of wireless MWD system
1.1 曼彻斯特码编码方式
曼彻斯特码也叫做相位编码,是一种同步时钟编码技术。在这种编码中用电平跳变来表示“0”和“1”,电平由低跳到高代表“0”,由高跳到低代表“1”,时钟同步信号隐藏在数据波形每一位跳变中,中间的跳变既作为时钟信号又作为数据信号[4]。在编解码过程中,井下测量参数分别以5~13 个位数的格式组成字符串,前几位为数据字符,最后一位为奇偶校正字符。只有当字符串通过奇偶校正后才能被识别,然后通过解码得到测量数据的物理值[5]。
1.2 脉冲时间间隔调制编码方式
脉冲时间间隔调制编码是将数据信息调制在每个脉冲上,把该脉冲出现的时间长短作为数据信息进行传输的方法。通常1 个脉冲代表1 个十六进制数(0-F),其具体数值取决于它出现的时间位置,即取决于它与上一个脉冲之间的间隔时间长短[6]。图2 为利用时间间隔编码传输井下测量参数的十六进制数MN的表示方式。其中,TPW表示标准脉冲宽度,TMI表示最小脉冲间隔,TC表示数据编码时间增量,其长短为码元携带的十六进制数据(0-F)与标准脉冲宽度的乘积,时间增量TC=(0-F)×TPW。码元K携带的井下测量数据高位十六进制数为数据M,可以得到两个相邻脉冲之间的时间间隔LK=TMI+TC=TMI+M×TPW。码元K+1 携带的井下测量数据低位十六进制数N,两个相邻脉冲之间的时间间隔LK+1=TMI+TC=TMI+N×TPW[7]。
表1 常见测量参数的定义Tab.1 Definition of common measurement parameters
图2 脉冲时间间隔编码调制Fig.2 Pulse time interval coding modulation
1.3 脉冲位置编解码方式
脉冲位置编码方式是基于脉冲位置调制(PPM)的一种编码形式。将测量数据调制于脉冲信号之间,以时间帧的方式进行传送。无线随钻测量系统控制脉冲发生器在指定的时间内不同位置产生不同数量的脉冲,位置与数量信息用可直接存储的二进制数据来描述,在实时传输时转换成时间位置编码以适合泥浆压力波的传输。此种编码方式是将一段确定的时间T分为M等份的时间帧,并在其中分布K个脉冲信号,其每两个脉冲信号之间的时间间隔是不同的,脉冲信号之间时间间隔的变化代表所测量参数数值的变化。因此,每个脉冲与其前一个脉冲的间隔时间可表示多位二进制数。根据事先约定好的对应方式,来对应一个不同取值的二进制数[8]。由图3 可知5 个脉冲信号在28 个时间帧中的分布。图中最下方的每个圆圈代表1 个时间帧,共计28个时间帧,其中5个绿色圆圈代表脉冲信号所在的时间帧位置。
图3 脉冲与时间帧分布Fig.3 Pulse and time frame distribution
2 脉冲位置编解码方式框架结构
2.1 定义各种测量参数
在这种编码方式中,首先确定井下仪器测量每种数据的名称、量纲、分辨力、十进制数范围、二进制位数、十进制数转换成二进制数的转化系数。其次,对于每种测量数据确定其相应的二进制编码的位数,如工具面用8 位的二进制编码表示,方位角用11 位二进制编码表示,井斜用11 位二进制编码表示等。测量数据的二进制编码位数共有16 种长度(由 1 位到 16 位),分别是21、22、…、215、216。由表1 可知几种常见的测量数据定义的量纲、分辨率等参数。从表中可以看出对于不同的测量数据,需根据其分辨率和精度确定不同位数的二进制编码数。
2.2 定义基本参数脉冲数K和时间帧数M
多脉冲信号位置编码设计时需要设计不同脉冲数K与不同的时间帧数M的分布对应码来表示需要对应的二进制数。其主要为两个基本参数脉冲数K和时间帧数M,两脉冲信号之间需至少间隔2 个时间帧且二者须有机结合,所选用的数学模型必须满足所选择的K与M的组合对应码数量大于需要表示的二进制位数的组合数,即脉冲分布对应码≥2位数。在设计编码方式时脉冲数K由1 到6,时间帧个数M由4 到36,K脉冲与M时间帧对应码的组合个数覆盖了1 位到16 位的二进制编码。每种长度的二进制编码均可找到对应的K脉冲与M时间帧对应码[9]。16 位的二进制数组合数为216=65 536,当选择5个脉冲数与36个时间帧数组合时,其组合数为65 780,大于16 位的二进制数组合数。所以,当选择适当的脉冲数与时间帧数组合式完全可以覆盖16位二进制数。
2.3 定义测量数据串识别码
在实时传输时,测量数据经过压缩后以数据串形式通过脉冲发送。同时,需根据不同的工况选择传输特定的数据串格式。如短测量数据串以传输工具面、井斜和方位角为主;长测量数据串除传输工具面、井斜和方位角之外还需要传输井下方向传感器在X、Y 和Z三轴上的分量以及仪器的状态位等。通过定义的测量数据串将多个测量数据编成串,同时标识上识别码。实时传输时通过识别当前传输的数据串识别码可以了解该数据串中包含哪些测量数据,以及这些测量数据的传输的次序。
2.4 编译过程
多脉冲位置编码方式的编译过程是通过特定的计算公式把K脉冲数与时间帧M分布码转换成二进制数;再通过二进制与十进制之间的转换方式将其转换为十进制数;最后,将十进制数乘以对应测量参数的分辨力,即可得到测量数据的真实值。通过前文可知工具面数据由8 位二进制数表示,假设测量所得工具面数值根据分布码转换成二进制数为10 000 101,其转换为十进制数值为27+22+20=133。根据上文表1中可以查到工具面的分辨力为1.406 25,工具面的真实测量值为133×1.406 25=187.031 25≈187.03 deg。上述编译方式适用于脉冲位置解码方式测量所得数据的计算[10-12]。
3 脉冲位置编解码方式数学模型
3.1 脉冲与时间帧组合对应映射模型
多脉冲信号位置分布编码设计需设计不同脉冲数K与不同的时间帧数M的分布对应码来表示对应的二进制数。下文将详述脉冲信号分布的数学模型[13]。
3.1.1 脉冲数K=2、时间帧M=11时的对应情况
当第1 个脉冲在第1 时间帧时,第2 个脉冲从第4 时间帧向右移动,算上初始位置最大移动数有6 种位置。当第1 个脉冲移到第2 时间帧时,则第2个脉冲移动的次数比上次减少了1,依次类推可以得出脉冲数K=2,时间帧M=11,对应码个数。
推广到脉冲数K=2,时间帧数为M脉冲数模型中:令第1 个脉冲在第1 时间帧时,第2 个脉冲从第4 时间帧开始,对于M个时间帧则有效帧数为M-2 个,则对应码可移动的次数Q2如公式(1)和(2)所示:
脉冲数K=2 时间帧数M编码组合数写成通用表达式:
3.1.2 脉冲数K=3、时间帧M=12时的组合码
相对于两个脉冲的情况,K=3 情况时,组合数的确定略微复杂一些,但是方法类似:首先第1、第2 个脉冲不动只是第3 个脉冲移动。当第1 个脉冲在第1时间帧及第2个脉冲在第4时间帧时第3个脉冲移动数加上初始位置Q3=12-9;当第1 个脉冲不动时第2 个脉冲移到第5 时间帧时,则第3 个脉冲移动的次数比上次减少了1 有3 种位置。依次类推脉冲数K=3,时间帧M=12 时,组合码个数为20。
通过脉冲数K=3,时间帧M=12 数学模型,推广到脉冲数K=3 时间帧M模型中,根据公式(1)得出组合码个数表达式:
脉冲数K为3,时间帧为M的编码组合数写成通用的表达式:
3.1.3 脉冲数K时间帧M组合码数学模型
根据上述推论的递归方法和排列组合原理可得,脉冲数K和时间帧数M组合方式可以组合表示的二进制个数为:
3.2 编码效率数学模型
将N位二进制数据(信息位数)映射到M个时间帧(其中有K个脉冲信息)完成脉冲信息编码,可以找到多种K脉冲数与M时间帧的分布及其对应关系。选择脉冲数与时间帧组合时,选择的组合数不可能刚好与所需表示的二进制数相等。本文将脉冲数与时间帧的组合数与所表示的二进制数对应后,剩下的组合数称为多余组合数。采用脉冲数多与时间帧数少的组合形式称为快型组合,将脉冲数少与时间帧数多的组合形式称为慢型组合。
由表2 快型组合方式和表3 慢型组合分析表可以得出相同长度的位数可以采用不同的组合,如黄色部分表示6 位数数据信息,可以采用快型3 脉冲数与15 个时间帧组合,也可以采用慢型2 脉冲数与16时间帧组合。
表2 快型组合分析Tab.2 Fast mode combination analysis
表3 慢型组合分析Tab.3 Slow mode combination analysis
采用不同型式的组合方式可得到不同的分辨率和组合码个数。对于不同长度的位数,也需要采用不同的脉冲数和时间帧组合来满足组合码数量大于需要表示的二进制位数的组合数,即脉冲分布对应码≥2位数,亦可以得到不同的分辨率和组合码数。快型组合运用相对短的时间传输更多的数据信息,可以获取较高的传输速率;慢型组合减少了相对时间内的脉冲数,降低了脉冲器动作频率,减少了脉冲器设备的磨损。在现场使用过程中需根据实际情况优先选择其中一种组合方式。
为了反映不同组合型式下时间帧M所能映射的二进制位数N,采用η表征二进制数据为N时和时间帧数为M时建立传输效率的数学模型[14],见公式(6):
从上文可知在M个时间帧上放置K个脉冲有种组合,这些组合所能编码的信息位数N为公式(7):
其中,int(X)表示不超过实数X的最大整数。由公式(5)、公式(6)和公式(7)可以得到脉冲数K与时间帧数M组合表示N位二进制数的编码效率见公式(8):
3.3 数据传输速率的计算对比
在现场使用时针对不同的脉冲宽度采用不同的脉冲数K和时间帧数M组合,运用快型与慢型两种不同的组合方式时编码方式可以获取不同的传输速率。数据传输时组合码采用一次性同步,当同步完毕后数据串将连续的由脉冲传送至地面。由于减少数据串的同步次数,随着时间推移有效的数据传输速率将逐步提高。从组合码同步开始所传输的数据串的总位数与其传输所需脉冲数的总时长的比值为传输速率,其单位为bits/sec。井下脉冲发生器每秒动作次数所能代表的数字信息称为数据密度。脉冲宽度设置为0.24~3 s,采用快型与慢型两种不同的组合形式时,计算得出的数据密度和传输速率(表4)。从表中可以看出,脉宽越宽时两种组合方式传输速率无明显差异,但是随着脉宽的变小两者的传输速率差异性越大。在选择脉宽时还需要考虑到脉冲信号压力波的带宽压力波,带宽越宽脉冲信号强度越强,但占用时间越长,传输速率就越低,所以需综合考虑脉宽和组合方式[15-16]。
表4 组合码数据密度和传输速率比较Tab.4 Comparison of combination code data density and transmission rate
4 软件实现
通过公司自行研制的D-pilot v2.0 软件实现了脉冲位置编码方式的解码过程,如图4 所示。软件分为数据显示区、解码数据区和波形显示区。从解码数据区可以看出每种测量数据对应显示了脉冲分布的时间帧位置和分布的脉冲数。如图4 中的解码数据区显示的数据BX 42.99(3,7,13,18,23n=5)。其中,BX 42.99 表示传输的是X 轴方向的磁力分量,其分量数值42.99;n=5表示测量数据采用了5 个脉冲数,且脉冲数分布在3,7,13,18 和23时间帧位置上(见波形显示区)。
图4 脉冲位置编码方式软件编译图Fig.4 Pulse position encoding method software compilation diagram
5 结论
本文阐述了曼彻斯特码、脉冲时间间隔调制编码和脉冲位置编码三种编码方式的特点。着重介绍了脉冲位置编码方式的原理,并进行了框架结构分析,建立了采用不同脉冲数K和时间帧数M组合时其组合码映射的数学模型。在脉冲位置编码方式基础上,提出了快型和慢型两种组合方式,推导了编码效率的计算公式;同时,针对采用0.24~3 s 脉宽和两种不同组合方式下,数据密度和传输速率的差异。曼彻斯特码在表达每个字符时需要信号跳变两次,传输等量数据需2 倍的等量带宽,但编码效率只有50%,传输速率较低。脉冲时间间隔编码方式设计简单,但传输速率随着数值而变化,数值越大传输速率越低。相比曼彻斯特码、脉冲时间间隔调制两种编码方式,脉冲位置编码方式具有更高的编码效率和传输速率,传输速率可以根据不同的脉宽和组合模式实现0.22~2.76 bits/sec 的变化,并通过软件实现了该编码方式。