基于特征标记的油田无人值守站运行异常辨识研究
2024-05-03赵敏王云辉王华付兵金峰长庆油田第五采油厂
赵敏 王云辉 王华 付兵 金峰 (长庆油田第五采油厂)
1 概述
数字化技术的快速发展,不仅给人们的日常生活带来了方便,也使得很多领域实现了智能化发展,油田巡检就是其中之一。在传统的油田管理中,会设置人工巡检,以此保证油田的正常运行,但这种巡检方式需要耗费大量的人力物力,且巡检数据不易保存,无法及时发现油田存在的隐患。通过油田无人值守站来对油田的运行进行巡检,其不仅能够实时掌握油田及周边环境的情况,而且能够及时解决突发情况。然而,无人值守站也会因受到外界因素的影响在运行过程中出现异常,因此需要对其进行异常辨识。
不少研究学者针对异常辨识方法展开了研究,并提出了自己的想法。一是首先采集低压台区线损数据,并对采集的数据进行预处理,剔除外界因素对数据的干扰。然后在考虑分布光伏的前提下,提取线损数据的特征,并对其进行分类,从而实现对状态异常辨识,但该方法的辨识时间过长[1]。二是通过对风机运行状态的监测和分析,提取其中的异常状态数据,并融合分形特征,构建相应的异常辨识模型,从而实现对风机异常运行状态的辨识,但该方法辨识的结果不准确[2]。三是对配电站的备自投动作状态进行捕捉,并提取其中的数据特征,在网损平衡异动分析的作用下,构建相应的状态辨识模型,从而实现对其动作状态的辨识,但该方法的应用成本较高[3]。
在上述研究的基础上,设计了基于特征标记的油田无人值守站运行异常辨识方法。通过采集油田无人值守站的运行状态数据并对数据进行预处理,提取出其中的异常运行状态数据,并对异常状态特征进行标记处理,从而实现对无人值守站异常运行状态的辨识。设计的方法能够及时发现无人值守站运行过程中存在的问题,并制定相应的解决措施,保证无人值守站的稳定运行[4-5]。
2 无人值守站运行异常辨识方法
2.1 运行数据采集及预处理
为实现对无人值守站运行状态异常的辨识,需要采集一段时间内的无人值守站运行数据。一般来说,数据采集时长为6 个月。在采集无人值守站的运行状态数据后,考虑到无人值守站在运行过程中受到周围环境的影响,采集的数据中存在大量不良数据,导致数据质量整体较差,无法准确表征无人值守站正常运行和异常运行之间的差异[6]。因此,需要对采集的数据进行预处理。该设计数据预处理的过程分为两部分,一是数据清洗,二是数据降噪处理。其中数据清洗是将采集的数据进行简化处理,去除其中的重复数据,并将剩余的数据转换成标准化数据,以便用于后续分析[7]。
在数据清洗过程中,首先将采集的数据按照数据清洗的规则进行相关处理。若符合要求,则直接输出处理后的数据[8]。若不符合要求,则需要判断数据中是否存在重复值、缺失值和无效值。若存在,则删除数据中的重复值;若不存在,则直接对数据进行下一步处理。在上述过程的基础上,再对数据的一致性进行判断。若不符合要求,则需要对数据进行归一化计算,保证数据的一致性,再输出处理后的数据。通过上述处理,完成对数据的清洗[9]。然后,对数据进行降噪处理。在降噪处理的过程中,首先得到含有噪声的数据模型,以此为基础,对数据进行分解,将其中的噪声进行分离处理,再将数据按照既定的规则进行重构,从而得到去除噪声后的平滑数据。具体降噪过程:
式中:S(x)为含有噪声的一阶数据模型;x为数据采集点;m(x)为真实的数据;δ为设定的噪声阈值;e(x)为噪声函数;f(x)为噪声处理的结果;C为需要进行降噪处理的数据数量,个;Wf(a,b)为降噪函数;ψ(·) 为降噪后的重构函数;a、b分别表示为降噪处理的各项参数。
在上述过程中,分别对采集的数据进行了数据清洗和降噪处理,提高了数据的质量,为后续运行状态数据的特征提取及标记奠定了基础[10]。
2.2 运行异常数据特征提取
在对无人值守站的异常数据进行特征提取时,因其在运行过程中不同设备和仪器的运行参量及剩余寿命不同,且不同设备之间的相关性也存在一定的差异,因此需要直接提取异常数据的特征量,以此对无人值守站异常运行状态进行分析。选取数据的统计均值、方差和均方根值作为异常数据的特征量。其中,数据的统计均值能够直接反映无人值守站的异常运行情况,方差能够展示异常运行状态出现时的波动情况,均方根值能够反映异常运行状态对无人值守站的影响。异常数据特征量的具体计算过程:
式中:S为异常数据的均值;n为异常数据数量,个;ri为异常数据特征值;pri为该异常数据出现的可能性;M为异常数据的方差;rˉ为异常数据的真实数值;R为异常数据的均方根值。
2.3 异常状态特征标记
通过公式(2)提取出异常数据的特征量,对异常状态特征标记。特征标记是指通过对数据中的特征进行标记,以表示其在某种条件或环境下的状态或属性。这种标记可以是数字、符号、颜色等形式,用于辅助分析和判断。在无人值守站运行状态异常辨识中,特征标记的创新点如下:
1) 直观可视化,通过对关键特征进行标记,可以直观地展示数据的状态。例如,将正常运行状态标记为绿色,异常运行状态标记为红色,以便快速辨识异常情况。
2) 提高准确性,通过对关键特征进行标记,可以突出特征的重要性,帮助辨识算法更加关注和利用有用的特征信息,这有助于提高无人值守站运行状态异常辨识的准确性。
3) 加强关联性分析,通过对特征进行标记,可以更好地捕捉不同特征之间的关联关系。例如,将相似特征标记为同一类别,便于进行相关性分析和模式辨识,进一步深入了解异常产生的原因和机制。
4)简化特征选择,在无人值守站的异常辨识中,可能存在大量的特征待选。通过特征标记,可以对特征进行分类和归类,从而简化特征选择的过程。这有助于减少特征空间的维度,并且更集中地关注与异常相关的特征。
在对异常数据进行标记时,需要将所有的数据特征都集中在同一个特征空间中。在该特征空间中,利用数据的时域性,划分出对应的时域平面。在该时域平面内,由于时域能量的不同,异常数据的特征会集中在不同的时域平面上,从而实现异常状态特征标记。异常状态特征标记过程见图1。利用时域能量去检测异常状态数据,并将检测到的异常状态数据进行标记,为后续的异常辨识奠定基础。
图1 异常状态特征标记过程Fig.1 Process of abnormal state characteristic marking
在上述设计的基础上,进行对无人值守站运行状态异常的辨识。利用提取的异常数据特征,再结合特征标记的结果,构建相应的运行状态异常辨识模型。油田无人值守站运行异常辨识模型见图2。
图2 油田无人值守站运行异常辨识模型Fig.2 Abnormal identification model of unattended station operation in oilfield
首先对输入的无人值守站运行数据进行预处理,并对预处理后的状态数据进行特征提取。然后提取出其中的异常数据特征,通过计算对应的异常辨识参数,实现对无人值守站运行状态异常的辨识。在上述过程中,异常辨识参数的计算过程:
式中:W为构建的运行状态异常辨识模型;f(i)为异常数据判别函数;Ki为异常辨识模型中的特征变量;t为时间变量;d为辨识模型中的异常辨识参数;Gi为外界的干扰参数。
通过公式(3),计算出数据的异常辨识参数。当该异常辨识参数达到设定阈值时,则说明无人值守站当前的运行状态出现异常,需要进行及时处理。由此,完成对无人值守站异常运行状态的辨识。至此,基于特征标记的油田无人值守站运行异常辨识方法的设计完成。
3 实验测试
3.1 实验准备
为验证设计的异常状态特征标记的辨识方法在实际应用中的效果,进行实验测试。实验中,以某油田无人值守站为实验对象,进行相关实验测试。
对某油田无人值守站进行数据采集,采集时间为6 个月,采样点为6 000 个,采集的无人值守站运行数据见图3。
图3 某油田无人值守站运行数据采集结果Fig.3 Data collection results of unattended station operation in an oilfield
以图3 采集的运行状态数据作为基础,为提高采集数据的质量,对其进行预处理。预处理后的无人值守站运行数据见图4。
图4 预处理后的无人值守站运行数据Fig.4 Operating data of unattended station after appointment processing
采集的数据经过预处理后,数据的质量得到了提高,能够用于后续实验。此外,为提高实验结果的可靠性,设置了相应的对照实验。其中,基于特征标记的油田无人值守站运行异常辨识方法为方法1,基于多源数据重构的油田无人值守站运行异常辨识方法为方法2,基于卷积神经网络的油田无人值守站运行异常辨识方法为方法3。
3.2 实验结果与讨论
为验证三种方法在实际应用中的效果,以三种方法的辨识准确率为评价指标,对比三种方法的性能。实验中,利用三种方法对某油田10 座无人值守站的运行状态进行辨识,统计其辨识结果。辨识结果见表1。
表1 辨识结果Tab.1 Identification results
根据表1 可知,方法1 的辨识准确率最高。因此,基于特征标记的油田无人值守站运行异常辨识方法在实际应用中效果最好,能够准确辨识无人值守站在运异常,能够确保无人值守站的稳定运行。
4 结束语
1)为了提高辨识准确度,对数据进行清洗和降噪处理。这一步骤在异常辨识中起到了关键作用,提高了异常数据特征的提取效果。
2)采取均值、方差和均方根值等统计量作为异常数据的特征,并对异常状态特征进行了标记处理。这种方法不仅充分利用了数据的统计特性,还提高了辨识模型的可解释性和准确度。
3)通过测试,实验结果表明,所设计方法具有很高的辨识准确率,辨识准确率平均值为93.77%,这一结果表明该方法在辨识油田无人值守站运行异常方面具有较好的效果,可在实际应用中得到广泛应用。
通过对研究成果的应用及时发现运行异常,并采取相应的措施进行处理,从而降低运维成本和风险,提高生产效率和安全性。而其缺陷在于仅对油田中的数个无人值守站进行实验测试,导致实验结果存在单一性,在之后的研究中将采集更多的样本进行相关实验,以此最大程度上保证辨识精度。