钻完井静态数据质量管理与提升方法探讨
2022-08-27蒋天皓陈波史旻和鹏飞宋峙潮
蒋天皓,陈波,史旻,和鹏飞,宋峙潮
1.中国海洋石油有限公司(北京 100010)
2.中海油能源发展股份有限公司 工程技术分公司(天津 300452)
0 引言
随着大数据的增长和信息化技术的创新,社会各传统行业都进入了数字化转型阶段,如何提高数据质量是转型中面临的巨大挑战[1-3],为降低无效数据体量,许多企业都投入了大量成本开展数据治理工作[4-5]。
中海油钻完井数据库涵盖海洋石油钻完井作业全周期的静态数据信息,为管理者决策部署、作业人员回顾作业信息、降本增效提供扎实全面的数据支持。为确保数据的完整性、准确性、一致性和有效性,梳理分析了近年来钻完井静态数据质量存在的主要问题,提出通过完善制度管理体系、健全源头管控标准、把控末端数据质量等手段,从管理和技术层面提高数据质量,促进数据对钻完井作业生产提供更优质的支持。
1 钻完井数据特点及质量控制难点分析
中海油钻完井静态数据主要由钻完井现场作业监督根据当日作业情况进行相关数据的收集提炼,通过静态数据源头采集工具对每日钻完井作业数据进行上报,同时传输至数据库。静态数据主要包括钻井平台信息、人员信息、天气信息、支持船信息、钻头、钻具组合、钻井液性能、作业日志等。钻完井工程作业数据具有体量大、种类多、关联性强等特点,管理者需要通过数据预处理才能充分了解工程现状、做出决策[6],这对数据的及时性、准确性提出了更高的要求。通过梳理分析,目前数据质量存在的问题主要表现在以下3个方面:
1)数据管理制度不健全,数据完整性和一致性差。《中海油钻完井数据库管理办法》仅针对数据库的维护、使用和数据安全管理等做了相应的规定,在实际执行中仍有诸多方面无法被该办法涵盖。所有静态数据均由采集者直接录入至数据库,没有任何分级审核和监管机制。
2)源头数据采集标准不统一,数据质量亟需提升。中海油钻完井监督人员已超200 人,人员素质不一。现场作业监督作为源头数据的采集者,因认知不同,在数据采集的时效性、完整度、规范性等方面均存在较大差异,无法进行统计计算处理。以“渤海五号”为例,录有“渤海5 号”“渤五”“BH5”“B5”等多种名称。
3)入库数据缺乏质量管控机制,未充分释放数据应用价值。对历史数据质量检查、新增数据质量校验没有明确和有效的控制措施,出现数据质量问题无法考核。目前组建钻完井数据管理团队进行库内数据检查,但由于数据体量巨大,检查复核任务艰巨,难以高效开展工作。
2 钻完井数据质量管理与提升方法
钻完井作业中产生的原始数据,以行业标准规范的报表格式进行采集、存储、分析和展示,才能最大程度释放数据价值。在开展数据质量管控时,要注重管理和技术两个方面的功能措施:在管理方面,制定数据管理、治理的相关制度和流程,并在公司内部进行推广;在技术方面,应用人工智能算法及大数据分析促进数据质量管理与服务的进步和发展,为各项业务需求应用和决策提供高质量的数据。
2.1 完善制度管理体系
钻完井数据管理团队通过梳理近年来各环节数据采集、质量控制存在的问题,进一步优化数据质量管理流程,完善钻完井数据管理制度体系,保证钻完井数据的整体质量。
1)从集团公司层面紧抓数据质量管理,修订《中海油钻完井数据管理办法》,落实集团公司、分公司数据管理的职责,增加分公司、集团公司两级审核制度,明确钻完井数据质量管理流程(图1)。
图1 钻完井数据质量管理流程
2)严格执行数据源头及分公司级审核制度,制定分公司级别的《钻完井数据采集管理制度》办法,以制度形式明确数据采集管理岗位职责、数据采集内容、具体数据采集上报时间和采集管理方式。
3)优化钻完井数据质量考核内容,建立数据质量直接与绩效考核挂钩,压实责任,推动数据质量考核成绩在钻完井监督年度绩效考核中占比从0提升至5%。
2.2 健全源头管控标准
源头采集主要涉及到静态数据源头采集工具和钻完井现场作业监督培训两个方面[7-8]。
1)静态数据源头采集工具结合静态数据和实时数据的特点,规范了数据管理和数据服务职能,梳理出钻完井专业所涉及的一级业务、二级业务、三级业务和其他业务活动。根据业务活动划分出244 个数据集,并细分当前钻完井专业所涵盖的3 399 个数据项。明确每个数据项的来源、名称、代码、描述、数据类型、量纲、字符长度和值域等,最终形成《钻完井业务数据规范》和《钻完井业务数据质量规则模板》(图2),以此为基准统一采集工具的数据标准。
图2 数据质量规则模板
2)针对静态数据源头采集工具使用过程中出现的问题,编制钻完井时效划分管理、数据质量提升培训课程和《钻完井静态数据采集操作手册》。定期为现场监督组织开展数据标准规范、源头数据采集培训答疑,提高现场监督数据录入的技能,保证钻完井静态数据的准确、完整和实用。
2.3 把控末端数据质量
为提高数据质量,保证其有效性,静态数据存储到数据库后,钻完井数据管理团队采用人工复核和智能检测两种方式进行数据质量的末端把控,向各生产、研究单位提供高质量的数据。
1)人工复核。钻完井专业各项业务指标均由数据库内不同数据项计算得出,为降低数据管理难度,提高数据质量,根据中海油钻完井作业不同数据项的使用频次和对核心业务指标影响程度的高低,将钻完井数据划分为“核心数据项”和“非核心数据项”。以月为周期开展上月完成井的入库数据复查(图3),以完整性、准确性、一致性和有效性4个维度进行人工复核。同时,将复查结果反馈给钻完井业务管理部门和问题井的现场监督,并要求现场监督进行完善整改,整改后由钻完井数据管理团队再次进行复查。
图3 人工复查数据质量
2)智能检测。依据《钻完井业务数据规范》标准和《钻完井业务数据质量规则模板》,开发了钻完井静态数据质量智能检查系统(图4),每日实时进行作业井的完整性检查、一致性检查、记录条数检查和特殊样本数据的检查,并根据检查结果,自动导出常规异常数据质量问题,及时报告作业井现场监督进行完善修改[9-10]。
图4 钻完井静态数据质量智能检查系统
研发智能检测系统能够有效降低人工复核的工作量,辅助提高数据复核准确率。该系统能精准分析海况、管柱组合、防喷器部件等信息的完整性,向管理人员直观呈现数据缺失项,减少了数据复查时间;实时检查作业日志、钻井时效等结构化数据的准确性,发现问题后及时提示前端数据录入人员和后端数据复核人员,强化钻完井数据前后端的沟通,提升了数据复核工作整体效率。
3 数据质量管理方法应用效果
钻完井数据质量管理方法于2020年实施,对钻完井静态数据进行管控,结合源头控制、人工复核、智能检测和制度保障等手段有效提升了钻完井静态数据质量,“核心数据”与“非核心数据”问题数量逐步减少。以天津分公司钻完井数据为例,“核心数据”平均单井问题数从高点4.97%降至目前“核心数据”无新增问题数据,“非核心数据”平均单井问题数从2020 年1 月至2021 年6 月平均下降了77.68%(图5)。
图5 平均单井核心数据及非核心数据问题数
井壁稳定分析对钻完井作业安全具有极其重要的意义,渤海C油田东营组泥岩掉块、垮塌问题突出,以一口调整井C3 井为例,该井设计井深5 000 m,215.9 mm(8⅟2")水平段穿过东二下段地层,井壁失稳风险较高,需要在钻井液设计、井深结构设计及地质风险分析等环节广泛参考邻井资料。根据同区块已钻历史井与待钻C3 井之间的靶点距离位置关系,优选了1 井、2 井、A1 井及A5 井为参考邻井。通过审核上述4 口已钻历史井测井、钻井等数据资料的适用性及完整性,分析现有数据是否满足岩石力学及井壁稳定分析的需要。已钻历史井资料见表1。
表1 历史井资料审核情况
治理后的数据具有较强的参考应用价值,通过钻井日志资料统计卡钻、漏失等复杂情况,通过测井资料计算岩石力学参数,综合地质录井图资料,形成了基于有限量历史数据资源的井壁稳定分析方法,对减少C3井钻井复杂情况及事故的发生具有重要意义。
4 结论
1)中海油钻完井数据库涵盖钻完井作业全周期的静态数据信息,具有体量大、种类多、关联性强等特点,目前数据治理过程中存在制度管理体系不完善、源头采集标准不统一、入库质量把关不严格等问题。
2)针对数据质量问题,从管理层面提出制定数据治理相关制度、标准、流程,并广泛推广;从技术层面提出人工复核+智能化软件辅助监控,降低“非核心数据”入库前的错误率,杜绝“核心数据”质量问题。
3)通过统计库内问题数据数量发现,钻完井数据质量管理体系运行以来,平均单井核心数据问题数降低了100%,非核心数据问题数降低了77.68%。基于治理后的邻井历史数据,形成了一套适用于渤海C 油田泥页岩井壁稳定分析模型,对减少该油田钻井复杂情况及事故的发生具有重要意义。
数据质量是数字化转型的基础,通过应用钻完井静态数据质量管理方法,有效降低了无效数据体量。但随着钻完井数据的不断增加,还需探索出更加切实有效的数据质量提升方法,建立健全数据质量评价体系。