基于数据挖掘技术的煤矿智能精准开采系统
2020-08-05易瑞强
易瑞强
(陕西黄陵二号煤矿有限公司,陕西 延安 727300)
0 引言
煤矿综采自动化技术是实现煤炭安全、高效回采的重要保障,是国家经济发展所需煤炭供应的先决条件[1]。随着开采深度的加大和赋存地质条件的恶化,已对深部煤炭资源的安全开采造成严重威胁。由于综采工作面自动化系统[2]以过程化控制为核心,与生产管理过程脱节,未进行高效实时的实现信息集成和互通,不能有效地对综采关键设备进行管理,更因为自动化开采过程中存在大量数据可以广泛使用,并且迫切需要将这些数据转换成有用的决策信息和控制策略,为生产控制生产管理者提供决策和建议,因此把综采自动化各子系统的信息融合[3]形成统一监管和大数据分析的平台,并进行数据深度挖掘,最终实现智能化精准开采显得尤为重要。
1 煤矿综采自动化技术及信息融合
1.1 综采自动化技术
信息整合:煤矿综采工作面系统的自动化水平是当前国际采矿界研究的热点。我国煤矿综采设备具备数据传输功能,并能与多种通信系统和接口进行传输。对所有重要的参数,随时随地进行监测,并进行信息交换。由于设备种类繁多,数据上传的接口与协议不统一,给信息整合带来了很大的难度。
系统控制:煤矿综采自动化系统中液压支架和采煤机在远程控制、全自动开采等方面做了大量的研究,并取得了一定的成果,但在设备位置监测、姿态自动调整、三维自动开采等方面仍需攻关。由于开采过程是动态的,且传输环境恶劣,限制了各个设备关联。因此,迫切需要建立一套系统,建立关联的系统控制策略和精准控制的算法。
1.2 综采自动化信息融合
信息融合的难点:综采自动化系统涵盖整个工作面的所有设备和控制单元,复杂且完备,因此每个监控系统既负责数据的采集控制,又负责数据的校验、传输、共享,大部分功能相互关联。而现有设备数据采集没有统一的数据标准、采集标准,在采集数据时,需根据提供的格式进行解析、转换,增加出错率与工作量;且现有设备所生成的数据格式不一。
信息融合重要性的表现:多源异构数据的信息融合成为大量开采数据运算平台运转的核心,主要体现在以下3个方面。①原始数据采集。通过以太网采集相关的设备参数;②数据传输。将采集到的参数通过工业环网传输给开采大数据决策平台,为数据挖掘开采决策提供实时准确的设备信息;③集控中心作为平台的执行者,可以按照平台下发的指令完成相应的动作。通过融合集控所回传的井下设备姿态数据,计算设备井下实际位置、辅助测量姿态数据、实际采高卧底、动作执行状态反馈。利用所计算出的数据来绘制各设备实时开采数据模型。
2 开采大数据决策平台建立
2.1 大数据平台设计架构
设计架构的要求:围绕综采开采工艺流程分析及模型建立、生产过程决策及可视化控制、生产过程动态数据挖掘分析、精准控制决策分析等需求,开发智能控制算法,实现精准控制决策,创新设计平台设计架构,具体设计架构要求,如图1所示。
图1 开采大数据决策平台架构
大数据决策平台数据采集:参数采集功能模块作为整个系统的重要部分,主要用来监测井下的各类环境参数[4]和设备开停等主要生产参数。综采自动化的一些环境参数和设备运行工况信息可以直接在地面中心站及管理工作站上反映出来,并对设备、系统、生产等关键信息进行集成和互通,减少工作负担,在第一时间掌握安全生产和设备运行工况,为综采自动化生产和日常调度提供数据支持。系统可对有关检测参数进行记录、显示、分析运算、超限报警控制、查询、编辑、动态定义等。平台实现对信息化设备,通过自定义通讯[5-6]实现对综采自动化数据采集、本地存储,并将数据过滤处理,多层加密后发布[7]到云服务平台。数据终端通过访问云服务平台,实现移动应用端和移动端服务器的数据连接,完成跨移动平台的数据交互[8]。
数据预处理:在设备工况数据及其他数据接入平台之后,因为数据量太大,并且多半来自多个异种数据源,因此需要对数据预处理。①数据噪点降噪、清洗。平台通过分箱(Bining)方法考察数据的“近邻”来光滑有序的数据值。对于丢失的数据但属性级别较高的,平台采用多重插补法对数据变量之间的关系进行预测,利用蒙特卡洛方法生成多个完整的数据集,并对这些数据集进行分析,最后对分析结果进行汇总处理;②大数据算法自主优化。平台采用Alluxiospark计算方式,比传统Spark框架在效率及速度上提高了10倍,极大降低了数据的延迟,提高了数据之间传递的实时性,降低占用网络带宽。平台拥有自主深度学习和算法扩展功能。
数据管理和存储:平台包括实时库和工业库[9]本地存储以及云数据库存储功能,综采数据通过智能化管理平台处理、加工、过滤、整理,以统一的形式发送给云数据库,平台对云数据库进行主从分布式数据库管理和负载平衡管理,使用分布式系统,可做到数据容灾保护,更为数据分析提供稳定可靠的数据源基础。
2.2 开采大数据决策平台分析功能
平台可以实现生产数据分析和设备自诊断,针对设备运行工况,根据运行参数,通过数据分析算法,实现在生产前预判设备状态,生产中系统实时自诊断。
设备数据分析:①启停分析。记录设备启停情况,分析自动或人工操作启动成功率,反馈启动成功的比率;②操作记录。分析违规操作详情,包括违规的行为、时间、违规操作的设备、位置、违规的类型、违规操作人、处理办法;③故障记录。记录故障的名称、发生的时间、出现的位置、故障分类、发生故障的设备、系统若能自动修复则展示系统正在自动恢复中请等待、系统若不能修复则展示系统无法处理并给出人工处理的处理意见。
设备自诊断:①可通过定时周期自诊断或收到命令开始自诊断,系统会检查当前各设备的控制状态是否正确、各传感器的数据是否正常、通讯状态是否正常等,并将诊断结果展示出来;②建立故障分析库,将已处理的故障进行分类整理、可选性的分类显示,以列表的形式呈现,点击后可查看详情。详情页面展示故障的名称、每次出现此故障所出现的时间列表、故障分类、发生故障的设备、相同故障出现的次数;③建设大数据平台必然是由自动化集控向智能化决策分析推进,主要体现在基于大数据挖掘技术对建立的开采模型进行融合,根据实时工况数据及各传感器测量数据反馈实际,进行智能开采模型算法的深度学习和控制算法的迭代,随着数据挖掘不断优化控制参数和决策算法分析,增加了系统和装备的分析决策功能,最终转换为开采策略指导开采模型,必将极大地提升智能化控制的整体水平。
3 综采自动化数据挖掘及精准智能开采
3.1 综采自动化数据挖掘技术
数据挖掘流程:在开采大数据决策平台建立的开采数据模型基础上,通过平台的大数据分析功能提取测量高度,实时反馈的测量位置,同时结合开采数据及辅助校准建立数据样本库,对多源异构下的数据源进行相关性和开采工况数据校准精准度的深度分析挖掘[10-11]。研究过程以基于设备工况和测量数据条件为核心设计研发工作面开采模型,对融合后的地质及开采数据进行影响因素分析,采集推进过程中各相关设备的运行状态、故障情况、生产工艺调整,特别是运输机的直线度、俯仰角度等内容。结合实际测量数据通过分析收集到的现场数据具体化工作面推进过程,不断学习抽取其中可能的工作面的推进逻辑,而且针对不同工作面依照程度的大小列出影响推进过程、精准控制的因素。数据挖掘技术路线,如图2所示。
算法因素:在上述基础上建立相关的数据挖掘分析结果。其中分析校准的算法因素主要体现在以下3方面,如图3~图5所示。精准校准决策分析实现对推进过程采集的大量数据建立分析系统的逻辑关联,通过平台自动根据实时测量数据迭代历史样本库进行不断的自我迭代升级提供有效的数据模型库。为精准开采决策模型提供精准的数据支撑。
图3 支架控制及校准算法数据挖掘模型
图4 采煤机控制及校准算法数据挖掘模型
图5 运输机控制及校准算法数据挖掘模型
3.2 精准智能开采
精准控制技术:在结合工作面透明地质、综采大数据决策技术得到突破和解决,攻克工作面透明地质信息建模、平台和精准设备姿态定位、增强可视化远程控制等多种技术后,形成一套具有“模型—推理—决策—执行”的综采工作面,“地质模型→开采决策→精准控制”的智能开采方式,从严格意义上讲是填补了基于大数据挖掘的精准开采技术空白。通过不断对工作面集中控制影响,连续推进的控制因素大数据算法研究,过程中深入探究设备姿态实时定位和直线度测量、控制模型与平台的数据融合、控制策略控制算法挖掘等关键精准控制技术。精准控制技术路线,如图6所示。
图6 基于数据挖掘技术的精准控制技术路线
精准开采的控制流程:①平台提供的精准开采模型,对井下精准控制系统进行执行控制转换,转换为全自动开采的控制算法,根据算法指导设备全自动作业。根据设备姿态的实测数据,实现设备具体控制姿态的准确测量值,通过精准控制设备姿态反馈,实现基于精准开采模型的控制闭环;②利用大数据挖掘是否达到指令状态。精准开采模型控制闭环后,记录执行动作以及控制指令,生成数据样本库,并通过算法对样本库结合精准开采数据模型,反馈到大数据精准开采决策平台,利用控制模型闭环后所产生的样本数据挖掘进行精准开采模型算法的迭代优化;③通过决策平台对自动化系统的关键性过程进行应用分析,主要包括设备的精细化管理决策,实现设备的故障诊断,提供维护和运行策略;工作面顶板管理决策,实现周期来压预测,提供顶板管理策略;操作行为管理策略,实现操作人员行为分析,提供操作方式的最优改进策略。
3.3 关键技术分析
开采大数据决策平台关键技术:平台基于工业化组态架构,通过该平台开发的综采自动化、智慧矿山等信息项目的应用,担负着数据采集、通信、计算、存储、显示及监控逻辑的定制、控制设备动作等重要任务,是系统实时监控、数据分析、数据云发布、云服务数据采集转换及存储的中枢。开采大数据决策平台工业化组态架构关键技术,如图7所示。
图7 开采大数据决策平台工业化组态架构关键技术
数据中心部署架构:①数据中心包含数据存储和处理。从各种Type和Stype的数据中抽取数据作为历史数据,并且从已有的历史数据中抽取数据集合,存储到数据中心,使用数据流操作,最大限度保证数据的延续性,防止数据丢失。使用分布式系统,可以做到容灾;②采用大数据分布式架构可以保证信息化的延续性,如图8所示。随着信息化程度的逐年提高,数据必然会有爆发期,如果在系统整合期,没有大数据作为基础条件,未来的可扩展性就会受到严重限制;③数据获取技术。实现从设备到生产、排查、应急、预警、运维管理、运输、用户等生产全过程自动监测与感知,对获取的海量数据实时监测并及时上传,是实现智能化管理平台的基础;④数据管理技术。包括关系型和非关系型数据管理技术、数据融合和集成技术、数据抽取技术、数据清洗和过滤技术,具体是指矿山数据ETL、矿山数据统一公共模型等技术;⑤模块化技术。针对现场的需求变更,需要加强各种系统间的协作,必须能够及时响应功能需求的变更,在项目工程组态时,设计实现组态图形画面、变量、设备和脚本等,是一项繁杂而耗时的工作。所以通过提供丰富的模块化功能,复用已有组态工程的内容,将组态工程中常使用到的设备、变量、脚本、画面等工程组态内容分别生成模板,生成模块化组态单元,从而在构建新项目时可以从模板中快速生成。在此过程中,用户只需要按照向导做些简单配置和变量、字符串替换等工作,就可以快速创建工程组态,大大提高工作效率。
图8 大数据分布式架构
大数据挖掘关键技术:①大数据采集及管理技术。利用 HDFS(分布式文件系统)来处理节点服务器之间的交互。由于平台是一个分布式系统集群,对于计算节点的服务器来说,服务器的硬件配置要求稍低,也避免了大量的服务器集群之间的数据传输问题。关于数据的安全性、容错性、容灾机制,则在HDFS上均有非常完善的体系机制,能够达到毫秒级实时数据的接入,避免由于数据量大在传输中出现数据失帧、脏数据无法处理的现象。②大数据的分类、筛选方法。工作面的设备种类多,数据量大,因此研究“综采工作面大数据”的分类、筛选方法非常必要。③过程数据挖掘技术。过程数据挖掘技术主要包括:数据的预处理技术研究,实现数据中的噪声消除、丢失数据的恢复、错误数据的清理、多维数据的维数约减、特征提取、概念形成、标度统一;分析过程数据特征,选择适当的挖掘模型,通过模式评估、分类等算法,对综采工作面系统进行建模,并利用神经网络技术提供智能决策;知识的可视化技术和方法研究,以一种图形化的简明形式呈现知识。④数据展现技术。数据解决方案自助分析工具包含报表工具和分析工具。自定义报表工具使用了报表引擎,为用户开发出图形界面,用户就可以使用向导,无需编写代码,通过工具配置创建出一个报表,能更大程度上满足用户的数据需求。多维分析工具提供了丰富的图形化展现界面和接口。⑤信息安全体系。平台在数据传输、处理和存储过程中建立信息安全体系,管理平台将处理后的数据通过多层保护机制。一是数据本身的安全,对数据多重加密进行主动保护,并通过双向强身份验证之后才会发送至云服务平台,从而保证数据的保密性、完整性;二是数据防护的安全,主要是采用云数据库存储手段对数据进行主动防护,同时通过云磁盘阵列、云数据备份、异地容灾等手段保证服务端数据的安全。在数据处理和存储的安全体系中,平台主要保护数据库在系统运行之外可读的安全性。对数据库中数据加密是为了增强关系数据库管理系统的安全性,提供一个安全适用的数据库加密平台,对数据库存储的内容实施有效保护。防止出现某些敏感或保密的数据被不具备资格的人员或操作员阅读,而造成数据泄密等后果。
4 结语
智能化综采管理平台项目以远程通讯、物联网、云计算、大数据、数据挖掘等高新技术为主导,以智慧监测管理理论为指导,建成面向矿山的智慧监测管理体系,实现信息数字化、控制自动化、故障预知化、决策智慧化,提升矿山系统的管理水平,降低人员及设备成本,实现经济效益最大化。平台的实施应用,可随时随地掌握工作面的动态工况,并为设备保养、生产工艺、系统优化、故障处理提供可靠的数据依据和决策依据,提高了矿井智能化综采工作面的智能化程度,改进了现场管理方式,基于生产大数据构建深度数据挖掘模型,实现设备的精准控制、故障自诊断以及对生产工艺的智能决策,最终实现基于数据挖掘的智能化精准开采。