智能化矿山数据分类与编码方法研究
2023-12-06徐金陵孙长春樊九林王致兵胡而已张冬阳陈帅领张伟阔
徐金陵,孙长春,樊九林,王致兵,黄 金,汪 莹,刘 婵,胡而已,张冬阳,陈帅领,张伟阔
(1. 华电煤业集团数智技术有限公司,北京西城区,100035;2.华电煤业集团有限公司,北京西城区,100035;3.中国华电集团有限公司,北京西城区,100031;4.中国矿业大学(北京)管理学院,北京市海淀区,100083;5.应急管理部信息研究院,北京市朝阳区,100029;6.华电电力科学研究院有限公司,北京丰台区,100039)
0 引言
智能化矿山数据融合共享问题成为煤炭行业日益关注的焦点,2020年,国家能源局、国家煤矿安监局等八部委联合出台了《关于加快煤矿智能化发展的指导意见》,工信部、国家发改委、自然资源部发布了《有色金属行业智能工厂(矿山)建设指南(试行)》,为智能化矿山建设提供了顶层设计依据[1]。国家矿山安全监察局于2023年6月26日发布了《智能化矿山数据融合共享规范》[2],包含基础共性、数据编码、数据采集、数据治理、数据安全、数据应用六大专题共40项规范。由上述政策与研发成果的背景可知,智能化矿山数据的标准化建设是决定煤炭行业数字化转型成败的关键路径。智能化矿山数据治理是智能化矿山建设中的关键一环,统一的数据标准规范是智能化矿山建设全面发展的基本保障,而智能化矿山数据分类与编码则是智能化矿山数据融合共享的基础。数据分类是进行数据编码的首要工作,即面向智能化矿山业务,结合数据建模方法对智能化矿山业务域进行划分,对业务对象、系统对象及矿山未来应用场景对象进行识别和分类。数据编码能够在对某种类别的数据进行逐层分类的基础上对分类结果赋予特定代码,以达到对该种数据类别或其分类结果在语义上的无歧义理解。
分类编码已成为煤矿基础信息标准化建设与煤矿基础数据库数据组织、存储、管理和交换的共同基础,也是实现数据共享与交互操作的必然要求。关于煤矿数据分类与编码,我国学者很早便开始关注。1999年,张振飞等[3]提出了一个基于适于区域矿产资源定量评价系统的地学信息分类代码体系思路,初步讨论了如何实现分类编码的科学性、系统性及实用性。煤矿地质测量信息方面的数据分类与编码受到学者重视,在地学信息分类代码基本思路的基础上,继续深入研究,探索数据分类和编码技术[4-7]。随着信息化的不断发展,数字矿山、智慧矿山概念的提出,人们逐渐关注煤矿信息化标准体系,潘涛[8]等提出了数字化煤矿信息化标准体系的总体框架,探讨了数据元、元数据的概念及描述方法,给出数据分类方法及实例;周琳[9]和万娜等[10]对智慧矿山进一步提出了数据分类与编码思路,并对智慧矿山元数据识别模型进行了初步探索。近年来煤矿智能化标准体系与建设成为煤炭行业关注的焦点,智能化矿山数据的融合共享成为行业发展的必然趋势。但智能化煤矿各子系统缺乏统一的通信标准,各系统信息难以集成是当前智能化矿山数据融合共享面临的瓶颈,煤矿各子系统智能化水平发展迅速,亟需制定相关标准指导、规范相关功能和安全要求,同时进行分类分级建设[11]。
现有智能化矿山数据分类和编码方法尚存一定局限性。首先,由于尚未形成统一的标准,导致信息孤岛的存在,不能对智能化矿山业务数据进行唯一编码,存在不同业务系统之间数据重复编码问题;其次,数据覆盖面不足,无法覆盖支持智能化矿山各种智能设备的场景数据;此外,数据存在滞后性,存在对当前智能化矿山智能设备数据描述不清、造成歧义等问题。因此随着智能化矿山智能化水平的快速发展,煤炭行业亟需制定一套与当前智能化矿山智能场景相适应的数据分类与编码体系。王国法等[12]提出智能化煤矿分类分级体系需根据国家、社会、行业对智能化煤矿认识、要求的提高不断进行修订完善;谭章禄[13]从3个层面分析了智能化煤矿数据归类与编码的目标要求,认为智能化煤矿宜采用“基准?傆b扩展”两阶段的数据归类思路,并提出了数据归类与编码需关注确定业务域、确定数据域、识别对象类、抽取对象类属性、定义数据元5个关键步骤。上述研究成果为智能化矿山数据分类编码指明了方向,提供了良好的前期积累,对于本研究的开展具有重要的参考价值。
笔者结合智能化矿山数据融合共享活动特点,提出面向智能化矿山数据共享活动的数据分类与编码方法,并基于该方法对智能化矿山数据进行分类并编码,旨在为智能化矿山数据共享工程各建设单位提供指导和规范,为各种智能化矿山数据的采集、治理和应用相关的数据分类与代码规范提供参考,进而推动智能化矿山数据的融合与共享。
1 智能化矿山数据分类的方法
1.1 智能化矿山数据分类的整体思路
智能化矿山数据分类是智能化矿山数据编码的基础,为准确实现对智能化矿山业务数据的编码,首先需要对智能化矿山数据进行精准分类。在智能化矿山数据及其关联数据的分类过程中,应遵循科学性、唯一性、稳定性、系统性、可扩展性、兼容性等基本原则。智能化矿山数据分类的整体思路梳理如图1所示。
图1 智能化矿山数据分类的整体思路
首先要确定智能化矿山数据分类的理论依据,进而构建层次结构划分的数据模型,为智能化矿山数据类目隶属关系的划分提供依据与指导;然后依据具体的数据元识别模型,从业务、系统、未来智能化应用场景3个方面确定业务对象及其属性,以确定整个分类体系;最后完成对智能化矿山所有数据的分类。
其中,智能化矿山数据分类理论依据包含基于业务对象的划分、基于现有系统对象的划分以及基于智能化矿山未来应用场景的划分3个方面。一是基于业务对象进行划分是以智能化矿山现有业务为基础,辅助采用数据建模等方法,规范表达业务流程分析、数据流程分析,实现智能化矿山对象全识别、属性全抽取、关联全建模,面向业务过程或职能范围进行数据分类,以实现对智能化矿山现有业务数据的准确分类;二是基于现有系统对象进行分类是在依据业务对象分类的同时,应对现有信息化应用平台、信息系统、系统功能以及各系统功能所需要的数据支持,进行数据源追溯,从而与基于业务对象的分类方法相互补充校验,并根据数据现场应用特征对数据分类进行完善;三是基于智能化矿山未来应用场景进行数据分类是考虑当前智能化矿山建设基础,面向智能化矿山未来应用场景,构建完备的智能化矿山数据体系,智能化业务系统应集成系统功能以及各系统功能需要的数据支持,追溯现有数据源,对数据分类进行校验和补充。
1.2 智能化矿山数据分类的基本方法
在对智能化矿山数据分类进行设计时,将IDEF0和UML建模方法结合起来,自上而下,对智能化矿山的业务进行全面分析,首先运用IDEF0业务建模方法,建立智能化矿山业务模型,对智能化矿山的生产经营活动进行分解,将其划分为最小业务单元,以此为依据,再运用UML建模方法,分析各最小业务活动的对象和属性,从中提取数据元。
1.2.1 IDEF0业务建模方法
智能化矿山数据分类采用系统工程建模工具IDEF0,自上而下,面向业务属性,对智能化矿山业务域进行层次结构识别和划分,最终识别出最小业务单元。
IDEF0建模的主要元素是由方盒和箭头组成,如图2所示,方盒代表完成某种功能的活动,箭头表示活动所需或活动产生的真实信息或对象,IDEF0基本功能活动由活动、控制、机制、输入、输出5个元素组成,控制是该活动执行的机制和条件,机制是执行活动的人或设备[14-15]。
图2 IDEF0基本功能活动
IDEF0方法采用自顶向下逐层分解的方式来构建系统的功能模型。根据智能化矿山数据分类理论依据,面向业务属性,对智能化矿山业务域进行层次结构识别和划分,将智能化矿山数据确定为包含主题域分组、主题域、业务对象、数据实体和属性5个层次的层次架构,从而确定其类目的隶属与关联关系。
1.2.2 UML建模方法
UML立足于对事物的实体、性质、关系、结构、状态和动态变化过程的全程描述和反映。作为一种建模语言,UML有严格的语法和语义规范。UML采用一组图形符号来描述软件模型,所描述的软件模型,可以直观地理解和阅读,由于其具有规范性,所以能够保证模型的准确、一致。
UML建模方法是用来精确识别并提取智能化矿山中数据元的系统性方法,智能化矿山数据分类采用面向业务对象、结合现有信息系统分类方法相互补充校验,同时考虑智能化矿山未来应用场景对分类进行完善,基于此构建智能化矿山数据分类体系框架。在将矿山各业务划分为业务单元的基础上,采用UML数据建模方法,通过UML建模方法中的活动图、顺序图和类图,提取对象和属性,从中逐层识别和提取出数据元。
1.2.3 基于IDEF0和UML建模方法
IDEF0建模是智能化矿山业务数据进行系统分类的有效方式,UML建模是基于IDEF0识别出的最小业务单元进一步分析最小业务单元的属性、关系、结构、状态等的一种建模语言。比如,基于IDEF0识别智能化矿山最小业务单元,如图3所示,A0为顶层图,表示智能化矿山业务,自顶向下分为A1图、A2图、…、An图,分别表示矿山的各项业务;基于A1图管理业务细分,分为A11图、…、A16图,分别表示管理业务的人、财、物、产、供、销6方面;基于A11图细分为A111图、…、A11n图;基于A111图继续对人事管理细分,分为A1111图、…、A111n图,从而识别出智能化矿山业务下管理业务的所有最小业务单元。然后按图4中UML建模方法,对每个最小业务单元的属性、关系等进行识别,以提取出其中涉及到的所有数据元,这是进行数据编码的最小数据单元。
图3 IDEF0建模实例
2 智能化矿山数据编码的方法
智能化矿山数据编码是在智能化煤矿数据分类体系的基础上,对智能化矿山各层级数据进行系统性编码的过程。智能化矿山数据编码应遵循唯一性、匹配性、可扩充性、简洁性等基本原则,编码方法宜采用层次编码方法[16]。智能化矿山层次编码格式如图5所示。
图5 智能化矿山层次编码格式
根据数据结构模型确定数据分类的层级结构为主题域分组、主题域、业务对象、数据实体以及属性5个层次,在此基础上对智能化矿山数据进行编码。其中,主题域分组使用3位字母表示,用MJA表示井工煤矿基础类数据,MJB表示井工煤矿生产类数据,MJC表示井工煤矿安全类数据,MJD表示井工煤矿管理类数。主题域分组的字母代码为中文拼音首字母,第一位字母M为“煤矿”中“煤”拼音首字母,第二位字母J为“井工矿”中的“井”的拼音首字母,第三位字母A代表基础类数据,B代表生产类数据,C代表安全类数据,D代表管理类数据。主题域顺序码使用2位数字表示,业务对象顺序码使用2位数字表示,数据实体顺序码使用3位数字表示,属性顺序码使用4位数字表示。
3 智能化矿山数据分类结果
根据上述提到的智能化矿山数据分类与编码方法,以业务对象、现有系统对象以及智能化矿山未来应用场景3方面为分类依据,采用IDEF0数据建模方法,自上而下对智能化矿山的数据进行分类,形成主题域分组、主题域、业务对象、数据实体以及属性5个层次的分类层级体系。其中,属性的识别提取常采用UML的建模方法。最终将智能化矿山数据分成基础类、生产类、安全类和管理类四大主题域分组,如图6所示。以生产类主题域分组为例,对智能化矿山数据分类最终结果进行阐述,主题域可理解为煤矿生产的各个业务场景,可划分为采煤、掘进、主运输、辅助运输、通风等;以掘进主题域为例,业务对象可理解为掘进业务场景中重要的系统组成及功能模块,可划分为掘进设备、支护系统、运输系统、集控系统等。数据实体可理解为描述业务对象某些业务特征的属性集合。以掘进设备该业务对象为例,根据业务特征的不同可分为掘进机、连采机、掘锚机、盾构机等数据实体。属性用于描述业务对象在某方面的性质和特征。以掘进机为例,属性包括编号、使用单位、型号等静态数据,运行状态、行进方向、截割速度等实时运行类数据以及报警类数据、故障类数据等。
图6 智能化矿山数据分类层次
其他主题域分组分类结果如图7所示。其中基础类主题域分组分为证照信息、机构、地质条件、开采条件、灾害条件和IT基础设施6个主题域;生产类主题域分组分为采煤、掘进、供配电、提升、主运输、辅助运输、通风、压风、供水、排水、降温制冷、选煤、调度管理、生产技术管理、生产计划管理、机电管理和爆破管理17个主题域;安全类主题域分组分为顶板管理、冲击地压防治、火灾防治、瓦斯防治、粉尘防治、热害治理、安全监控、井下作业人员监控、视频监控、通讯联络、风险分级管控、事故隐患排查治理、上级安全检查、不安全行为管理、事故管理、安全培训、职业健康、应急管理和环境保护20个主题域;管理类主题域分组分为人力资源管理、财务管理、审计管理、物资管理、设备管理、运销管理、节能减排管理、科技管理、项目管理、法务管理、综合管理和信息化管理12个主题域。各主题域下均细分业务对象、数据实体与属性。
图7 智能化矿山数据主题域分组及主题域示例
4 智能化矿山数据分类与编码示例
以安全类主题域分组为例,展示智能化矿山数据分类与编码结果。由图5可知,将IDEF0方法和UML方法结合使用,自上而下对智能化矿山数据业务对象等进行识别分类,得到安全类主题域分组分为顶板管理、冲击地压防治等20个主题域。以顶板管理主题域为例,顶板管理主题域编码为MJC01,其可细分为采煤工作面顶板防治、掘进工作面顶板防治、巷道特殊区域顶板防治、采煤工作面支架工作阻力监测、锚杆(索)应力监测、顶板离层监测、巷道围岩变形观测和巷道表面位移监测等8个业务对象,其编码依次为MJC0101、MJC0102、MJC0103、MJC0104、MJC0105、MJC0106、MJC0107和MJC0108。顶板管理分类见表1。
表1 顶板管理分类
上述8个业务对象可进一步细分为多个数据实体,比如,采煤工作面顶板防治细分为采煤工作面顶板基本信息、采煤工作面回采基本信息、工作面顶板被动支护、巷道顶板主动支护、巷道顶板被动支护、来压期间顶板防治、断层等构造带顶板防治和冒顶处理等8个数据实体,其编码依次为MJC0101001、MJC0101002、MJC0101003、MJC0101004、MJC0101005、MJC0101006、MJC0101007和MJC0101008。
智能化矿山数据分类层级体系中的每项数据实体均具有独特的属性,进而每项数据实体可进一步细分为具体属性,并使用唯一代码进行标识。以采煤工作面顶板基本信息(MJC0101001)这一数据实体为例,对其属性进行识别并编码,见表2。可见,这一数据实体包含采煤工作面名称、采煤工作面编号、工作面标高、顶板关键岩层厚度、煤层顶板与顶板关键岩层垂距、顶板岩层抗压强度、顶板岩石普氏硬度系数、顶板冲击倾向性鉴定结果、伪顶岩层名称、伪顶厚度、直接顶岩层名称、直接顶厚度、基本顶岩层名称和基本顶厚度等14项属性,其属性编码依次为MJC01010010001、MJC01010010002、MJC01010010003、MJC01010010004、MJC01010010005、MJC01010010006、MJC01010010007、MJC01010010008、MJC01010010009、MJC01010010010、MJC01010010011、MJC01010010012、MJC01010010013和MJC01010010014。
表2 采煤工作面顶板基本信息属性编码
5 结语
结合智能化矿山数据融合共享活动特点,阐述了面向智能化矿山数据共享活动的数据分类与编码的基本原则,提出了智能化煤矿数据分类及编码的方法。智能化矿山数据分类采用IDEF0建模方法,自顶向下对智能化矿山的业务进行全面分析,对智能化矿山的生产经营活动进行分解,将其划分为最小业务单元,以此为依据,再运用UML建模方法,分析各最小业务活动的对象和属性,从中提取数据元。智能化矿山数据编码按照主题域分组、主题域、业务对象、数据实体和属性依次以字母或数字进行编码。本研究所提出的智能化矿山数据分类与编码方法,为智能化矿山数据融合共享规范体系的建立提供了基本依据和方法体系。