基于聚类算法的动力用煤资源质量评价方法与应用研究
2024-04-02谈鹏菲顾承串吴基文顾佳一
谈鹏菲,顾承串,詹 润,吴基文,顾佳一
(1.安徽理工大学地球与环境学院,安徽 淮南 232001;2.安徽省煤田地质局勘查研究院,安徽 合肥 230088;3.安徽大学资源与环境工程学院,安徽 合肥 230000)
动力用煤一般指的是发电、工业锅炉、窑炉、船舶以及蒸汽机等用煤统称,包括褐煤、无烟煤和烟煤中的长焰煤、1/2 中黏煤、不黏煤、弱黏煤、贫煤等[1]。我国作为世界上最大的能源生产国和消费国,动力用煤占国内煤炭消费的80%以上。在“双碳”目标战略与能源结构转型的背景下,煤炭清洁和高效利用日益受到重视[2]。煤炭分级和煤炭分质利用则是实现煤炭清洁利用的重要环节。
针对煤炭质量分级,前人开展了大量研究。袁三畏[3]最早主要依据煤质指标,将煤质划分为优等质量煤、中等质量煤、低等质量煤3 个等级。21 世纪以来,煤炭质量分级方面的研究又分为两个方向。一是研究煤的“洁净等级”,主要关注煤中的有害物质。唐书恒等[4]致力于煤炭资源洁净等级评价研究,采用层次分析和模糊分析的方法建立了“五分法”的煤炭资源洁净等级评价体系;胡广青[5]运用对比加权标度指数法,建立了适用于淮南煤田的洁净煤评价体系。二是依据用途来研究煤炭资源“优质环保等级”,在考虑煤中有害物质的同时,结合不同用途对煤质各项指标进行综合评价。秦云虎等[6-7]采用加权平均法统计基本煤质参数和有害微量元素含量,建立了动力用煤和炼焦用煤的优质环保等级构架;魏迎春等[8]考虑了动力用煤、炼焦用煤和化工无烟煤3种用途,并分别建立了基于灰色关联分析的煤炭资源优质等级评价体系。
对于动力用煤质量划分,部分学者也进行了相关探讨。黄福臣等[9]选用我国主要动力用煤产区的煤样作为评价对象,将动力用煤标准分为五级,采用灰色关联分析法和模糊综合评判法对动力用煤质量进行评价。马荣等[10]以云南省昭通-曲靖赋煤构造带中动力用煤资源作为研究对象,通过层次分析法确定权重,并对评价体系中各参数给予合理的赋值,从而对动力用煤资源进行评价。李静琴等[11]选取9 个动力用煤煤质参数作为评价因子,利用综合标度指数法对各因子进行计算得出综合标度指数,建立了新的动力用煤质量评价体系。总体来说,目前对于动力用煤质量评价多采用层次分析、模糊评价等传统数学方法,这些方法很难达到快速识别、精确划分动力用煤资源的目的。随着技术的进步,机器学习方法逐渐应用于煤炭资源开发[12-13]。因此,选取更为先进、科学的方法对动力用煤资源质量进行评价显得尤为关键。
淮南煤田作为华东地区重要的动力用煤生产基地,目前对于动力用煤的利用多从能源需求角度考虑,没有真正达到分级、分质利用的目标,导致对部分优质动力用煤盲目开采,造成了经济浪费。因此,本文选取淮南煤田8 煤层动力用煤资源作为研究对象,依托前期积累的丰富钻孔煤质数据,采用ISODATA 聚类算法,结合GIS 空间处理功能,对动力用煤资源质量等级进行划分,为淮南煤田动力用煤资源评价与合理开发提供技术支撑。
1 研究区地质背景
淮南煤田地处安徽两淮平原南部,主体位于淮南市和阜阳市境内,是华北板块东南部发育的一个石炭纪-二叠纪聚煤盆地,煤系地层均被新生界松散层所覆盖。淮南煤田含煤地层主要为二叠系的山西组与上石盒子组地层、下石盒子组地层,一般含可采煤层9~18 层,可采煤层总厚度25~34 m[14],其中8煤层为全区主采煤层。研究区目前主要有14 对生产矿井,4 对闭坑矿井,5 处勘查区(图1),其动力用煤资源丰富、储量较大,主要为气煤、1/3 焦煤,次为褐煤、中黏煤和不黏煤等低变质程度煤。各煤类以中灰、中高挥发分、低硫、中高热值煤为主,次为低灰、中挥发分、特低硫、中热值煤,是良好的发电与制造水泥回转窑的燃料[15]。根据市场需求与各矿井实际生产销售情况,目前,大部分1/3 焦煤也作为动力用煤资源使用,因此,本文将其也作为评价对象。
图1 研究区矿井分布图Fig.1 Distribution map of mines in the study area
2 评价原理与方法
2.1 评价原理
1)ISODATA 聚类算法。ISODATA 算法全称是迭代自组织数据分析法,由K-均值算法改进而来。ISODATA 聚类算法是以空间相似性为原则的非监督分类方法[16],其主要运算思想是:设置聚类分析控制参数,将准备分类的样本值读入,按照与聚类中心距离最小的原则将各样本分类。如果在同一类中样本分布太过密集或者类的数目过少,则根据类内各样本分布标准差,将该类进行分裂操作,否则保留。如果类与类相隔太近,根据类与类之间的距离设置,将其合并,或者是某一类中的样本数目过少而不足以成为一类时,也可以将该类合并到其他类。在分裂与合并操作之后,将新数据集的样本值读入,如此往复地进行分类、判断、分裂或合并操作,如果达到了预计的分类效果,或者操作次数已经达到一定数目,则完成算法[17-18]。因此,相较于其他聚类算法,该算法对大数据运算精度较高。
2)综合指数法。综合指数法基本原理是利用熵权法计算得到的权重和各评价指标的赋值进行累乘,然后相加,最后计算出效益指标综合评价值[19]。熵权法作为一种客观赋值方法,相较于以往传统方法,可依据实际信息量的大小确定影响评价指标的权重[20],因而在大数据处理过程中具有明显的优势。
ISODATA 聚类算法不同于K-均值算法,其可以在聚类过程中自动调整类别个数和类别中心,使聚类结果更加客观,但是在聚类过程中并未将各个指标的重要程度考虑在内。因此,本次在聚类结果的基础上,先通过熵权法计算每一类各指标的权重,再利用综合指数法对动力用煤资源质量等级进行更精确的划分。
2.2 评价方法与步骤
基于ISODATA 聚类算法与综合指数法的煤质数据处理流程分为以下几步。
1)数据选取与预处理。根据淮南煤田动力用煤煤质特征,选取钻孔煤质数据作为评价依据,煤质数据来源于淮南煤田各矿井钻孔煤质表。利用GIS 中数据采集和编辑功能,将数据录入过程中存在错误、冗余及缺失的数据进行处理,坐标缺失、属性值明显错误的数据予以剔除。
2)ISODATA 聚类算法数据处理。将上一步预处理后的煤质数据进行量化处理,借助GIS 空间插值功能,建立不同煤质指标专题图。基于ISODATA聚类算法,设定相关参数,对各个煤质指标专题图进行聚类分析。存储聚类获得的不同簇类煤质指标数据,为下一步数据展布及等级划分作准备。
3)聚类数据展布及等级划分。首先,利用GIS软件,将聚类得到的不同簇类空间分布图投影到地图上,分析不同簇类的分布特点。然后,建立动力用煤资源煤质指标评价体系,利用熵权法计算每一簇类各个指标的权重,求出各钻孔点的煤质质量综合评价值,并对每个簇类动力用煤资源进行质量等级划分。
3 评价指标选取及数据归一化
3.1 评价指标的选取
动力用煤资源评价指标的选取对于评价体系与专题图的建立以及评价结果起着关键的作用。根据前人对动力用煤的研究成果[21-22],结合淮南煤田实际煤质资料,充分考虑经济性和环保性两方面影响,选取煤的发热量、灰分、硫分、挥发分、软化温度和可磨性指数作为8 煤层动力用煤资源的评价指标。
1)发热量是动力用煤资源的首要质量指标,煤的发热量对锅炉设计和燃烧设备选型以及燃烧方式均有着重要影响。
2)灰分是煤中的不可燃成分,反映煤中矿物质的数量和成分,无论是对着火引燃还是稳定燃烧都有不利的影响,所以原煤的灰分必须加以限制。
3)硫分作为煤中的有害成分,是燃煤过程中最重要的污染源。在燃烧时,煤中绝大部分硫分将被转化为二氧化硫,随烟气排向大气,造成环境污染,危害人身健康,所以对硫分也应加以限制。
4)挥发分是煤在隔绝空气条件下受热分解后的产物,其高低在一定程度上反映了煤着火引燃的难易程度。一般来说,煤的挥发分越高,越易着火。
5)软化温度影响着用煤设备的燃烧及排渣方式的选取,软化温度与设备相匹配才能保证生产的安全性。
6)可磨性指数是表征燃煤磨制成粉难易程度的特性指标,可磨性指数越大则越容易粉碎,可降低生产成本。
3.2 数据归一化
利用预处理后的钻孔数据,对8 煤层动力用煤资源评价指标进行量化处理。结合淮南煤田8 煤层的钻孔分布特点,借助GIS 中的反距离权重空间插值功能,分别建立发热量、灰分、硫分、挥发分、软化温度和可磨性指数6 个评价指标的专题图(图2)。
图2 评价指标专题图Fig.2 Thematic map of evaluation indicators
由于各聚类指标分属不同类别,需要对各指标进行归一化处理。根据经济环保性,可分为正向指标(发热量、挥发分、软化温度、可磨性指数)与逆向指标(灰分、硫分)。正向指标与动力用煤资源质量呈正相关,量化值越大,质量越好;反之则越差[23]。
正向指标归一化公式见式(1)。
逆向指标归一化公式见式(2)。
式中:yj为归一化处理后数据;xj为归一化前各主控因素的量化值;max(yj)和min(xj)分别为各聚类指标量化值的最大值和最小值;j为样本个数。
利用GIS 中模糊分类工具对评价指标专题图分别进行归一化处理,得到指标归一化专题过程图,为后续的聚类与评价奠定基础。
4 评价结果与分析
4.1 基于ISODATA 算法的动力用煤聚类分析
由于GIS 中的ISODATA 算法需要人为输入所预期的分类数,其受主观因素影响较大,而且ISODATA算法是在K-均值算法的基础上增加对聚类结果的“合并”和“分裂”两个操作。因此,利用K-均值算法的手肘图可以确定ISODATA 聚类过程中的预期分类数,如图3 所示。由图3 可知,当K为3 时,折线上对应的点明显位于折线的肘部,故本次聚类的预期分类数设定为3。在以往研究的基础上[24],通过多次试验,设置其他参数:最小类大小为30、采样间隔为100、迭代次数为45。
图3 手肘法K 值折线图Fig.3 K-value line chart of elbow method
经GIS 数据整理后,选取372 个钻孔点为数据源,这些钻孔点空间上均匀分布。通过GIS 中ISODATA聚类算法将钻孔煤质数据最终分为3 类(图4)。其中,第一簇类数据样本共115 个,占样本总数的30.9%,主要分布在口孜西井田西南部、口孜东矿东南部、杨村矿北部、顾北矿东部、潘集外围及阜凤逆冲断裂构造带深部,这些地区8 煤层埋深普遍较大,且煤化程度低。第二簇类共110 个样本,占比29.6%,主要分布在杨村矿南部、刘庄矿中西部、顾桥矿、张集矿、丁集矿东部、潘三矿、潘二矿和潘一矿等地区,这些地区构造较为复杂,局部有岩浆岩发育,地温梯度与煤化程度均较高。第三簇类共147 个样本,占比39.5%,主要分布在板集矿、口孜东矿西部、谢桥矿、新集一矿、新集二矿、顾桥矿、朱集西矿、朱集东矿、李嘴孜矿、新庄孜矿和谢一矿。总体来看,第三簇类分布较分散且面积较大,煤化程度普遍较低。
图4 聚类结果图Fig.4 Diagram of clustering results
对比3 个簇类相关指标参数属性信息(图5),可以看出第一簇类具有较高的灰分、挥发分和较低的发热量;第二簇类煤的软化温度和可磨性指数较高,硫分含量相对较小;第三簇类的灰分、挥发分、软化温度和可磨性指数较小,发热量较大。通过聚类结果可知,3 个簇类的硫分、挥发分和可磨性指数差异相对较小,但发热量、灰分、软化温度差异较大,是产生聚类现象的主要原因。其中,第二簇类煤质总体上较好,其次为第三簇类,第一簇类的煤质相对最差。因此,通过ISODATA 聚类算法可达到对淮南煤田动力用煤资源质量快速识别与聚类的目的。
图5 不同簇类钻孔煤质参数统计图Fig.5 Statistical diagram of coal quality parameters of different cluster boreholes
4.2 基于综合指数法的动力用煤资源等级评价
为了更精确划分淮南煤田动力用煤资源的质量等级,在聚类结果的基础上利用综合指数法对每一簇类的动力用煤资源进行等级划分。ISODATA 聚类算法的优势在于对大数据的分析较为客观、准确,但缺少对评价指标的权重计算。综合指数法则可利用熵权法确定指标权重。相比于其他权重计算方法,熵权法可以融合客观信息,从而弥补综合指数法具有一定主观性的不足。因此,将两种方法结合会使结果更为科学合理。
4.2.1 熵权法确定各指标权重
为了更准确划分动力用煤资源的质量等级,本文将结合熵权法对聚类结果的每一簇类进行动力用煤资源质量等级评价。在运用熵权法确定各评价指标的权重时,首先要计算第i项评价指标中第j个数据的比重,其计算公式见式(3)[25]。
式中:yij为各评价指标归一化后数值;fij为第j个数据占第i项评价指标的比重。
第i项评价指标的信息熵计算见式(4)。
式中:Hi为信息熵,可反映信息的无序程度;n为评价指标中数据的个数。
则第i项评价指标的熵权计算见式(5)。
式中:Wi为第i项评价指标的权重;m为评价指标个数。
运用熵权法计算得出的每一簇类各评价指标权重见表1。由于实际生产中的权重可能受到其他因素的影响,如经验、主观判断和政策考虑等,这些因素无法被熵权法计算所考虑到,可能导致在生产过程中得出的权重与熵权法计算的权重存在差异。另外,在文献及现行熵权法中选择的信息熵模型也会对最终权重的计算产生质量修正。故此次权重的计算结果具有一定的合理性。
表1 各个簇类评价指标权重Table 1 Weight of each cluster evaluation indexes
4.2.2 综合评价结果
基于动力用煤资源经济性和环保性两方面考虑,根据最新动力用煤规范标准《商品煤质量发电煤粉锅炉用煤》(GB/T 7562—2018)和《商品煤质量煤粉工业锅炉用煤》(GB/T 26126—2018)[26],结合研究区动力用煤煤质特点,将其划分为优质煤、中质煤、低质煤(表2)。
表2 动力用煤资源质量等级Table 2 Quality grade of power coal resources
将每个钻孔的6 个煤质指标值划归到对应等级中,并对其赋值:属于优质煤的赋值为“3”,属于中质煤的赋值为“2”,属于低质煤的赋值为“1”,再依据式(6)求出各钻孔煤质的综合评价值[27]。
式中:Ei为钻孔煤质的综合评价值;xij为第i个煤样中第j个评价指标的赋值;Kj为各个评价指标的权重。
根据综合评价值Ei结果,将每一簇类动力用煤资源分为优质煤、中质煤和低质煤。当2.5≤Ei≤3 时,为优质煤;当2.0≤Ei<2.5 时,为中质煤;当Ei<2.0 时,为低质煤[28-29]。通过以上评价方法,结合GIS 中的空间插值功能,将每一簇类的优质煤、中质煤、低质煤投影到平面上,可得到淮南煤田8 煤层动力用煤资源质量划分综合评价结果(图6)。
图6 不同簇类动力用煤资源质量等级分布图Fig.6 Distribution map of quality grade of power coal resources of different clusters
利用GIS 中的“重分类”和“按属性提取”功能,可以得到3 个簇类动力用煤资源质量等级面积情况,见表3。
表3 各个簇类动力用煤资源质量等级面积Table 3 Quality grade area of each cluster of power coal resources
由图6 和表3 可知,淮南煤田8 煤层发热量、灰分和可磨性指数是产生聚类差异的主要指标因素。在第一聚类中,以发育中质煤、低质煤为主,面积占比分别为50.80%和45.98%,中质煤主要分布于刘庄矿、口孜东矿、顾桥矿和丁集矿附近,低质煤分布于罗园、连塘李井田和潘集外围勘查区,优质煤相对较少且零星分布,面积占比仅为3.22%。第二簇类中以发育优质动力用煤为主,其面积占比达65.40%,其次为中质煤,占比34.17%,低质煤分布面积最少。其中,优质煤主要分布在杨村矿、顾北矿、潘三矿、潘二矿和潘一矿附近。第三簇类中以发育中质煤为主,优质煤相对发育,但明显少于第二簇类,低质煤极少发育,其中,中质煤主要分布在板集矿、口孜西矿、新集一矿、朱集东矿和谢一矿。综合以上分析可知,第二簇类动力用煤资源质量最好,其次为第三簇类,第一簇类动力用煤资源质量相对最差。针对淮南煤田动力用煤资源的不同等级,可实行梯级利用方式,以极大提高煤炭利用率。优质煤应进行保护性开采,加强分类管理,优先保障用于高端钢铁和化工行业等重点领域。中质煤使用范围较广,在尽可能地实现订单需求情况下,采取节约用煤的措施,增强清洁燃烧技术,减少环境污染。低质煤燃烧时易产生污染物和大量灰渣,对环境和设备危害较大。若在调整燃烧工艺后仍难以减少能源浪费和环境污染,应对其限制采购量,寻找其他替代方案,加大技术改进的力度。以上分析结果可为今后淮南煤田动力用煤清洁、高效开发利用提供技术指导。
5 结论
1)基于ISODATA 聚类算法,将淮南煤田8 煤层动力用煤资源煤质数据分为3 个簇类,结合聚类数据分析可知,第二簇类动力用煤资源质量优于第三簇类,第一簇类动力用煤资源质量最差。利用熵权法计算每一簇类各煤质指标的权重,通过综合指数法对每一簇类动力用煤资源进行更精确的等级划分,结果显示第二簇类中的优质煤最多,其次是第三簇类,第一簇类优质煤最少且低质煤最多。
2)淮南煤田动力用煤的发热量、灰分和软化温度是产生聚类现象的主要原因。第三簇类的发热量最高,其次是第二簇类,第一簇类最低;第一簇类的灰分最高,其次是第二簇类,第三簇类最低;第二簇类的软化温度最高,其次是第一簇类,第三簇类最低。硫分、挥发分和可磨性指数在3 个簇类中差异相对较小。
3)3 个簇类的钻孔空间分布显示,第一簇类中质煤、低质煤占比最大,主要分布在刘庄矿、口孜东矿、顾桥矿、丁集矿、罗园矿和潘集外围勘查区。第二簇类优质煤占比较大,主要分布在杨村矿、顾北矿、潘三矿、潘二矿和潘一矿附近。第三簇类中质煤占比较大,主要分布在板集矿、口孜西矿、新集一矿、朱集东矿和谢一矿。