基于粗糙集理论和改进PNN算法的岩爆预测

2021-04-27刘晓悦张雪梅杨伟

华北理工大学学报(自然科学版) 2021年2期

刘晓悦,张雪梅,杨伟

(华北理工大学电气工程学院，河北唐山 063210)

随着矿山越来越深层的开采，岩爆现象极易发生，这些潜在的危险已经影响了矿山的正常开采。岩爆是一种动态破坏现象，是由采矿扰动导致地下工程围岩中累积的应变能突然释放而引起的[1]，它不仅可威胁到矿山人员和设备的安全，而且可影响到矿山建设项目的正常发展。由于现阶段的岩爆预测模型仍存在需要改进的地方，因此，为了保证矿山进行安全平稳的进行深层开采，探索新的理论和方法预测岩爆十分迫切。

准确进行预测岩爆是预防岩爆发生的关键。该项研究采用基于粗糙集理论对采取的岩爆数据进行约简，去除掉不重要的数据，使PNN网络的输入个数减少，降低了PNN网络的复杂性。选择合适的平滑因子，利用PNN训练并建立矿山岩爆预测模型。

1方法原理

1.1 粗糙集理论

粗糙集理论(rough set theory, RS)具有在处理大量数据、消除冗余信息和处理不确定性信息等方面的优势[2]。

1.1.1决策表

S= (U,A,V,f) 是一个信息系统。其中：U为论域；A为属性的非空有限集合，A=C∪D，C∩D≠φ，C称为条件属性集合，D称为决策属性集合；V是所有属性的值域集合；f是信息函数集。对于U中的任意元素x，f：U×A→V，S是决策表。

1.1.2不可分辨关系

由粗糙集理论可知，知识库表示一个关系系统，记作K=(U,R)，近似空间称为K，论域U上的一个等价关系是R，称为关于K的不可分辨关系，记为：

IND(R)={(x,y)∈U×U|∀a∈A,f(x,a)=f(y,a)}

(1)

其中U/IND(R) 是论域U的划分，里面包含的任意元素称为等价类。

1.1.3下近似集和上近似集

子集X关于R的下近似集和上近似集分别为：

(2)

POSR(X)=R(x)称为X的R正域。

1.1.4属性约简

在信息系统的知识库中, 不仅不同知识 (属性) 其作用不同, 而且还有许多多余属性。因此，知识约简不仅保证知识库的分类能力不变, 还要把冗余的知识删除掉。

如果IND(R) =IND(R-{r}) , 称r在R中是可被约去的知识；如果P=R-{r}是独立的, 则P是R的一个知识约简。

在不同的环境和地质条件下，对于影响岩爆发生的因素也会有所不同，所以岩爆预测决策表，就是在保持岩爆发生烈度正确归类的条件下，把岩爆预测决策表中不相关或不重要的影响因素删除掉，最后形成1个最优属性集的决策表。

1.2 概率神经网络

概率神经网络(Probabilistic Neural Network，PNN)是在1989年由D. F. Specht提出的一种以径向基神经网络为基础的前馈神经网络[3]，其中的基函数是高斯函数，并且在故障诊断等模式分类领域应用十分广泛。

概率神经网络的结构[4]如图1所示。

图1 概率神经网络拓扑结构

相比较BP人工神经网络而言，PNN网络的主要优点是：容错能力强、收敛速度快、训练容易、结构简单等。从以上优点可得，该项目采用概率神经网络来构建岩爆预测模型，并且为了减少PNN网络的输入向量将训练的复杂度降低，提高PNN岩爆预测模型的准确率，利用粗糙集理论删除了冗余的数据。

2岩爆烈度预测模型

2.1 岩爆预测指标的选取

建立岩爆评价指标体系的原则是评价指标应能反映岩爆的主要特征和围岩的性质，并能方便地获取数据，选取了5个具有代表性的指标。

岩爆烈度等级通常分为4级：I级(无岩爆活动)、II级(轻度岩爆活动)、III级(中度岩爆活动)、IV级(剧烈岩爆活动)。岩爆预测指标离散化区间[5]如表 1 所示。

表1 岩爆等级分类标准表

2.2 基于粗糙集理论的预测指标约简

决策表构建以岩爆烈度等级指标为条件属性, 岩爆等级为决策属性构建决策表，U表示岩爆实例样本即论域U={1, 2, 3, ……,20}，条件属性集C={C1,C2,C3,C4,C5}，决策属性集D={d}，其中:C1为岩石取样处的埋深H，C2为岩石单轴抗压强度σc，C3为应力系数σθ/σc，C4为脆性系数σc/σt，C5为岩石冲击倾向性指数Wet，D为岩爆等级。将文献[6]中选取的矿山岩爆实例数据进行离散化处理和属性值的约简，得到简化后的决策表如表2所示。

表2 属性值约简后的岩爆预测决策表

论域分别按条件属性和决策属性进行等价类划分得：

U/IND(C)={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15},{16},{17},{18},{19},{20}}

U/IND(D)={{1,2,3,4,5},{6,7,8,9,10},{11,12,13,14,15},{16,17,18,19,20}}

分别依次去掉一个条件属性后的论域等价类划分得：

U/IND(C-C1)={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15},{16},{17},{18},{19},{20}}

U/IND(C-C2)={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15},{16},{17},{18},{19},{20}}

U/IND(C-C3)={{1,9},{2,8},{3},{4},{5,19},{6},{7},{8},{9},{10,14},{11,12},{13},{15},{16,18},{17},{20}}

U/IND(C-C4)={{1},{2},{3},{4},{5},{6,19},{7},{8},{9},{10},{11},{12},{13},{14},{15},{16},{17},{18,20}}

U/IND(C-C5)={{1},{2},{3},{4},{5},{6},{7},{8},{9,14},{10},{11},{12},{13},{15},{16},{17},{18},{19},{20}}

各条件属性下的决策属性的正域：

POCC(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20}

POCC-C1(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20}=POCC(D)

所以，C1在C中是不必要的。

POCC-C2(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20}=POCC(D)

所以，C2在C中是不必要的。

POCC-C3(D)={3,4,6,7,8,9,13,15,17,20}≠POCC(D)

所以，C3在C中是必要的。

POCC-C4(D)={1,2,3,4,5,7,8,9,10,11,12,13,14,15,16,17}≠POCC(D)

所以，C4在C中是必要的。

POCC-C5(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,15,16,17，18,19,20}≠POCC(D)

所以，C5在C中是必要的。

由此可知：该预测决策表中，属性C3、C4、C5是必要的，而属性C1和C2不是必要的。通过进一步分析，该预测决策表的相对约简为X={C3,C4,C5}，所以得到的影响岩爆发生的主要因素是应力系数σθ/σc、脆性系数σc/σt和岩石弹性变形能指数Wet。

2.3 预测模型的建立

PNN矿山岩爆预测模型的建立过程：(1)建立岩爆预测等级的划分标准，进行各指标值的离散化处理；(2)属性值约简。根据粗糙集理论，将矿山岩爆影响因素进行约简，删除掉不必要的属性，得到影响岩爆发生的关键因素；(3)由于不同的物理量有不同的量纲，所以需要对样本数据按照属性进行归一化处理，这样可以减小误差；(4)调整平滑因子的大小，确定最优的PNN网络；(5)训练典型岩爆样本和岩爆等级之间的对应关系，最后使用经过训练后的PNN网络确定测试样本的岩爆级别。

2.4 PNN网络参数的确定

输入向量是上述粗糙集理论的属性约简结果，为3个岩爆预测指标，所以输入层神经元个数是3；训练样本数据15组；所以模式层神经元个数是15；因为有4类岩爆烈度等级，所以累加层和输出层神经元个数是4。由上述可知，建立的PNN网络的拓扑网络结构是3×15×4×4。将数据进行归一化之后，先输入15组训练样本对PNN进行训练，然后使用剩下的5组测试样本来测试PNN网络的性能。

对于PNN网络性能来说，平滑因子(SPREAD)的选择非常重要，因为如果平滑因子太小，很容易导致网络过度拟合；反之，如果平滑因子太大，则无法完全区分细节[7]。PNN网络接近线性分类器。所以需要通过调整平滑因子的大小，确定最佳的PNN模型。通过MATLAB中的newpnn函数建立PNN。经过对平滑因子大小多次的调整，当SPREAD=0.41时，PNN具有极高的收敛性，神经网络训练效果达到最佳。

利用PNN网络进行训练后得到的样本误差平方和变化曲线如图2所示。