基于粗糙径向基函数的瓦斯涌出量预测
2010-11-02付优
付 优
(1.太原科技大学 计算机科学与技术学院,山西 太原 030024;2.山西建筑职业技术学院 计算机工程系,山西 太原 030006)
基于粗糙径向基函数的瓦斯涌出量预测
付 优1,2
(1.太原科技大学 计算机科学与技术学院,山西 太原 030024;2.山西建筑职业技术学院 计算机工程系,山西 太原 030006)
针对径向基网络对训练样本要求高的情形,将粗糙集和径向基神经网络相结合,提出粗糙径向基神经网络的方法,利用粗糙集对数据进行属性规约,得到适合径向基网络要求的数据,进而提高了其训练速度以及精度。将该方法应用在瓦斯涌出量预测的实验中,并将粗糙径向基神经网络和BP网络的预测结果进行对比,可以得出粗糙径向基网络预测效果比BP的效果好的结论,同时证实该方法的可行性。
粗糙集;径向基神经网络;瓦斯涌出量
1.引言
在煤矿生产过程中,瓦斯是一个危险因素,瓦斯的主要成分是甲烷。如果不注意瓦斯浓度的变化,会出现一系列的灾难,如瓦斯浓度过高,将造成人呼吸困难,甚至死亡;爆炸等大规模的灾害。当今,可以使用各种技术、方法对瓦斯浓度、瓦斯涌出量进行预测,而为了避免矿难的发生,对瓦斯浓度、瓦斯涌出量的预测成为必然。
影响瓦斯浓度、瓦斯涌出量的因素很多,如煤层深度,通风情况等等,而这些因素是非线性的,这对预测造成一定的困难。近年来,随着学者对神经网络的进一步研究表明,神经网络对解决高维非线性情况有及其优越的性能:如BP神经网络,SOM神经网络,径向基函数(RBF)神经网络等,从而可以使用神经网络的方法实现瓦斯涌出量的预测,本文将使用RBF神经网络对瓦斯涌出量进行预测。瓦斯涌出量数据由于各种因素在收集过程中会造成数据中含有噪声,而RBF神经网络对训练样本的要求很高,这样会对预测精度噪声影响,因此为了提高预测准确性以及预测精度,引入粗糙集(Rough Set)理论,形成粗糙RBF神经网络。在实验中,也进一步证实了该方法的可行性。
2.粗糙集
粗糙集是由波兰科学家Z.Pawlak[1]于1982年针对 G.Frege的边界线区域思想提出的,在解决问题过程中,Z.Pawlak将无法确定的个体划分到边界线区域,将该区域定义为上近似集和下近似集之差集。粗糙集在分析处理不精确数据、不完整知识方面有其优越之处。粗糙集处理问题时是以分类机制为基础,将处理的数据进行分类即等价关系,形成概念以及规则,从而实现知识的发现,达到解决问题的目的。[2]
如果将一个知识库定义为一个关系系统:
其中 U为非空集合,称为全域或论域,它是所有需要讨论的个体的集合,R是U上等价关系的一个族集。
如果非空 P⊆R,那么 P中所有等价关系的交集称为P上的一种不可区分关系,或者可称难区分关系,记作 IND(P),即
在关系系统 K=(U,R)上,如果子集 X⊆U,那么可以将 X称为U上的一个概念,在形式上,空集也可以认为成一个概念;非空子族集 P⊆R所产生的不分明关系IND(P)的所有等价类关系的集合 U/IND(P),称为基本知识,相应的等价类则称为基本概念;特别地,若关系 Q∈R,则关系 Q就称为初等知识,相应的等价类就称为初等概念。根据上述定义,概念是对象的集合,概念的族集(分类)就是 U上的知识,U上分类的族集可以认为是U上的一个知识库,或说知识库即是分类方法的集合。在上述定义的基础上可以定义粗糙集的下近似,上近似。
X的下近似:
如果BNR(X)是一个非空集合,则集合 X就是一个粗糙概念。下近似包含了所有使用知识R可确切分类到X的元素,上近似则包含了所有那些可能是属于 X的元素。概念的边界区域由不能肯定分类到这个概念或其补集中的所有元素组成。此时称为集合 X的R-正区域,称为集合 X的R-反区域。
假设 P是等价关系的一个族集,且 P∈R,如果 IND(R)=IND(R P),则称关系 P在族集R之中是可省的,否则关系 P在族集R之中是不可省的。若族集 R中的每个关系P都是不可省的 则称族集 R是独立的,否则就是依赖的或非独立的。
若 Q⊆P是独立的,并且 IND(Q)=IND(P),则称 Q是关系族集 P的一个约简 。在族集 P中所有不可省的关系的集合称为P的核。
3.RBF
Powell在1985年提出了多变量插值的径向基函数方法,之后在 1988年,J.Moody和 C.Darken提出的径向基函数(Radial Basis Function,简称RBF)神经网络,RBF神经网络是模拟人大脑中局部调整以及区域可以相互覆盖接受域特点而形成的神经网络结构,它是一种单隐层前馈型网络,[3,4,5,6]由输入层、隐层和输出层构成,其中隐层的个数是一。
RBF基本思想是:隐含层空间由一些使用RBF作为隐单元的“基”构成,这样可以直接将输入矢量映射到隐空间,如果可以确定RBF的中心点,则这种映射关系相应地也可以确定[7]。
RBF的构成包括三层,如图1是一个 n-h-m的RBF结构,即网络有 n个输入,这 n个输入经过h个节点组成的隐层,可以得到 m个输出。这三层网络分别有着不同的作用:
(1)输入层由 n个节点组成:
通过输入层可以将数据输入到RBF网络中,实现了网络与外部环境的交互。
图1 RBF网络模型
(2)第二层隐层,RBF网络仅有的一个隐层,由径向基函数构成。它的作用是从输入层进入到RBF网络的数据进行非线性变换到达到隐层;在大多数情况下隐层空间比输入层空间有较高的维数,这样有利于预测,分类。径向基的类型有很多,如:
常用的径向基为高斯径向基函数(GRBF):
(3)第三层是线性输出的输出层,它对输入层输入的信号、数据提供响应,通常可以由简单的线性函数构成。[8]
数据 X由外部通过环境通过输入层进入到RBF网络,经过径向基函数的左右转换到更高维度空间,在隐层与输出层之间的权值调整下,由输出层输出结果。
RBF网络的性能主要取决于隐藏层函数的中心和输出权值的调整。
当径向基函数采用高斯径向基函数时候,隐藏层函数的中心可以由公式(14)求得:
相应地,方差可以由公式(15)求得:
其中 dmax是样本点到中心的最大距离,I是隐单元个数。
4.实验仿真
在对RBF训练过程中,一个影响RBF网络性能的关键因素是中心的选取,从现有中心选取的方法来看,本质上是利用聚类的方法将中心向量位于输入空间的一个重要区域。在本文中利用粗糙集处理数据的优势,将粗糙集作为RBF的前置处理器,这样可以对数据属性进行规约,保留了数据的关键属性,可以加快RBF的训练速度,以及提高RBF的性能。
实验的流程为:
(1)将数据离散化。实验过程中需要的数据是离散型数据,进入RBF网络的数据应该是离散型数据。
(2)数据属性规约。使用粗糙集理论对数据的属性进行规约,这样可以减少非关键属性,保留关键属性,这样有利于提高RBF的训练速度。
(3)训练 RBF网络。使用2中的数据,可以对RBF网络进行训练,使得RBF网络可以实现预定目的。
(4)预测。使用训练完成的RBF网络对瓦斯涌出量的预测。
为了验证模型的性能,本文采用157组数据对模型进行训练,表1是部分训练数据,23组数据进行预测,并与实际值以及RBF预测数据进行对比,表2是部分预测数据的比较。在表1以及表2,煤层深度/m,煤层厚度/m,日产量/(t/d),风速/(m/s)是影响瓦斯涌出量的不可省略因素。
图2 实验流程
表1 训练数据
表2 预测数据以及比较
为直观观察预测情况,将粗糙RBF和BF模型得到的预测值以及实际值在图5中显示,从中可以看出由粗糙RBF模型得到的预测值比BP模型得到的预测值更接近实际值,即粗糙RBF比BP预测的准确度更好。相应的将2种模型的相对误差率显示在图4中,也可以得到相似的结论,这主要因为粗糙集对数据属性进行规约,得到满足RBF的条件的数据,以及RBF比BP有更好的预测性能。
5.结论
RBF网络在处理含有噪声的数据时的效果不佳,而粗糙集的数据预处理有一定的优势,将粗糙集与RBF网络相结合,粗糙集座位RBF的前置处理器,对数据进行处理,使得RBF可以更好的处理数据,得到更好的数据精度。与BP网络对比,这样的粗糙RBF的效能要比BP的好,这一结论可以在试验中得到进一步的证实。
图4 相对误差
[1]Pawlak Z.Rough[J].International Journal of Computer and information Science,1982(11):341-356.
[2]王国胤,姚一豫,于 洪.粗糙集理论与应用研究综述[J].计算机学报,2009(7):1229-1246.
[3]党开放,杨利彪.一种新型的广义RBF神经网络及其训练方法[J].计算技术与自动化,2007,26(1):9-13.
[4]赵志刚,单晓虹.一种基于遗传算法的RBF神经网络优化方法[J].计算机工程,2007,33(6):211-212.
[5]Meng Joo Er,Shiqian wu,Juwei LU.Face recongnization with radial basis function(RBF)neural networks[J].IEEE Trans.On Neural Networks,2002.13(3):697-710.
[6]陈政,杨天奇.基于 RBF神经网络的股票市场预测[J].计算机应用与软件,2010(6):108-110.
[7]姜静清,宋初一,刘娜仁,等.RBF神经网络的训练方法及分析[J].内蒙古民族大学学报(自然科学版),2003,18(4):301-303.
[8]吴涛,张铃,张燕苹.机器学习中的核覆盖算法[J].计算机学报,2005,28(8):1295-1301.
[责任编辑:曲卫华]
Forecasting Gas Emission Based on Rough Set RBF
FUYou1,2
(1.Computer Science and Technology Institute,Taiyuan University of Science and Technology,Taiyuan,030024,China;2.Computer Engineering Department,Shanxi Architectural Technology Institute,Taiyuan,030006,China)
As RNF has high requirements on the training samples,we can combine rough set with RNF and get a method of rough set RNF.By stipulating the data with rough set,we can get the data which can meet the requirements of RNF.Thus the training speed and accuracy can be increased.We apply this method in the forecasting experiment of gas emission,and compare the prediction result of rough set RNF with that of BP net,we can conclude that the prediction result of rough set RNF is better than that of BP.At the same time we confirm that this method is feasible.
rough set;RBF;gas emission
TP319
A
1671-5977(2010)03-0120-04
2010-07-10
付 优(1984-),女,山西太原人,太原科技大学计算机科学与技术学院在读硕士研究生,山西建筑职业技术学院计算机工程系助教。