APP下载

信用风险预警的MA—RSFNN模型构建与应用

2013-04-29黄福员

智能计算机与应用 2013年6期
关键词:粗糙集

摘要:为了克服模糊神经网络的维数灾难、结构复杂、局部早熟及收敛慢等缺陷,在设计一种模糊神经网络的基础上,将模因算法和粗糙集理论引入模糊神经网络,提出一种模因进化型粗糙模糊神经网络(MA-RSFNN)。新模型借助模因算法的全局搜索能力减少网络陷入局部极值的可能性,同时利用粗糙集知识约简对网络输入数据进行降维消冗,精简输入维度,避免“维数灾难”。实例仿真结果表明MA-RSFNN模型的预测准确性较高,是一类解决金融风险管理中高维复杂问题的有效方法。

关键词:信用风险预警; 模糊神经网络; 模因算法; 粗糙集

中图分类号:TP301.6 文献标识码:A文章编号:2095-2163(2013)06-0010-05

0引言

近年来,人工神经网络已广泛应用于信用风险预警等金融风险管理领域,研究表明神经网络预测准确性优于统计判别分析等传统预警方法,但其中的“黑箱”操作等缺陷却也导致了神经网络在信用风险管理领域的应用遭到多方质疑[1-2]。源自模糊理论与神经网络相融合的模糊神经网络(Fuzzy Neural Network,FNN)提高了网络的透明性、启发性及鲁棒性,在一定程度上克服了神经网络的“黑箱操作”,然而FNN也存在“维数灾难”、结构复杂、学习算法冗长、局部早熟等问题,由此也限制了其在金融风险管理领域中的应用[3]。据此,本文试图在对模因算法(Memetic Algorithms,MA)进行改进的基础上,结合粗糙集(Rough Set,RS)和模糊神经网络提出一种模因进化型粗糙模糊神经网络(MA-RSFNN)模型,旨在利用模因算法进行模糊神经网络的训练学习,发挥模因算法的全局优化能力,消减网络陷入局部早熟的可能性,使网络具有进化和学习的双重智能,同时借助粗糙集知识约简精炼训练集、降低输入维度,避免“维数灾难”现象。

1模因算法

模因算法(Memetic Algorithms,MA)由Moscato和Norman等人于1992年提出,是一种超启发式全局搜索混合算法,主要思想源自道金斯的文化进化思想和达尔文的自然进化法则[4]。其原理是在全局搜索策略中有机集成局域搜索策略,利用局部搜索策略的局部寻优能力提高算法的性能和收敛速度。相关研究表明模因算法在搜索过程中兼顾深度和广度,不仅有较强的全局寻优能力,同时算法收敛速度快,在许多问题上的求解获得了比遗传算法收敛速度更快[6-9]。

经典的模因算法通常采用遗传算法作为全局搜索策略,因此算法流程与遗传算法类似。根据文献[5],模因算法的流程如图1所示。

2模因算法改进

模糊神经网络的训练学习是一个连续函数优化过程,以遗传算法为基础的模因算法能有效求解组合优化问题,但对连续空间问题的求解则效率不高。粒子群算法是一种源自对鸟类等生物群体觅食行为进行模仿的实编码优化算法,其概念简单、结构简洁,是求解实编码优化问题的有力工具。本文提出一种以粒子群算法为全局搜索策略,BP算法为局部搜索策略的改进型模因算法,以期设计出一种高效的模糊神经网络学习算法。

粒子群算法(Particle Swarm Optimization ,PSO)是一种基于群体智能的全局优化算法,其灵感源自鸟群、蚁群等生物群体的觅食过程[10-11]。目前,具有概念简单、算法简洁、隐含并行及全局收敛等优点的粒子群算法已广泛应用到决策分析、知识发现等领域[12-13],并取得了丰硕研究成果。基本粒子群算法的数学描述如下[10]。

假设一颗微粒代表寻优空间中的一个解,算法初始化时随机生成一定数量的微粒构成种群,而后通过不断随机有向迭代寻求问题最优解。在迭代过程中,微粒通过跟踪个体及种群历史最优值,按式(1)、(2)不断调整个体的速度和位置以实现向最优解靠拢。

其中,式(3)为速度vij的调整量;速度vij为位置xij的调整量;w∈[0.4,0.9]为惯性因子;c1=c2=2.0为学习因子; r(·)∈(0,1)为随机数;pij和pg分别为个体及群体历史最优值。

2.2改进型模因算法

改进型模因算法基本流程如图2所示。

3模因进化型模糊神经网络

3.1网络结构

信用风险预警通常为多输入单输出的问题,参照文献[14-15]设计的模糊神经网络拓扑结构如所图3所示。

3.2网络学习算法

(1)编码。微粒的坐标值代表了模糊神经网络的模糊参数与权值,其编码如图4所示。

其中,yi为实际输出;yi为期望输出,P为群体规模。

(3)算法步骤。学习算法的主要步骤如下:

步骤一:初始化。设置全局搜索策略和局部搜索策略的相关参数,随机生成种群。

步骤二:BP算子。采用BP算法对每个个体进行局部寻优。

步骤三:算法终止判断。如果算法满足终止条件则跳转步骤六,否则跳转步骤四。

步骤四:PSO算子。①根据式(4)计算每个个体的适应值;②个体及群体历史最优位置调整;③按式(1)调整微粒速度;④按式(2)调整微粒位置。

步骤五:BP算子。采用BP算法对每个个体进行局部寻优,产生新群体,跳转步骤三。

步骤六:算法结束。

其中,算法终止条件:① MSE<ε,ε为预先给定足够小的数;②算法迭代次数>最大进化代数。

BP算子的目标函数为式(4)所示的适应值函数,学习过程中,网络参数与权值按以下数学公式作调整:

上述模因进化型模糊神经网络采用模因算法对网络进行学习与训练,使得模型具备了学习与进化的双重智能,但该模型也存在一般模糊神经网络的“维数灾难”现象。为此,采用粗糙集知识约简对模型输入数据进行前置处理,简化训练集、减少输入维数,从而降低网络结构的复杂程度,避免“维数灾难”现象。前置处理的主要步骤如下:

(1)指标初选和数据预处理

在考虑数据可获取性的前提下初步建立预警指标体系,指标体系要求涵盖各方面的信息,力图从全方位、多层次反映信用风险特征。

数据预处理主要是根据指标的特性,对连续型预警指标的数据进行离散化处理。数据离散化的原则是保持数据集分类或决策能力不变的前提下尽可能压缩数据。

(2)建立决策表

以指标初选和数据预处理后的数据为基础,建立如表1所示的决策表。

(3)知识约简

对建立的决策表进行约简处理,得到条件属性的相对约简,选取相对约简所代表的预警指标组成指标集作为模型的输入指标体系。

5模型在信用风险中的应用

从商业银行的角度看,信用风险是指借款人的违约而造成的损失可能性。本文从商业银行的企业贷款违约方面研究模型在信用风险评估中的应用,以检验模型在金融风险管理领域中的应用成效。

5.1指标初选与数据采集

在研究国内外相关成果的基础上,参考相关商业银行的企业绩效评价指标体系[16-19],选择涵盖企业盈利能力、偿债能力、成长能力及营运能力等方面的共21个指标构成初选指标集,如表2所示。

5.2粗糙集前置处理

(1)数据离散化与决策表的建立

采用等频率划分算法在保持数据分类能力的前提下对数据进行离散化处理,断点集数k可通过试验获得,一般取k=3。在数据离散化的基础上,以初选指标为条件属性,属性Bc(1:贷款违约公司,0:贷款正常公司)为决策属性,建立信用风险预警的决策表,如表3所示。

(2)属性约简

5.3模型训练学习

学习算法的相关参数初始化如下:

(1)模糊子集数设为3(代表高、中、低),则该模型为6-18-3-1结构的模糊神经网络,输出Y为企业违约信号(1:违约;0:不违约)。

(2)参数初始化。网络的模糊参数及权值随机初始化,隶属中心∈[-1,1],隶属宽度∈(0,1],耦合权值∈(-1,1)。

(3)模因算法的参数设置。PSO算子随机生成规模M=30的种群,w=0.729, c1=c2=1.49,[Vup,Vdown]为[-1,1],Vmax=0.3,BP算子的学习率η=0.005。

(4)训练终止条件:①适应值<0.000 5;② 模因算法迭代次数>10 000。

在Matlab7.0环境中,编程实现上述的模型与算法,采用训练数据集的150份数据对模型进行训练学习,训练过程误差变化如图5所示。经过3 000多代的进化,MSE达到了0.000 281。

采用测试集的数据对预警模型进行仿真实验,表4汇总了三类模型的实验结果,从中可以看出MA-RSFNN模型的预测准确率高达90%,相比BP神经网络及单纯模糊神经网络均有了大幅度提高。无论是第一类错误还是第二类错误MA-RSFNN模型的表现都最好。

6结束语

模糊神经网络具有启发性、透明性等特征,可处理模糊信息,能避免神经网络的“黑箱操作”,但其存在“维数灾难”现象、结构复杂及收敛性差等缺陷。本文所提出的MA-RSFNN模型将模因算法和粗糙集理论融入模糊神经网络,发挥模因算法的全局搜索能力提升模糊神经网络的学习能力,借助粗糙集知识约简的降维消冗能力对训练数据进行降维消冗处理,从而精简网络结构,避免网络陷入“维数灾难”。应用实例的结果表明了新模型的有效性,可望为金融风险管理提供一种新方法和新思路。

参考文献:

[1]MIN J H, LEE Y C. Bankruptcy prediction using support vector machine with optimal choice of kernel function parameters[J]. Expert Systems with Applications, 2005, 28 :603-614.

[2]BAHRAMMIRZAEE A. A comparative survey of artificial intelligence applications in finance: artificial neural networks, expert system and hybrid intelligent systems[J].Neural Comput & Applic,2010,19:1165-1195.

[3]HAMDANI T M, ALIMI A M, FAKHRI K. Enhancing the structure and parameters of the centers for BBF fuzzy neural network classifier construction based on data structure[A]// Proceedings of the International Joint Conference on Neural Networks[C]. Piscataway NJ: IEEE, 2008: 3174-3180.

[4]MOSCATO P. On evolution, search, optimization, genetic algorithms and martial arts: towards memetic algorithms[A]//Tech. Rep. Caltech Concurrent Computation Program [C]. Pasadena, California, USA, 1989: 1-67.

[5]NORA S,CHRISTIAN S, ANDREAS Z.A memetic clustering algorithm for the functional partition of genes based on the gene ontology[C]//Proc of the 2004 IEEE Symposium on Computational Intelligence in Bioinformatics and Computational Biology.San Diego,USA,2004:252-259.

[6]DAWKINS R. The selfish gene[M].UK:Oxford University Press,1976.

[7]MOSCATO P, NORMAN M G. A memetic approach for the traveling salesman problem-implementation of a computational ecology for com-binatorial optimization on message-passing systems[C]// Proceedings of the International Conference on Parallel Computing and Transport Applications. Amsterdam:IOS Press,1992: 177-186.

[8]RADCLIFFE N J, SURRY P D. Formal memetic algorithms[J]. Evolutionary Computing, 1994,865: 1-16.

[9]XU Xin,HE H G.A theoretical model and convergence analysis of memetic evolutionary algorithms[C]//Proc of Int Conf on Natural Computation.Changsha,2005:1035-1043.

[10]KENNEDY J. EBERHART R C. Particle swarm optimization [A]// Proceedings of IEEE, International Conference on Neural Networks [C]. Piscataway NJ:IEEE, 1995: 1942-1948.

[11]KENNEDY J. The particle swarm: social adaptation of knowledge [A]//Preceedings of Evolutionary Computation [C] ,Indianapolis: IEEE, 1997:303-308.

[12]EBERHART R C, SHI Y H. Particle swarm optimization: developments, applications and resources [A]//Proceedings of the IEEE Congress on Evolutionary Computation [C]. Piscataway, USA: IEEE Service Center, 2001:81-86.

[13]吴启迪,汪镭. 智能微粒群算法研究及应用[M]. 南京:江苏教育出版社,2005-04.

[14]AKAGI T, SUGENO M. Fuzzy identification of systems and its application to modeling and control[J]. IEEE Transactions on Systems, Man, and, Cybernetics, 1985,15(1): 116-132.

[15]黄福员. 金融风险预警的MPSO-FNN模型构建与应用[J]. 计算机工程与应用,2009,45(14):210-212.

[16]ALTMAN E I, MARCO G, VARETTO F. Corporate distress diagnosis: comparisons using linear discriminant Ana analysis and neural networks[J]. Journal of Banking and Finance, 1994, 18: 505-529.

[17]李志辉, 李萌. 我国商业银行信用风险识别模型及其实证研究[J]. 经济科学, 2005(5): 61-71.

[18]财政部统计评价司. 企业绩效评价问答[M]. 北京:经济科学出版社, 1999.

[19]章彰. 解读巴塞尔新资本协议[M]. 北京: 中国经济出版社, 2005.

猜你喜欢

粗糙集
粗糙集与包络分析下舰船运行数据聚类算法
局部多粒度覆盖粗糙集
基于Pawlak粗糙集模型的集合运算关系
基于二进制链表的粗糙集属性约简
基于粗糙集的不完备信息系统增量式属性约简
优势直觉模糊粗糙集决策方法及其应用
基于键树的粗糙集属性约简算法
悲观的多覆盖模糊粗糙集
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用