APP下载

免疫遗传算法对中国区域经济协调发展的聚类及预测分析

2017-03-29付传秀周建新

赤峰学院学报·自然科学版 2017年3期
关键词:遗传算法聚类预测

付传秀,周建新

(1.皖西学院 金融与数学学院;2.皖西学院 应用文科实训中心,安徽 六安 237012)

免疫遗传算法对中国区域经济协调发展的聚类及预测分析

付传秀1,周建新2

(1.皖西学院 金融与数学学院;2.皖西学院 应用文科实训中心,安徽 六安 237012)

利用免疫遗传算法,对中国区域经济协调发展水平做聚类分析;将免疫遗传算法与BP神经网络相融合,对中国区域经济协调发展水平进行预测.首先建立区域经济协调发展评价指标体系,通过主成分分析对指标数据降维;然后利用免疫遗传算法,对2014年的中国区域经济协调发展水平进行聚类与预测分析.仿真表明,聚类、预测结果与客观实际有较高的吻合度,免疫遗传算法能较好地实现数据聚类分析,免疫遗传算法优化的BP网络预测模型合理有效.

区域经济;免疫遗传算法;聚类;预测

在遗传算法的基础上融合生物免疫系统机制,可以形成免疫遗传算法.相比遗传算法等进化算法,免疫遗传算法增加了疫苗接种、免疫检测、免疫平衡等算子,在种群的个体更新、降低新一代种群适应度退化、维持种群多样性等方面有良好的改进.

习近平总书记在党的十八届五中全会上,提出“创新、协调、绿色、开放、共享”五大发展理念,体现了党对经济社会发展规律认识的深化.人力资源与生态资源在绿色协调发展中的作用提升,绿色发展、科技创新、经济效益与生态效益的统筹兼顾、区域经济协调发展的重要性凸显,未来中国的区域发展也将更加注重统筹协调.因此,正确评价区域经济协调发展,为区域发展的统筹规划提供理论指导,是一项非常有意义的工作.

基于以上原因,利用免疫遗传算法,对中国区域经济协调发展水平做聚类分析;将免疫遗传算法与BP神经网络相融合,对中国区域经济协调发展水平进行预测.通过仿真实验,可以得到一些有意义的结论.

1 区域经济协调发展评价

1.1 区域经济协调发展水平评价体系

表1 区域经济协调发展水平评价指标体系

影响区域经济协调发展的因素较多,评价其发展水平的系统较复杂.通过综合衡量经济、社会、科技、生态、资源等方面,选取重点评价指标24项,构建区域经济协调发展水平评价体系.评价指标见表1.

1.2 评价指标数据处理

对评价指标原始数据进行同向化、标准化处理;利用主成分分析提取数据主成分,对数据降维处理、消除数据相关性,同时为区域经济协调发展聚类和预测分析提供初始样本.

2 免疫遗传算法聚类及预测分析

2.1 免疫遗传算法聚类分析

免疫遗传算法是在遗传算法的框架中引入免疫机制,将待求解问题的目标函数对应抗原、问题的可行解对应抗体、抗原与抗体的亲和度对应可行解的适应度.相比遗传算法等进化算法,免疫遗传算法增加了疫苗接种、免疫检测、免疫平衡等算子,在种群的个体更新、降低新一代种群适应度退化、维持种群多样性等方面有良好的改进.

免疫遗传算法用于聚类分析的主要思想:在多维空间中,根据样本特征,利用免疫遗传算法协调抗体的适应度与抗体浓度,实现抗体的促进或抑制,指导种群向更优方向进化,把特征相似的样本归为一类,最终实现聚类划分.

免疫遗传算法聚类分析实现步骤:

Step1:设置算法相关参数:种群规模、聚类中心数、交叉概率、变异概率、最大迭代次数等;

Step2:疫苗提取算子:计算样本相似度,构造疫苗表;

Step3:更新抗体个体:交叉算子、变异算子、疫苗接种算子、免疫检测算子;

Step4:更新抗体种群:免疫平衡算子、免疫选择算子;

Step5:循环迭代至最大次数,将最优个体的抗体解码,输出各样品类别.

利用免疫遗传算法,实现对中国区域经济协调发展水平的聚类分析.

2.2 免疫遗传算法优化BP网络预测模型

BP网络是由输入层、隐含层、输出层组成,误差反向传播的多层前馈神经网络.其学习过程为两个阶段:(1)前向传播:输入信号从输入层经隐含层、输出层逐层处理,得到网络输出.如得不到期望输出,则转入反向传播;(2)反向传播:误差信号由输出层经隐含层向输入层反传,逐层修正各层神经元的连接权.不断迭代此过程,使BP网络的输出逐渐逼近期望输出.

传统BP算法存在收敛速度慢、易陷入局部极小的缺陷,但网络具有良好的泛化映射能力;免疫遗传算法具有全局搜索和收敛快的特点.将两者结合,采用免疫遗传算法优化网络初值的方法,可以提升网络性能.

免疫遗传算法优化BP神经网络的实现步骤:

Step1:确定BP网络拓扑结构、控制参数,产生初始群体并初始化编码;

Step2:利用免疫遗传算法良好的寻优能力,获得最优适应度值对应个体的优化参数;

Step3:优化参数解码得到最佳初始权值与阈值,回代入BP网络,进行网络训练及预测.

利用免疫遗传算法优化BP神经网络,实现对中国区域经济协调发展水平的预测分析.

3 实例分析与结论

3.1 实例分析

(1)评价数据处理

依据区域经济协调发展水平评价指标体系,提取中国31个地区2011年至2014年的数据,进行主成分分析,降低评价体系数据冗余,选取累计贡献率达85%的重要主成分,将其分值作为综合评价样本.

2011年至2014年共4组样本,分为3组训练样本和1组测试样本.其中,聚类分析使用测试样本;预测分析使用训练样本和测试样本.

(2)利用免疫遗传算法,聚类分析2014年的中国地区经济协调发展水平.

在matlab软件平台中编写程序,进行免疫遗传算法聚类分析.

基本参数设置:样品个数31;每个样本特征数3;聚类数目4;目标函数取样本到聚类中心距离之和的最小值;适应度值为目标函数的倒数.

(3)利用免疫遗传算法优化BP神经网络,预测2014年的中国地区经济协调发展水平.

在matlab软件平台中编写程序,进行预测仿真.

其中,输入层、隐含层、输出层神经元个数分别为:4、15、1;交叉概率0.6;变异概率0.1;2011年至2013年数据为训练样本,2014年数据为预测样本.

选取一次的聚类和预测仿真结果,加以分析:

聚类仿真结束,得到免疫遗传算法最优适应度优化过程曲线(图1),聚类结果(图2).

2014年中国31个地区经济协调发展水平的免疫遗传算法聚类结果(4类):A类(一类地区):上海、北京;B类(二类地区):天津、江苏、浙江、福建、广东、山东、湖北、海南、重庆、陕西、内蒙古、辽宁;C类(三类地区):西藏;D类(四类地区):河北、山西、吉林、黑龙江、安徽、江西、河南、湖南、广西、云南、贵州、四川、甘肃、青海、宁夏、新疆.

图1 免疫遗传算法最优适应度优化过程

图2 免疫遗传算法聚类结果

图3 免疫遗传算法优化BP网络预测输出拟合曲线

预测仿真结束,得到免疫遗传算法优化BP神经网络的预测结果,实际值与估计值的拟合曲线(图3).

3.2 根据免疫遗传算法聚类与预测分析结果,可以得出以下结论:

(1)经济系统的影响因素复杂、数据非线性特征明显.利用免疫遗传聚类算法,聚类分析中国地区经济协调发展水平,为区域经济分析提供了一种智能方法.免疫遗传聚类算法与传统聚类法相比,减少了人为选择因素,对中国地区经济协调发展水平的分类更客观.

(2)免疫遗传算法与BP神经网络相融合,实现了两算法间的优势互补,提高了算法的总体性能,收敛速度和计算精度大为改善.相比较传统BP算法,融合算法具有明显优势.

(3)从3幅输出图可知,仿真结果较理想.图1:随着迭代次数的增加,免疫遗传聚类算法最佳适应度值逐渐增大,数据聚类效果转好;图2:在三维平面图中直观地看到聚类结果,实现了数据定量与定性的统一;图3:免疫遗传算法优化BP神经网络的预测值与实际值拟合度高,数据拟合性能较好.

(4)查阅相关资料,发现聚类、预测结果与客观实际较为吻合.从聚类与预测分析结果看,中国各地区的经济协调发展水平差距较大,东部地区水平高于其它地区;中西部地区水平差距缩小;东北地区水平有提升;西藏因国家扶持政策协调发展较快.综合分析结果可知,统筹区域经济协调发展是一项长期的任务.

本文利用免疫遗传算法,对2014年中国地区经济协调发展水平进行聚类与预测分析.建立区域经济协调发展评价体系,通过主成分分析对高维样本数据降维处理;利用免疫遗传算法对区域经济协调发展水平做聚类分析,免疫遗传算法优化BP神经网络模型对区域经济协调发展水平做预测分析.仿真表明,免疫遗传聚类算法能较好地实现数据聚类分析,免疫遗传算法优化的预测模型合理有效.

〔1〕高洪深.区域经济学(第四版)[M].北京:中国人民大学出版社,2014.199-264.

〔2〕何晓群.多元统计分析(第四版)[M].北京:中国人民大学出版社,2015.57-191.

〔3〕王艳辉,冯百侠.用聚类分析法分析我国区域经济发展水平[J].价值工程,2016(2):72-73.

〔4〕马志飞,李在军,张雅倩,吴启焰.基于地理加权主成分的经济发展综合评价研究[J].华中师范大学学报,2016(2):276-281.

〔5〕张旭东,高茂庭.基于IGA-BP网络的水质预测方法[J].环境工程学报,2016(3):1566-1571.

〔6〕张弛,贾丽媛,王加阳.改进的混合免疫算法在约束函数优化中的应用 [J].中南大学学报,2016(6):1940-1946.

〔7〕刘朝华.混合免疫智能算法理论及应用[M].北京:电子工业出版社,2014.

TP312;F224

A

1673-260X(2017)02-0098-03

2016-09-17

皖西学院自然科学项目(WXZR201633);安徽高校省级科学研究项目(KJ2013B332)

猜你喜欢

遗传算法聚类预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
基于K-means聚类的车-地无线通信场强研究
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
不必预测未来,只需把握现在
基于高斯混合聚类的阵列干涉SAR三维成像
基于遗传算法和LS-SVM的财务危机预测
基于Spark平台的K-means聚类算法改进及并行化实现
软件发布规划的遗传算法实现与解释