基于灰色模型的RBF人口迁移预测方法研究
2015-09-18刘欣蔡婧
刘欣 蔡婧
摘要:人口迁移预测模型是深入研究人口迁移行为的基础。现有迁移预测模型大多集中在单模型、单变量预测上,不能描述人口迁移行为的合力效应。提出了一个新的人口迁移预测模型——GRBF,该模型包含两个子模型:灰色模型和RBF模型。灰色模型构建于人口迁移的影响指标之上,为GRBF提供充分时间维度指标信息;RBF模型则接收灰色模型的输出,计算人口迁移量的预测值。实例分析证明,GRBF支持人口迁移量预测,提供对预测数据的误差分析,能够有效预测人口迁移量的变化。
关键词:灰色模型;RBF;GRBF;人口迁移预测
DOIDOI:10.11907/rjdk.151548
中图分类号:TP301
文献标识码:A 文章编号文章编号:16727800(2015)008006403
0 引言
随着我国市场化和城市化进程的稳步推进,要素流动日趋频繁,人口的迁移和流动愈加规模化,已成为重要的社会经济现象。人口迁移现象受到人们越来越多的关注,很多学者进行了大量的研究,如何准确预测人口迁移量,已成为相关领域的重点课题[12]。当前,主要的人口迁移量预测方法包括Logistic回归模型、多元线性回归模型、神经网络预测方法和灰色预测模型等。其中,最受关注的是基于神经网络的人口迁移量预测方法。当代社会人口迁移的影响因素已多元化,包括就业、收入、生活、环境、资源等诸多因素,其相互间作用较复杂,具有非线性特征。神经网络极强的非线性映射特性,正好可以用来解决此类问题。不过国家人口统计的粒度往往是以年为单位,导致可用数据较少。而神经网络在对小数据集进行预测时会出现训练外延的问题。
针对上述问题,本文在神经网络预测模型中引入灰色预测模型[3],解决在数据少时的训练外延问题,建立一种优化的人口迁移量预测模型。灰色预测模型利用累加生成后的新数据建模,在一定程度上弱化了原始数据的随机性,容易找出数据变换规律。
1 灰色预测方法
灰色预测是指对结构模糊、变化随机、描述不完备的数据建立灰色模型所做的定量预测。灰色模型众多,本文选用灰色模型GM(Grey Model)(1,1)。该模型主要应用于时间序列预测,其实质为一阶单变量微分方程动态模型,其形式如下:
原始数据中一般都会包含噪声,通过累加生成操作能够大大削弱噪声,突出系统所蕴涵的内在规律,形成较有规律的单调递增数列。对生成的数据列X(1)建立一阶灰微分方程:dx(1)dt+ax(1)=u,其中,a、u为参数,该灰微分方程的解为:
2 神经网络
神经网络,是人工神经网络的简称,是一种模仿大脑神经突触联接进行信息处理的数学模型。神经网络模型众多,包括BP网络、ART网络、Hopfield网络、RBF网络等,本文选用收敛状况较好的RBF网络进行实证研究。
2.1 RBF神经网络结构
径向基函数神经网络RBF(radial basis function neural networks) 性能良好,可逼近非线性函数,具有全局最佳逼近点[4],广泛应用于模式识别、非线性时间序列预测等场景。
RBF为三层前向型网络,包括输入层、隐层和输出层,具体构成如图 1,其中x=(x1,x2,...,xm)为输入层,(φ1(x),φ2(x),...,φn(x))为隐层,y为输出层,(ω1,ω2,...,ωn)为隐层与输出层之间的连接权重。
图1 RBF结构
输入层将所有数据输入隐层,而隐层节点经线性加权即可得到RBF的输出。隐层通常选用径向对称非线性的高斯函数作为其径向基函数,用φi(x)表示。
φi(x)=exp-x-ci22σ2i
隐含节点输出信息在输出层中通过预设的权值线性加权后得到最终结果,即:
y=ω0+∑ni=1ωiexp-x-ci22σ2i
其中,x∈Rm为输入向量,n为隐层节点数量,ci(1≤i≤n)为RBF的中心,x-ci 为向量x与ci之间的欧氏距离,σi为第i个隐含节点的基函数围绕中心点的宽度。ωi(1≤i≤n)为线性加权的权重,ω0表示偏差。通过调整σi和ωi的值就可以实现对任何函数曲线的拟合。
2.2 RBF训练准则
RBF的训练方法主要有4种:直接计算法、自组织学习法[5]、有监督学习法和正交回归法[6]。本文选用自组织学习法,具体过程如下:
(1)假设存在N对样本数据(xk,yk)(k=1,2,…,N),利用聚类方法[7]对样本分类,定义存放各聚类的输出和值的矢量为A,定义记录各类所属样本数的矢量为B,定义高斯函数φ(x)的半径为r。假设存在M个聚类中心,定义聚类中心为ci(1≤i≤M),对应权重记为ωi(1≤i≤M)。
(2)根据聚类情况,尝试不同的r,因为r的大小决定分类的精细程度,而分类的精细程度与算法效率又相关,所以r取值是效率与精度权衡的结果。
(3)将第一个数据对(x1,y1)记为首个聚类中心,记cl=x1,A(l)=y1,B(1)=1,得到RBF网络的一个中心为cl隐单元,其权矢量记为w1=A(1)/B(1)。
(4)关注第二个样本数据对(x2,y2),求出x2到聚类中心cl的欧氏距离x2-c1,记为d2,d2不大于r时则x2属于c1聚类,且A(1)=y1+y2,B(1)=2,w2=A(1)/B(1);d2大于r时则将x2记为新的聚类中心c2,即c2=x2,A(2)=y2,B(2)=l,得到RBF网络一个新的隐单元,其权矢量记为w2=A(2)/B(2)。
(5)考虑第k个样本数据对(xk,yk)(k=3,4,…N)时,上述RBF网络中已找出L个隐单元。分别求出(xk,yk)到L个聚类中心的距离xk-ci(i=1,2,...,L),取最小距离,记为dk,其对应的聚类中心记为cj,则dk不大于r时xk属于cj聚类,且A(j)= A(j)+yk,B(j)= B(j)+1,wj=A(j)/B(j),否则将xk记为新的聚类中心cL+1,即cL+1=xk,A(L+1)=yk,B(L+1)=l,得到RBF网络一个新的隐单元,其权矢量记为wL+1=A(L+1)/B(+1)。
(6)遍历所有的样本,完成隐单元构建,进而完成RBF网络的构建,其数学表达式如下:
f(xk)=∑Mi=1ωiφ(xk-ci)∑Mi=1φ(xk-ci)
3 基于灰色模型的RBF人口迁移预测模型
3.1 模型架构
考虑到灰色模型和RBF网络的互补关系,基于这两种算法,本文构造了一种灰色RBF组合预测模型GRBF(Grey Radial Basis Function Neural Networks)。GRBF对GM(1,1)灰色模型和RBF作串联组合,形成预测核心,即以GM(1,1)灰色模型的输出作为RBF的输入,实现数据的有效预测,具体流程如图 2所示。
人口迁移规模与社会经济环境有着显著的关系:迁移人口有从社会经济环境较差区域迁向社会经济环境较好区域的明显趋势。因此,社会经济环境是人口迁移的重要影响因素。为此,本文从社会经济环境角度,挑选出户籍人口、居民消费价格指数、城镇居民人均可支配收入、公共交通运营车辆、人均公园绿地面积、卫生机构和全市各类学校招生数共7个因素作为影响人口迁移的指标进行预测,分别将这7个指标的样本数据输入GM(1,1)模型作预测,获取指标预测值,然后利用这7个指标的样本数据对RBF进行训练,最后将指标预测值输入GRBF模型,得到人口迁移量预测结果。GRBF模型包括1个GM(1,1)模型组(内含7个GM(1,1)模型)和1个RBF模型,含7个输入节点和1个输出节点,隐层节点由算法动态选取。
3.2 算法步骤
(1)初始数据处理:对于户籍人口、居民消费价格指数、城镇居民人均可支配收入、公共交通运营车辆、人均公园绿地面积、卫生机构和全市各类学校招生数的原始序列采用p1、p2、p3、p4、p5、p6、p7分别表示,作为研究数据序列。用p表示城镇人口净迁入,其内涵为城镇户籍人口净迁入数量与暂住人口数量的加总。
(2)指标预测:对7个研究数据序列GM(1,1)模型组进行预测,得到相应的指标预测值。
(3)生成训练样本集:标准化步骤(1)得到研究数据序列,消除量纲影响,具体计算方式为=x-S,其中为指标序列数据的均值、S为指标序列的标准差。组合标准化后的研究数据序列,生成RBF网络的输入x、输出样本y,具体为x=1,2,3,4,5,6,7T,y=。
(4)训练RBF网络:将样本数据输入RBF网络,循环学习至误差达到预期。
(5)GRBF模型预测:将标准化步骤(2)所得的研究数据序列预测值,输入(4)中已训练完成的RBF网络,输出预测结果。
4 GRBF在北京人口迁移预测中的应用
以城镇户籍人口净迁入数量和暂住人口数量之和,作为人口迁移规模的表征,并命名为城镇人口净迁入。
为了使评价结果更为合理准确,有效剔除主观因素,使分析结果尽量客观反映人口经济实际状况,且保证原始数据统计口径一致,文中所选用的原始数据均取自《北京市统计年鉴》(1995~2013)[8]。为检验文中GRBF模型的预测性能,我们取所有指标变量1994~2003年的数据作为训练样本,2003~2012年数据作为检验样本。
为检验新模型方法的预测能力,选用RBF模型、GM(1,1)模型、Logistic模型作为陪测模型,对2003~2012年的城镇人口净迁入进行预测,并将三种陪测模型的预测结果与GRBF模型的预测结果进行比较。
3种陪测模型与GRBF模型对2003~2012年的预测结果对照如图 3所示,具体预测结果如表 1所示。从表 1结果可以看出,基于GRBF模型方法的整体误差最小(误差为相对误差,即(预测值-实测值)/实测值*100),预测稳定性最好,能较好反映数据的变化趋势,因此检验结果证实GRBF模型方法具有一定的实用价值。
参考文献:
[1] YEN TSENG HSU,CHYUN SHIN CHENG,CHWAN CHIA WU.Grey dynamic modeling and prediction control of macroecnomic system[J].Journal of Grey System,1997,9(3):6772.