基于灰色-BP神经网络的房价波动预测研究
——以内江市为例
2022-04-13李秀芝徐文靖冷雪莲
李秀芝,徐文靖,苏 俊,师 艳,冷雪莲,鲜 烨
(内江师范学院 地理与资源科学学院,四川 内江 641100)
1 引言
我国宏观经济中关键的一环就是房地产市场,其在国民经济体系中的地位十分重要,对推进我国经济健康发展意义重大[1]。居民的购房需求是一种刚性需求,商品房住宅销售价格(简称房价)的变动备受社会的长期关注。在国民经济的宏观调控作用下,虽然我国房地产行业已部分实现了健康发展,但今后的房价走势依然不明朗。这给房地产的投资者和消费者带来了极大困扰,所以预测房价变化趋势将在一定程度上降低他们的困扰。
由于房价数据波动较大,经常发生无规律、随意性变化,采用合适的房价预测方法十分重要。国内已有许多学者从不同的视角运用多种方法对房价预测进行了研究。现有常用的传统房价预测方法有时间序列模型[2]、灰色GM(1,1)模型[3]、多元线性回归模型[4,5]、BP神经网络模型[6~8]等。BP神经网络是人工智能中应用最广泛的神经网络,它是一种按照误差逆向传播算法训练的多层前馈神经网络,具有算法稳定可靠、容错性高和纠错能力强的特点[6],目前已是适用范围较广的神经网络之一。但此预测方法存在易受其他无关因素干扰、预测精度不高等不足[9]。本文以内江市为研究区,以皮尔逊相关度系数筛选影响房价的因素,减少无关因素对预测结果的干扰,再利用灰色GM(1,1)模型对影响房价的各因素进行预测分析,最后构建BP神经网络模型对内江市房价进行分析和预测,以提高预测精度,以期有助于内江市房地产市场中各主体理性、清晰地认识房价的波动变化,促进内江市房地产业稳定、健康和有序发展。
2 数据来源与研究方法
2.1 数据来源
地区生产总值、人均可支配收入、常住人口、住宅竣工面积、城镇化率、住宅投资额、土地交易价格、居民消费价格指数、存款准备金率、竣工房屋造价、房价等数据来源于《内江市统计年鉴(2006-2020年)》[10]《四川统计年鉴(2006-2019年)》[11]。本文中房价的计算方法为房价=商品房住宅销售额/商品房住宅销售面积。
2.2 研究方法
2.2.1 皮尔逊相关系数
皮尔逊相关系数法是一种准确度量两个变量之间的关系密切程度的统计学的方法,广泛应用于信号分析、风险预测等方面,两个变量间线性相关程度的强弱通过皮尔逊相关系数的大小反映,其数值介于-1~1之间。相关系数数值的绝对值越大,相关性则越强,反之相关性越弱[12]。
对于两个变量X和Y,其皮尔逊相关系数定义为[13]:
(1)
表1 皮尔逊相关系数的相关程度[14]
2.2.2 灰色GM(1,1)模型
灰色系统理论是由我国控制论专家邓聚龙教授在1982年首次提出,经过多年来国内外专家学者的不断深入探索和完善,该理论在许多领域得到广泛而深入的应用。灰色系统是用部分已知信息去预测未知信息的不确定性系统,它主要通过对“部分”已知信息中有价值的信息进行提取和分析,从而对系统运行规律有正确认识和有效控制[15]。灰色GM(1,1)模型是灰色理论中较早发现的预测模型之一,在灰色系统理论中应用最广。它的主要特点不是基于原始数据序列,而是在原始数据的基础上通过运算生成新的数据序列,从而形成该模型,其具体计算步骤如下。令X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),其中x(0)(k)≥0,k=1,2,3,…,n[16]。
针对原始数据序列的特征,为弱化其随机性和使其呈现出规律性,对X(0)进行一次累加生成(1-AGO),从而生成新的数列:即X(1)=(x(1)(k)|x(1)(k)≥0,k=1,2,…,n)。其中:
(2)
构建矩阵Y,B:
此处利用一元线性回归,即最小二乘法来求解灰参数:
(3)
其次,将灰色参数代入时间函数,即:
(4)
(5)
(6)
(7)
特别说明:公式(1)中,a为发展系数,其大小反映了数据序列X(0)的增长速度;u为内生变量,Y(k)为预测值。
为了确保建立的灰色模型具有可靠性,能够达到预测商品房住宅销售价格的目的,需对模型进行精确度检验,方可用于房价预测。此处采用后验差检验法。
计算原始数据序列X(0)的方差S1:
(8)
计算残差序列的方差S2:
(9)
计算均方差比值,即后验差:
(10)
根据均方差比值的精确度等级来划分:当均方差比值≤0.35时,则模型精度为优;当均方差比值≤0.5时,则模型精度为良;当均方差比值≤0.65时,则模型精度为一般;当均方差比值>0.65时,则模型精度为不合格,不能用于预测(表2)[17]。
表2 灰色GM(1,1)预测模型精度[18]
计算小误差概率:
(11)
2.2.3 BP神经网络预测模型
BP神经网络也称为反向传播神经网络,是一种具有3层或者3层以上结构的无反馈的、层内无互连的网络[7]。BP神经网络主要由输入层、隐含层、输出层组成,其中,隐含层可以有一层或多层。在实际工作中,多以图1所示的单隐含层网络的应用最普遍,对于一般的模式识别问题,三层网络可以很好的解决问题[19]。通过对样本数据的训练,不断去修正网络模型中权值和阈值,从而使误差函数沿负梯度方向下降,来逼近期望的输出[20]。
图1 三层神经网络
BP神经网络具有很强的非线性逼近能力,众多影响因素与房价的关系是非线性的,需要运用一个非线性模型才能对房价进行预测。神经网络的另一个优点就是不需要事先给出任何的公式,它可以通过学习输入的历史数据,自己总结归纳出隐含层与输入、输出层之间的关系,并经过多次训练进行修正,从而得出正确模型。此外,BP神经网络还有较强的泛化能力,也就是适用于其他用途的能力[21]。当房地产影响因素的权重改变、交易时点改变或房地产所处地域改变,都不会使得BP神经网络的学习规则改变,只要调整一下初始设置就可以实现评估或预测作用[8]。
3 结果与分析
3.1 皮尔逊相关系数分析
本文共选取了10个可能影响内江市房价的因素:地区生产总值X1、人均可支配收入X2、常住人口X3、住宅竣工面积X4、城镇化率X5、住宅投资额X6、土地交易价格X7、居民消费价格指数X8、存款准备金率X9、竣工房屋造价X10,房价为X11。
为深入了解各因素对房价产生的作用和影响,运用SPSS软件分别对各影响因素和房价进行皮尔逊相关系数分析,分析结果见表3。
表3 内江市房价影响因素的皮尔逊相关系数
表3中存款准备金率与居民消费价格指数的检验系数均>0.05,所以在置信水平为0.05时,存款准备金率、居民消费价格指数对房价产生的影响与作用不显著,应将这二者从可能影响内江市房价的影响因素中剔除。且其他影响因素的相关系数绝对值均超过0.8,结合表1可知,除存款准备金率和居民消费价格指数外,其他影响因素的关联程度均为极强相关。因此选择地区生产总值、人均可支配收入、常住人口、住宅竣工面积、城镇化率、住宅投资额、土地交易价格、竣工房屋造价因素作为内江市房价的影响因素。
3.2 灰色GM(1,1)模型因素预测
3.2.1 精度检验
运用DPS软件计算出各因素的后验比c和小误差概率p的值,见表4。由表4可知c值均小于0.65,p值均大于0.70。根据表2可知,模型具有可靠性,因此可对房价影响因素进行预测。
表4 内江市房价各影响因素后验比c和小误差概率p值
3.2.2 房价影响因素GM(1,1)模型预测
运用DPS软件对内江市房价各影响因素进行GM(1,1)模型预测。预测值见表5。
表5中,通过分析可以得知地区生产总值、人均可支配收入、城镇化率、住宅投资额、土地交易价格、竣工房屋造价呈上升趋势,常住人口、住宅竣工面积则呈下降趋势。通过对各影响因素进行预测,可为BP神经网络的房价预测提供数据支撑。
表5 内江市未来3年房价影响因素GM(1,1)模型预测值
3.3 BP神经网络的房价预测研究
通过对内江市房价影响因素的皮尔逊相关系数进行分析,筛选出地区生产总值、城镇人均可支配支配收入、全市常住人口、商品房住宅竣工面积、城镇化率、住宅投资额、土地交易价格指数、竣工房屋造价8个因素作为内江市房价的主要影响因素,以此建立BP神经网络对内江市房价进行预测。
本文采用三层BP神经网络结构模型,即输入层、隐含层和输出层。BP神经网络的节点包括输入层节点、输出层节点和隐含层节点。其中,输入层节点是系统的自变量个数[22],因此输入层有8个节点,即为选取的8个影响因素。隐含层节点数和输入层节点数之间有近似的关系:[23],则隐含层的节点数17。输出层节点即为系统目标个数,在本模型中节点为1,即为房价。所以本文确定的BP神经网络的结构为8-17-1模型。
3.3.1 模型精度的检验
利用构建好BP神经网络模型对学习样本进行训练,选取2005~2015年的11组历史数据作为训练样本,将2016~2019年的4组历史数据作为测试样本。2016~2019年房价预测值、实际值、相对误差如表5所示。由表5可以看出房价拟合值和实际值之间非常接近相对误差都在±3%之内。结果表明,训练模型的预测效果较好,精度较高,可用来对内江市2020~2022年的房价进行预测。
3.3.2 2020~2022年房价的预测
将2020~2022年内江市的各影响因素预测值作为BP神经网络的输入值,对2020~2022年内江市的房价进行预测,预测结果见表6。通过表6可知:内江市房价除2020年较2019年下降1.3%外,总体呈上涨趋势。2020年房价下降的成因可能是受2020年特殊原因的影响,全市经济发展放缓,流通停滞,导致投资者的投资热情退去;另一方面可能也与购房者的购买意愿有关,购房者因经济发展放缓,家庭积蓄减少,购房热情受挫,对购房的需求减少。最终使内江市2020年的房价产生了波动。
表6 BP神经网络测试阶段和预测阶段房价预测值及相对误差
房价总体上均呈现上升趋势,并且上升趋势较快。这说明伴随内江市经济的发展,其房地产市场也在不断扩大,从侧面反映了内江市经济的繁荣,但需要警惕因房地产市场过热而可能发生的“泡沫”。
4 结论
基于内江市2005~2019年影响房价的经济指标历史数据,借助皮尔逊相关系数初步筛选房价的影响因素,确定内江市地区生产总值、城镇人均可支配收入、全市常住人口、商品房住宅竣工面积、全市城镇化率、住宅投资额、土地交易价格指数、内江竣工房屋造价8项因素是影响内江市房价的主要因素。以这八大要素构建灰色-BP神经网络模型,预测未来房价。预测结果表明:在2020~2022年,除2020年由于特殊原因而导致房价有所下降外,总体上均呈现上升趋势,并且上升趋势较快。