时空相关神经网络的地价动态预测评估模型研究
2022-02-08浙江省自然资源厅信息中心屠龙海
□浙江省自然资源厅信息中心 屠龙海
中国房地产市场政策是土地市场、金融市场、财税体系的有机整体。自1998 年住房制度改革以来,房地产业经过了20多年的飞速发展,成为中国经济的重要组成部分。房地资产也成为了政府和个人的重要资产。如何建立健全稳健长效的房地产市场调控政策机制,确保地产市场平稳健康发展,是一个需要持续深入研究的课题。国家通过建立地价监测网,按季度发布全国主要城市地价监测报告,为国家土地市场宏观调控提供依据。但是报告对具体城市的土地供应和土地交易来说,因为一个城市的不同地段、不同区位的地块在不同的时期都存在价格差异,因而缺乏具体价格指导。当一个地块上市交易时,无论政府一方还是参与交易的企业一方都想了解地块的预期价格,政府通过设置交易底价保护国家利益,企业也会设定可接受的最高限价来保护企业的预期利益。目前,地价都是通过有经验的专业人员进行评估来了解。专业人员在评估时存在一定的主观性,不同人员评估的结果也可能存在较大的差异。本文探讨了基于时空相关神经网络的地价预测模型的可行性,应用人工智能技术,建立以城市为单元的地价动态预测评估系统,为当地土地市场宏观调控和供地地块价格预测预估提供有力工具。
一、时空相关神经网络的地价预测模型
传统的土地价格表现形式可以分为基准地价和宗地地价两种类型,基准地价是某一期日的不同用途、不同级别的土地使用权区域平均价格,该价格仅仅能够反映不同用途、不同级别的区域土地使用权的平均收益能力,而不能反映某一级别内具体位置的土地价格。宗地地价是某一地块在某一期日、某一特定权利条件下的土地使用权的价格。宗地地价虽然能够得到每一块宗地比较准确合理的价格,但宗地地价的测算需要投入大量的人力、物力,耗费较多的时间。我们应用土地网上交易的成果,以住宅用地的地价预测为例,将时间和空间作为主要因素,通过建立时空相关神经网络的宗地地价预测模型来探讨供地地块自动化价格预测预估的可行性。
(一)影响地价因素分析
影响住宅用地价格的因素包括规划因素、商业因素、交通因素、基础设施因素、环境因素、社会经济因素、人口因素、容积率、使用年限等等。在传统的土地价格评估和预测中,需要选取影响因子组成因素因子指标体系。如:在影响地价的商业因素中,选取商服中心作为影响因子;在交通因素中,选取客运站、主要道路、普通道路、公交站点作为影响因子;在基础设施因素中,选取小学、初中、幼儿园、医院作为影响因子;在环境因素中,选取公园作为影响因子等等。这些影响因素的选取和权重的制定都带有人为因素,需要根据经验来制定。即使这样,有些影响因素的参数获取也十分困难,需要投入大量的人力、物力。
通过对影响地价因素的分析,我们发现很多因素都是空间相关的,也就是地块位置确定了,这些因素的综合影响也就确定了,我们称为空间因素,这些空间因素可以打包在一起,用空间位置来表示:
空间因素={所在行政区政务服务因素,商业因素,交通因素,基础设施因素,环境因素,……}=g(x,y)
(x,y)是地块质心位置坐标,g 表示函数关系。地块位置确定后,空间因素的综合影响也就确定了,我们无需了解单个因子的影响力,只要了解空间因素的综合影响力。
还有一些影响因素是时间相关的,也就是交易的期日确定,这些因素也就确定了,比如社会经济因素(GDP、就业、人均收入等)、人口因素、宏观调控因素等,我们称为交易期日因素:
交易期日因素={GDP,就业,人均收入,人口,宏观调控政策,……}
另一类影响因素比较独立,如:规划用途,土地使用年限、容积率、出让面积等。
我们认为,土地网上交易价格是这些因素的综合反映,当然,对已成交的具体地块的价格还受到参与者多少和参与者的能力的影响,但综合所有交易地块,还是能客观反映土地的使用价值。因此,我们可以建立时空相关神经网络机器学习算法,以土地网上交易价格来进行训练学习,获得地价与影响因素之间的关系。即:
地块地价=f(空间因素,土地使用年限,容积率,规划用途,出让面积,交易期日因素)
其中,空间因素隐含了空间相关的因素,我们用地块质心位置(x,y)变量来表示,而交易期日因素我们用交易期日相对于基期日期的月份差数来表示,如果以2006 年1 月1 日作为基期日期,则:
月份差数=DateDiff ("m","2006/1/1",交易日期)
Datediff 函数用于计算两个日期之间存在的时间间隔数目,参数"m"表示计算月份之差。
地块容积率反映了地块可开发强度;
出让面积反映了地块可整体开发的程度;
地块的土地使用年限反映了土地使用权的长短。
如果我们只研究一个城市的住宅用地地价,土地的规划用途都是相同的,可以省略,那么单位面积住宅用地地价可表示为:
单位面积住宅用地地价=f(x,y,容积率,出让面积,(剩余)使用年限,交易月份差数)
这些数据在土地网上交易时都是公开的,很容易获取。
(二)机器学习神经网络
人工神经网络(Artificial Neural Network,简称“ANN” )一般是指用计算机模拟人脑的结构,用许多的处理单元模拟生物的神经元,用算法实现人脑的识别、记忆、思考过程。反向传播神经网络(Backpropagation Neural Network,简称“BP 网络”)不需要任何先验公式,就能从已有数据中自动地归纳出规则,获得这些数据的内在规律,具有很强的非线性映射能力,能够以一定的精度逼近复杂的非线性映射,特别适合于因果关系复杂的非确定性推理、判断、识别和分类等问题的研究。它的基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方差为最小,在人工神经网络的实际应用中,绝大部分的神经网络模型都采用BP 网络及其变化形式。而地价和其影响因素之间的复杂关系,很难用一定的函数来描述,因此利用BP 神经网络以其超强的学习和批处理能力作为多维非线性函数的通用数学模型的优势来模拟地价影响因素和地价的函数,从而由地价的影响因素推导出地价。
(三)带时空结构的神经网络模型
神经网络模型的结构主要由输入层、中间隐藏层和输出层的神经元组成。这里输入层神经元个数即为影响地价的因素,输出神经元即为预测地价,中间隐藏层层数和中间隐藏层神经元数的选取很重要,如果神经元太少,则网络学习效果较差,如果太多,则训练时间较长,甚至还会出现网络不收敛的情况。
我们要预测的变量是连续的地价,因此,这是一个回归分析类问题。从前述分析可知,地价是一个与时间和空间相关的目标函数,在建立神经网络模型时,我们要将地块的交易期日因素和空间位置因素作为输入层的神经元。基本目标是将住宅用地地价建模为x 坐标,y 坐标,容积率,出让面积,剩余使用年限,交易月份差的函数。
输入层的参数包括:x 坐标、y坐标、容积率、出让面积、(剩余)使用年限、交易月份差数。
输出层:单位面积地块地价:以元/平方米为单位,用作目标。
1.数据集
第一步是准备模型学习用的数据集,从土地交易数据中提取相关字段内容,并进行预处理。先去除不合理的数据,用GIS 提取地块的质心坐标。表示地块位置的坐标系统可以是球面坐标,也可以是平面坐标,只要能反映地块的相对位置关系即可。容积率选取上限值,地块单价(元/平米)=地块交易价(万元)/土地面积(公顷),用Excel输入编辑处理后,保存为csv 格式文本文件,本例中变量(列)的数量为 7,实例(行)的数量为 516,见表1所示。
2.选择神经网络架构
第二步是选择正确的神经网络架构。对于宗地地价预测问题,我们建立一个包含七层的神经网络模型:输入层、缩放层、两个感知器层、取消缩放层、边界层和输出层。
二、自动化地价动态预测评估模型开发
自动化地价动态预测评估模型开发分为两部分:神经网络参数学习训练部分和地价预测评估部分。在神经网络参数学习训练部分,我们基于OpenNN开发,OpenNN是一个用C++编写的开源类库,它实现了神经网络建模。OpenNN 的主要优点是其高性能,该库在执行速度和内存分配方面表现出色,为神经网络算法和应用的研究开发提供了一个有效的框架。OpenNN 主要由以下五部分组成。
表1 数据集内容
数据集类:包含处理数据的实用程序。
神经网络类:汇集了所有不同类型的神经网络模型。
训练策略类:表示神经网络的训练策略的模型。
模型选择类:表示 OpenNN 中模型选择算法。它用于查找具有最大泛化能力的网络体系结构。
测试分析类:包含用于在不同学习任务中测试神经网络的工具。
自动化地价预测评估模型的神经网络参数学习训练部分主要功能有装入原始数据,自动将数据实例(记录行)按60%、20%和20%的比例随机拆分为训练子集、选择子集和测试子集;构建七层神经网络架构;设置中间隐藏层的神经元数量;构建训练策略对象,设置训练策略:损失指数和优化算法,这里损失指数采用均方差,优化算法采用Adam 算法(适应性矩估计),并进一步设置优化误差范围、最大叠代次数、最大叠代时间等。构建测试分析对象,将神经网络输出与数据集的测试实例中的相应目标进行比较,评估模型,验证模型的泛化性能;最后以xml 格式保存模型学习到的参数。神经网络模型在参数学习中,中间隐藏层的神经元数量我们分别用10、20、30、50 和100进行了试验,在设置100 个神经元时预测结果较好。
地价预测评估部分是应用神经网络学习到的参数预测评估一块新地的地价,包括在系统中装入地价预测神经网络模型,将模型参数与地块属性字段参数进行匹配,自动计算预测地价并保存在地块属性表中,一次可完成多个地块的计算,以及地价预测评估趋势分析模块,如图1 所示,属性框中最后一列为应用神经网络模型计算出来的预测地价。
▲图1 自动化地价预测评估模型分析界面
▲图2 地块价格走向趋势预测分析示意图
地价预测评估趋势分析模块,用于了解地块交易前后价格的变化,特别是要比较不同时期交易的地块价格时,可以通过模型将地价归算到同一时期的价格。图2 是某一地块在交易前两年和交易后两年的价格走向趋势预测分析,图3 展示了不同区域七个地块在交易前两年和交易后两年的价格走向预测。地块的价格在时空尺度上是有起伏的,不同时期不同区域的地块有不同的价格曲线。
三、地价预测结果分析
我们通过对历史交易地块的交易单价和预测价的分析,56.0%的地块预测地价相对误差在10%以内,92.4%地块预测地价相对误差在50%以内,见表2 和表3。
四、结语
地价预测的准确性,很大程度上取决于所收集地价相关数据的准确性和现势性,在日常的出让地块地价评估操作中,常常会遇到地价资料的不完整、相关参数的不易把握、方法确定的主观性、不同方法估价结果差异过大等诸多问题,本文研究利用神经网络模型,通过对交易地价的学习,实现了以一定的精度逼近复杂的非线性映射的能力。本模型与同类模型相比,最大的特点是采用时间和空间位置因素取代大量时空相关的因素,减少了搜集这些影响因子数据和权重评估的工作量,应用时空相关的神经网络模型预测评估地价具有良好的效果,而且省时省力,可应用于土地估价、出让地块的地价评估,对住宅用地监测点地价的检验、土地市场精准化调控也具有较大的参考价值。但由于受样本数量的限制,检验过程中的控制误差仍然较大,随着学习样本数量的不断增加,通过神经网络模型预测的结果将会更加准确。当遇到政策调整,预测结果也需要加减政策影响因子,随着政策调整后交易地块价格的加入学习,神经网络模型也会学习到新的政策因素。因此,模型需要不断进行动态学习与动态预测。
▲图3 多地块价格走向预测分析
表2 地块预测地价和相对误差
表3 预测误差统计表