APP下载

数据挖掘技术在房地产预警系统中的应用

2012-04-29王飞王学明王新一

计算机时代 2012年1期
关键词:支持向量机房地产数据挖掘

王飞 王学明 王新一

摘要分析了各种房地产应用软件,将数据挖掘技木引入房地产预警系统设计中,结合数据仓库和决策支持系统,建立了基于粗糙集数据预处理的支持向量机预警模型,运用3σ警界控制原理确定各状态区间,划分出不同的警度,并提出了房地产市场预警预报系统的完整解决方案,最后,结合银川市的实际情况,构建了银川市房地产预警系统指标体系。

关键词房地产,数据挖掘,粗糙集理论,支持向量机

中图分类号TP392文献标志码A 文章编号:1006-8228(2012)01-24-03

O引言

近几年来,计算机技术的飞速发展,为房地产预警与计算机技术的结合提供了前所未有的发展机遇和技术支持。数据仓库、数据挖掘技术以其强大的决策支持功能和良好的发展前景而受到越来越多的关注。进入21世纪,随着我国经济体制改革和商品经济的发展,房地产业正在迅速崛起。为了全面、及时、准确地掌握房地产市场运行状况,加强对房地产市场的监测和调控,避免房地产币场非常态波动的出现,必须尽快建立房地产预警系统,实现对房地产市场的预警和对房地产投资、消费的引导,为政府制定房地产政策,保证房地产经济健康、持续、稳定的发展提供重要的手段和决策依据。

1研究思路

本文先采用定性与定量相结合的分析方法选取两个在房地产行业最具代表性的指标,再利用粗糙集对选定的指标进行数据预处理和指标约简,最终确定影响房地产行业发展的重要指标并建立房地产预警指标体系。分布式系统、数据仓库技术和数据挖掘技术的发展给以上问题的解决带来了新的契机。

我们从建立房地产经济的各类经济统计指标,以及宏观经济中与房地产相关性较强的经济统计指标的数据仓库入手,充分利用房地产预警理论和方法的研究成果,建立各种预测、预警模型,并引入基于粗糙集数据预处理的支持向量机预警模型的,组成模型库管理系统。同时,结合银川币的实际情况,采集银川市不同时期的历史数据,建立存贮非量化预警信息和相关知识的辅助信息库作为补充,并运用3σ警界控制原理对各状态的区间进行确定,划分出不同的警度。最后根据警限值将预测值转化为警度并进行预报。用户可交互地为预警系统的定量分析补充定性分析的信息。

2房地产预警预报系统设计

2.1系统总体设计

房地产预警系统,简单地说,就是能够事先发出房地产警告信号的系统。房地产预警预报在本质上是以管理信息系统为基础,兼有决策支持系统功能的计算机预警预报信息系统。房地产预警系统是构建在分布式系统构建之上,随着数据的挖掘和时间变化而调整信息的,其数据的传递都是由系统的多方用户即各房地产相关部门、决策者等交互完成。系统总体结构如图1所示。整个系统从硬件的角度来看,每个应用程序由客户端和服务器通过因特网或局域网连接来实现其功能。从软件设计的角度看,整个系统采用分布式的表示层、功能层、资源层的三层结构。表示层位于客户端,功能层是整个应用程序中最为重要的一层,对应于一个或多个用户界面,是整个系统的价值的体现,资源层由几个相关信息数据仓库、房地产市场信息知识库和模型库组成,一般存放于服务器上。表示层主要是及时响应用户发来的请求,验证每个用户请求的权限,并将所请求的最终数据返传给客尸端。

2.2数据仓库整体设计

基于数据仓库的房地产预警系统以数据仓库技术为核心,以联机分析技术和数据挖掘技术为基础,把原始数据系统开发的主要内容是汇集和整理成不同的数据库群体,通过合理、全面的数据管理,再利用粗糙集对选定的指标进行数据预处理和指标约简,使最终用户可对获得数据作直接处理,用以进行数据分析。预警预报所需数据要能反映基本数据所体现的整体趋向或随时间变化而表现出来的变化趋势,因此必须对基本数据进行分类、析取、归纳、加工等处理才能得到这些数据。这些数据构成数据仓库的数据源,通过建立提取器,将来自数据原的、影响数据仓库的数据定期的转化为数据仓库模式。当数据源中数据发生变化时,集成对数据进行过滤、转化和综合,并和其他数据合并,把新的数据集成到数据仓库中。

为了建立一个质量过关的数据仓库需要做好以下几个工作。(1)数据仓库设计。主要任务是数据仓库环境的定义和设置,(2)数据抽取。从外部数据源定期提取数据并变换数据,对所获得的源数据进行一些必要的加工处理,使其符合数据仓库中数据库可以有组织和存储管理的数据格式和语义规范。(3)数据管理。数据的维护和分配,支持数据处理和应用。各种数据的存储分发及分布到多个不同的数据库服务器。数据的转储、恢复和维护,安全性检测和定义等。

2.3数据挖掘

从信息源获取信息,并将它们组织集成到数据仓库,其目的在于对数据仓库中的数据进行分析和综合,我们采用了数据挖掘等第三方工具,对目前已有的信息进行挖掘,以加强系统预警功能。数据挖掘是在数据仓库的基础上进行知识发现。概括起来,它具有以下特点(1)需要对大量数据进行处理,(2)对模糊查询要求,可以寻找用户可能感兴趣的信息,(3)它把大量的原始数据转换成有价值的知识,用于描述过去的趋势和预测未来的趋势,(4)能迅速响应数据量陕速增长。

2.4需求分析

房地产预警的—般流程如图2所示。系统开发的主要内容是建立数据库数据仓库,利用数据挖掘模型,选取最能代表房地产经济发展的指标。预测是房地产预警的核心。房地产预警系统运行流程的实施步骤大致可归纳为(1)确定房地产预警监测的对象;(2)寻找警情产生的根原,(3)选定警兆指标,(4)确定警限(5)核算综合预警指数,(6)划分警级,(7)预报警度。其中明确警情是预警的前提,也是房地产预警研究的基础,寻找警源,分析警兆,确定警限是对引起警情的各类因素作出定性和定量分析,而预报警度则是预警的目标。

3银川市房地产预警实证分析

伴随着西部大开发政策的逐步实施,银川作为最适宜居住的城市之一,在城币环境、币政配套的不断完善、房地产市场需求不断走高及商品房综合品质提升等因素影响下,房地产币场呈现出了房价开始逐渐走高,商品房投资额增幅加大,内部结构不平衡等发展偏热的迹象。

3.1方法论

(1)评价无非就是对指标运行处于正常、基本正常、异常等何种状态等作出判断。这种判断应该基于成熟的定量分析工具同经验分析的结合。本文用警界控制原理对各状态的区间进行确定,采用两倍标准差作为房地产预警系统指标是否异常(过热或过冷)的依据。同时,选择偏离均值一倍到两倍的区间作为预警指标偏热与偏冷区间,在均值正负一倍标准差内的区间为正常区间。

(2)粗糙集理论与支持向量机模型。粗糙集理论是由波兰科学家z Pawlak自1982年研究信息系统逻辑特性时发展起来的理论。粗集理论是一种处理模糊与不确定知识的数学算法,它能有效地分析和处理各种不精确、不一致和不完整的信息,并从中发现隐含的知识,揭示潜在的规律。SVM算法的实质

是采用智能算法求解一个具有线性约束的二次凸规划问题,因此该算法的解一定是惟一的、全局的和最优的。我们采用支持向量机建立房地产预测模型,对房地产币场的未来供需形势进行预测。

3.2样本数据的收集和选取

基于专家意见及银川市房地产市场的具体特征,本文拟使用以下16个指标作为房地产币场预警的初始指标体系,这16个指标分别为房屋空置面积、房屋竣工面积、空置率、商品房销售额、商品房交易面积、人均住宅面积、房屋出租面积、全社会住宅投资、全社会固定资产投资、土地开发投资、商品房建设投资、房地产价格、土地交易价格指数、房地产增加值、国内生产总值、物价指数。

房地产业的波动是外部因素冲击和内部机制传导的综合结果。我们结合银川市房地产业的具体数据,运用基于粗集的属性归约方法对不同时期的历史数据进行预处理,采用粗糙集数据预处理的支持向量机预警模型,然后运用警界控制原理对各状态的区间进行确定,并以此划分出不同的警度,最后根据警限值将预测值转化为警度并进行预报。通过分析得出银川市房地产综合预警指数如图3所示:

4综合分析

由上图可判断,银川市房地产市场的发展大致分为三个阶段,即偏冷运行阶段、正常运行阶段,偏热运行阶段。综合看银川市房地产发展是基本正常的、房价是稳中上升的。但从2003年起银川房地产出现了波动,2005年起银川市房地产发展处于“偏热”的状况,并呈现持续上升的趋势,而之前的时间处于平衡状态在未来几年市场运行很可能亮红灯,会有房地产泡沫产生的危险,因此,需结合市场与政府调控的双向机制保持银川房地产市场健康、有序的发展。

在近十年里我国房地产行业呈现发展过热的状况,房价上涨过快,给人民的生活带来了沉重的负担,在对国民经济造成巨大影响的同时,也对整个社会的稳定发展带来了不少负面影响。以保障国民经济持续、快速发展为出发点对房地产预警进行研究,更好地对未来的房地产市场运行和发展形势做出准确判断,并对房地产市场现有状况是过热或过冷的失衡原因快捷地发出警报,可以帮助相关部门及时调整相应的产业发展政策以保持其供需平衡,推动我国房地产行业持续、稳定、健康的发展。因此进行房地产行业形势预警研究具有重要的理论价值和社会意义。

针对银川市房地产市场的警情状况和市场特点,为抑制房价上涨过快,稳定房地产市场所应采取的一些措施包括一,制定相关的土地政策,改变商品住宅供应结构,坚持以住房为主的土地供应,严格控制土地价格和土地囤积,从严查处土地违法行为,二,加强二级市场、租赁市场的建设,搞好城市规划管理,合理配置住房资源,加快建立并完善预警预报系统,三,政府结合市场进行相应的调控,严格把守贷款申请等金融工作,限制炒房,使房地产开发行业提高固定资产投资项目资本金比例、首付款比例。

本文研究得出的结论较多为宏观数字,对未来几年的房地产市场供需形势也仅能从总体上做出判断,不能够准确市场的突发事件作出很准确的反应和预测,因此在以后的研究中,我们将尽量多研究短期房地产市场发展状况的预警。此外,本文对国家宏观调控方面的房地产行业市场的政策性指标因素考虑不多,影响房地产行业市场走势的重要政策性指标在后续的国家宏观调控中肯定会出现,因此在之后的研究中要不断完善指标体系,提高对房地产行业市场状况预测的准确性。

猜你喜欢

支持向量机房地产数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
关于房地产是支柱产业的辨析
化解我国房地产库存对策研究
新形势下的房地产企业成本控制研究
基于支持向量机的金融数据分析研究
“白银时代”房企转型,路在何方