沿海城市房价主要驱动因素分析
2019-06-29杨月卢伊
杨月 卢伊
摘要:大数据时代的到来使得对数据的迅速捕捉和实时分析显得至关重要。相比传统商业智能软件,新型商业智能软件使用的轻量建模形式能够迅速响应需求变动。Tableau正是这样一款定位于数据可视化敏捷分析和完成商务智能的展示工具。利用Tableau进行初步可视化分析及高级可视化分析,极大地提高数据分析与操作的效率。此次研究以沿海城市三亚市为研究对象,从使用角度介绍Tableau数据分析软件在房价分析中的使用技巧,并将数据以可视化形式展现出来,分析结果发现临海距离是影响三亚市房产价格的主要因素之一,而交通状况及住宅面积对于房价的影响并不是最为主要的,对研究影响三亚市房价乃至沿海城市的房价的主要驱动因素有着至关重要的作用。
关键词:大数据;商务智能;Tableau;数据可视化;旅游
中图分类号:F293 文献标识码:A
文章编号:1005-913X(2019)05-0053-03
Analysis of housing price main driving factors in coastal cities
——Take Sanya City as an example
Yang Yue1, LuYi2
(university of sanya, SanYa 572000;2. Taizhou Sunshine Property Insurance Co. Ltd, TaiZhou 318000)
Abstract: The arrival of the era of big data has made the rapid capture of data and real-time analysis essential. Compared with the drawbacks of traditional business intelligence software, the lightweight modeling used by new business intelligence software can quickly respond to changes in demand. Tableau is exactly such a display tool that is aimed at data visualization, agile analysis and completion of business intelligence. Use Tableau for preliminary visual analysis and advanced visual analysis to greatly improve the efficiency of data analysis and operation. This study takes the coastal city of Sanya as the research object, introduces the use of Tableau data analysis software in the analysis of house prices from the perspective of use, and presents the data in a visual form. The analysis found that the coastal distance is the price of real estate in Sanya. One of the main factors, and the impact of traffic conditions and housing area on housing prices is not the most important, and it is of crucial importance to study the main driving factors affecting housing prices in Sanya City and even coastal cities.
Key words: Big data; Business intelligence; Tableau; Bata visualization; Tourism.
随着数字化技术的普遍使用和信息化程度的不断提高,人类正在逐渐跨入大数据时代。当然,发达国家充分意识到这一发展趋向,纷纷将大数据上升为国家的重要策略。[1]2015年8月中国国务院通过了《关于促进大数据发展的行动纲要》,推动了大数据的进一步发展。在企业中,数据已成为一种新的重要策略资产,更多的企业选择了强化数据资產管理,并且开设专门的组织或确定相干的责任部门,大力开展数据分析与运用。数据分析顺应时代发展的潮流,作用越来越大。[2]一方面,海量的数据中藏匿了诸多有价值的信息,通过有用的数据分析与发掘,提出适合的业务建议,能够有效地提高企业竞争力;但从另一方面来看,这样却增加了数据监测、分析任务的难度。传统的数据分析理念、数据分析工具愈加难以顺应新的发展情势。对此,急需提出新的手段和措施,于是高效率的数据分析方法与工具顺运而生。Tableau作为一款定位在数据可视化敏捷开发和完成商业智能展示的工具,能够用来实现交互式的、可视觉化的数据分析和仪表板使用,进而协助企业迅速地了解和知道数据,以此面对不断变化的市场环境与挑战。[3]
一、Tableau的主要特性
一是极速高效。在Tableau的高性能数据引擎中导入数据,它便会以极快的速度开始工作。结束时,只要一下单击便可以完成,过程无需编程。Tableau 的内置装置能在操作的瞬间将数百万行的数据转变为答案。当然也能够直接点击 Tableau左上角的菜单键选择连接到快速数据库、多维数据集,分析实时数据。用户可以依据自身需要在这两选项间切换。[4]二是简单易用。Tableau 是一个直接式的拖拽式工具,用户能够直观的看到其操作带给整体视图的每一个变化,数据随使用者的思路变化而变化演变的过程,得到极速的显示。[5]三是便捷的数据源联接功能。Tableau的数据源联接功能最重要的在于随时随地,无需准备只要联接任何一种数据源就能够开始分析数据。它可以直接与任何文件、电子表格、数据体、数据库以及数据仓库相联接。其动态连接方式让用户能够对每分钟的数据都十分清楚。四是完美的数据整合功能。强大的数据处理功能,专注结构化数据(如Excel、数据库)处理,数据引擎速度极快,在几秒钟内可完成上亿行数据处理,经过智能化可视化模式的选择,把干枯无味的数据用简单、亲和、美观的图表模式展示。[6]Tableau懂得辨认数据字段且会为字段归类,自动创建划分的维度和度量,在确定了维度和度量之后,在Tableau中就可以通过鼠标拖拉拽的方式实现自主式分析。同时,它能够把两个数据源整合到同层,并且可以在一个数据源筛选出另一个数据源,并让筛选出的数据在数据源里突出显示,这种超强的数据整合能力实用性很大。五是优秀的数据分析实践工具。在斯坦福大学中问世,结合了诸多博士的智慧而最终实现的 Tableau,在成为优秀的数据分析工具这条路上走上正轨。从活泼的颜填充模式,再到有丰富有内涵的经典模式,Tableau必定可以帮助使用者找到最适合的影响因素的数据描述方式。[7]
二、三亚市房价的成交情况
作为一款主打简便智能操作的商业软件,通过简单的拖放数据字段信息即可形成可视化图形。此外,Tableau除了没有复杂的代码编辑,仪表盘(控制台)也可完全自定义配置。在仪表板上,不但可以监测信息,而且还提供完整的分析能力。笔者通过收集整理链家网上的三亚市新房数据,整理出三亚市房价统计数据,利用轻量级的BI 软件Tableau作为分析工具,对三亚市房价数据展开多维度分析,通过多种形式的图表,呈现出房价与地段、空间等方面的关系。
(一)文字云分析
文字云作为一种优秀的图形展现方式,这种图形可以看到三亚市所有出售的楼盘。通过连接到数据源三亚市房价统计数据后,做如下操作:将字段“楼盘”拖至【文本】标记,将字段“成交平均价”设置度量“平均值”,并将该字段拖至【大小】标记,将字段“区域”拖至【颜色】标记。然后从【智能显示】菜单键中挑选并单击“填充气泡图”。从【标记】菜单键下拉选项中选择“文本”,此时结果如下图1所示。
图1中说明,字体越大,说明房屋成交额越高,当鼠标滑过任意字段,该字段中将出现该楼盘的详细信息。
(二)条形图分析
若要看三亚市2018年3月份各区域间楼盘成交价之间的对比情况。其操作如下:双击字段“区域”、“楼盘”自动显示在列功能区。双击字段“成交平均价:万元”自动显示在行功能区。接着将字段“成交平均价:万元”拖拽到【标记】里附属的【颜色】一栏,图表就能够依据数值的大小而变化颜色的深浅,十分直观(柱形图的高度代表着住房的总额)。在界面左上角处找到【分析】选项,为图表添加每一个区的平均值线。得到如下图2所示。
从图2可以看出三亚市海棠区楼盘的平均成交额最高,为2674万元。其中住房成交额最高的楼盘是吉阳区的亚龙湾壹号楼盘。就目前来看,房源最多的地区集中在三亚吉阳镇。崖州地区的开售的楼盘数量最少。
三、主要驱动因素分析
本小节使用Tableau尝试分析三亚市房价的某些重要的驱动因素。这里考虑的因素主要有:交通状况(高铁)、临海距离、住宅面积等。
在因素分析中,首先考虑的是高铁距离。操作如下:一是导入数据源,将字段中“城市”(三亚)的地理角色设置为“城市”,双击字段“城市”,此时Tableau会自动界定区域。为了能够精确的知道每个楼盘所在的地理位置,以不同的颜色代表指定的位置,可以在地图中导入各楼盘的经纬度。选择菜单【地图】中的【编辑位置】操作,依次导入经纬度。这里的经纬度数据是从源数据中导入的,由于此次涉及的数据量较少,经纬度的数据是在百度地图中搜素位置查询经纬的。
这样每个楼盘的具体位置得到精确,再次点击字段“楼盘”,地图中将出现多个蓝色的点,每个点表示一套楼盘。当鼠标划过各点,将出现相应的楼盘名称。二是将字段“楼盘”拖至【标记】中的【标签】、【颜色】。字段“区域”拖至【标记】中的【详细信息】。【标记】的填充类型选择“地图”。菜单栏中选择【地图】——【地图层】,勾选“街道和高速公路”“海岸线”及“地名”等选项。为了使地图更加美观,选择背景颜色“黑色”。三是将字段“平均成交价:万元”拖至标记中的“大小”。然后将字段“高铁距离”拖至标记中的“颜色”,设置颜色“红色—蓝色发散”。这样操作的目的是:设置“高铁距离”为因子,住房的“成交额”为因变量。在地图中,据高铁距离影响圆圈的颜色,与高铁距离越近的楼盘,其位置上的圆圈的颜色就越红;与高铁距离越远的楼盘,其位置上的点就越蓝。住房的成交额影响圆圈的大小,该房屋的价格越高,圆圈就越大。操作结果如下图4所示。
从图4中观察到,无论是离高铁距离近还是远,住房的成交额都没有呈现出明显的趋势变化。这就在一定程度上说明了据高铁的距离并不是驱动高房价的主要因素。
其次,考虑的是住宅建筑面积,设置“住宅建筑面积”为因子,住房的“成交额”为因变量。步骤和上述高铁距离因素分析类似,结果得到如下图5所示。
从图5中观察到圆圈的面积大小差异不大,在一定角度上说明了房屋面积并不是房价高的主要因素。
然后考虑的是临海距离。三亚市毕竟是以旅游业为重心发展的城市,三亚市的楼盘也大多为旅游地产。所以考虑到这一因素。为了验证此猜想,设置“临海距离”为因子,住房的“成交额”为因变量。结果得到如下图6所示。
从图6中可以清楚的发现,圆点较大的大多都靠近海岸线一带,离海越近的圆圈红色颜色越深。到此可以由数据归纳出一个可能的结论:三亚市是以旅游业为发展的城市,其充分利用海景等资源推动三亚市旅游地产的发展。特别海棠湾、亚龙湾等地区,离海距离近,风景宜人,成为了该地区在三亚市内房价较高的一个驱动因素。
通过利用Tableau数据分析软件对三亚市楼盘地理位置、成交额和对楼盘附近交通状况、临海距离的比较及楼盘室内空间大小、楼盘类型的分析,数据显示,三亚市内房源在吉阳镇最为密集,天涯镇房源最少。另外,通过观察图表可以得到这样一个结论:三亚市作为一个旅游胜地,高房价的影响因素极大程度与楼盘所处的临海距离有关,而交通状况及住宅面积对于房价的影响并不是最为主要的。从三亚也可以辐射出其他沿海城市房价的主要影响因素,对研究一些沿海城市的房价影响因素有着重要的意义。
参考文献:
[1] 戴国忠,陈 为.信息可视化和可视分析: 挑战与机遇——北戴河信息可视化战略研讨会总结报告[A].中国科学:信息科学,2013(1).
[2] 高 屹.信息可视化技术研究分析[J].科技创新与应用,2016(1).
[3] 飞 扬.2015年度中国大数据综合服务提供商Top100[J].互聯网周刊,2016(2).
[4] 张 志.Tableau在华设立分公司帮助客户掌握数据的力量[J].技术前沿,2015(9).
[5] 王 众.带着苹果基因的BI工具[J].IT经理世界,2016(3).
[6] 马正杰.商业智能软件对比评测:FineBI和Tableau[J].中国IT研究中心,2016(4).
[7] 余国勇.Tableau9.3为数据分析、分享和协作提速[J].信息通信技术,2016(4).
[责任编辑:谭志远]