基于python爬虫数据的枣庄市二手房价空间分析
2018-09-05唐承佳林真真付珊珊
唐承佳,林真真,付珊珊
(枣庄学院 旅游与资源环境学院,山东 枣庄 277160)
0 引言
住房与居民的日常生活密切相关,整体上看住房均价在空间上也存在差异.研究小区住房的特征价格,揭示住房平均价格水平的空间分布规律,不仅可以为政府制定相关发展规划、进行相关基础设施的建设提供参考建议,也可以为居民选房购房提供更直观的选择依据以及为进一步研究城市发展水平和房价变动是否合理提供理论依据.
目前国内对住房价格空间分异特点的研究主要分成两类:第一类是创立特征价格模型,对影响房价的各个因素进行量化,并分析其作用力大小;第二类是使用 GIS技术和地统计学,对住房价格的空间分布规律进一步研究探讨[1].因为影响房价水平差异的许多因素在不同地理位置上互相作用,使得在一定的区域范围内呈现出房价空间分布具有差异性,很多学者对北京、上海、广州、深圳等城市的空间格局应用了空间分析方法做出了详细的研究[2],但当前对三四线城市的房地产价格空间结构和分布规律差异的研究却极少.本文从地理空间分析的角度,住房地理位置结合城市基础设施、CBD等分布状况以及交通设施,研究住房均价空间分布规律及其影响因素.
基于python语言设计爬虫程序,在安居客网站、房天下网站上抓取枣庄市各区县和主城区二手住房小区均价以及其空间位置,建立空间数据库,并将数据库导入ArcGIS软件中,利用其空间分析功能进行空间分析形成核密度图,结合枣庄市各区县以及主城区基础设施、CBD等分布状况和交通设施进行二手住房价格空间差异规律分析,确定影响二手住房价格空间分布差异的因素.为枣庄市房地产开发、城市基础设施合理布局、枣庄市民合理选购住房提供依据,也有助于政府制定相关城市住房政策.
1 研究区状况,数据来源及研究方法
1.1 研究区概况
枣庄市位于鲁中南南部的低山丘陵,处在黄淮冲击平原的一部分地带,全市地势北部高南部较低,东部高西部略低,整体呈现出从东北向西南方向倾伏.枣庄市面积约有4550平方公里,其中包括市中区、薛城区、山亭区、台儿庄区、峄城区和滕州市(县级),全市共有5个街道办事处、39个镇和46个乡.枣庄市经济最初较偏重第一产业,以煤矿出名.近些年以来,深入推进供给侧结构性改革,不断优化升级枣庄市产业结构的同时,服务业发展呈现迅猛趋势.
截止到2017年,枣庄市地区生产总值约2316.21亿元, 2017年枣庄市三次产业结构由原来7.5:51.7:40.8改变成7.0:51.6:41.4,整体上看:第一产业和第二产业比重呈现下降的趋势,而第三产业比重则有所上升,2017年服务业增长7.9%[3].
2017年3月开始,最为严厉的房地产调控政策蔓延全国,一系列与房地产有关的政策密集出台,其目的是不断规范房地产市场管理,枣庄市房地产市场仍流漏出价格持续上涨的趋势,2017年枣庄市二手住房平均价格同比去年上涨10.93.
1.2 数据获取及数据处理
基于Python语言编写代码,设计爬虫程序在安居客网站(https://zaozhuang.anjuke.com/community/?from=esf_list_navigation)、房天下网站(http://esf.zaozhuang.fang.com/)、找房网站(http://zaozhuang.zhaofangw.cn/index.php?caid=3)上抓取枣庄市5区1市的二手住房小区的具体名称小区均价以及各小区的具体地址以及经纬度坐标,获取数据存储于EXCEL表格中.
处理获取的表格数据,对照百度地图(https://map.baidu.com/)检验并修改小区有误的经纬度坐标以及小区地址,删除不存在的小区,将整理后的结果依次按照小区名称、小区均价、具体地址、经纬度坐标的顺序重新存储,建立空间数据库.
1.3 技术方法
运用ArcGIS10.0加载已经矢量化的枣庄市地图,作为空间分析的底图.导入处理后带有房价的空间数据库,在ArcGIS中表现为点要素,并转化WGS-84坐标系,使点要素的坐标与底图坐标相一致.对飞出底图之外的点进行适当修改,将修改后的点要素与底图进行空间相交分析,删除偏差较大的点.
图1.获取的二手房空间数据
对处理后的点要素进行叠加、地形转栅格、核密度等空间分析.
2 枣庄市二手住房小区均价空间分析
2.1 地形转栅格分析
ArcGIS中的地形转栅格是一种插值分析方法,这种分析方法是利用迭代有限差分插值技术.在运算过程中进行优化,使得表面呈现出一定的连续性,类似于局部差值分析的连续行,在实际应用中这种分析方法用来拟合DEM,拟合后呈现出一定的地形突变,从视觉上感受三维立体效应[4].
对相交处理后的点图层进行地形转栅格分析,输入经纬度坐标作为X Y值,X Y在同一平面内,其中Z值导入空间数据数据库中的小区二手住房小区均价作为高程数据,不同的房价代表不同的高程数据,设置容差为5.0 和 200.0.(如图2)
图2.枣庄市二手房价空间分布栅格分析
图中不同的灰色梯度分别代表不同的小区二手住房均价,颜色梯度差别不明显,表明枣庄市二手住房小区均价各区县相差不大,仅在枣庄市南部的台儿庄古城区出现了一个明显的灰度梯度色区,表明该位置的二手住房小区均价与整个枣庄市相比具有显著的差异.
2.2 核密度分析
利用核密度分析工具对其周围邻域范围中的密度进行要素计算.核密度分析不仅可以计算点要素的密度,同样也适用于线要素密度的计算[5].
对枣庄市小区二手房均价进行点要素的核密度计算,利用密度分析算出每一个将要输出的栅格像元周围的点要素的密度.核密度分析可理解为在每一个要计算的点上方都存在着一个较为平滑的曲面,其中在进行搜索半径仅仅允许使用圆形领域,这个平滑的曲面在点位置处其表面的值达到最大,当点与点之间的距离的增大时其表面值也会缓缓下降,而当所要搜索的半径等于点的距离时,此时在该位置处的表面值等于零[6].
在进行操作时,通常情况下,进行建立的平滑的曲面单位一般条件下由所输入的点要素数据决定的,也可以在制图输出过程中自行设定.若使用面积单位,则需要在计算中将所得到的像元密度乘上相对应的因子.
加大半径不会使计算所得的密度值产生很大变化.虽然更大的邻域范围内将包括更多的点,但计算密度时点数将除以更大的面积.更大的半径主要影响是计算密度时需要考虑到更多的点,而这些点可能距栅格像元更远[7].
在ArcGIS中,利用空间分析工具中的核密度分析,以处理后的点要素为对象,进行点要素的核密度计算与分析,设置默认搜索半径参数,生成核密度图(如图3),整体颜色梯度一致,表明枣庄市二手住房小区7整体情况相差不大,但是其中有三个小区颜色梯度具有显著差异性,分别位于市中区、滕州市、薛城区,说明此三处的二手住房小区交易较热,分布较为集中.
图3.枣庄市二手房价空间分布核密度分析
2.3 叠加分析
叠加分析可以实现多种数据集的要素合并,形成一个新的要素.在实际应用中一般是叠加分析与其他空间分析结合使用.采用要素叠加方法将枣庄市内的基础设置要素(路网、水系、商业中心、学校、医院等)与核密度分析得到的图层进行叠加分析[8].综合解释地形栅格转换出现分异的原因以及出现三个核区的影响因素.叠加分析效果如图4.
图4.枣庄市二手房价空间分布与基础设施叠加分析
3 枣庄市二手住房小区均价空间分布特征及其影响因素
3.1 空间分布特征
枣庄市二手住房小区均价总体呈现“一个极核”的分布格局,多个中心发展趋势显现.从枣庄市地形转栅格图中可以看出,枣庄市滕州、薛城、市中均有不规则的中心发展.其中滕州市内的中心大体沿省道、乡道延伸方向延伸,表明滕州市内的二手住房小区均价,受道路的影响较为明显;薛城区二手住房小区均价较高的地方多临近政府机构和学校;市中区内中心发展其周围的基础设施都较完善;台儿庄东南部出现一个极核,以台儿庄古城为中心的极核是全枣庄市内房价最高的地方,房价甚至超过1万元.
枣庄市二手住房小区房源呈现“一个中心,四个次中心”从枣庄市的核密度图中可以看出,市中区二手住房小区房源有一个明显的中心,市中因其为老城人口最多,此处的二手房最受欢迎,在滕州、薛城、峄城、台儿庄区分别出现不同范围的次中心,其中薛城区的次中心呈现出明显的不规则.
3.2 影响因素
住宅价格的空间分布受多种因素的共同影响.结合枣庄市二手住房小区市场的实际情况,发现其二手住房小区均价空间分布影响较大的因素有4个:交通情况、基础设施条件、学校和政府机构、景区.
在国道省道乡道沿线等交通较为发达的地方,沿交通线路分布的小区方便市民上下班,是市民首选的房源,导致二手住房小区均价普遍较高.
在通达度较高的市区,交通情况不是影响二手住房小区均价的主要因素,市民大多愿意选择基础设施较为完善的小区,此时靠近公园、银行、商厦、超市、餐饮等的小区均价普遍较高.
随着枣庄市新城的开发,学校和政府机构的搬迁,有一大部分人搬至新城,这些人包括政府公务员、陪读学生家长和小商贩等.为了工作方便,这部分人多选择居住在交通较为便利的政府机构、学校旁边,使得薛城区内政府机构、学校附近的二手住房小区均价上涨较快.
台儿庄景区是国家AAAAA级旅游景区,游客来自全国各地,由于景区的客流量增多,管理景区的工作人员增多,为了工作方便他们多选择就近居住在景区附近,加之游客的短时间居住,使得以景区为中心的二手小区住房均价普遍较高.
4 结论
利用 GIS 空间分析方法得出枣庄市二手住房小区均价呈现“一个极核”多个中心发展趋势的空间分布格局特征,受到交通情况、基础设施条件、学校和政府机构的影响,中心发展呈现不规则分布,台儿庄景区的发展会抬高附近整体房价,出现一个极核的格局.枣庄市二手住房小区房源呈现“一个中心,四个次中心”.一个中心位于建城区较早的市中区,其余四个次中心分别位于各区县基础设施较为完善的城市建成区.