基于地理格局的水地标空间分析
2021-08-30张仁贡
金 晶,张仁贡
(浙江禹贡信息科技有限公司,浙江 杭州 310000)
0 引言
随着社会经济的不断发展,各地城市规划和建设愈加重视文化内涵,打造文化地标的活动也十分兴盛[1]。文化地标既是城市文化和精神的载体,也是城市文化塑造的参与方。从某种意义来说,文化地标的建设状况直接决定了城市文化的建设效果,影响城市精神的辐射范围和深度,也具有塑造城市之魂的功能和使命[2-4]。中国的城市历史文化沉淀厚实,地标的形成多伴有文学的流传,如《滕王阁序》、《金陵览古诗》、《台城怀古》等。传统GIS中,对于地标的研究多以空间位置的形式,而并非空间坐标,这是因为日常生活中,往往对于坐标串很难理解描述的空间位置,通常则采用比较熟知的参照物或者地名地址,描述相应地标的位置,更容易让人们接受和理解[5-8]。如从全局定性空间位置角度描述地标的空间位置,确保其空间关系的准确性;将定性位认为是目标对象与其他特征的相对参照位置,通过未知特征与已知特征之间建立空间关系来描述。水地标是指一定规模水域为依托,具有文化内涵的水工程、水景观、水聚落,能体现城市或地区的精神风貌和特质[9-10]。以江苏省为例,全省4A级景区180多家,其中具有水资源的景区占比超过50%;省级以上的旅游度假区52家中,依托湖泊、江河、海洋等建设的多达40家,充分体现了江苏的特色。就研究对象来看,国内的研究多着重于城市地标、地理标志产品等[1,3,9];从研究方法角度来说,对于空间格局的研究,多从空间位置格局、聚集程度分析等来探索其空间集聚性[2-3],因而,对于水地标的空间格局研究还较少,同时,受限于数据获取的困难性,对于水地标的空间格局研究仍处于一定的瓶颈期。
随着移动互联网技术的发展,出现了志愿者地理信息,以公众参与为主要形式给城市建设等所需地理信息难以及时、有效更新提供了新的方式,国内的如微博、微信,国外的如推特、Foursquare等,但正是由于公众参与度较高,因而数据的数量急剧增加,但如何抽取出有效信息成为有待解决的难题。本文从GIS空间分析视角出发,依托空间数据及互联网开放数据,基于热点分析等空间分析方法,探索江苏省水地标分布格局,明晰水地标分布集聚及受欢迎程度,为水地标的打造和完善提供空间决策支撑。
1 水地标空间格局分析方法
水地标空间格局分析过程主要包括4个步骤,如图1所示。
图1 水地标空间格局分析过程
(1)数据收集部分,分为基础地理信息数据、扩展地理数据两类,其中基础地理信息数据涵盖了行政区划、水系等数据,扩展地理数据主要包括水地标基本数据、互联网开放大数据;
(2)GIS数据处理部分,主要包括数据清洗、数据抽取、数据转换、数据整合4方面,通过对搜集的数据进行4方面的操作,形成坐标投影统一、属性类型单一、标识编码唯一的可操作水地标相关数据;
(3)GIS空间分析部分,针对水地标的分布特性,通过空间分布、热点分析2个维度,依赖GIS空间分析方法,建立水地标空间格局的分析指标并计算成果。
(4)空间格局成果汇总与整理。
1.1 空间序化方法
对于带地名/位置基因的信息数据,首先需要识别萃取出地名地址信息,依赖地名地址引擎匹配,建立含有地名标识的切分序列与逻辑组合关系,开展基于分词、本体和词语相似性的多种匹配,提出局部模糊匹配后的歧义消除方法,实现高效、精准、实用的地名地址匹配。在进行数据预处理的基础上,进行属性挂接,最后整理入库,空间序化图如图2所示。
图2 空间序化
1.2 热点分析
基于已有的空间数据,利用空间热点分析工具进行水地标的空间分析,运用探索性空间数据分析(Exploratory Spatial Data Analysis,ESDA)中的空间冷热点分析进行建成区空间聚类分析,发现相同空间特征的地区集聚,探索空间发展的异常峰值,用以揭示水地标分布的异质性,发现哪些地区的农场处于热点区域,哪些地区的农场相对“受冷”,分布较少。
空间冷热点检测是通过监测空间数据的总体模式和趋势进行热点评估。当高值与低值同时聚类时,它们倾向于彼此相互抵消,如果低值与高值同时聚类时测量空间聚类,则使用空间自相关工具。
标准化后处理的公式为:
式中,Xj为样本,Wij为研究对象i、j之间的空间邻接矩阵,反映了空间单元的邻近关系。E(Gi*(d))和Var(Gi*(d))分别是Gi*(d)的数学期望值和方差。如果Z(Gi*(d))为正,且显著,表明位置i周围的相对较高,属高值空间集聚,即热点区,反之,如果Z(Gi*(d))为负且显著,表明位置i周围的相对较低,属低值空间集聚,即冷点区。
2 数据搜集
(1)水地标数据
2017年,江苏省正式公布了40个最美水地标(数据来源:江苏省文化和旅游厅http://wlt.jiangsu.gov.cn/art/2017/11/29/art_73168_8138440.html),其 中包括了18个国家级A级景区和7个省级以上旅游度假区。
根据正式公开的数据(40个最美水地标),进行空间序化,如1.1节方法所示,最后整理入库。
(2)微博签到数据
微博签到数据即利用微博开放的API借口,获取其公开的数据,具体流程如图3所示。
图3 微博签到数据获取
首先依托微博开放的API接口,选择合适的编程语言进行调用,本次搜集选用Python语言,其次,通过获取OAuth2.0授权,得到身份认证,由于微博开放接口在一定周期内限定访问请求次数,因而使用代理IP,每次请求http都随即获取一个token,并且设定定时任务更改IP,再次,通过需求设置相应的参数,利用“place/nearby/pois”获取POI信息,将返回的POI数据进行存储,对这些返回的数据进行清洗,剔除无效信息,最后,将清洗后数据进行整理并存储入库。
3 案例分析
3.1 水地标统计
江苏省水资源丰富,从区域视角来说,江苏是全国唯一同时有大江、大河、大湖、大运河的省份,为了凸显“水韵江苏”的特色,江苏省水利厅、省文化厅、省旅游局于2017年共同评选出40个“江苏最美水地标”,按水文化内涵,可分为水工程、水景观、水聚落。
从图4可以看出,①南京、苏州、扬州、淮安的水工程在全省排在前列,均为2个,常州、南通两市没有水工程入选;②苏州、泰州、常州三市的水景观均为2个,为全省最多,连云港没有水景观入选;③除了南京、泰州、盐城,其余10个设区市各有1个水聚落入选。
图4 江苏省最美水地标各设区市统计
在已有数据的基础上,利用地名地址匹配引擎,通过空间序化、数据预处理、属性挂接等处理,完成水地标数据的空间化,并进行空间分布的可视化展示,如图5所示。
图5 江苏省水地标空间分布
从水地标空间分布图来看,全省的水地标以江(长江)、湖(太湖、邵伯湖、洪泽湖、潘安湖、玄武湖等)、海(黄海)、河(濠河、望虞河等)为依托,形成了具有江苏特色的水地标空间分布。
3.2 水地标热点分析
(1)水地标热点分析
基于水地标空间数据,利用1.2节热点分析方法,对水地标空间格局进行分析,结果如图6所示。
图6 水地标热点分析
全省水地标的热点主要形成了“一主两副”的格局,其中,一主主要是指镇江、扬州两市的水地标形成了主要热点,两副是指无锡与苏州交界、徐州市形成了次热点,南京市也形成了相对较低的水地标集聚,由于距离的原因,与扬州、镇江两市的主热点已集中连片。
一方面,就水地标数量而言,扬州、镇江两市均居全省前列,其中,扬州4个,镇江3个,另一方面,从空间分布角度来说,扬州、镇江两市的水地标在空间格局更为集聚,尽管苏州的水地标数量为5个,但分布相对不集中,形成分布相对较散的格局。
更进一步分析,从地形来看,水地标热点集聚地主要是以江和湖为主,主热点地区是依托高邮湖、长江的集聚,次热点则依托潘安湖(徐州)、太湖,此外,洪泽湖周边、南京长江段也有部分集聚,这也充分体现了江苏以“水”为特色的省情。
(2)水地标周边签到空间分析
首先,针对获取的微博数据(现势性为2019年6月),提取水地标500 m范围内的微博签到数据(本研究将500 m范围内的签到数据认为是该水地标范围内的有效活动范围);其次,综合考虑全省面积因素,创建1 km×1 km的格网;利用GIS空间分析(Overlay)功能,将签到数据与格网数据进行挂接;再计算格网内签到次数总数;最后统计水地标微博签到数据排名,如图7所示。
图7 全省水地标微博签到统计
从结果来看,玄武湖微博签到数全省最多,超过了50 000次;前10排名中,南京的水地标占了3个,淮安、无锡2个,南通、扬州、镇江各1个,这也反映了这些水地标相对于其他30个而言,更受到公众的欢迎;就水地标分类来看,水工程3个,水景观4个,水聚落3个,其中水工程3个为江都水利枢纽、三汊河河口闸、武定门节制闸,这三个水工程都部分对外开放,如江都水利枢纽作为南水北调东线工程的源头,开放了比较知名的黄金大道,受到公众的欢迎;三汊河河口闸有外秦淮河水利风景区以及南京水利展示馆,武定门节制闸是蓄水调节的水利工程。而其他水聚落、水景观都因为向公众开放,因而微博签到数较多。
从本案例分析可以得出如下结果:
①全省的水地标以江(长江)、湖(太湖、邵伯湖、洪泽湖、潘安湖、玄武湖等)、海(黄海)、河(濠河、望虞河等)为依托,形成了具有江苏特色的水地标空间分布。
②全省水地标形成了“一主两副”的热点格局,主要包括以镇江、扬州两市的水地标主热点,和无锡与苏州交界、徐州市形成了次热点。
③依托微博签到数据,玄武湖的微博签到数据居全省之首,说明了受欢迎程度最高;此外,全省微博签到排名前10的水地标中,水工程3个,水景观4个,水聚落3个。
4 结论
水地标是人类活动和自然演变的合作产物,也代表了地域水文化的集聚。本文依托水地标数据、互联网开放数据,利用GIS空间分析方法,分析江苏水地标的空间格局分布。通过上述研究得出如下结论:
①针对非结构化带地名基因的数据,GIS空间序化提供了从空间维度探索问题的有效途径,让数据更空间化且直观。
②对于水地标等静态空间分布的现象,构建监测指标,GIS空间分析方法能从有效挖掘出空间规律。
需要说明的是,本文获取的签到数据有一定的局限性,只能反应部分程度上的水地标受欢迎程度,未考虑到没有智能手机或没有用微博APP的用户,在后续的研究中,需要加入其它的数据来源,进一步修正结果。