APP下载

基于微博大数据的广州内涝时空分布特征分析

2022-11-25胡茂川张龙海刘丙军王宝华

西北水电 2022年5期
关键词:黄埔区场次内涝

胡茂川,张龙海,刘丙军,杨 辉,王宝华,杨 芳

(1. 水利部珠江河口治理与保护重点实验室,广州 510610;2. 中山大学 土木工程学院,广州 510275;3. 广州市水务规划勘测设计研究院有限公司,广州 510641;4.珠江水利科学研究院,广州 510610)

0 前 言

当前全球气候变暖问题不断加剧,加上快速城市化导致下垫面和局部气候的改变,极端天气事件的发生频次与强度呈现逐渐上升趋势,使得中国内涝灾害问题愈发严重[1-3]。广州市作为粤港澳大湾区的城市之一,内涝频发,且强度呈上升趋势[4-5]。常态化的内涝问题对广州市的正常运行以及公共安全造成了巨大影响,经济发展也受到了威胁。如2020年5月22日,特大暴雨发生导致广州市区内多处产生积水,道路桥梁、地铁站等处受灾严重,交通受到严重阻碍[6]。因此,深入了解广州市近些年的内涝时空分布,对于广州市防灾减灾管理具有重要意义。

城市内涝信息获取方式众多,如遥感监测、灾后调查、社交媒体等[7-9]。其中,社交媒体数据由于来源广泛、获取成本低,近年来在灾害防治中受到广泛的关注。已有研究表明通过探索数据分析方法和空间单元,大规模的社交媒体数据在反映自然灾害发生时间和地点上,取得了良好的进展和应用[10-12].李想[13]使用聚类法处理社交媒体数据中的灾害信息,并将地址信息经纬度化,对现有的灾情地点数据库进行补充完善。Nikita等[14]对Twitter中的灾害信息进行数据挖掘,利用话题标签实现了快速分类聚集并估计了灾害影响区域。

社交媒体种类丰富,其中新浪微博在国内具有最广泛的用户基础。据统计,截止2021年第三季度,微博月活跃人数达到了5.73亿,其中94%为移动端,日活跃人数达到了2.48亿。微博中包含有发布时间、地理定位等记录灾害信息的各类数据[15]。王波等[16]基于微博签到数据构建公众感知指数和公众情绪指数,从时间、空间两个维度分析居民对暴雨洪涝响应的时空格局。肖杨[17]基于微博文本来判别暴雨内涝灾情,并将机器学习算法应用于舆情分析中,为相关应急管理部门的灾害预警提供了一定的参考。

当前,社交媒体数据在城市内涝灾害中的应用尚不多见,且面向单次灾害事件[18-20],针对同类灾害的历史发生规律分析的研究较为少见。伍智超等[21]利用微博数据统计分析了武汉市2015—2019年内涝时空分布特征。在内涝问题严重的粤港澳大湾区尚未有相关研究。本文在分析广州市暴雨时空分布特征的基础上,爬取2017—2021年的微博数据中广州市内涝相关信息,从内涝的空间变化情况、时间变化情况以及在不同行政区的内涝情形差异等方面对广州市近年的内涝形势进行分析,并探讨了其对暴雨的响应情况,为广州市内涝防治工作提供参考。

1 研究方法

1.1 降雨数据来源与处理

降雨数据来源于广东省水利厅汛情发布系统,包括2017—2021年广州市245个站点的场次降雨数据。由于站点分布较均匀且流域内地形起伏变化不大,本文基于各站点的场次降雨数据,通过算术平均法得到广州市行政区划内各区的场次面雨量,分析广州市各区的暴雨分布特征,并将24 h累计面雨量超过50 mm的雨量时间作为微博内涝相关信息爬取的时间边界条件。

1.2 微博数据获取

目前获取微博数据的途径主要有3种:① 微博API(Application Programming Interface);② 第三方爬虫软件;③ 网络爬虫技术。为使数据获取流程具有更高的目的性和指向性,提高研究系统性和高效性,本研究开发了基于XPath路径语言的python网络爬虫程序,该程序主要包括:① 登录微博,获取cookie;② Requests库收集、解析微博页面源代码;③ 根据关键词(见表1)与时间筛选出符合条件的微博文本和签到数据。内涝关键词的选取主要参考了王荩梓[22]的相关文献,具体详见表1。时间上设定为历史场次暴雨发生的时间段。

表1 内涝关键词

1.3 微博信息处理

本研究收集了广州市2017—2021年发生的场次暴雨对应的内涝签到数据(包含文本信息、用户打卡点、时间),由于微博爬取的数据较为复杂,对爬取的签到数据进行了以下处理:

(1) 由于得到的数据包含了其他省份的签到数据,故需要研究区以外的数据进行剔除,这一部分主要是通过Matlab编程进行识别筛选;

(2) 通过人工判读去除文本内容与内涝无关对应的签到数据,比如“选择来这家公司,我真是脑子进水了。”“家里管道爆了,卫生间和客厅被水淹了”等。将处理后微博数据通过百度地图API确定其空间位置。

2 结果分析

2.1 暴雨时空分布特征

2017—2021年广州市发生了31场24 h雨量大于50 mm的暴雨事件,其中19场24 h雨量大于100 mm。暴雨发生最多的是2018年,共发生了9场暴雨事件,最大为281.2 mm(发生于2018年6月8日);2017年紧随其后,发生了8场暴雨事件,相比于2018年,2017年的最大暴雨量均较小;2019和2021年的暴雨事件数量上较接近,有5场左右;2020年暴雨事件最少,只有3场。从场次暴雨对应的月份来看,广州市暴雨事件多发于5、6月份,其次是7月和8月,最后才是9月。

2017—2021年广州市各区发生的暴雨次数如图1所示。白云区发生的暴雨次数最多(27次);其次是荔湾区,暴雨次数为26次;在其后的是从化区、花都区、海珠区、黄埔区和番禺区,均在5 a间发生了20场暴雨左右;相较而言,天河区、南沙区、增城区和越秀区发生暴雨的次数较少,均在15次左右。从发生次数在各区的分布来看,暴雨在广州北部及中部两侧区域发生较多。

图1 2017—2021年广州市各区暴雨发生次数

各区的最大暴雨量分布如图2所示。从化区在这5 a间的最大暴雨量是各区中最大的,达到281.2 mm。紧随其后的是黄埔区与花都区,其最大暴雨量都达到了220 mm以上;其次是白云区和荔湾区,最大暴雨量为175 mm左右;增城区、越秀区、海珠区、天河区和番禺区最大场次暴雨量均比较接近,在155 mm左右;较其他区而言,南沙区的最大暴雨量最小,只有123.8 mm。总的来说,最大场次暴雨量的分布呈现从北向南递减的态势。

图2 2017—2021年广州市各区最大场次暴雨量

2.2 内涝时空分布特征

2017—2021年广州市内涝数分布如图3所示。2018年广州市内涝最为严重(259次),其次是2019年(125次)、2020年(122次),最后是2021年(74次)和2017年(63次)。月尺度上,广州市内涝主要发生于5月和6月(见图4),其中,2018年6月内涝数接近150次,这主要与2018年台风艾尼云在广州引发的强降雨事件相关。

图3 2017—2021年基于微博爬取的广州市内涝数

图4 2017—2021年各月基于微博爬取的广州市内涝数

广州市2017—2021年内涝点空间分布如图5所示。近5 a广州市内涝主要出现于白云区、越秀区、海珠区、天河区。紧邻这些区域的番禺区、黄埔区、增城区、荔湾区也有一些涝点,其余各区在这五年间内涝发生数相对较少。广州市内涝主要发生于主城区,内涝影响程度以其为中心四周扩散有所减弱的态势。

图5 2017—2021年广州市内涝点分布情况

整体而言,广州市辖区的内涝年际变化情况与广州市整体变化情况不完全一致,广州市内涝时空分布差异与各区降雨、下垫面、高程和排水系统等差异有关。2018年广州内涝最为严重,但对于黄埔区、增城区和从化区而言,其内涝数并不是5 a中最多的。这与2018年广州市的内涝主要成因是强台风引发的风暴潮增水灾害相关,从化和增城因地理位置关系,受风暴潮影响相对较小。2020年黄埔区、增城区内涝发生数是该区5 a中最多的。2020年“5·22”广州特大暴雨,黄埔区降雨量达到了176.2 mm,增城区降雨量达到了155.4 mm,位于所有区中的前两位,其中增城区也是该次暴雨事件的重灾区。

3 讨 论

3.1 微博数据可靠性分析

从图1和图5可知,内涝空间分布与暴雨次数空间分布总体上一致,近5 a广州市内涝发生次数年变化与暴雨次数的年分布也较为一致。2018年广州市内涝发生次数最多,2018年广州市暴雨次数和最大雨量也是近5 a中最多的。城市内涝发生最直接影响因素之一就是极端暴雨,通过微博获取的内涝时空分布与暴雨时空分布总体一致,可以反映出微博内涝信息具有一定的精度和可行度。

从图5可知,广州市内涝多集中于越秀、海珠、天河及白云区左下部等主城区域。Zhang等[23]通过对来自广州市水务局防汛抗旱中心的广州历史涝点数据分析也得出了类似结论。可见,基于微博获取的内涝信息具有较高的可信度。王荩梓[22]对比基于微博获取的内涝信息和上海市历史涝情,证明微博内涝信息可覆盖和补充官方观测数据,具有较高的精度。本研究中由于缺少详细的历史涝点数据,微博内涝信息的精度仍需进一步的验证。

3.2 内涝对暴雨的响应

虽然广州市内涝时空分布总体上与暴雨时空分布一致,但两者并不完全相同。部分市辖区如从化区和花都区近5 a内的暴雨次数和最大暴雨量都相对较大,但微博内涝签到数并不多,而有些区如天河区的暴雨次数和最大暴雨量相对其他区较少但提取出的内涝相关微博签到数却很多。这一现象的产生与各区的城市化程度、排水管网以及人口分布均有关系。如天河区人口密度较大,微博活跃人数多,内涝发生时发博数可能会更多,并且由于城市化程度较高,不透水面积大加上排水管网失修损害等也会加剧内涝灾害的发生,就算是暴雨量较小也可能会发生较严重的内涝,同时这个区域离珠江河口近,易受风暴潮和天文大潮影响;而花都区和从化区的人口密度和城市化程度较低,再加上地势较高,虽然雨量很大,但内涝的发生数和相关微博签到数可能较少。

4 结 论

本研究在利用广州历史降雨站点数据计算各行政区面降雨量的基础上,分析了2017—2021年广州市暴雨时空特征,之后利用python爬虫程序从微博数据中爬取了广州市2017—2021年的微博内涝签到数据,经过去噪后,基于百度地图API进行空间定位,分析近5 a广州市内涝时空分布情况,形成结论如下:

(1) 微博签到数据能较为直观地展示广州内涝分布情况,具有较高的可信度。

(2) 内涝主要出现于越秀区、荔湾区、海珠区和天河区,其次是白云区、番禺区、黄埔区。

(3) 2018年广州市受内涝影响最大,其次为2020、2019年和2021年,而2017年相对受影响最小。

(4) 月尺度上,广州内涝多发生于5月和6月。

(5) 广州市辖区的内涝年际变化情况与广州市整体变化情况不完全一致。

(6) 受城市化、排水能力、人口及潮位等因素影响,广州市内涝时空分布总体上与暴雨时空分布一致,但不完全相同。

本研究还存在一些不足和改进之处,如:微博数据受人口密度影响较大,人口分布较少的区域信息相对较少;由于微博数据对于地名描述较为模糊,借用百度地图API进行空间定位会产生一定的误差,微博反爬限制也可能会导致部分内涝信息缺失等。本次研究主要是基于微博数据对内涝进行定性的分析,而定量(水位、水量)信息对于未来内涝的趋势分析与评价更为重要,后续可通过文本信息提取来进行一些定量分析以提高可信度。

猜你喜欢

黄埔区场次内涝
书画展示
搜城
黄埔区
长江上游高洪水期泥沙输移特性
基于运行场次用时误差的载人设备故障预警可视化研究
排考场次分配方法及其SQL实现
国外应对城市内涝的智慧:从“驯服”到“巧用”
黄埔区青少年“展翅计划”夏令营圆满落幕
地铁观影指南
城市内涝的形成与预防