APP下载

基于三维核密度函数的台风起点模拟

2020-02-24刘大伟黄文锋

关键词:起点高斯台风

刘大伟, 黄文锋

(合肥工业大学 土木与水利工程学院,安徽 合肥 230009)

近年来,我国高层及大跨建筑物与构筑物层出不穷,这些高层和大跨结构对风的敏感性很强,风荷载也成为这些结构在设计时的主控因素之一。我国地处台风频发的西北太平洋西岸,海岸线较长,在相对发达的沿海地区,建筑结构的设计风速是极为重要的安全因素。为了得到足够多的台风数据,只能借助数值模拟的方法。一次完整的台风路径模拟过程包括起点模拟、路径模拟及终点模拟,起点模型的合理性直接决定了整个台风模拟的准确性,这就要求在模拟台风起点时建立合理的起点模型。

目前已有多种模拟台风起点的方法。文献[1-4]采用负二项分布对历史年发生量进行拟合,并抽样得到模拟台风的年发生数量和发生位置;文献[4-5]用泊松分布计算年发生率并采用Monte Carlo方法得到台风的起点位置。上述方法都是基于参数化的统计方法,精度相对较低。在统计学中,密度函数通常用来描述数据的随机性,核密度方法作为一种非参数化的统计方法,目前已经得到了很好的发展。文献[6-7]采用一维高斯核函数模拟台风起点;文献[8]采用二维高斯核函数模拟台风起点。一维和二维核函数都能较好地模拟台风起点的空间位置分布,但没有考虑时间因素的影响。台风的发生位置受到季节因素的影响,文献[9]在模拟台风起点时采用三维高斯核函数来模拟台风起点位置在时间与空间上的分布,使得模拟结果更加精确合理,但是,在模拟时需要对不同区域乘以不同的权值来修正模拟结果,且没有给出权值的具体取值标准。本文以文献[9]的研究为基础,并对其进行了修正,能够较好地模拟西北太平洋地区台风发生位置在时间与空间上的分布。

本文首先对核函数及三维高斯核函数进行简要介绍,然后使用一维高斯核函数模拟台风发生次数,最后根据三维高斯核函数模拟台风起点在时间与空间上的分布。

1 台风起点模型

1.1 数据来源与数据处理

台风起点模型数据采用中国气象局1949—2016年的台风实测数据。每个记录点的实测数据包括记录时间、台风等级、纬度、经度、中心压强及2 min最大平均风速6个参数。为了使起点模型更加准确,需要对得到的台风观测数据进行处理。

(1) 在台风选取时,删除了观测数据中的热带低压记录,即台风等级不超过1级的台风记录。

(2) 在起点选取时,会遇到如下2种情况:若第1个台风记录数据的2 min平均最大风速值不为0,则该点统计为台风起点;若出现前几次记录的2 min平均最大风速值为0,则选取最后一个为0的记录作为台风起点。

根据该统计方法在68 a的台风实测数据中得到1 854次台风起点记录。

1.2 台风起点模型

起点模型包含发生数量和发生位置2个部分,年发生量可根据一维核密度函数随机抽样得到,对于台风的发生位置,本文采用基于时间与空间的三维核概率密度函数(probability density function,PDF)对历史样本进行拟合,然后根据Monte Carlo原理进行随机抽样,最后得到模拟起点的具体位置。

1.2.1 年台风发生数量

核密度估计是一种非参数化的估计方法,基本的PDF为:

(1)

其中,x为被估计的向量;xi为第i个样本向量;n为样本数量;h为窗宽;K(·)为核函数。本文采用高斯核函数,即

(2)

最佳窗宽值可采用有偏交叉验证(biased cross-validation,BCV)方法确定,本文以文献[10]给出的一维BCV的一般式为基础,对具体表达式进行推导,推导过程如下:

(3)

(4)

(5)

将(5)式代入(4)式可得:

(6)

其中,Δij=(xi-xj)/h;xi、xj分别为第i年、第j年的台风年发生数量。将(6)式代入(3)式可得一维BCV的具体表达式为:

(7)

1.2.2 台风发生位置

文献[11]给出了多维核PDF及其窗宽的BCV公式的通用表达式。本文结合具体分析对象给出两者的公式如下:

(8)

(9)

其中,n为样本数量;h1、h2、h3分别为纬度、经度及时间维度的最佳窗宽;xlat、xlon、xtime分别为纬度、经度及时间维度的模拟起点位置参数;xlat,i、xlon,i、xtime,i分别为3个维度的第i个历史样本;Slat、Slon、Stime分别为3个维度的标准差;Δijk=(xik-xjk)/hk,xik、xjk分别为第k(k为1、2、3)维的第i个、第j个正规化样本。由于各维度的取值范围及量纲不同,需要将3个维度的样本进行正规化处理,即将历史样本减去相应维度的均值,再将得到的值除以其标准差。考虑到时间为1~366 d循环变化,为了兼顾前一年年末对当年年初的影响以及后一年年初对当年年末的影响,需要将样本在时间维度上扩大3倍,前一年的时间值在原来的时间上减去366,后一年的时间值在原来的时间上加上366。为了保证3个维度的样本量相同,需要将空间维度的样本等值扩大3倍。

2 算例分析

2.1 年发生次数模拟

台风的年发生次数可以根据(1)式进行随机抽样,但在抽样之前需要确定窗宽的最优值,最优窗宽值可以根据BCV方法得到,即选择适当的h值使(7)式中的DBCV取得最小值。台风年发生次数概率的一维高斯核函数拟合如图1所示。

图1 台风年发生次数概率的一维高斯核函数拟合

从图1a可以看出,当h=3时DBCV有最小值。为了有效评估本次拟合的效果,本文进行了30次模拟,每次均模拟68 a的台风发生数量,30次模拟的平均值为1 892.33次,与历史值的偏差为2.07%,模拟结果较为可靠。

2.2 起点位置模拟

台风的发生位置由纬度、经度及时间3个参数确定,根据(9)式可以确定样本正规化以后3个参数的最佳窗宽分别为0.25、0.15、0.05,最后根据Monte Carlo方法结合(8)式可以模拟出大量台风的起点位置。为了方便与历史值相比较,本文模拟了1 854次台风起点,模拟结果如图2所示。

为了对比模拟起点与历史起点的差异,本文在3个维度方向上分别作了统计,统计结果见表1~表3所列(表中的数据为30次模拟结果的平均值)。

从表1~表3可以看出,模拟结果与历史统计结果相近,相对偏差较小,其中相对偏差大于10%的部分是由于历史数据较少带来较大的相对偏差。模拟值与历史值的偏差主要来自2个方面:① 模型本身具有很高的随机性,而随机性带来的偏差是不可避免的;② 台风的起点位置受多种因素共同影响,本文模型没有考虑除时间和空间以外其他因素的影响,但是有些因素不必单独考虑,比如温度和湿度与时间有很大的相关性,考虑时间因素在一定程度上兼顾了温度和湿度的影响,因此本文选择了3个最主要的因素。

图2 历史与模拟台风起点分布对比

表1 台风起点纬度对比

表2 台风起点经度对比

表3 台风起点时间对比

3 结 论

(1) 本文采用基于三维高斯核函数的方法模拟台风发生位置在时间与空间的分布,该方法能够考虑时间因素的影响,是台风模拟发展的趋势,也为台风全路径模拟打下了坚实的基础。

(2) 最佳窗宽的选择对核函数模拟的精确性有着很大的影响,为了保证模拟结果的可靠性需要确定合理的窗宽值,本文使用有偏交叉验证方法计算出的窗宽具有较高的可靠性。

(3) 利用台风起点模型对西北太平洋地区进行了1 854次模拟,并将模拟结果与历史实测数据在3个维度上分别进行了对比,结果表明,模拟结果与历史实测数据的偏差较小,偏差大于10%的部分是由于历史数据较少带来较大的相对偏差。

猜你喜欢

起点高斯台风
小高斯的大发现
台风过韩
台风来了
天才数学家——高斯
台风爱捣乱
弄清楚“起点”前面有多少
起点
台风来时怎样应对
我的“新”起点
新年的起点