APP下载

影响台风陆地衰减速率的定量与定性研究

2014-08-08时文晓孙趣张帅王梦妍刘静

2014年11期
关键词:回归分析

时文晓 孙趣 张帅 王梦妍 刘静

摘要:本文主要针对台风陆地强度衰减速率变化的问题,充分考虑了影响登陆后台风强度衰减速率的主要因素,采用第2代回归统计建模方法(PLS)建立了台风登陆后其强度变化模型,并对各个因素包括时间因素、地形地貌、纬度因素等对台风强度衰减速率的影响进行了定量的评价分析。ザ杂谔ǚ绲锹胶笃淝慷缺浠模型的建立。采用第2代回归统计建模方法,设自变量为登陆时最大风速,中心气压,纬度,季节,移动速度;因变量为24小时风速的减小量和气压增加量。应用偏最小二乘回归算法得到回归系数,最后得到在未来某时刻预报的强度预报。把自变量和因变量标准化,提取主成份,逐步回归。ト缓螅模型求解和分析。通过偏最小二乘法(PLS)求解,并由偏最小二次法模拟的回归方程。由模型分析和计算数值可得到相关结论:台风强度衰减速度和登陆时中心气压值成负相关关系,和登陆时最大风速成正相关关系。プ詈螅将本模型求解的结果和预期结果,实际台风衰减速率的变化状况,回归模型的结果进行比较,对模型进行检验,进一步优化模型。在上述模型的基础上,利用计算机进行编程,推广方便,移植性较好。

关键词:台风陆地衰减速率模型;台风强度;偏最小二乘回归算法;回归分析

1.问题重述ザ杂谄苹敌约大的台风,找出台风登陆之后衰减速率与各种因素之间的关系,分析影响登陆后台风衰减速率的主要因素以及登陆后台风衰减速率的分布特征,对于台风灾害损失及风险评估具有重要的意义。ネü分析1949年以来的台风数据,可分析出衰减速率的分布特征,其中包括空间和时间的分布特征,再进一步分析影响台风衰减速率的因素之间的关系,并建立台风登陆后其强度变化模型,定义强度衰减速率,计算每场台风的衰减速率。プ詈螅根据建模分析的结果,写出有关于影响台风陆地衰减因子的数值研究报告。

2.问题分析ナ紫仁亲柿系乃鸭与整理。对于附件中给出的所有台风的数据,筛选出题目要求的“登陆台风”,即在陆上持续时间超过24小时或在陆地上消亡的台风,以方便后续计算。サ诙是模型的分析。台风强度变化会受其登陆位置、登陆时间、登陆时中心气压及最大风速等因素影响。我们要逐步分析各个影响因素与台风强度之间的关系。通过分析得到定性结论,模型建立后可以通过模型拟合数据进一步验证。サ谌是模型的建立。通过对相关数据以及变量的分析,改进最小二乘法,采用偏最小二乘法。将数据标准化后,把相关信息写成矩阵形式,并写出矩阵形式的自变量、因变量的初始矩阵,通过逐次拟合,得到回归方程及回归系数,即可求得登陆台风的衰减强度和各个因素间的关系,并将筛选出的登陆台风的衰减强度算出。プ詈蠼模型求解结果和实际衰减强度,以及与最小二乘回归得到结果进行分析比较,可以对模型进行评价。

3.模型假设及符号系统说明

3.1模型假设ィ1)数据参考1949—2010年台风相关数据范围,其中取登陆台风数据进行模拟,所有数据均有效;ィ2)台风强度由24小时中心气压和风速变化量可以确定;ィ3)登陆台风定义为在陆上持续时间超过24小时或在陆地上消亡;ィ4)地转偏向力、水汽、地形摩擦因素视为次要因素,在回归方程中通过常数项拟合;ィ5)台风路上维持时间定义为:登陆时刻至路上消失或入海之间的时间间隔,多次登陆者取在大陆上的维持时间之和;3.2符号系统说明Di—— 台风数目的削减率;N —— 登陆某地的台风总数;Ni—— 登陆后在一段时间内减少的台风数;v0—— 台风登陆时最大风速;p0 —— 台风登陆时的中心气压;N —— 台风登陆的纬度;m —— 台风登陆的季节;vv—— 台风中心的移动速度;v —— 24小时风速的减小量;p —— 24小时气压增加量;tm—— 提取的主要成分;R┨ǚ绐 —— 预报趋势一致率;vi琾—— 预报的台风强度;vi琿——观测的台风强度rr—— 7个变量之间的相关系数矩阵;data—— 将原矩阵标准化之后的矩阵;x0—— 自变量的初始矩阵;y0—— 因变量的初始矩阵;e0—— 自变量的初始矩阵标准化;f0—— 因变量的初始矩阵标准化;beta—— 拟合回归方程的系数;I —— 提出的成分个数;

4.模型的准备

4.1建国以来西北太平洋台风概况ゾ萃臣拼1951年至今,我国每年大概3~12个台风登陆我国东南沿海,造成严重的经济损失和人员伤亡。因此,关于台风的生成、移动路径、强度和登陆的预报一直是我国与有关国家气象界热点的研究课题之一。ケ疚氖紫茸凼隽私年来WNP海域台风和台风生成和活动在季节、年际、年代际时间尺度上的变化规律,以及造成这些变化的可能物理机制的研究进展,然后对将来的研究动态进行展望。

4.2影响台风陆地衰减的各因素分析ヌǚ缭诼缴衔持的时间各不相同,由1949—2010年台风登陆情况,根据年鉴[2,3]资料,它们的登陆活动有以下几种登陆情况:登陆后在路上消失、深入大陆后再度入海、过岛入海后在境外再次登陆(最终去向不明)以及未深入大陆(在陆上不足24小时)即入海。下文研究的重点是台风在陆地上的衰减,后三种情况台风登陆后只要仍受海洋的影响,下面的统计中将只考虑前两种情况。

4.2.1时间因素ィ1)登陆台风持续时间分析ヌǚ绲锹胶笪持时间长短和台风登陆的强度有关。为减少季节变化、地理位置不同、地表差异的干扰,更直接表现维持时间与强度的关系,我们制作了7~8月在浙江登陆台风的陆上维持时间与登陆时强度(中心气压和最大风速)的相关点聚图。得到台风维持时间与其强度有明显的相关。台风陆上维持时间与登陆时的风速成正比,与中心气压成反比。弱的台风维持时间短,越强的台风维持时间越长。ヌǚ绲锹轿持也与季节有关。台风陆上维持时间的月际变化,登陆数最多的为8、7月,台风维持时间最长,其次是6月、9月, 10月、11月和5月的维持时间较短。ィ2)台风登陆后的强度衰减分析(30个典型长时间登陆台风)ヌǚ绲那慷缺浠主要发生在登陆后的6小时内,其中心气压值明显增加。24小时之后台风强度变化不明显,台风以相当于热带低压的强度在陆地上维持和移动,其中心气压或加强,6小时的波动幅度一般为2hPa左右。

4.2.2陆地因素ィ1)地形影响ケ疚牟捎肁kima多项式内插值法,将台风做成时间间隔为1小时的光滑路径,使模拟路径与真实路径重合很好。用Matlab拟合台风强度分布图。得到以下结论:ア倌Σ亮Γ禾ǚ绲锹胶蟮匦文Σ列вΧ蕴ǚ缜慷染哂醒杆偎ゼ踝饔茫华ア谒汽:台风形成需要暖性洋面。台风内部气体分子之间的以运动摩擦会含有巨大的能量,必须靠广阔热带海洋上释放的潜热来提供。ア燮渌:登陆后地形的动力爬升及降水増幅效应,一定程度可以减缓台风的减弱;登陆后陆地对表面潜热输送的阻断使台风强度减弱[5]。ィ2)地区影响1949-1980年间台风登陆我国次数为400次,年均12.5次。32年来我国沿海从广西向北至辽宁均有台风登陆。其中广东是登陆次数最多的地区,约占总次数的52.75%。其次是台湾、福建和浙江,接下来依次为广西、山东、辽宁、江苏、上海、香港和天津。ザ杂谄皆和山区,在山区登陆的台风半数以上在24小时内消亡,平原不足1/5。ィ3)纬度影响ア俨煌纬度登陆数目ノ了便于分析,将我国部分沿海地区分为3个纬度带:21°~28°N,主要是华南沿海地区;28°~35°N,主要是华东沿海;35°~42°N,即我国北方沿海地区。将台风登陆各个纬度带后就地消亡的称为消亡类台风,登陆各个纬度带后又重新入海的称为入海类台风。ソ台风在陆地上的维持时间定义为登陆台风在三个纬度带内维持的时间间隔。将入海类台风在陆地上的维持时间定义为入海类台风在陆地上平均维持时间(见表1),消亡类台风在28°~35°N 带内维持时间最长,最北纬度带最短,最南纬度带次之。

表1登陆台风在各纬度带陆地上的平均维持时间

②不同纬度衰减速度ト粲锰ǚ绲锹胶笤诼降厣厦6h气压的增加值代表衰减速度。得下表2:在最南纬度带登陆台风其强度衰减最快,中间纬度带衰减最慢。这与表1中消亡类台风在28°~35°N内维持时间最长相对应。

表2登陆台风在各纬度带陆地上的衰减速度

5.模型的建立

5.1方法的确定ノ了加强模型的准确性,需要增加自变量中的因子来改进强度预报方法。但随着自变量中因子个数的逐渐增加,自变量因子之间出现显著线性相关性的概率也大大增加,因此将第2代回归统计建模方法——偏最小二乘(PLS)回归引入到线性回归模型当中,进一步提高台风强度模型分析准确性。ザ杂谄鸨ㄊ笨涛猼的台风,使用PLS模型对未来t+Δt时刻的强度进行预报。首先按照上述选择历史样本的原则挑选历史台风样本,并计算出相应的自变量xi和因变量y;然后应用偏最小二乘回归算法得到每个自变量的回归系数βi;最后利用起报t时刻的自变量Xi,得到在未来t+Δt时刻的预报强度Y。

5.2目标函数的确定ア偕枇⒈淞俊*プ员淞课登陆时最大风速v0,中心气压p0,纬度N,季节m,移动速度vv;因变量为24小时风速的减小量v和气压增加量p。并把变量标准化。标准化处理后的数据矩阵极为E0=(E01,E02,…,E05)〗﹏xp,Y经标准化处理后数据矩阵为F0=(F01,F02)〗﹏xp。ア谔崛≈鞒煞荩逐步回归。ゼ莟1是E0的第一个成分。t1=E0 w1,w1是E0的第一个轴。它是一个单位向量,即‖w1‖=1;u1是F0的第一个成分,u1=F0 c1,c1是F0的第一个轴,‖c1‖=1。ソ立台风模型,根据主要成分分析原理应该有:var(t1)→max var(u1)→maxチ硪环矫妫瑃1、u1的相关程度应达到最大值,即r(t1,u1)→max。实质上是要求t1、u1的协方差达到最大。然后,可求出E0 、F0对t1的回归方程,而得到方程的残差矩阵E1 、F1。用残差矩阵E1 、F1取代E0 、F0,再求第二个轴w2和c2以及第二个成分t2、u2。同理可得E1 、F1对t2的回归方程。ア壑馗匆陨喜街瑁直到提取的主成分tm对模型预测效果的边际贡献不显著为止。ア芨据交叉有效性,确定共取m个成分t1 、t2…、tm可以得到一个满意的预测模型,即得回归方程。通过matlab得回归方程,如下两个式子即为台风强度变化模型,y1,y2数值代表24小时内中心气压增大值和风速的减少值,即衰减速率。y1=-2.3821-0.0062t1+0.7539t2+0.3478t3-0.0809t4+0.0460t5y2=-3.0242-0.0048t1+0.7195t2+ 0.3107t3-0.0748t4+0.0452t5

6.模型求解与结果分析

6.1模型的求解

①将符合条件的336个台风自变量数据选出,求出回归系数矩阵记为:a=[-0.0062,0.7539,0.3478,-0.0809,0.0460];b=[-0.0048,0.7195,0.3107,-0.0748,0.0452];ア谟胊*t,b*t算出每一场台风的强度,从而可以得到模拟台风气压变化值和模拟台风风速变化值。

6.2 结果分析

①由模型和计算可得到:空间上,登陆台风衰减速度在最南纬度带最快,中间纬度带最慢;时间上,台风在登陆6小时内衰减最快,24小时后趋于稳定。ア谟善最小二次法模拟的回归方程可知,台风强度衰减速度和登陆时中心气压值成负相关关系,和登陆时最大风速成正相关关系。

7.模型评价、改进与推广

7.1模型优缺点

从技术层次上,统计预报和数值预报方法相结合的主要途径之一是在统计预报方程中增加自变量,而所增加的自变量则需从数值预报产品中具有显著动力学表征力的样本中挑选。然而,随着自变量个数的大量增加,自变量之间出现显著线性相关性的可能性增加、自变量大于样本量的可能性也将增加;这显然将严重影响多元线性回归建模的恒稳性,进而导致预报的失效。本文所用的PLS模型,其回归建模的核心技术——偏最小二乘方法恰恰能够在自变量存在严重相关性和样本量小于自变量个数的条件下,建立有效地针对小样本、多自变量的统计外推模型。サ碧ǚ缜慷燃跞趸虺中时间至72小时后,PLS模型的预测能力和STI相差愈小,有时候甚至不如STI模拟效果好。一方面可能由于没有具体考虑地形差异导致,另一方面可能由于样本数量仍不够多。

7.2模型改进与推广

可以将地形具体因素考虑到台风强度衰减判断中,进一步优化模型;或者搜集更多的有效数据,验证此方案的合理性。ゾ」苋绱耍由于PLS模型采用了偏最小二乘回归法,算法上的合理性已经可以较为准确估计台风衰减。同时,此模型可以增加更多的具有动力表征量的自变量,用以优化该模型,达到更好预估实际台风强度及衰减速率。以方便将此技术运用于实际,进一步改进台风强度的预报。

おおおお

参考文献:

[1]黄荣辉,陈光华. 西北天平样热带气旋移动路径的年际变化及其机理研究. 气象学报,2007.

[2]上海台风研究所. 西北太平洋台风基本资料集(1949—1980). 北京:气象出版社,1984

[3]中国气象局. 台风年鉴(1981—2000). 北京:气象出版社,1982—2001

[4]李英,陈联寿,徐祥德. 水汽输送影响登陆热带气旋维持和降水的数值试验. 大气科学,2005.

[5]王晓芳,李红莉,王金兰. 登陆我国热带气旋的气候特征. 暴雨灾害,2007.

[6]陈联寿,丁一汇. 西太平洋台风概论. 北京:科学出版社,1979.

猜你喜欢

回归分析
社会保障支出与GDP之间的关系研究
我国城镇居民消费水平影响因素实证研究
基于CGSS2003数据关于住房影响因素的报告
基于CGSS2003数据关于住房影响因素的报告
溶血标本对生化检验的准确性干扰及纠正性回归分析
中国经济发展状况与大学生就业情况的相关性研究
北京市旅游产业与经济增长的实证分析
城乡居民医疗费用的相关性与回归分析
基于变形监测的金安桥水电站坝体稳定性分析
森林碳汇影响因素的计量模型研究