符号动力学和信息熵在暴雨监测中的应用研究
2014-11-27杜言霞,林辉阳,汪月霞,温继昌
杜言霞,林辉阳,汪月霞,温继昌
摘 要:暴雨是世界上最主要的灾害之一,每年都会给国民经济和人民的生命财产造成巨大的损失。但是,暴雨预报是非常困难的,造成这种情况的根本原因是对大气环流短时间的突变和强对流天气系统发生、发展的机理了解得非常少。这其中包括对大气内部的动力机制及其与外部环流之间相互作用的物理过程和热带、中纬度的各种天气系统异常变化的机理,特别是对多尺度相互作用的研究还非常浅显。假如忽略一些随机因素的影响,大气系统可以被认为是一个确定性的非线性系统。符号动力学是非线性科学的一个分支,有着深厚的理论基础,它已慢慢成为实际工作中所要掌握的工具之一。信息熵是信息论中最重要的物理量之一,它把非线性科学与统计学结合起来,已经成为了一种分析非线性问题的重要工具。利用符号动力学和信息熵对暴雨过程进行研究具有一定的探索意义,通过分析大量暴雨过程的熵曲线,发现大部分暴雨过程在发生前10 d内,其熵值达到了极小值。这一征兆的发现表明,该方法在对暴雨事件进行监测和预报方面具有一定的研究价值。
关键词:符号动力学;信息熵;暴雨;小波去噪
中图分类号:P446 文献标识码:A 文章编号:2095-6835(2014)21-0148-03
1 暴雨研究
暴雨预报是世界难题之一,根据《科学时报》登载,美国暴雨预报的准确率是22%,中国仅为19%,暴雨研究引起了世界各地气象科学家的重视,并且他们对此进行了大量的研究。目前,科学家的研究主要集中在监测手段的事实分析、数值模拟和动力及热力诊断等方面。随着自动气象站、风廓线仪、雷达、卫星等气象监测手段的不断完善和气象学理论的发展,暴雨中尺度系统发生和发展机理的研究也在日趋深入。暴雨研究概括起来主要集中在以下三个方面。
1.1 观测研究和建立概念模型
从气象科学的理论出发,认为暴雨、洪涝、强风暴、雷暴和龙卷风等天气现象经常是中尺度对流系统(MCSs)造成的,弄清楚了MCSs的结构和发生、发展机制,就能够对这些天气现象做出合理的解释和预测。中尺度对流系统的分析主要是利用卫星云图进行的,包括分析颮锋云型、雷暴低层外流边界、弧状云线的形成、雷暴中高压、云团的形成及其相互作用等。
1.2 数值模拟和分析诊断
这是目前气象学的研究热点,随着研究的不断深入,其理论也在不断充实。简要的讲,数值模拟和分析诊断就是从目前的大气状态来看,通过求解支配大气状态演变的动力和热力方程组,推导未来的大气状态。
1.3 动力分析和理论研究
从动力学的理论出发,反演出具体天气现象与物理参数的关系,或者总结出物理量随天气变化的规律。比如气压、浮力、潜热释放、能量变化等随天气的变化。
如果忽略一些随机因素的影响,大气系统可以被认为是一个确定性的非线性系统,而非线性时间序列分析也成为了从观测资料中探索复杂系统现象和揭示其物理本质的强有力的工具。符号动力学是非线性科学的一个分支,在利用非线性时间序列揭示复杂系统物理本质方面非常有效。信息熵是信息论中最重要的物理量之一,在非线性科学、统计力学和最优信息处理等学科领域中被广泛应用。本文利用符号动力学对非线性时间序列进行分析,先对大气可降水量原始数据的非线性时间序列进行预处理,包括插值和去噪;再利用符号动力学和信息熵分析暴雨过程。
2 时间序列的插值
常用的插值方法有最近邻点插值、线性插值、立方插值和三次样条插值。为了比较这几种插值方法对大气数据的插值效果,本文以成都地区2007-03-01—2010-03-31的可降水量时间序列为测试序列进行研究。该时间序列共4 508个数据点,其隔点采样为2 254点,分别采用最近邻点插值、线性插值、立方插值和三次样条插值。为了直观地比较插值结果,选100点作图,插值时间序列与原始时间序列的比较如图1所示,4种插值方法的绝对误差比较如图2所示。为了定量衡量插值效果,分别计算插值时间序列与原始时间序列的绝对误差的均方根、平均值、方差和插值时间序列与原始时间序列的相关系数,结果如表1所示,从图1、图2和表1中可知,三次样条插值的精度最高。因此,在本文研究中,将选择三次样条插值方法对大气时间序列进行插值。
图1 4种插值法与原始时间序列的比较
图2 4种插值方法产生的绝对误差
表1 差值结果的统计比较
插值方法 均方根 平均值 方差 相关系数
最近邻点插值 1.944 1.079 3 2.615 8 0.990 7
线性插值 1.311 0.735 3 1.180 8 0.996 0
立方插值 1.307 0.731 3 1.174 6 0.996 0
三次样条插值 1.296 0.726 9 1.152 6 0.996 1
3 时间序列的去噪
在小波域阈值滤波去噪中,阈值函数的选取是关键,软阈值函数和硬阈值函数是两种经典的阈值函数。虽然这两种阈值函数都被广泛应用,但是,它们都有自身固有的缺点。
在经典软阈值函数、硬阈值函数的基础上,提出了新阈值函数,将其定义如下:
.(1)
式(1)中:M——任意正常数,一般为正整数,本文取M=5.
当M趋于无穷时,新阈值函数逼近于硬阈值函数。从定义中可以看出,新域值函数克服了硬阈值函数不连续性的缺点和软阈值函数对大于阈值的小波系数进行收缩而产生较大偏差的缺点。
下面对软阈值函数、硬阈值函数和新阈值函数进行对比、研究,并运用信噪比(SNR)和最小均方误差(MMSE)衡量这几种阈值函数的去噪效果。
为了比较各种阈值函数的去噪效果,选用MATLAB中wnoise函数产生的含噪信号bumps进行测试。运用信噪比(SNR)和最小均方误差(MMSE)检验去噪效果。将信噪比和最小均方误差定义为:
. (2)
. (3)
式(2)(3)中:px——原始信号的能量;
——噪声的能量;
N——原始信号的长度。
信噪比越高,说明信号中的噪声越小;最小均方误差越小,说明去噪后信号与原始纯净信号越接近,去噪效果越好。
3.1 确定最优分解层数
为了确定将原始信号分解为多少层时去噪效果最好,选用db4小波对bumps信号进行分解,并用新阈值函数处理小波系数,表2列出了不同分解层数的去噪结果。
表2 不同分解层数新域值函数的去噪效果
层数N 1 2 3 4 5
SNR 71.142 75.625 77.313 77.723 77.959
MMSE 0.444 4 0.283 9 0.239 8 0.230 2 0.224 8
层数N 6 7 8 9 10
SNR 77.951 77.803 77.793 77.793 77.793
MMSE 0.225 0 0.228 3 0.228 5 0.228 5 0.228 5
从表2中可以看出,当分解层数N为5时,信噪比最大,最小均方误差最小,这时的去噪效果最好,因此,本文选用的分解层数为5.
3.2 各种阈值函数的去噪效果比较
为了比较上述3种阈值函数的去噪效果,本文用db4小波对bumps信号进行5层分解,并分别用上述3种阈值函数进行处理,重构获得的去噪信号。3种阈值函数的去噪效果如表3所示。从表3中可以看出,软阈值函数去噪的信噪比最小,最小均方误差最大,去噪效果最差;新域值函数去噪的信噪比最大,最小均方误差最小,去噪效果最好。
表3 硬阈值函数、软阈值函数和新域值函数的去噪效果
阈值函数 原始信号 硬阈值函数 软阈值函数 新阈值函数
SNR 63.769 0 76.012 2 64.651 1 77.959 0
MMSE 0.929 1 0.273 1 0.850 6 0.224 8
4 时间序列的符号化
时间序列符号化就是将原始时间序列转化为符号序列的形式。将观测数据分割成一系列离散的数字,常用的分割方法有两种,即分割区间法和差值法。本文采用的方法是分割区间法,首先选择一条合适的分割线,如果原始数据在分割线上,则记为1,否则记为0. 这样原始时间序列就转化为了由0和1组成的离散符号序列。
关于分割线的选择有多种不同的方法。好的分割线应该使符号轨道唯一地对应在一个连续的空间轨道上,这样符号动力学特性就完全等价于连续空间中的动力特性,这样的分割被称为生成分割。
生成分割应该保留原始系统的信息,最优分割是生成分割的最好逼近,它是使分割得到的符号序列熵最大的分割。为了获得最优分割,设定初始分割值为时间序列的平均值,并计算获得的符号时间序列的熵,然后在平均值周围微调分割值,并计算相应的熵值,选取熵值最大的符号序列对应的分割值作为最优分割值,此符号序列为最优符号序列。
5 符号序列的统计分析
在对符号序列统计、分析之前,需要将符号序列编码。先从符号序列中提取出长度为n的字(图3中n=3),然后将每个字作为1个二进制数,并将其转化为十进制数。这样,不同的字可以用1个唯一的十进制数表示,符号序列就转化为了代码序列。在编码后,就可以很容易地知道每个字出现的概率,可以用柱状图表示,如图3所示。
图3 符号序列的编码图和序列的柱状图
在实际研究中,必须选择合适的n值,如果选取的n太小,那么,计算得到的熵值不能反映系统信息量的大小;但是,如果n值选得太大时,计算熵值需要的数据量会很大,会大大增加计算的复杂度。
按照上述方法获得每个字出现的概率后,就可以很方便地根据信息熵公式计算熵值。信息熵计算公式为:
. (4)
式(4)中,pi——第i种代码出现的概率;
H——该代码序列的熵值。
计算获得每一段的熵值后,可以得到1个由熵值组成的时间序列,观察在暴雨前该熵值序列的变化情况,进而得出一些有意义的结论。
6 暴雨事件实例分析
2013-07-09,成都地区遭遇强降雨袭击,利用符号动力学方法分析此次暴雨事件。使用的大气可降水量时间序列来源于每日4次的分辨率为1°×1°的NCEP再分析格点资料。
6.1 可降水时间序列的插值
本文将采用三次样条插值法对大气可降水量时间序列进行10倍插值,图4是成都市2011-06-10—2011-07-09的大气可降水量数据,对其进行10倍插值后如图5所示。
图4 可降水时间序列的分段示意图
图5 插值前后的时间序列
6.2 可降水时间序列的去噪
采用新阈值函数对插值后的可降水量时间序列进行去噪,先采用db4小波对可降水量时间序列进行小波分解,分解层数为5,然后用新阈值函数处理小波系数,最后再用小波逆变换重构处理后的小波系数,进而获得去噪后的大气可降水量时间序列。
6.3 可降水时间序列的分段
对去噪后的可降水量时间序列按照每三天数据分为一段,即插值后每段数据长度为120,然后测试每段数据的平稳性。此次所用的数据第一次分段后的每段数据都是平稳的,因此不再重新分段。分段后的数据仍用图4提供的数据,分段后原始时间序列被分为{t1,t2,…,t14}共14个小段,由于最后一段不够120个数据,因此丢弃。
6.4 可降水时间序列的符号化
以分段后的第一段t1为例介绍时间序列的符号化,其他小段符号化的方法相同。计算t1段的平均值m,并将其作为阈值,然后将大于m的置为1,其他的置为0,可用公式表示:
. (5)
式(5)中:Si——第i个元素符号化后的符号;
xi——原始时间序列中的第i个元素。
计算所获得的符号序列的熵值(熵值的计算方法将在后文介绍),然后在平均值周围微调阈值,并计算相应符号序列的熵值,最后将熵值最大的符号序列作为最优符号序列。
6.5 符号序列的编码和统计分析
为了便于统计分析符号序列,需要对符号序列进行编码。将符号序列分为长度为n(n取值为3)的子序列,这里称其为字,然后将每个字当作1个二进制码,将其转化为十进制数,这样,每个不同的字对应1个不同的十进制数,即可以用1个十进制数表示1个字,便于后面统计每个字出现的概率。
图6 成都市2013-06-10—2013-08-09的熵曲线图
符号时间序列分析的重点在于分析每一个字的相对频率,通过分析出现的字,达到揭示系统动力学特性的目的。一般来说,表征系统主要特性的字出现的频率往往较高,而那些出现频率很低的字不能反映系统的动力学特性。对符号序列进行编码后,就可以很方便地计算出每种字出现的概率及其信息熵。
在计算每个子序列的熵值后,就得到了1个由熵值组成的序列,熵值代表其对应时间序列信息量的多少,这样就可以得到随着时间的推移系统信息量的变化。如果在暴雨来临之前出现了很小的熵值,则认为在暴雨前出现了征兆。根据此征兆可以对暴雨做出预测。
图6为成都市2011-06-01—2011-07-09的熵曲线图,先将可降水量时间序列进行10倍插值和去噪,然后将时间序列分为10段,分别计算每段时间序列的熵值,这样便获得了由熵值组成的时间序列,每个熵值对应3 d时间。从图6中可以看出,在暴雨发生前6 d出现了明显的熵最小值,此即为暴雨出现的征兆(或称预报因子)。
7 大量暴雨实例的研究结果
本文分析了全球68个暴雨过程,选取每个暴雨时间暴雨前30 d的可降水量时间序列,然后采用三次样条插值方法进行10倍插值,再用新阈值函数去噪,最后将去噪后的可降水量时间序列采用符号动力学的方法统计、分析,做出熵值曲线。结果表明,其中有44个暴雨过程在暴雨发生前的10 d内,其熵的极小值都达到了0.5以下,所占比例为64.7%. 在目前暴雨预报准确率仍非常低的情况下,从熵值变化这一征兆出现的比例来讲,用符号动力学的方法分析暴雨过程能够得到较为理想的结果。为了进一步说明该方法的适用性,以暴雨发生前10 d熵值极小值是否达到0.5以下作为判据,又验证了53个暴雨事件,发现其中34个暴雨过程在暴雨发生前10 d熵值极小值达到了0.5以下,所占比例约为64.2%. 这一结果表明,应用符号动力学的方法监测和预报暴雨具有一定的研究价值,并且从非线性角度提供了一个新的研究思路。
8 结束语
本文将符号动力学与信息熵理论相结合,分析了大量暴雨事件发生前一段时间内大气可降水量的熵值变化,这是从非线性角度对暴雨过程研究进行的一次全新尝试,旨在为暴雨监测预报的研究提供一个新思路。结果表明,该方法在对暴雨事件的监测方面具有一定的研究价值,然而,由于该方法应用于暴雨过程的研究是一种全新的尝试,所以,有些问题还需要进行更深入的研究和完善。
参考文献
[1]Orlanski L A.A rational subdivision of scales for atmospheric processes[J].Bull Amer Meteor Soc,1975(56).
[2]冯伍虎,程麟生.“98.7”特大暴雨中尺度系统发展的热量和水汽收支诊断应用[J].气象学报, 2001,12(4).
[3]Hane C E,Jorgensen D P.Dynamic aspects of distinctly three-dimensional mesoscale convective systems[J]. Mon Wea Rev,1995(123).
[4]林振山.非线性科学及其在地学中的应用[M].北京:气象出版社,2003.
[5]许小勇,陈竹.基于模拟退火算法的最短三次样条插值[J].航空计算技术,2007,37(6).
[6]汪同庆,郭子义,刘家兵,等.一种基于改进阈值函数的小波域超声信号去噪方法[J].无损检测,2007,29(11).
[7]张雨,胡茑庆.基于符号树信息熵的机械振动瞬态信号特征提取[J].国防科技大学学报,2003,25(4):79-81.
〔编辑:白洁〕
Study on Symbolic Dynamics and Information Entropy and Its Applications in the Monitoring of Rainstorms
Du Yanxia, Lin Huiyang, Wang Yuexia, Wen Jichang
Abstract:Rainstorms is the main disaster in the world and lead huge losses of national economy and peoples life and property every year, but the prediction of rainstorms is very difficult. The basic reason is that we are unclear to the sudden change of atmospheric circulation and the occurrence and development mechanism of severe convective weather; include the inner dynamic mechanism and the physical interaction process of it with the external atmospheric circulation and the abnormal change mechanism of various weather system in tropical and middle latitude zone. Especially, the research on multi-scale interaction is lack. Atmospheric system is a deterministic nonlinear system if a few random factors are ignored. Symbolic dynamic which have gradually become a tool of practitioners is a branch of nonlinear science and has a strong theoretical foundation. Entropy is a basic physical quantity and it is apply widely in nonlinear science, statistical mechanics, and optimum signal processing, and so on. Using symbolic dynamics to explore storm event has some certain significance, the entropy curves of a large number of heavy rain are analyzed and the entropy has reached its minimum ten days before most of the heavy rainfall in the storm. So it is valuable in monitoring and forecasting heavy rain events.
Key words: symbolic dynamics; information entropy; rainstorms; wavelet de-noising
. (5)
式(5)中:Si——第i个元素符号化后的符号;
xi——原始时间序列中的第i个元素。
计算所获得的符号序列的熵值(熵值的计算方法将在后文介绍),然后在平均值周围微调阈值,并计算相应符号序列的熵值,最后将熵值最大的符号序列作为最优符号序列。
6.5 符号序列的编码和统计分析
为了便于统计分析符号序列,需要对符号序列进行编码。将符号序列分为长度为n(n取值为3)的子序列,这里称其为字,然后将每个字当作1个二进制码,将其转化为十进制数,这样,每个不同的字对应1个不同的十进制数,即可以用1个十进制数表示1个字,便于后面统计每个字出现的概率。
图6 成都市2013-06-10—2013-08-09的熵曲线图
符号时间序列分析的重点在于分析每一个字的相对频率,通过分析出现的字,达到揭示系统动力学特性的目的。一般来说,表征系统主要特性的字出现的频率往往较高,而那些出现频率很低的字不能反映系统的动力学特性。对符号序列进行编码后,就可以很方便地计算出每种字出现的概率及其信息熵。
在计算每个子序列的熵值后,就得到了1个由熵值组成的序列,熵值代表其对应时间序列信息量的多少,这样就可以得到随着时间的推移系统信息量的变化。如果在暴雨来临之前出现了很小的熵值,则认为在暴雨前出现了征兆。根据此征兆可以对暴雨做出预测。
图6为成都市2011-06-01—2011-07-09的熵曲线图,先将可降水量时间序列进行10倍插值和去噪,然后将时间序列分为10段,分别计算每段时间序列的熵值,这样便获得了由熵值组成的时间序列,每个熵值对应3 d时间。从图6中可以看出,在暴雨发生前6 d出现了明显的熵最小值,此即为暴雨出现的征兆(或称预报因子)。
7 大量暴雨实例的研究结果
本文分析了全球68个暴雨过程,选取每个暴雨时间暴雨前30 d的可降水量时间序列,然后采用三次样条插值方法进行10倍插值,再用新阈值函数去噪,最后将去噪后的可降水量时间序列采用符号动力学的方法统计、分析,做出熵值曲线。结果表明,其中有44个暴雨过程在暴雨发生前的10 d内,其熵的极小值都达到了0.5以下,所占比例为64.7%. 在目前暴雨预报准确率仍非常低的情况下,从熵值变化这一征兆出现的比例来讲,用符号动力学的方法分析暴雨过程能够得到较为理想的结果。为了进一步说明该方法的适用性,以暴雨发生前10 d熵值极小值是否达到0.5以下作为判据,又验证了53个暴雨事件,发现其中34个暴雨过程在暴雨发生前10 d熵值极小值达到了0.5以下,所占比例约为64.2%. 这一结果表明,应用符号动力学的方法监测和预报暴雨具有一定的研究价值,并且从非线性角度提供了一个新的研究思路。
8 结束语
本文将符号动力学与信息熵理论相结合,分析了大量暴雨事件发生前一段时间内大气可降水量的熵值变化,这是从非线性角度对暴雨过程研究进行的一次全新尝试,旨在为暴雨监测预报的研究提供一个新思路。结果表明,该方法在对暴雨事件的监测方面具有一定的研究价值,然而,由于该方法应用于暴雨过程的研究是一种全新的尝试,所以,有些问题还需要进行更深入的研究和完善。
参考文献
[1]Orlanski L A.A rational subdivision of scales for atmospheric processes[J].Bull Amer Meteor Soc,1975(56).
[2]冯伍虎,程麟生.“98.7”特大暴雨中尺度系统发展的热量和水汽收支诊断应用[J].气象学报, 2001,12(4).
[3]Hane C E,Jorgensen D P.Dynamic aspects of distinctly three-dimensional mesoscale convective systems[J]. Mon Wea Rev,1995(123).
[4]林振山.非线性科学及其在地学中的应用[M].北京:气象出版社,2003.
[5]许小勇,陈竹.基于模拟退火算法的最短三次样条插值[J].航空计算技术,2007,37(6).
[6]汪同庆,郭子义,刘家兵,等.一种基于改进阈值函数的小波域超声信号去噪方法[J].无损检测,2007,29(11).
[7]张雨,胡茑庆.基于符号树信息熵的机械振动瞬态信号特征提取[J].国防科技大学学报,2003,25(4):79-81.
〔编辑:白洁〕
Study on Symbolic Dynamics and Information Entropy and Its Applications in the Monitoring of Rainstorms
Du Yanxia, Lin Huiyang, Wang Yuexia, Wen Jichang
Abstract:Rainstorms is the main disaster in the world and lead huge losses of national economy and peoples life and property every year, but the prediction of rainstorms is very difficult. The basic reason is that we are unclear to the sudden change of atmospheric circulation and the occurrence and development mechanism of severe convective weather; include the inner dynamic mechanism and the physical interaction process of it with the external atmospheric circulation and the abnormal change mechanism of various weather system in tropical and middle latitude zone. Especially, the research on multi-scale interaction is lack. Atmospheric system is a deterministic nonlinear system if a few random factors are ignored. Symbolic dynamic which have gradually become a tool of practitioners is a branch of nonlinear science and has a strong theoretical foundation. Entropy is a basic physical quantity and it is apply widely in nonlinear science, statistical mechanics, and optimum signal processing, and so on. Using symbolic dynamics to explore storm event has some certain significance, the entropy curves of a large number of heavy rain are analyzed and the entropy has reached its minimum ten days before most of the heavy rainfall in the storm. So it is valuable in monitoring and forecasting heavy rain events.
Key words: symbolic dynamics; information entropy; rainstorms; wavelet de-noising
. (5)
式(5)中:Si——第i个元素符号化后的符号;
xi——原始时间序列中的第i个元素。
计算所获得的符号序列的熵值(熵值的计算方法将在后文介绍),然后在平均值周围微调阈值,并计算相应符号序列的熵值,最后将熵值最大的符号序列作为最优符号序列。
6.5 符号序列的编码和统计分析
为了便于统计分析符号序列,需要对符号序列进行编码。将符号序列分为长度为n(n取值为3)的子序列,这里称其为字,然后将每个字当作1个二进制码,将其转化为十进制数,这样,每个不同的字对应1个不同的十进制数,即可以用1个十进制数表示1个字,便于后面统计每个字出现的概率。
图6 成都市2013-06-10—2013-08-09的熵曲线图
符号时间序列分析的重点在于分析每一个字的相对频率,通过分析出现的字,达到揭示系统动力学特性的目的。一般来说,表征系统主要特性的字出现的频率往往较高,而那些出现频率很低的字不能反映系统的动力学特性。对符号序列进行编码后,就可以很方便地计算出每种字出现的概率及其信息熵。
在计算每个子序列的熵值后,就得到了1个由熵值组成的序列,熵值代表其对应时间序列信息量的多少,这样就可以得到随着时间的推移系统信息量的变化。如果在暴雨来临之前出现了很小的熵值,则认为在暴雨前出现了征兆。根据此征兆可以对暴雨做出预测。
图6为成都市2011-06-01—2011-07-09的熵曲线图,先将可降水量时间序列进行10倍插值和去噪,然后将时间序列分为10段,分别计算每段时间序列的熵值,这样便获得了由熵值组成的时间序列,每个熵值对应3 d时间。从图6中可以看出,在暴雨发生前6 d出现了明显的熵最小值,此即为暴雨出现的征兆(或称预报因子)。
7 大量暴雨实例的研究结果
本文分析了全球68个暴雨过程,选取每个暴雨时间暴雨前30 d的可降水量时间序列,然后采用三次样条插值方法进行10倍插值,再用新阈值函数去噪,最后将去噪后的可降水量时间序列采用符号动力学的方法统计、分析,做出熵值曲线。结果表明,其中有44个暴雨过程在暴雨发生前的10 d内,其熵的极小值都达到了0.5以下,所占比例为64.7%. 在目前暴雨预报准确率仍非常低的情况下,从熵值变化这一征兆出现的比例来讲,用符号动力学的方法分析暴雨过程能够得到较为理想的结果。为了进一步说明该方法的适用性,以暴雨发生前10 d熵值极小值是否达到0.5以下作为判据,又验证了53个暴雨事件,发现其中34个暴雨过程在暴雨发生前10 d熵值极小值达到了0.5以下,所占比例约为64.2%. 这一结果表明,应用符号动力学的方法监测和预报暴雨具有一定的研究价值,并且从非线性角度提供了一个新的研究思路。
8 结束语
本文将符号动力学与信息熵理论相结合,分析了大量暴雨事件发生前一段时间内大气可降水量的熵值变化,这是从非线性角度对暴雨过程研究进行的一次全新尝试,旨在为暴雨监测预报的研究提供一个新思路。结果表明,该方法在对暴雨事件的监测方面具有一定的研究价值,然而,由于该方法应用于暴雨过程的研究是一种全新的尝试,所以,有些问题还需要进行更深入的研究和完善。
参考文献
[1]Orlanski L A.A rational subdivision of scales for atmospheric processes[J].Bull Amer Meteor Soc,1975(56).
[2]冯伍虎,程麟生.“98.7”特大暴雨中尺度系统发展的热量和水汽收支诊断应用[J].气象学报, 2001,12(4).
[3]Hane C E,Jorgensen D P.Dynamic aspects of distinctly three-dimensional mesoscale convective systems[J]. Mon Wea Rev,1995(123).
[4]林振山.非线性科学及其在地学中的应用[M].北京:气象出版社,2003.
[5]许小勇,陈竹.基于模拟退火算法的最短三次样条插值[J].航空计算技术,2007,37(6).
[6]汪同庆,郭子义,刘家兵,等.一种基于改进阈值函数的小波域超声信号去噪方法[J].无损检测,2007,29(11).
[7]张雨,胡茑庆.基于符号树信息熵的机械振动瞬态信号特征提取[J].国防科技大学学报,2003,25(4):79-81.
〔编辑:白洁〕
Study on Symbolic Dynamics and Information Entropy and Its Applications in the Monitoring of Rainstorms
Du Yanxia, Lin Huiyang, Wang Yuexia, Wen Jichang
Abstract:Rainstorms is the main disaster in the world and lead huge losses of national economy and peoples life and property every year, but the prediction of rainstorms is very difficult. The basic reason is that we are unclear to the sudden change of atmospheric circulation and the occurrence and development mechanism of severe convective weather; include the inner dynamic mechanism and the physical interaction process of it with the external atmospheric circulation and the abnormal change mechanism of various weather system in tropical and middle latitude zone. Especially, the research on multi-scale interaction is lack. Atmospheric system is a deterministic nonlinear system if a few random factors are ignored. Symbolic dynamic which have gradually become a tool of practitioners is a branch of nonlinear science and has a strong theoretical foundation. Entropy is a basic physical quantity and it is apply widely in nonlinear science, statistical mechanics, and optimum signal processing, and so on. Using symbolic dynamics to explore storm event has some certain significance, the entropy curves of a large number of heavy rain are analyzed and the entropy has reached its minimum ten days before most of the heavy rainfall in the storm. So it is valuable in monitoring and forecasting heavy rain events.
Key words: symbolic dynamics; information entropy; rainstorms; wavelet de-noising