基于时间序列的灾害区域关联网络构建方法*
2015-05-13杨秋格孙旭光陈丹琪
杨秋格,吴 鹏,孙旭光,陈丹琪
(1.防灾科技学院灾害信息工程系,河北廊坊065201;2.防灾科技学院信息化管理中心,河北廊坊065201)
基于时间序列的灾害区域关联网络构建方法*
杨秋格1,吴 鹏2,孙旭光1,陈丹琪1
(1.防灾科技学院灾害信息工程系,河北廊坊065201;2.防灾科技学院信息化管理中心,河北廊坊065201)
针对灾害地区相关性问题,提出一种灾害区域关联复杂网络构建方法。首先利用幂级数展开得出网络灾害节点的系统动力学方程,通过节点关联系数来表征节点间的区域关联关系,并通过相关转化使得可以利用压缩感知理论对节点关联系数进行求解,从而实现对网络节点关系拓扑的构建。最后通过中国地震灾害数据进行性能仿真实验,实验结果表明,完成网络构建只需要较少量的时序信息,构建得出的区域关联结果也具有一定的科学性。
灾害;时间序列;压缩感知;区域关联;复杂网络
自然灾害的区域关联现象一直是灾害学研究的热点,大量观察到的事实,如历史记录中某些灾害(如地震)在部分地区会表现出一种同步衰涨趋势,即同时趋于活跃或平静[1],以及2005年及2007的苏门答腊地震后,我国南方都随之发生了雨涝灾害,这表明了旱、洪、震等自然灾害存在着一定的区域关联性[2],而对其的研究则能够为灾害预测提供支持。
灾害的时间序列是进行灾害区域关联研究的基本信息,通过对两个地区的灾害时间序列进行相似性匹配,从而确定两者之间是否具有相关性,也是近年来灾害区域关联分析的常见方法[3-5]。由于这类方法每次只选取两个区域进行相似性匹配(即单点对单点),因而在时间序列信息上会有大量的截取操作,而如果我们想以复杂网络角度来研究多个区域间的灾害相关性(即多点对多点),由于多个点间同步影响会形成一个复杂系统,就使得这种单点匹配得到的区域相关性难以作为节点链接来构建灾害区域关联复杂网络。
如何基于各区域的灾害时序信息,挖掘出潜在的关联关系并重构成网络,是本文所要解决的问题。事实上,复杂网络重构正逐渐成为复杂网络研究的热点问题,已提出的重构方法如逆向工程法[6]、微扰响应法[7]、收敛镜像系统法[8],以及基于噪声的相关性方法等[9],其基本思想都是通过个体单元行为来推导网络拓扑,但都或多或少存在着运算成本过大的问题。文献[10-12]中则针对这一问题,提出一种基于压缩感知的复杂网络重构方法,能够以相对于网络规模很少量的数据实现拓扑重构,并对非线性系统及博弈网络等进行了重构尝试,取得不错的效果。
本文则借鉴压缩感知思想,基于灾害的时间序列信息,将灾害区域视为复杂网络节点,通过构建出节点的复杂系统动力学方程,进而确定节点间的拓扑关系,从而构建出一个灾害区域关联复杂网络。在后面的实验中我们会看到,只需要少量的时序信息,本文方法就可以完成对网络的构建工作。
1 压缩感知
作为一种新的信息获取理论,压缩感知技术主要基于可压缩信号的稀疏性,并满足在远小于Nyquist采样率的情况下,实现对信号的精确重建。压缩感知技术的主要优势在于能够只基于少量观测数据S(S∈RM)就实现对稀疏向量a(a∈RN)的高效恢复,并满足S=D·a,其中D是一个M*N维满秩矩阵,而信号重建过程即为对以下凸优化问题进行求解,如式(1)所示。
由于当a为稀疏向量并使得D满足式(1)时,利用压缩感知技术可以在M远小于N的情况下,准确恢复出a。而鉴于复杂网络本身表现出的稀疏性,保证了向量a的稀疏性,那么只要把复杂网络重构问题转化成压缩感知理论能够处理的形式,就可以利用这一方法基于少量的时序信息准确重构网络拓扑。
对于灾害区域关联网络,由于各个区域节点的灾害信息是可以获取的,而具体灾害结果的造成除了受区域自身各种因素的影响,还类似于振子网络,同时受到其他多个区域多种因素的复合作用。因此本文希望能够用少量的相关时序信息,从多节点复合影响的角度,推演出各个节点间的关联情况,进而构建出整个网络拓扑。
2 基于时序的网络构建算法
设灾害区域关联复杂网络中节点个数为n,第i个节点在某一时刻(如时刻t)的时序信息被划分为两部分,第一部分设为si,表示在时刻t该区域观测到的受灾结果,第二部分设为xi,这是一个观测参数向量,包含了在时刻t与该区域相关的孕灾环境参数分量,如气压、气温、降水、位移场、地应力场等,设该向量的维数为m。那么节点i的灾害复杂系统动力学方程可以用式(2)表示。
式中:fi(xi)为节点i独自的灾害动力学方程,式(2)后半部分则为节点i与其他节点间的关系动力学方程,两者共同组成节点i的系统动力学方程;Gij表示节点i和节点j间的观测参数向量关联矩阵,如式(3)所示。
对于式(2),我们还可以用式(4)的方式表示
那么式(4)的前半部分就变为只关于xi的方程,后半部分则是关于其他节点观测向量的方程。此时我们可以将式(4)的前半部分用Qi(xi)表示,并使用一个N阶幂级数将Qi(xi)展开,如式(5)所示。
式中:(xi)1表示节点i的观测向量的第1个分量,(ai)k表示第k个展开项的系数,需要注意的是式(5)涵盖了该阶幂级数下所有可能的展开项,即展开项数目为(1+N)m,这意味着许多展开项前的系数可能为0。
此时,式(4)又可以表示如式(6)所示。
从式(6)可以看到,在节点时序信息已知的情况下,未知的即为Qi(xi)中的展开项系数以及关联矩阵Gij,同时,为了尽可能地从少量时序信息中构建出网络拓扑,依据压缩感知理论的稀疏性需求,即满足大部分系数为零的条件,我们把式(6)中的Gijxj同样按照式(5)的方式展开,那么式(6)又可以表示如式(7)所示。
式(7)的好处在于,它不仅满足了压缩感知理论对稀疏性的需求,同时体现出了节点i与其他节点的关联性,如果求出Qj(xj)的系数全为零,那么就表示节点i与节点j没有区域关联性,反之如果存在不为零的系数,就表示两者具有区域关联性,同时还能通过分析非零系数所对应的观察向量的分量,进一步研究各个参数对灾害区域关联的影响力。
对于式(7)中各个Q(x)函数,如以求解Qi(xi)为例,即式(5)。设展开项的各个系数用向量ai表示,由于是按照幂级数展开,因此展开形式是固定的,如在级数N=3,m=3的情况下,Qi(xi)的展开如式(8)所示。
式中:b,y,z为向量xi的3个分量。系数向量ai即为ai=[(ai)000,(ai)001,…,(ai)333]T,同时,对于某一时刻t下的观测向量xi(t),我们可以得到式(9)。
此时Qi[xi(t)]=di(t)·ai,如果我们记录有关于节点i的L个时刻的时间序列信息,那么就可以设观测结果向量为S,即S=[si(t1),si(t2),…,si(tL)]T,从而可以得出符合压缩感知理论的S=D·a形式的等式,如式(10)所示。
式中:S及di(t)都能够通过已有的时序信息求得,同时由于满足了压缩感知的稀疏性,使得算法可以在时序信息量L远小于网络节点规模n的情况下求出各系数向量a,进而构建出网络拓扑。
3 仿真实验
由于灾害预测研究自身的特点,使得对灾害区域关联网络的有效性验证缺乏绝对参照。针对这一问题,我们选择用具带状分布特点的地震灾害来评估本文方法的性能。我国地域内共计有23条地震带,根据这些地震带的分布又可以划分为以下五个主要地震地区:台湾省及其附近海域;西南地区;西北地区;华北地区;东南沿海的广东、福建等地。本文从这5个地区中选取共计60个城市作为网络节点(除华北地区由于城市密集选取20个外,其他地区皆为各选取10个城市),时序数据资料来源于历史灾害数据库,包括从1965年到2004年共计40年各个城市的地震受灾情况及相关孕灾环境参数,即n=60,L=40。
实验平台为Matlab 7.0。在参数设置上,幂级数阶数N=3,并根据专家建议选择了6项参数作为地震关联参数,即观测向量的维数m=6,观测结果则根据当年有无4级以上地震(含余震)记为1或0。由于地质特点,同一地震带上的节点本身就具备一定的关联性,即每一个地震带可以认为是一个社团,其内部节点具有较高的连接率。根据这一特性,可以从一定程度上检验出本文算法所建立网络的科学性。
图1为根据算法运行结果并利用pajek软件做出的网络拓扑图,网络的平均度为3.20,图中出现了6个孤立节点,度最大节点为14号节点,度为8,对应城市为中国台北市。
表1所示为根据节点关系拓扑,将节点链接映射到节点所对应地震带的连接率统计结果,若本文算法有效,那么首先属于同一地震带的节点间会有较高的连接率。连接率的计算方法为地震带内节点的实际链接数除以节点全连接数。
表1 各地震带节点连接率
图1 地震区域关联网络拓扑图
从表1可以看到,本文算法建立的网络拓扑中,地震带内节点的连接率是符合期望的,这说明图1中的网络拓扑具备了一定的科学性,而对于地震带间出现的节点链接,由于缺乏有效验证方法,因而更适合作为线索信息来对灾害区域关联网络进行分析。这里,通过对pajek拓扑图的节点对应区域进行分析,我们发现台湾-四川,四川-云南,青海-西藏这些区域内的节点连接十分密集,其中台湾和四川分属不同的地震区,两者间表现出的关联性值得进一步关注。
为了进一步确认本文算法对时序信息量的低需求。我们用根据初始时序数据(即L=40)构建的网络拓扑(图1)作为参照,逐渐减少算法使用的时序信息量,观察算法所建立的网络是否能够和图1拓扑保持一致。为了不失一般性,算法分别在每种数据比例下进行5次网络构建,时序信息为随机抽取,最后统计与图1拓扑匹配度的平均值。
图2和图3中给出了在不同时序信息量下,所求得网络与图1网络的连接匹配度。图中横坐标表示所用数据占原数据量的比例,我们用了两种参数进行评估,分别为节点间的非空链接和空链接。图2中纵坐标表示错误链接占所求得链接的比率,图3中纵坐标表示求得正确链接占实际链接的比率。
图2 不同数据量下的错连率
图3 不同数据量下的正确连接率
从图2和图3中可以看到,算法只需要使用60%左右的原时间序列数据量,就可以得出与图1一致的网络拓扑,即实现对图1网络的准确构建。这同时也表明,在保证一定数据量的情况下,算法得出的网络拓扑结果是比较稳定的。
4 结论
本文基于压缩感知理论,尝试利用少量时间序列信息实现对灾害区域关联复杂网络的构建,并取得了一定效果。可能由于所构建网络节点较少的原因,本文实验中所需的数据量尚未达到远小于网络规模的程度。下一步工作将对求得节点动力学方程中的各系数及非零项进行分析,以期能进一步探讨灾害区域关联网络的演化问题。
[1] 门可佩.重大地震灾害链的时空有序性及其预测研究[J].地球物理学进展,2008,22(2):645-651.
[2] 延军平,白晶,苏坤慧,等.对称性与部分重大自然灾害趋势研究[J].地理研究,2011,30(7):1159-1168.
[3] 邱剑锋,谢娟,李炜,等.中强地震的相关性与周期性研究[J].计算机工程,2011,37(10):16-18.
[4] 吴明辉,许爱强,周小程,等.基于时间序列分析的动调陀螺仪故障预测研究[J].计算机测量与控制,2014,22(2):321-324.
[5] 吴绍春,吴耿锋,王炜,等.寻找地震相关地区的时间序列相似性匹配算法[J].软件学报,2006,17(2):185-192.
[6] 盛光磊,甄姬娜.一种网络信道拓扑结构坚韧度的测量方法研究[J].科技通报,2014,29(02):152-154.
[7] GardnerA T S,d Bernardo D,Lorenz D,et al.Inferring genetic networks and identifying compound mode of action via expression profiling[J].Science,2003,301(5629):102-105.
[8] Bongard J,Lipson H.Automated reverse engineering of nonlinear dynamical systems[J].Proc Natl Acad Sci USA,2007,104(24):9943-9948.
[9] Timme M.Revealing network connectivity from response dynamics[J].Phys Rev Lett,2007,98(22):224101-1-4.
[10]Yu D,Righero M,Kocarev L.Estimating topology of networks[J].Phys Rev Lett,2006,97(18):188701-1-4.
[11]Wang W X,Yang R,Lai Y C,et al.Predicting catastrophes in nonlinear dynamical systems by compressive sensing[J].Phys Rev Lett,2011,106(15):154101-1-4.
[12]WangW X,Yang R,Lai Y C,etal.Time-series based prediction of complex oscillator networks via compressive sensing[J]. EPL,2011,94(4):48006-1-6.
Com plex Network Construction M ethod of Disaster Regional Association based on Time Series
Yang Qiuge1,Wu Peng2,Sun Xuguang1and Chen Danqi1
(1.Institute of Disaster Prevention,Disaster Information Engineering Department,Langfang 065201,China;2.Institute of Disaster Prevention,Information Management Center,Langfang 065201,China)
Aiming at the disaster regional-related issues,a complex network construction method of disaster regional association based on time series is proposed.The disaster system dynamic equations of network node are obtained through the use of power series expansion and the correlation coefficients between nodes are obtained through the use of compressed sensing theory,so as to realize the construction of the network topology.Experimental results show that,complete network construction requires less amount of time series information and the construction result has a certain rationality.
disaster;time series;compressive sensing;regional association;complex network
X43;TP18
A
1000-811X(2015)04-0021-04
10.3969/j.issn.1000-811X.2015.04.004
杨秋格,吴鹏,孙旭光,等.基于时间序列的灾害区域关联网络构建方法[J].灾害学,2015,30(4):21-24.[Yang Qiuge,Wu Peng,Sun Xuguang,etal.Complex Network Construction Method of Disaster Regional Association based on Time Series[J]. Journal of Catastrophology,2015,30(4):21-24.]
2015-04-13
2015-05-21
中央高校青年教师资助计划项目(ZY20130213);中央高校创新团队资助计划项目(ZY20120104)
杨秋格(1981-),女,山东聊城人,硕士,讲师,研究方向为物联网技术.E-mail:yangqiuge0302@163.com