APP下载

分段回归在剔除精河、库尔勒水平摆气象因素影响的探索①

2015-06-09邢喜民

地震工程学报 2015年2期
关键词:精河库尔勒分段

邢喜民, 张 涛

(新疆维吾尔自治区地震局,新疆 乌鲁木齐 830011)

监测报告

分段回归在剔除精河、库尔勒水平摆气象因素影响的探索①

邢喜民, 张 涛

(新疆维吾尔自治区地震局,新疆 乌鲁木齐 830011)

以精河、库尔勒水平摆观测数据为因变量,以地温、气温、气压为自变量进行分段回归分析,结果如下:(1)地温和气温是影响精河、库尔勒水平摆观测数据年频段信息的主要因素,它们之间具有准线性关系;(2)去掉趋势后,观测数据与地温、气温、气压之间的线性相关性明显增强,说明观测数据的趋势转折变化不是气象因素造成的,可能是观测区域的构造应力变化所致;(3)研究表明分段回归是全样本回归分析方法的一种改进,是降低时间序列数据处理难度的有效方法。

分段回归; 水平摆; 相关系数; 回归方程

0 引言

形变台站建立在地壳表层,因而不可避免地要受到各种因素的影响,这就意味着在测量(观测)值序列中不仅包含有来自地球内部的地形变信息,还可能不同程度地包含了来自地球外部的信息。因此形变台站的地形变观测时间序列是多种信息的综合,是可进行分离的[1]。

目前的认识水平有时难以区分干扰与地震前兆的变化形态,给前兆的异常判定带来很大困难[2]。国内外已开展了不少对各种干扰因素定量的研究工作,如:Moro等[3]研究了降水、气压对意大利NE地震区倾斜和应变的影响;王梅[2]论述了气压、雷电等干扰因素对数字化形变高频记录的影响及其机理;赵小贺等[4]分析认为气压、大风、降雨是导致观测资料出现异常变化的主要因素,气压的短周期突变可导致固体潮曲线畸变;孙玉军等[5]利用轴对称现弹性模型有限元方法,计算了洞室中温度微小变化所引起的地倾斜和地应变;张昱等[6]对甘肃地区数字化流体观测资料的干扰因素进行了系统的分析。

目前地震预测以观测事实归纳为主,并辅以物理模式演绎法。动力学预测(数值预报)为进一步追求目标的现状下,对影响观测数据的因素的定量判别也将是一个努力的方向。

1 台站、仪器概况

1.1 精河水平摆

精河台位于新疆博尔塔拉蒙古自治州精河县境内,高程为387.3 m,位于博罗科努、准格尔南缘、科古琴三大断裂的交汇区。地质年代为古生代,岩性为黑灰色千枚岩和凝灰岩。山洞东西向为主洞,进深约90 m,南北最长支洞约12 m,宽约2.2 m,上层覆盖约37 m,洞内年温差0.5 ℃,日温差小于0.1 ℃,最大的干扰源是大风干扰。自1990年石英水平摆观测以来,年变周期明显,NS分量以S倾为主。2006年11月份数字化改造后,原始曲线EW分向年变幅度明显减小,由E倾转为W倾,NS分量趋势变化不明显。以调和分析M2波潮汐因子中误差和长周期拟合相对噪声水平作为指标判定精河石英水平摆的数据观测质量,达到国家形变I类地震台标准。

1.2 库尔勒水平摆

库尔勒水平摆架设在库尔勒市北的霍拉山南坡。该区属暖温带大陆性干旱气候,冬季干冷;春季短暂,冷暖气候交替,天气多变,多大风、沙尘暴;夏季为低气压控制,空气对流强,常产生阵风;秋季短暂,常年刮东北风。山洞所在地区构造上处于南天山褶皱带与塔里木地台的交界部位,影响较大的主要有北轮台-辛格尔断裂和兴地断裂。洞内有一条走向NE-NEE的活动断裂,断裂上的元古界灰色黑云母片麻岩和大理岩逆冲在上新统砂砾岩层上。山洞全长408 m,覆盖层厚度不论是顶部还是侧面均大于50 m。洞内干燥,湿度<80%,洞内温度15 ℃左右,年温差<0.5 ℃。石英水平摆倾斜仪架设在山洞的中部,仪器墩为预埋的整块花岗岩,用水泥与台基基岩相粘接。

2 研究方法

随机变量Y与变量x(它可能是多维向量)之间的关系,当自变量x确定之后,因变量Y的值并不随之确定,而是按一定的统计规律(即随机变量Y的分布)取值,关系表示为

其中,f(x)是一个确定的函数,称为回归函数;ε为回归残差序列。回归分析的主要任务之一是确定回归函数f(x)。

回归分析的步骤:(1)根据研究目标,确定自变量和因变量;(2)进行相关分析。只有当变量与因变量确定存在某种关系时,建立的回归方程才有意义。相关分析一般是求出相关系数,以相关系数的大小来判断自变量和因变量的线性相关的程度;(3)建立回归模型。绘制自变量和因变量的散点图,依据散点图选择合适的数模,对自变量和因变量进行计算,在此基础上建立回归分析方程;(4)检验回归模型。由剩余方差的F统计量对应P值检验回归方程显著性,由可决系数向1.0的趋近性检验回归方程的拟合效果。在回归分析的基础上,确定出了气象数据对定点形变数据的合适的数学表达式,那么在一定程度上可以认为回归残差序列ε是剔除了气象因素干扰的定点形变数据。

在回归模型建立的过程中,定点形变的观测数据在不同时段呈现不一致的变化趋势,利用一个数学模型则无法完全描绘。那么在不同时段根据数据的变化趋势,采用不同数学模型来表达已是必然之势,这个必然将分段回归的需求凸显了出来。廖俊[7]将时间序列进行分段线性表示,是降低时间序列数据处理难度的有效方法。

分段回归在具体的建模过程中首要任务就是分界点的判定。分界点是变形规律变化的转折点,是变形曲线的拐点,也成为变形数模类型改变的转折点。分界点既是前一种变形曲线的终点,又是后一种变形曲线的起点;变形数模在分界点前是一种类型,在分界点后又是另一种类型。分界点判别的正确与否直接影响数模的质量[8]。

3 数据分析

3.1 精河水平摆

以精河水平摆观测数据为因变量,以气象因素为自变量,研究观测资料与气象因素之间的关系。选取的气象资料是新疆气象局的数据,地温数据资料自2006年4月1日起,这样限制了计算时段。但是经分析发现,精河地温滞后气温约2.5个月,将气温向前取2.5个月(也就是将气温数据相位向后平移2.5个月)代替地温值,通过计算两者的相关系数为0.951 1,说明两者高度线性相关,因此可以用向前取2.5个月的气温值代替地温值计算。精河地区气象资料见图1。

图1 精河地温、气温、气压日值时序图Fig.1 Daily value sequence diagram of ground temperature, air temperature and air pressure in Jinghe station

根据文献[9-10]编写程序代码,计算精河水平摆与气象因素之间的相关系数,计算结果见表1。

表1 精河水平摆与气象因素相关系数

由表1可见,精河水平摆观测数据与气象要素之间线性关系较弱,但是从图2可以看出,精河水平摆观测数据不但具有年变周期规律,而且存在趋势转折变化。由图1可知,精河气象资料仅存在年变周期规律,并没有趋势变化。根据车用太等[11]判断地下水干扰异常与排除中提出4个相关性原则中成因上的相关性,即:异常动态与其可能的影响因素之间存在成因上的关联,精河水平摆的趋势性转折变化并非气象因素的影响。因此,为了更好地把握气象因素对精河水平摆的影响特征,需要根据观测数据的趋势变化特征对数据

进行分段研究。

图2 精河水平摆日值观测曲线Fig.2 Daily value curves from horizontal pendulum in Jinghe station

根据文献[8],分段回归的分界点是变形规律变化的转折点,也是变形曲线的拐点[7],所以观测数据曲线的每一个波峰点或波谷点都是分段回归的分界点。选择精河水平摆EW向2003年9月1日至2004年1月25日半个周期为研究对象,在这半个周期精河水平摆观测的数据与气压、气温、地温相关系数分别为0.771 082 8、-0.944 855 9、-0.897 580 4,散点图见图3。由上述计算结果可知,气温、地温是精河水平摆在这半个周期的主要影响因素,而且它们之间具有准线性关系。

由图2可看出,波峰或波谷并非精河水平摆长趋势变化的转折点。如果把每个波峰或波谷均作为分段回归的分界点,一是无法说明精河水平摆的年频段信息的变化与地温、气温、气压之间的关系;二是使研究变得复杂。根据精河水平摆观测曲线的趋势变化,粗略地将精河水平摆EW向分成1992-01-01—1993-09-05,1993-09-06—2009-12-31,2010-01-01—2013-12-31三段;NS向分成1992-01-01—2001-02-22,2001-02-23—2003-02-10,2003-02-11—2008-02-14,2008-02-15—2013-12-31四段。

图3 精河水平摆与气压、气温、地温散点图(2003-09-01—2004-01-25)Fig.3 The scatterplots between Jinghe horizontal pendulum observation data and air pressure, air temperature,ground temperature (2003-09-01—2004-01-25)

在研究时,为了记录方便,记定点形变观测数据为y,地温为x1,气温为x2,气压为x3。

精河水平摆EW向的三个时段中,因第一时段和第三时段存在趋势变化,所以分别采用直线y=69 325.19-1.115 69x和y=72 510.733 76-1.349 06x拟合去掉趋势变化,结果见表2。 由表2的可决系数说明三分段拟合方程的拟合效果较好。

对精河水平摆NS向四个时段的分析表明,第一时段影响观测值的主要因素为气压,其次是地温,它们之间可用一元二次方程回归;第二、三、四时段,去掉趋势后发现影响观测数据的主要因素是地温,与地温相关系数分别为0.791 2,0.690 8,0.688 0,与气温和气压相关性较小,同样分段利用绘制气象因素与观测值的散点图,确定最佳回归方程。

3.2 库尔勒水平摆

因库尔勒水平摆在2006年进行仪器改造,造成2006年缺数较多,因此选择研究日期从2008年1月1日起,分别计算库尔勒两分量与气象因素之间的相关系数(表3)。计算结果表明,气象要素与观测数据之间线性关系较弱。

表2 精河水平摆EW向分段回归分析结果

表3 库尔勒水平摆与气象要素相关系数

由图4可以看出,库尔勒水平摆两分量存在趋势转折,根据趋势变化情况将库尔勒水平摆NS向分成2008年1月1日—2010年9月30日,2010年10月1日—2013年12月31日二个时段,将EW向分成2008年1月1日—2009年3月20日,2009年3月21日—2011年10月31日,2011年11月1日—2013年12月31日三个时段。

对于库尔勒水平摆NS向,由于第二时段存在趋势性变化,与精河水平摆一样,这种趋势变化并非气象因素造成的,采用直线y=264 901.686 93-4.791 12x拟合去掉趋势后,对两分段的回归分析结果见表4。

表4的可决系数说明两分段拟合方程的拟合效果好。

图4 库尔勒水平摆日值观测曲线Fig.4 Daily value curves from horizontal pendulum in Kuerle station

对库尔勒水平摆EW向三个时段分析结果表明,去掉趋势后,第一时段影响观测值的主要为气温和气压,相关系数分别为-0.667 1和0.686 8,与地温相对相关性较小,相关系数仅为0.454;第二、三时段影响观测数据的主要因素是地温,与地温相关系数分别为0.680 8和0.648 6,与气温和气压相关性较小。

表4 库尔勒水平摆NS向分段回归分析结果

4 结论与讨论

由回归分析的过程及结果,可以得到如下结论:

(1) 观测数据的周期性变化使得分段回归的分界点的选取变得困难,但是分界点是观测曲线趋势变化的转折点,所以观测数据分段的过程就是对定点形变趋势变化认识的过程。从另一方面来说,虽然数据分段具有一定的人为性,但是在保证每个分段曲线具有相同趋势变化的情况下,由精河水平摆半个周期和各分段计算的结果表明,分段的不同不会影响研究结果;地温和气温是影响精河、库尔勒水平摆观测数据年频段信息的主要因素,它们之间具有准线性关系。

(2) 孙毅[12]研究了川滇菱形块体内定点连续形变长周期频段信息和块体构造活动的关系。研究结果表明,在川滇菱形块体内,定点连续形变观测获得的长周期频段信息中的长趋势变化,除去仪器零漂等局部干扰外,基本上和块体运动方向或者块体边界主干断裂活动方式相一致,表明在定点连续形变长周期频段信息中也存在有与地震孕育有关的地壳形变信息。姜振海等[13]对甘肃岷县漳县MS6.6地震与甘肃形变异常情况探讨表明,在地震前宕昌、临县、兰州三地震台的部分定点形变均存在趋势转折变化。本文通过直线拟合去掉趋势之后,观测数据与气象因素之间的线性相关性明显增强,说明观测数据的趋势变化不是气象因素造成的,可能是区域的构造应力变化所致。如王在华[14]研究新疆新源、和静交界MS6.6地震前形变异常,结果表明库尔勒水平摆两分向2009年出现趋势转折和精河水平摆2009年NS向N倾的趋势转折均与该地震有关。

(3) 从研究方法上来说,分段回归是全样本回归分析方法的一种改进,是降低时间序列数据处理难度的有效方法。

(4) 气象因素在不同时段对精河、库尔勒水平摆观测数据的影响程度不同(如库尔勒水平摆EW向,第一时段的主要影响因素是气温、气压,第二、三时段的主要影响因素是地温),这可能与观测环境的改变有关。

(5) 2008年王海涛[15]提出了一种可以直接应用于变化相对平稳资料的分析,以及时间进程数据前兆异常识别研究的ECRS方法,并且指出对存在趋势性变化或周期性年变的资料以及由畸变点的资料,应进行去倾、拟合残差、畸变点插值剔除等预处理。该方法提出之后在测震学科的异常识别中有比较好的应用,但在前兆学科应用较少,而本文的研究将有助于ECRS方法在定点形变数据异常识别的应用。2011年唐兰兰[16]根据ECRS方法的定义和识别方法研制的软件,也将会使下一步的研究更便利。

References)

[1] 中国地震局监测预报司.地形变测量[M].北京:地震出版社,2008.China Earthquake Administration Department of Earthquake Monitoring and Prediction.Ground Deformation Measurement[M].Beijing:Seismological Press, 2008.(in Chinese)

[2] 王梅,李峰,孔向阳,等.数字化形变观测干扰识别[J].大地测量与地球动力学,2004,24(1):94-98.WANG Mei,LI Feng,KONG Xiang-yang,et al.Identification of Disturbance of Digital Deformation Observations[J].Journal of Geodesy and Geodynamics,2004,24(1):94-98.(in Chinese)

[3] Moro G D,Zadro M.Subsurface Deformations Induced by Rainfall and Atmospheric Pressure:Tilt/Strain Measurements in the NE Italy Seismic Area[J].Earth and Planet Science Letters,1998,164:193-203.

[4] 赵小贺,卢双苓,冯志军,等.洞体形变数字化观测干扰分析[J].地震地磁观测与研究,2009,30(4):55-62.ZHAO Xiao-he,LU Shuang-ling,FENG Zhi-jun,et al.Analysis of Disturbance of Digital Cavity Deformation Observation[J].Seismological and Geomagnetic Observation and Research,2009,30(4):55-62.(in Chinese)

[5] 孙玉军,李杰,曹建玲,等.深部洞室中微小温度年度变化足以造成地应变年度变化[J].地震学报,2008,30(5):464-473.SUN Yu-jun,LI Jie,CAO Jian-ling,et al.Small Variation of Annual Temperature in Deep Tunnel can Produce Annual Variation in Tilt and Strain[J].Acta Seismologica Sinica,2008,30(5):464-473.(in Chinese)

[6] 张昱,吴建华,范兵,等.数字化流体观测资料干扰因素分析[J].西北地震学报,2013,35(增刊):122-125.ZHANG Yu,WU Jian-hua,FAN Bing,et al.Analysis of the Interference Factors in Digital Fluid Observation Data[J].Northwestern Seismological Journal,2013,35(Suppl):122-125.(in Chinese)

[7] 廖俊,于雷,罗寰,等.基于趋势转折点的时间序列分段线性表示[J].计算机工程与应用,2010,46(30):50-53.LIAO Jun,YU Lei,LUO Huan,et al.Time Series Piecewise Linear Representation Based on Trend Transition Point[J].Computer Engineering and Applications,2010,46(30):50-53.(in Chinese)

[8] 徐兮.分段回归在隧道沉降变形监测中的应用研究[J].测绘通报,2007(12):18-20.XU Xi.Applied Investigation of Subsection Regression in the Inspection of Tunnel Settlement[J].Bulletin of Surveying and Mapping,2007(12):18-20.(in Chinese)

[9] 李秀敏,蔡霞.使用统计软件R进行多元回归分析[C]//国际应用统计学术研讨会.2008.LI Xiu-xia,CAI Xia.Using the Statistical Software R Multiple Regression Analysis[C]//International Conference on Applied Statistics,2008.(in Chinese)

[10] Paul Murrell R.Graphics[M].Computer Science and Data Analysis Series,2006.

[11] 车用太,鱼金子,刘成龙,等.判别地下水异常的干扰性与前兆性的原则及其应用实例[J].地震学报,2011,33(6):800-808.CHE Yong-tai,YU Jin-zi,LIU Chen-long,et al.Principles on Distinguishing Interference from Seismic Precursor of Underground Water Variation and Its Application[J].Acta Seismologica Sinica,2011,33(6):800-808.(in Chinese)

[12] 孙毅,汪智.定点连续形变长周期频段信息研究[J].四川地震,2005(2):35-39.SUN Yi,WANG Zhi.Relationship Between the Long-term Changes of the Crustal Title Observation in Seismic Stations and the Activities of Earthquake Structures[J].Earthquake Research in Sichuan,2005(2):35-39.(in Chinese)

[13] 姜振海,翟伟,王小娟.甘肃岷县漳县MS6.6地震与甘肃形变异常情况探讨[J].地震工程学报,2013,35(3):549-556.JIANG Zhen-hai,ZHAI Wei,WANG Xiao-juan.Analysis of the Relationship between Abnormal Ground Deformation of Gansu and the Minxian—ZhangxianMS6.6 Earthquake[J].China Earthquake Engineering Journal,2013,35(3):549-556.(in Chinese)

[14] 王在华,滕海涛.新疆新源和静交界MS6.6地震前形变异常[J].内陆地震,2012,26(4):347-353.WANG Zai-hua,TENG Hai-tao.Deformation Anomalies Before Xinyuan,Hejing Earthquake withMS6.6[J].Inland Earthquake,2012,26(4):347-353.(in Chinese)

[15] 王海涛,王琼.基于地震对应概率谱分析的前兆异常识别研究[J].地震研究,2008,31(4):330-334.WANG Hai-tao,WANG Qiong.Precursor Anomaly Identification Based on Earthquake Corresponding Probability Spectrum Analysis[J].Journal of Seismological Research,2008,31(4):330-334.(in Chinese)

[16] 唐兰兰,王海涛,王琼.新疆中强地震前ECRS方法的异常研究[J].西北地震学报,2011,33(2):159-165.TANG Lan-lan,WANG Hai-tao,WANG Qiong.Research on Anomaly of ECRS Method Before Moderate-strong Earthquakes in Xinjiang Region[J].Northwestern Seismological Journal,2011,33(2):159-165.(in Chinese)

Subsection Regression Method for Removing Meteorological Factors in the Jinghe, Korla Horizontal Pendulum

XING Xi-min, ZHANG Tao

(EarthquakeAdministrationofXinjiangUygurAutonomousRegion,Urumqi,Xinjiang830011,China)

Crustal deformation observation stations built near the surface cannot avoid distractions that include information from the Earth’s interior and exterior.Identifying earthquake precursors and other distraction factors is currently difficult.The regression method is a mathematical model for quantitatively deducting distraction factors.However,a mathematical model cannot describe the change in tendency during different stages when building a regression model.Subsection regression was used to divide data into sections to assist in the use of a mathematical model to conduct regression analysis.The dividing point of the regression model was the turning point for the change in tendency of deformation data.The selection of this dividing point can influence model quality.This study used ground tilt observation data from horizontal pendulums at the Jinghe and Korla stations as the dependent variable and meteorological factors as the independent variable.The tendency change of deformation data was divided into several parts and correlation coefficients were calculated.Scatter diagrams were created to test the results with the model.The results indicated that air and ground temperature were the main distractions for the fixed-point deformation of the horizontal pendulums at the Jinghe and Korla stations.The relationship between meteorological factors and deformation data strengthened existing knowledge regarding deformation observations.The linear correlation of meteorological factors and deformation data was strengthened after deducting the change in tendency.Therefore,the change in tendency may have been caused by regional stress changes according to the study on deformation data from the Sichuan-Yunnan rhombic block and the anomalies observed before the Xinyuan,Hejing earthquake ofMS6.6 in Xinjiang by Sun Yi and Wang Zai-hua.Subsection regression may be the most efficient method to reduce data processing difficulty because it improves performance of the regression method.

subsection regression; horizontal pendulum;correlation coefficient; regression equation

2014-01-29

中国地震局2015年度震情跟踪合同制项目(2015010225)

邢喜民(1980-),男,工程师,硕士,主要从事前兆数据分析.E-mail:24033663@qq.com

P315.7

A

1000-0844(2015)02-0623-006

10.3969/j.issn.1000-0844.2015.02.0623

猜你喜欢

精河库尔勒分段
一类连续和不连续分段线性系统的周期解研究
库尔勒下行到发场电码化特殊改频电路的改进
转变生产方式,促进库尔勒香梨提质增效
分段计算时间
氢对X80钢在库尔勒土壤模拟溶液中应力腐蚀开裂行为的影响
3米2分段大力士“大”在哪儿?
博尔塔拉河·精河及赛里木湖水质比较研究
地温、气温、气压对精河台水平摆观测的影响
关于新疆精河流域水文特性探讨
新疆精河枸杞产业发展优势初探