APP下载

基于二值Logistic回归模型的砂土液化指标敏感性分析

2015-12-05

安全与环境工程 2015年3期
关键词:砂土回归方程液化

潘 翔

(周口师范学院基建处,河南 周口 466001)

砂土液化是地震灾害的一种主要形式,常伴有喷砂、冒水、地面沉陷、诱发高速滑坡等现象,是地基失效并造成结构物损伤的重要原因之一[1]。20 世纪60 年代以来,几次大的地震,如日本新泻地震(1964)、美国阿拉斯加地震(1964)、中国唐山大地震(1976)、日本神户大地震(1995)以及中国汶川特大地震(2008)等均因砂土液化导致堤防或建筑物大规模的破坏,造成了巨大的经济损失,因此砂土液化问题已引起了工程界的广泛关注[2]。目前,对砂土液化已经发展出多种预测方法,如标准贯入法(SPT)、静力触探法(CPT)、剪切波速法(vs),它们是最常用的砂土液化评价方法,也是许多砂土液化预测方法建立的基础[3]。其中,标准贯入法较为成熟,已成为国内外工程界普遍接受的方法,我国《建筑抗震设计规范》和美国Seed都建议采用以SPT-N 值为指标的经验方法进行砂土液化预测[4]。

由于砂土液化受众多因素影响,同时各因素与砂土液化之间存在着高度的非线性关系,因此建立多因素综合模型对砂土液化进行准确预测对抗震减灾具有重要意义。据此,国内外的学者提出了多种综合预测模型和方法,如神经网络模型[4-5]、模糊综合评价法[6]、距离判别法[7]等,但他们在建立预测模型的同时,缺乏对变量的重要性和敏感性等方面的研究。由于不同的变量具有不同的敏感性,它们对于砂土液化的影响是不同的,因此可以利用现有数据提供的信息去分析变量的敏感性,在此基础上选择变量建立更为合理的预测模型。砂土液化的预测结果一般分为两种情况:液化(1)和未液化(0),而砂土液化指标一般都为连续变量,在这种情况下,二值Logistic回归模型可以用来作为砂土液化预测的基本模型。本文根据国内外173组样本数据[8],建立了砂土液化预测的二值Logistic回归模型,在此基础上利用优势比的概念对砂土液化指标的敏感性进行了分析。

1 二值Logistic回归模型

1.1 数学模型

现实中的很多现象可以划分为两种可能,或者归结为两种状态,这两种状态分别用0和1表示,如砂土液化(1)和未液化(0)两种状态。如果采用多个因素对0和1表示的砂土液化现象进行因果关系解释,则可以利用二值logistic回归的数学模型来表示,其表达式为[9]

式中:x1,…,xm为自变量;β0,…,βm 为待定参数,根据已有观测值进行估计。

对于给定的自变量x1,…,xm的值,其概率表达式为

由(2)式可以预测事件“0”和“1”的概率。一般情况下,若p>0.5,则确定为事件“1”;若p<0.5,则确定为事件“0”。

1.2 优势比

在Logistic回归模型中,设p 表示砂土液化的概率,则砂土液化的概率p 与砂土未液化的概率1-p之比为优势(Odds),有

固定其他自变量,比较xi与xi+1的ln(Odds)变化。

对于xi,有

对于xi+1,有

由(4)、(5)两式可得

经反对数变换得到

式中:ORi为第i个指标对应的优势比。

由此,系数βi 取值大小及符号说明变量xi对砂土液化发生的影响大小和方向,具体地说:若βi>0,则ORi=exp(βi)>1,即变量xi的水平每增加一个单位,砂土液化发生的相对危险度便提高exp(βi)倍,且xi处于高水平时,砂土液化发生的概率更大;若βi<0,则ORi=exp(βi)<1,即变量xi的水平每增加一个单位,砂土液化发生的相对危险度便降低exp(βi)倍,且xi处于低水平时,砂土液化发生的概率更大;若βi=0,则ORi=exp(βi)=1,即变量xi的各水平下砂土液化发生的相对危险度一致,表明该变量对砂土液化发生没有影响。若x1,…,xm的量纲不同,则可将数据标准化,得到标准化系数,标准化系数的绝对值越大,表示其对事件发生的影响也越大。

1.3 模型评价

评价二值Logistic回归方程的拟合效果一般采用以下几个指标[9]:

(1)模型拟合显著性检验的p 值,如果p<0.05,说明回归方程的拟合效果是显著的;

(2)拟合优度检验中对应于Pearson、偏差、Hosmer-Lemeshow 3 种方法 的p 值,如 果p >0.05,说明回归方程的拟合效果是好的;

(3)自变量系数显著性检验的p 值,如果p<0.05,说明自变量系数是显著的;

(4)事件预测准确率,根据回归方程可以预测事件的概率,一般情况下,若p>0.5,则确定为事件“1”,若p<0.5,则确定为事件“0”,在此基础上与实际情况对比即可计算事件预测准确率作为拟合效果评估的依据。

2 砂土液化指标敏感性分析

2.1 指标和数据

本文选择Stark等[10]研究的180组砂土液化与未液化现场实例中的173组数据作为分析样本,其中7组由于缺失平均粒径数据未入选。173组数据中,107组发生砂土液化,66组未发生砂土液化。在这些实例中,沙涌、建筑物破坏或下沉、地面侧向大变形等被视作砂土液化发生的标志,缺乏上述标志则认为砂土液化未发生。限于篇幅,本文并未列出具体数据,可参见文献[10]。

原始数据中统计了震级M、深度ds、地下水位dw、总应力σ0、有效应力σ′0、平均粒径D50、修正的CPT 锥尖阻力qc1、地面峰值加速度amax和地震剪应力比SSR。其中,qc1和SSR 的计算公式如下:

上式中:Cq为有效应力修正系数,根据Kayen等[11]提供的公式进行计算;qc为CPT 锥尖阻力值;amax为地面峰值加速度;g 为重力加速度(9.81 m/s2);σ0为总应力(MPa);σ′0为有效应力(MPa);rd为深度折减因子,可由下式计算[11]:

其中,z为土层埋深(m)。

在上述这些指标中,部分指标之间具有高度相关性,如σ0和σ′0,amax和SSR。对于二值Logistic回归模型而言,如果指标之间高度相关,则可能导致模型不稳定,解释上存在矛盾等[12]。例如σ0和σ′0、amax和SSR 同时存在于二值Logistic回归模型中,采用上述优势比分析,所反映的结果是σ0和σ′0或者amax和SSR 与砂土液化潜势之间的趋势关系恰好相反,这是不符合实际的。因此,需对原始数据进行相关性分析,并选择相对独立且具有代表性的指标做进一步的敏感性分析。本文在对原始数据进行统计分析时,对于原始数据中的区间值,取所在区间的中值代替。原始数据相关性分析结果见表1。

表1 原始数据相关性分析Table 1 Correlation analysis of data

由表1 可以看出:M、D50、qc13 个指标 相对独立,而ds、σ0与σ′0以及amax与SSR 之间高度相关,相关性系数大于0.9,而dw与σ′0之间的相关性较好,相关性系数为0.773。根据各指标的代表性和独立性,本文从上述9个指标中选择M、σ′0、D50、qc1和SRR 作为基本分析指标。

2.2 模型建立

以173组数据建立二值Logistic回归模型,具体操作可通过SPSS统计分析软件实现,得到二值Logistic回归的数学模型如下:

由此概率表达式为

2.3 模型评价

对建立的二值Logistic回归方程的拟合效果进行评价,其评价结果如下:

(1)模型拟合显著性检验的p=0.000<0.001,说明回归方程的拟合效果非常显著;

(2)拟合优度检验中对应于Pearson、偏差、Hosmer-Lemeshow 3种方法的p 值分别为0.840、1.000和0.068,三者都满足p>0.05,说明回归方程的拟合效果是好的;

(3)自变量系数显著性检验的p 值中,M 对应的p=0.017<0.05,SRR 对应的p=0.005<0.05,说明两者的系数是显著的,其余3个指标对应的p=0.000<0.001,说明三者的系数非常显著;

(4)由式(12)预测事件“1”砂土液化发生的准确率为95.3%,预测事件“0”砂土液化未发生的准确率为83.3%,平均预测准确率为90.8%,预测效果良好。

综上所述,本文所建立的二值Logistic回归模型能够较好地解释砂土液化现象之间的因果关系,因此可用二值Logistic回归模型进行指标敏感性分析,也可用于砂土液化预测。

2.4 指标敏感性分析

本文利用优势比分析各指标的敏感性以及其与砂土液化潜势的趋势性关系。由于各指标的意义和量纲不同,为了使优势比具有可比性,需对指标数据进行标准化处理后再建立二值Logistic回归模型,而指标数据的标准化并不影响模型的评价和预测结果。

首先对原始数据进行均值化处理,这样不仅可以消除数据量纲和数量级的影响,同时也可以保持数据内的变异信息[13]。但由于均值化后的数据过小,因此将所有数据增大10倍处理,均值化公式如下:

式中:i为指标编号(i=1,2,…,m);j为样本编号(j=1,2,…,n)。

然后通过SPSS统计分析软件,得到标准化处理后的二值Logistic回归的数学模型如下:

模型的系数和对应的优势比汇总于表2中。

表2 模型的系数和对应的优势比Table 2 Coefficients of each model and corresponding odds ratios

由表2可以看出:未标准化的模型系数和对应的优势比差异相当大,根本不具有可比性,无法说明指标的敏感性;而标准化后的模型系数和对应的优势比处于同一个数量级,具有可比性,可根据各指标的优势比来分析其对砂土液化的影响大小和方向。σ′0和qc1的系数小于零,对应的优势比小于1,说明在其他指标不变的情况下,这两个指标任意一个增大,将会导致砂土液化的相对危险性减小,以qc1敏感性较大;M、D50、SRR 的系数大于零,对应的优势比大于1,说明在其他指标不变的情况下,这三个指标任意一个增大,将会导致砂土液化的相对危险性增大,以M 敏感性最大。对于σ′0、qc1、M 和SRR 与砂土液化的趋势性关系符合一般认识,但是一般认为平均粒径D50越大,则抗液化能力越强[14],而优势比给出的是D50越大,砂土液化的相对危险性越大,因此这两者的统计关系还有待进一步验证。

将σ′0和qc1优势比求倒数(表2中括号内数值)即可与其他指标进行对比,由此可以得到各指标敏感性排序为:M>qc1>σ′0>D50≈SRR,也就是说砂土液化对M 指标最为敏感,对qc1指标次之,说明qc1指标是除M 以外最为有效的预测指标,其次σ′0、D50和SRR 三者之间的敏感性相差不大。敏感性排序结果对应于指标的优选顺序。由于5个指标的优势比或者优势比倒数都与1具有一定的差距,说明它们都是预测砂土液化不可或缺的指标。

3 结论

本文将二值Logistic回归模型应用到砂土液化预测中,以国内外173组样本数据作为研究对象,对砂土液化指标的敏感性进行了分析,所得结论如下。

(1)通过原始数据相关性分析选择M、σ′0、D50、qc1和SRR5个指标建立二值Logistic回归模型,模型评价结果都满足要求,预测准确率达到了90.8%,说明二值Logistic回归模型可用于描述指标与砂土液化现象之间的因果关系,其概率表达式可用于砂土液化预测。

(2)砂土液化指标敏感性分析结果表明:各指标的敏感性排序为M>qc1>σ′0>D50≈SRR;σ′0和qc1指标与砂土液化的相对危险性呈负相关趋势,以qc1指标敏感性较大,M、D50、SRR 指标与砂土液化的相对危险性呈正相关趋势,以M 指标敏感性最大。

[1]陈建伟,苏经宇,苏幼坡.场地地震液化的主要影响因素分析[J].安全与环境工程,2013,20(4):18-22.

[2]刘勇健.基于聚类-二叉树支持向量机的砂土液化预测模型[J].岩土力学,2008,29(10):2764-2768.

[3]Lai S Y,Hsu S C,Hsieh M J.Discriminant model for evaluating soil liquefaction potential using cone penetration test data[J].Journal of Geotechnical and Geoenvironmental Engineering,2004,130(12):1271-1282.

[4]陈国兴,李方明.基于径向基函数神经网络模型的砂土液化概率判别方法[J].岩土工程学报,2006,28(3):301-305.

[5]林志红,项伟.基于贝叶斯正则化BP神经网络的砂土地震液化研究[J].安全与环境工程,2011,18(2):23-27.

[6]薛新华,张我华,刘红军.砂土地震液化的模糊综合评判法[J].重庆建筑大学学报,2006,28(1):55-58.

[7]金志仁.基于距离判别分析方法的砂土液化预测模型及应用[J].岩土工程学报,2008,30(5):776-780.

[8]Xue,X H,Yang,X G.Application of the adaptive neuro-fuzzy inference system for prediction of soil liquefaction[J].Natural Hazards,2013,67(2):901-917.

[9]吴令云,吴家祺,吴诚鸥,等.MINITAB软件入门:最易学实用的统计分析教程[M].北京:高等教育出版社,2012.

[10]Stark T D,Olson S M.Liquefaction resistance using CPT and field case histories[J].Journal of Geotechnical Engineering,1995,121(12):856-869.

[11]Kayan R E,Mitchell J K,Seed R B,et al.Evaluation of SPT-,CPT-,and Shear Wave-basedMethodsfor Liquefaction Potential Assessments Using Lorna Prieta Data[R].Buffalo,USA:National Center for Earthquake Engineering Research,1992:177-192.

[12]袭炯良,郏剑宁,张扬.主成分改进的logistic回归模型方法在流行病学分析中的应用[J].中国热带医学,2005,5(2):207-209.

[13]叶宗裕.关于多指标综合评价中指标正向化和无量纲化方法的选择[J].浙江统计,2003(4):24-25.

[14]罗战友,龚晓南.基于经验的砂土液化灰色关联系统分析与评价[J].工业建筑,2002,32(11):36-39.

猜你喜欢

砂土回归方程液化
水泥土换填法在粉质砂土路基施工中的应用研究
聚氨酯聚合物/剑麻纤维改良砂土剪切特性研究
非饱和砂土似黏聚力影响因素的实验研究
采用直线回归方程预测桑瘿蚊防治适期
液化天然气槽车装卸一体化系统
线性回归方程的求解与应用
线性回归方程要点导学
不同低温温度下砂土物理力学特性试验研究
复杂液化地基处理的工程应用分析
线性回归方程知识点剖析