回归分析在界限含水率试验数据处理中的应用

2010-07-05赵秀绍莫林利

华东交通大学学报 2010年3期

赵秀绍,莫林利

(1.华东交通大学铁路环境振动与噪声教育部工程研究中心,江西南昌330013;2.华东交通大学软件学院,江西南昌330013)

界限含水率试验所得结果液限wL和塑限wp是确定细粒土的承载能力、对细粒土进行填料分组的重要指标,所以准确地确定土的液塑限指标对工程建设具有重要的意义。

界限含水率试验测定完成后,目前常用的数据处理方法有作图法和公式法。作图法受人为因素影响,估读数据时一般会参照常规坐标,造成读数错误,其次每次试验都靠手工完成,不能实现数据处理自动化。近年来许多学者提出了一些新的算法,例如:殷春娟提出了用Excel表格处理界限含水率的方法[1],彭意[2],冯朝辉[3],张传邦[4]提出了公式法计算界限含水率的方法,高盟[5]提出了用样条函数求解的方法,这些方法大大的提高了计算的效率与精度。以上方法能通过塑限差法(Δ wp＜2%)控制试验的数据偏差与精度,但仅能处理三组数据,部分试验数据被迫舍去而得不到充分利用,往往导致试验要制样5～9次进行测试,而有效的仅有3次。在前人工作方法的基础上,提出了基于线性回归的界限含水率计算方法,充分利用了各数据点对试验结果的贡献,用Visual Basic语言实现了这种算法,并在实践中检验了该算法的合理与优越性。

1 作图法计算界限含水率

根据文献[6]可得:在液塑限联合测定试验中,锥尖入土深度h(mm)与含水率w(%)之间存在如式(1)之间的双对数线性关系:lg h=alg w+b (1)式中:a和b是由试验确定的常数,根据以上原理,界限含水率试验的作图法应采用双对数坐标系。例如《TB10102-2004铁路工程土工试验规程》[7]或土工试验方法标准[8]法,以w为横坐标,h为纵坐标,在双对数坐标纸上绘制,三组数据(A、B、C)应连成一条直线。三点明显不在一条直线上时,连接 AB和AC并延长,与 h=2 mm直线有两个交点D1、D2,两个交点横坐标(wAC-wAB)之差称为塑限差,当Δwp＜2%时,取两个交点的中点D,则AD就是表达式(1)的线性关系所绘制的直线。当Δwp≥2%时说明试验差距过大,应重做试验(见图1)。

图1 作图法原理图

作图法理论上可以计算和控制试验的精度,但实际操作起来相当困难,因为Δwp≥2%在双对数坐标上很难估读准确。

作图法的缺点:①受作图精度的影响;②受人为因素的影响;③作图法要求三个点之间的距离应尽量拉开,例如规程[7]规定,C点的范围在3～5 mm,B点范围在9～11 mm,A点范围在16～18 mm。但实际测定时,可能多次测试均不在以上范围内而需重新配水测定,造成试验数据浪费与人力资源浪费。

2 公式法计算界限含水率

依据作图法的原理(见图1),分别求出AB与AC直线的斜率KAB和KAC,则K=(KAB+KAC)/2可近似代替直线AD的斜率,利用式(2)和式(3)来求土样的液限wL和塑限wp2[2-4]:

式中:wp为塑限,锥尖入土2 mm对应的含水率;wL为塑限,锥尖入土10 mm对应的含水率。

公式法的优点:(1)公式法通过Δ wp＜2%控制试验的精度;(2)公式法为计算机程序设计提供了依据,可以编写程序在计算机上实现自动化计算,此处不再详述。

公式法的缺点:(1)公式法是作图法的公式化,仅能依据三组数据来计算,而不能充分利用平行实验数据及超过了规范h范围的数据;(2)以含水率最大点A点作准确点是人为假设的,如果试验时A点的数据出现偏差,从而造成整个测定数据是错误的。

3 线性回归计算界限含水率方法原理

目前常用的线性回归方法为最小二乘法,它是德国数学家高斯在1794年解决行星轨道预测问题时首先提出的,其主导思想为保证拟合误差的平方差最小。

由式(1)可知含水率w与锥尖入土深度h取了对数后线性相关,所以可以用线性函数进行拟合。可令y=lgh,x=lgw,则式(1)转换为拟合方程

设方程(4)的系数a,b已经确定,则对每一组试验自变量xk(lgw),都可以计算出一个yk′(lgh)

式中:k是第k次试验;yk′是yk的计算值,yk′与yk之间的差值称为残差,用ek表示。

显然,ek的大小可衡量被确定的系数a,b的好坏,反过来,好的系数确定应遵循使ek最小这样一个原则。最小二乘法就是使ek的平方和达到最小,即

很显然,Q是系数a,b的函数,要使Q达到最小,则有Q对a和b的偏导数均为0,从而可得关于a,b的线性方程组[9]

式中:S11为试验总次数,

解方程组(8)可得系数a,b。

根据式(1),(4)可得

分别把h=2 mm和h=10 mm代入式(9)可得土样的液塑限。

线性函数最小二乘法拟合是靠相关系数来评价拟合好坏的,相关系数用下式表示

对于一般的线性回归,相关系数的平方R2小于0.9时数据是不可信的,需重新试验,或舍去偏离较大的点。

根据以上原理,线性回归计算土样的界限含水率流程图如图2所示。

根据图2,本算法采用Visual Basic语言实现,其实现的关键代码如下:

图2 最小二乘法求解流程图

备注:X(),Y()为锥尖入土深度与含水率求对数后形成的数组,A,B返回拟合后的值,R2返回相关系数。

4 线性回归计算方法的工程应用与优缺点分析

本文选定南昌孔目湖粉土、樟树丁家山粉质粘土及抚州粘土3个典型实例,表1是3个工程土样界限含水率测定的数据,其中南昌孔目湖104,105,106对应的为平行试验数据。按照作图法和公式法的要求,试验超过3组数据的其余试验不能参与运算,同时这三组数据也不在规范范围内,都应舍去。如果采用了上述的最小二乘法来计算界限含水率,所有数据均能充分利用,其计算结果见表2,其计算机绘制的拟合直线如图3所示。

从以上的工程实例中得出,基于最小二乘法有下列优点:(1)数据不受三组试验组数的限制,平行试验数据可以得到充分利用;(2)可以充分利用非规程范围内的数据,例如,公式法和作图法受规范锥尖入土深度范围的限制(3～5 mm,9～11 mm,16～18 mm),实践表明h只要在3～20 mm的锥尖入土深度范围,都能较好的满足方程(1),也即满足了最小二乘法的应用基础。

在工程应用中也发现当试验数据中某点(试验操作错误)偏离直线较大,已经超过了规范中的要求,但相关系数R2仍大于0.9,即无法完全通过相关系数来控制试验精度。其克服方法采用试验过程控制,即每一级锥尖入土深度测定两次,两次测定值之差应小于0.7 mm[10],否则直接重新试验,避免处理数据时发现问题返工重做试验。

表2表明,采用了上述试验方法后,塑限差最大值(由最大锥尖入土深度数据与其它数据组合成三组计算)都在2%之内,达到了规范精度要求。

表1 试验数据分析表

表2 试验结果

采用以上回归算法,可以很方便的设计作图程序,其中南昌孔目湖与樟树丁家山土样界限含水率制图如图3与图4所示,其相关系数R2分别为0.990 7,0.998 5,可见试验点相关显著,其最大塑限差分别为1.467%,0.291%,完全满足规范规定的＜2%的要求,说明不在规范范围内的锥尖入土深度数据(南昌孔目湖h=8.820,19.360 mm;樟树丁家山取土场h=8.000,14.450,19.200 mm)可以使用。