回归分析在界限含水率试验数据处理中的应用
2010-07-05赵秀绍莫林利
赵秀绍,莫林利
(1.华东交通大学铁路环境振动与噪声教育部工程研究中心,江西南昌330013;2.华东交通大学软件学院,江西南昌330013)
界限含水率试验所得结果液限wL和塑限wp是确定细粒土的承载能力、对细粒土进行填料分组的重要指标,所以准确地确定土的液塑限指标对工程建设具有重要的意义。
界限含水率试验测定完成后,目前常用的数据处理方法有作图法和公式法。作图法受人为因素影响,估读数据时一般会参照常规坐标,造成读数错误,其次每次试验都靠手工完成,不能实现数据处理自动化。近年来许多学者提出了一些新的算法,例如:殷春娟提出了用Excel表格处理界限含水率的方法[1],彭意[2],冯朝辉[3],张传邦[4]提出了公式法计算界限含水率的方法,高盟[5]提出了用样条函数求解的方法,这些方法大大的提高了计算的效率与精度。以上方法能通过塑限差法(Δ wp<2%)控制试验的数据偏差与精度,但仅能处理三组数据,部分试验数据被迫舍去而得不到充分利用,往往导致试验要制样5~9次进行测试,而有效的仅有3次。在前人工作方法的基础上,提出了基于线性回归的界限含水率计算方法,充分利用了各数据点对试验结果的贡献,用Visual Basic语言实现了这种算法,并在实践中检验了该算法的合理与优越性。
1 作图法计算界限含水率
根据文献[6]可得:在液塑限联合测定试验中,锥尖入土深度h(mm)与含水率w(%)之间存在如式(1)之间的双对数线性关系:lg h=alg w+b (1)式中:a和b是由试验确定的常数,根据以上原理,界限含水率试验的作图法应采用双对数坐标系。例如《TB10102-2004铁路工程土工试验规程》[7]或土工试验方法标准[8]法,以w为横坐标,h为纵坐标,在双对数坐标纸上绘制,三组数据(A、B、C)应连成一条直线。三点明显不在一条直线上时,连接 AB和AC并延长,与 h=2 mm直线有两个交点D1、D2,两个交点横坐标(wAC-wAB)之差称为塑限差,当Δwp<2%时,取两个交点的中点D,则AD就是表达式(1)的线性关系所绘制的直线。当Δwp≥2%时说明试验差距过大,应重做试验(见图1)。
图1 作图法原理图
作图法理论上可以计算和控制试验的精度,但实际操作起来相当困难,因为Δwp≥2%在双对数坐标上很难估读准确。
作图法的缺点:①受作图精度的影响;②受人为因素的影响;③作图法要求三个点之间的距离应尽量拉开,例如规程[7]规定,C点的范围在3~5 mm,B点范围在9~11 mm,A点范围在16~18 mm。但实际测定时,可能多次测试均不在以上范围内而需重新配水测定,造成试验数据浪费与人力资源浪费。
2 公式法计算界限含水率
依据作图法的原理(见图1),分别求出AB与AC直线的斜率KAB和KAC,则K=(KAB+KAC)/2可近似代替直线AD的斜率,利用式(2)和式(3)来求土样的液限wL和塑限wp2[2-4]:
式中:wp为塑限,锥尖入土2 mm对应的含水率;wL为塑限,锥尖入土10 mm对应的含水率。
公式法的优点:(1)公式法通过Δ wp<2%控制试验的精度;(2)公式法为计算机程序设计提供了依据,可以编写程序在计算机上实现自动化计算,此处不再详述。
公式法的缺点:(1)公式法是作图法的公式化,仅能依据三组数据来计算,而不能充分利用平行实验数据及超过了规范h范围的数据;(2)以含水率最大点A点作准确点是人为假设的,如果试验时A点的数据出现偏差,从而造成整个测定数据是错误的。
3 线性回归计算界限含水率方法原理
目前常用的线性回归方法为最小二乘法,它是德国数学家高斯在1794年解决行星轨道预测问题时首先提出的,其主导思想为保证拟合误差的平方差最小。
由式(1)可知含水率w与锥尖入土深度h取了对数后线性相关,所以可以用线性函数进行拟合。可令y=lgh,x=lgw,则式(1)转换为拟合方程
设方程(4)的系数a,b已经确定,则对每一组试验自变量xk(lgw),都可以计算出一个yk′(lgh)
式中:k是第k次试验;yk′是yk的计算值,yk′与yk之间的差值称为残差,用ek表示。
显然,ek的大小可衡量被确定的系数a,b的好坏,反过来,好的系数确定应遵循使ek最小这样一个原则。最小二乘法就是使ek的平方和达到最小,即
很显然,Q是系数a,b的函数,要使Q达到最小,则有Q对a和b的偏导数均为0,从而可得关于a,b的线性方程组[9]
式中:S11为试验总次数,
解方程组(8)可得系数a,b。
根据式(1),(4)可得
分别把h=2 mm和h=10 mm代入式(9)可得土样的液塑限。
线性函数最小二乘法拟合是靠相关系数来评价拟合好坏的,相关系数用下式表示
对于一般的线性回归,相关系数的平方R2小于0.9时数据是不可信的,需重新试验,或舍去偏离较大的点。
根据以上原理,线性回归计算土样的界限含水率流程图如图2所示。
根据图2,本算法采用Visual Basic语言实现,其实现的关键代码如下:
图2 最小二乘法求解流程图
备注:X(),Y()为锥尖入土深度与含水率求对数后形成的数组,A,B返回拟合后的值,R2返回相关系数。
4 线性回归计算方法的工程应用与优缺点分析
本文选定南昌孔目湖粉土、樟树丁家山粉质粘土及抚州粘土3个典型实例,表1是3个工程土样界限含水率测定的数据,其中南昌孔目湖104,105,106对应的为平行试验数据。按照作图法和公式法的要求,试验超过3组数据的其余试验不能参与运算,同时这三组数据也不在规范范围内,都应舍去。如果采用了上述的最小二乘法来计算界限含水率,所有数据均能充分利用,其计算结果见表2,其计算机绘制的拟合直线如图3所示。
从以上的工程实例中得出,基于最小二乘法有下列优点:(1)数据不受三组试验组数的限制,平行试验数据可以得到充分利用;(2)可以充分利用非规程范围内的数据,例如,公式法和作图法受规范锥尖入土深度范围的限制(3~5 mm,9~11 mm,16~18 mm),实践表明h只要在3~20 mm的锥尖入土深度范围,都能较好的满足方程(1),也即满足了最小二乘法的应用基础。
在工程应用中也发现当试验数据中某点(试验操作错误)偏离直线较大,已经超过了规范中的要求,但相关系数R2仍大于0.9,即无法完全通过相关系数来控制试验精度。其克服方法采用试验过程控制,即每一级锥尖入土深度测定两次,两次测定值之差应小于0.7 mm[10],否则直接重新试验,避免处理数据时发现问题返工重做试验。
表2表明,采用了上述试验方法后,塑限差最大值(由最大锥尖入土深度数据与其它数据组合成三组计算)都在2%之内,达到了规范精度要求。
表1 试验数据分析表
表2 试验结果
采用以上回归算法,可以很方便的设计作图程序,其中南昌孔目湖与樟树丁家山土样界限含水率制图如图3与图4所示,其相关系数R2分别为0.990 7,0.998 5,可见试验点相关显著,其最大塑限差分别为1.467%,0.291%,完全满足规范规定的<2%的要求,说明不在规范范围内的锥尖入土深度数据(南昌孔目湖h=8.820,19.360 mm;樟树丁家山取土场h=8.000,14.450,19.200 mm)可以使用。
图3 有平行试验孔目湖界限含水率求解
图4 樟树丁家山界限含水率求解
5 结论
本文详细介绍基于回归分析的界限含水率处理方法的原理与实现方法,大大的方便了界限含水率的计算,通过工程实践分析,可以得出如下结论:
(1)最小二乘法克服了作图法受人为因素、作图精度的影响,且可以使数据处理过程自动化;
(2)最小二乘法可以充分利于平行试验数据及规程范围之外的数据,数据组数可以任意,避免试验数据浪费及反复试验的繁琐,且统计样本数据越多,越能反映土样界限含水率实际情况;
(3)最小二乘法可以使拟合后残差平方和达到最小,克服了公式法把锥尖入土深度最大点A点(见图1)假设为准确点的不足,实际上A、B、C点在试验中的位置是均等的。
[1]殷春娟,崔永高,郑大龙.液塑限联合测定法的若干问题探讨[J].上海地质,2007,27(1):64-66.
[2]彭意,李铀,彭强.提高液塑限联合测定试验精度的方法[J].土工基础,2007,21(4):81-84.
[3]冯朝辉,彭意.联合测定法中液塑限含水率的求取[J].湖南理工学院学报:自然科学版,2006,19(2):85-87.
[4]张传邦.计算法求土的液限及塑限界限含水量[J].路基工程,2006,23(3):28-29.
[5]高盟,张远芳.样条函数在液塑限联合试验成果确定中的应用[J].水利与建筑工程学报.2005,3(3):8-10.
[6]南京水利科学研究院土工研究所.土工试验技术手册[M].北京:人民交通出版社,2003.
[7]中华人民共和国国家标准.铁路工程土工试验规程(TB 10102-2004)[S].北京:中国铁道出版社,2004.
[8]中华人民共和国国家标准.土工试验方法标准(GB/T 50123-1999)[S].北京:中国建筑工业出版社,1999.
[9]吴若峰,乐之伟,陆文聪.计算机在化学化工中的应用[M].上海:上海大学出版社,2000:3-8.
[10]赵秀绍,莫林利.界限含水率试验数据计算方法及试验优化研究[J].路基工程,2010,27(2):29-31.