教学实验数据处理中的平均分组法和最小二乘法
2014-11-23王耿
王 耿
(西安交通大学 化学教学实验中心,西安 710049)
教学实验数据处理中经常要用数学方程式中的参数求解具有特殊物理意义的未知量,如物理化学实验“液体饱和蒸气压测定”中,由拟合直线的斜率可求解该液体的汽化热ΔvapH[1]。教学实践中确定数学方程式中特定参数的方法主要有绘图法和计算法,后者包括平均分组和最小二乘两种方法[2]。以下以n对按自变量大小排序后的数据(xi,yi)(i=1,2,…,n)拟合直线方程y=mx+b为例,简要对比分析平均分组法和最小二乘法。
1 平均分组法
定义第i个数据的残差Δ
设k为离n/2最近的整数,将数据近似均分为两组(x1,y1),(x2,y2),…,(xk,yk)和(xk+1,yk+1),(xk+2,yk+2),…,(xn,yn),平均分组法认为,拟合参数应使以上每组数据的残差代数和为零,即
由此可解出拟合参数m、b。
2 最小二乘法
定义各数据点的残差平方和为χ2,则
将式(1)代入式(2)展开得
最小二乘法认为最佳拟合结果应使各数据点残差的标准偏差最小[3]。残差的标准偏差存在极小值的必要条件为
解得
若记
则式(3)的书写形式可简化为
最小二乘法按公式能得出确定而客观的拟合结果。为评价拟合结果,在数学上引入了相关性的概念,相关性好说明拟合方程能很好地代表数据点的规律。对于直线拟合相关性系数R的定义为
3 平均分组法和最小二乘法的对比
平均分组法意义明确,就是找出离各数据点最近的那条直线,计算过程也相对简单。但由于拟合直线时,边缘数据点和中心数据点的重要性是不同的,类比误差理论中多次重复测量数据的残差总是小偏差居多。那么,平均分组法以完全平等的眼光看待每一个拟合数据,以代数和的形式处理残差就不太恰当了。
经过深入研究可知,最小二乘法拟合的直线斜率等于数据两端点连线斜率、次端点连线斜率,直到中心点连线斜率的带权相加之和[4],而先平方处理残差有利于放大残差中较大数据点的影响。可见,最小二乘法克服了平均分组法的弊端,得到的拟合结果比平均分组法更可靠。
4 结束语
近年来,随着计算机技术的不断发展,各种实验数据处理软件在基础实验室得到广泛应用,用计算机软件取代传统方法处理实验数据已是必然趋势[5]。选择实验数据处理方法时,计算量大小不再是考虑的重点。因此,实验教学数据处理中建议使用最小二乘法来处理实验数据。
[1] 尹寿银.Origin在物理化学实验中的应用[J].高校实验室工作研究,2012(4):66-67.
[2] 王明德,王耿,吴勇.物理化学实验[M].西安:西安交通大学出版社,2013:19-20.
[3] 田垅,刘宗田.最小二乘法分段直线拟合[J].计算机科学,2012,39(6A):482-484.
[4] 周浩.线性数据拟合方法的误差分析及其改进应用[J].大学数学,2013,29(1):70-76.
[5] 张来英,陈良坦.Excel软件在物理化学实验数据处理中的应用[J].厦门大学学报:自然科学版,2011,50(S1):167-168.