APP下载

最佳匹配直线模型的找寻法

2017-12-07赵金荣

卷宗 2017年33期
关键词:石棉计算器绘图

赵金荣

模型就是一个物体或一个过程的表示.例如,一个玩具法拉利就是一辆实际法拉利汽车的模型;一公路地图就是一个城市中道路的模型.数学模型指的是一个物体或过程的数学表达式(通常是一个等式).一旦得到一个数学模型,就能够使用这个模型得到与被建模的事物有关的有用的信息,或者对此作出预测.在本文中,我们要探索不同的数学方法,用来对真实的现象建立数学模型,从而可以使用这些数学模型解决实际问题.

1 与数据最佳匹配的直线

使用线性方程对某些变量之间的变化关系能够进行建模.而这些变量之间的相依关系是对收集的数据进行分析的过程中发现的.但是真实现象的数据很少都落在一条精确的直线上.在本文中,我们要讨论一种得到与数据最佳匹配直线的方法.

表1给出了年到年期间全美国范围内的婴儿早亡率.速率指的是个新生儿中,在到达一岁生日前去世的婴儿的数量.

图1给出的散点图说明这些数据粗略地落在一条直线上.我们可以从直观上用一条直线近似表示这些数据点,但是,这些数据不是严格线性的,所以似乎有很多直线都能够与这些数据匹配.但经过观察可以发现,在所有经过这些数据点的直线中,有一条与这些数据是“最佳”匹配的,也就是说,这条直线可以为这些数据提供最精确的线性函数模型.现在我们看一下如何找到这条直线.

最佳匹配直线与所有的数据点尽可能地接近看起来是合理的.也就是说最佳匹配直线是与数据点的竖直距离之和尽可能小的直线.从技术上考虑,最佳匹配直线是这些距离的平方和最小的直线.这样的直线叫做回归直线.回归直线的公式是使用微积分得到的,但幸运地是,这个公式编入了大多数的绘图计算器的程序中.在例题1中,我们会看到如何使用TI-83计算器求出前面描述的婴儿早亡率的回归直线.

2 回归分析例证

线性模型模拟给出的数据真的恰当吗? 其他类型函数也能够用来研究具有同样分布规律的数据,但使用回归模型在解决实际问题中还是有一定的用途的,比如线性回归可以用在医学研究中,用来探索某种疾病的潜在致病因素,比如说癌症.

例题 联系石棉和癌症之间关系的回归直线 当实验室中的老鼠暴露在石棉纤维中时,有些老鼠会发生肺癌.表格列出了不同科学家进行试验的几个试验结果.(a) 求出这些数据的回归直线.(b) 绘制出数据的散点图和绘制直线.根据图像,判断得到的回归直线是这些数据恰当的模型吗?(c) 这条回归直线的截距代表什么?

解 (a) 使用绘图计算器,得到下面的回归直线:

(b)数据的散点图和回归直线的图像见图3(b).根据得到的回归直线的图像,可以看出,这条回归直线是给定数据的一个合理的模型.

(c) 這条回归直线的截距是在没有石棉纤维存在的情况下生成肺癌的老鼠所占的百分比.换句话就是,这是正常情况下肺癌发病的百分比(石棉以外的其他因素导致的肺癌).

3 匹配的有多好? 相关系数

对于任意给定的双变量数据的集合,即使这些数据点从图像上看起来没有位于同一直线上,又或者即使这些数据点看起来根本毫无联系,通常情况下也总能找到一条回归直线.

绘图计算器能给我们提供每一个散点图的回归直线.但是这些直线能够多好地表示(或“匹配”)这些数据集呢?要回答这个问题,统计学家们发明了相关系数一词,一般用标识.相关系数是指位于和之间的一个数,用来量度数据与回归直线有多接近—或者,换句话说,变量是如何关联在一起的.很多的绘图计算器在计算回归直线时会给出的值.如果与或接近,那么这些变量紧密相联系—也就是,散点图与回归直线非常接近.如果接近,那么变量的相互关联性就很弱或者根本毫无联系.(的符号由回归直线的斜率决定.)

不存在严格和快速的法则用来判断哪些值足以决定线性相关是“显著的”.相关系数是唯一可以用来帮助我们判断得到的回归直线与数据的匹配程度是否可靠.例题1中,相关系数是,说明相关程度非常高,所以我们可以很有信心地说从年至年期间的儿童早亡率具有很强的直线性.(值是负值,原因是儿童早亡率在这段时间内呈下降趋势.)在例题中,相关系数是,也说明了变量之间具有很强的相关性.所以在石棉中的暴露程度很明显与老鼠中肺癌发生相关.这是否就意味着石棉导致了肺癌的产生?

如果两个变量相关,也不意味着一个量的变化一定能够引起另一个量的改变.例如,数学家John Allen Paulos指出鞋子的大小与在校儿童中的数学成绩相关.这是否意味着大脚的儿童的数学成绩就高呢?当然不是—鞋子大小和数学技能随着儿童年龄的增加分别单独地在增大.所以,不匆忙得出结论是非常重要的:相关和因果关系不是一回事.相关是得到因果效应关系的一有用的工具;但是,要证明因果关系,必须要解释一个变量影响另一个变量的机制.例如,吸烟和肺癌之间的关联经过观察是相关的,这个结论早在科学发现吸烟导致肺癌的机制之前就有了.

参考文献

[1]Precalculus.Mathematics for Calculus,.James. Stewart,.Lother.Redlin,Saleem.Watson,6ed. Brooker,.2012 P129-139endprint

猜你喜欢

石棉计算器绘图
来自河流的你
“禾下乘凉图”绘图人
[计算器不是万能的]
基于HTML5 Canvas绘图技术应用
石棉联社举办农信杯柑甜欢乐拍
一个损坏的计算器
一个损坏的计算器
Surfer和ArcView结合在气象绘图中的应用