APP下载

追根求源锲而不舍—一对一道概率统计试题的探究与反思

2020-02-20北京师范大学盐城附属学校224007郝文华

中学数学研究(广东) 2020年1期
关键词:回归方程线性直线

北京师范大学盐城附属学校(224007) 郝文华

有人说,解题就像挑线头一样,一团毛线在眼前,东拉一下,西扯一下,最后搞得毫无头绪,只有放弃.但如果能够从条件出发,顺藤摸瓜,追根求源,找到题目最本质最原始的一面,挖掘出题目最深层的结构,问题便会简单很多.但是,这个过程往往蕴含着百思不解,愁肠百结,惋惜纠结,豁然开朗,别有洞天等情感历程.最近笔者就遇到一道联考试题,激起众多师生的激烈讨论和穷追不舍.

1.原题呈现

题目某公司生产的某种产品,如果年返修率不超过千分之一,则其生产部门当年考核优秀,现获得该公司2011-2018年的相关数据如下表所示:

注年返修率=

(Ⅰ)从该公司2011-2018年的相关数据中任意选取3年的数据,以ξ表示3年中生产部门获得考核优秀的次数,求ξ的分布列和数学期望;

(Ⅱ)根据散点图发现2015年数据偏差较大,如果去掉该年的数据,试用剩下的数据求出年利润y(百万元)关于年生产台数x(万台)的线性回归方程(精确到0.01).

附线性回归方程中,

问题(Ⅱ)答案如下:

因为x5== 6,所以去掉2015年的数据后不影响的值,所以而去掉2015年的数据之后从而回归方程为: ˆy= 0.48x+1.27.答案直接说出“因为x5==6,所以去掉2015年的数据后不影响的值”,不禁让人感到突兀,进而对其引发了一系列的猜想和探究.

2 问题再探

探究视角1研究公式

通过观察公式,很容易发现,剔除第五个样本点(6,3)之后,由于x5==6,因此(x5-)2=0,进而分母的值不会发生改变.

而分子呢? 这时,有部分同学提出,由于(x5-)=0,因此,(x5-)(y5-)=0,从而得出分子的取值也不发生改变.乍一看,似乎有点道理,但很快就有同学提出不同的意见: 虽然(x5-)(y5-)=0,但是剔除第五个样本点(6,3)之后,剩下的七个点的却发生了改变,由原来的变成现在的因此,这说明不了分子到底是变还是未变,这都有可能性,还需要进一步探究.

探究视角2进行数据实验.

取A(1,2),B(2,4),C(3,3)和D(2.7)四个样本点,则

探究视角3一般性探究.

假设样本点为(x1,y1),(x2,y2),(x3,b3),··· ,(xn,yn),其中有一个样本点(xt,yt),且xt=,下面对剔除(xt,yt)前后的值进行对比.剔除前,

剔除后,

性质1在利用最小二乘法求样本点的线性回归直线方程时,若增减一些横坐标与相同的样本点,则不会影响所求线性回归方程的斜率,但其在y轴上的截距可能会发生改变.

为什么b的值不发生改变呢? 这需要追踪b值的来源.

探究视角4顺藤摸瓜,追根求源.

对于线性回归系数b的推导,在高中数学必修和选修教材中均有涉及,究其来源,要从平面中一个样本点(xt,yt)与一条直线y=a+bx的“距离”说起.数学中可以用多种量来刻画平面中点与直线的“接近程度”,但是在最小二乘法中,是利用[yi-(a+bxi)]2来刻画的.教材中力求利用最小二乘法找到一条最“理想”的直线y=a+bx,来拟合样本点(x1,y1),(x2,y2),··· ,(xn,yn),这就要求a,b,使这n个点与直线y=a+bx的“接近程度”之和最小,即使得Q(a,b)=(y1-a-bx1)2+(y2-a-bx2)2+···+(yn-a-bxn)2达到最小.教材中经过变形,发现当

时,Q(a,b)取最小值,可以认为,此时b的值即为函数Q(a,b)的最小值点.如果在样本点中,有一点为(xt,yt),且xt=,将其剔除,由于回归直线必过中心点(,),因此,Q(a,b)的值将会减少一个常量(yt -)2.一个函数去掉一个常数,其最值点是不会发生改变的,因此,b的值不会发生改变.这样,就找到了b值不变的根源,问题得到解决.

3 一点思考

培养学生核心素养是当前教育改革的主旋律.新课标指出,数学课程的目标要求学生在掌握“四基”(基础知识、基本技能、基本方法和基本活动)和提高“四能”(发现和提出问题的能力、分析和解决问题的能力)的基础上,进一步发展数学抽象、逻辑推理、数学建模、直观想象、数学运算、数据分析等数学学科素养.其中,“数据分析和数学运算”两大素养的确立,体现了发展核心素养应遵循“科学性、时代性和民族性”三大原则,适应当前信息化、大数据时代对人才培养的要求,这也是高中数学“六大核心素养”中最鲜明、最新颖的两个基本素养.近几年来,高考中的概率与统计试题,对学生“数据分析和数学运算”能力的考查要求越来越明显.这需要在备考时,进一步回归教材,精读教材的每一个角落,对教材中的统计学知识再挖掘,并深入理解统计学原理,领悟统计学思想.对于公式,不应停留在记住结论、公式的表层上,要弄清公式的来源、变形、推导过程及公式间的内部联系.例如,对于样本数据x1,x2,x3,··· ,xn的方差公式和随机变量X的方差公式在实质上是一脉相承的关系,可通过类比进行理解记忆.

另外,在公式的变形上还要学会融会贯通,例如,2016年全国Ⅲ卷的概率统计解答题,在求相关系数r的时候,附表中给出的公式就是但是根据题目条件和所给数据,不能直接计算分子的值,这个时候就要类比教材中线性回归方程的系数公式

的结构形式,推得相关系数的变形结构

这样才能使问题迎刃而解.因此,在高三复习备考中,除了深入研究历年统计与概率真题外,还要进一步回归教材,特别是教材中知识产生的背景、过程和结论,都应认真对待,不可轻视.

猜你喜欢

回归方程线性直线
二阶整线性递归数列的性质及应用
采用直线回归方程预测桑瘿蚊防治适期
不相交线性码的一种新构造*
画直线
非齐次线性微分方程的常数变易法
画直线
你喜欢直线吗?
走直线等