变量间的相关关系学习指导
2019-02-26廖庆伟
■廖庆伟
一、知识梳理
1.散点图:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫作散点图。利用散点图,可以判断两个变量是否相关,是正相关还是负相关。
2.两个变量的线性相关:(1)由散点图可知,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线。(2)回归方程为ˆy=b x+a,其中b=(3)通过求的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法。(4)相关系数当r>0时,表明两个变量正相关,当r<0时,表明两个变量负相关,r的绝对值越接近于1,表明两个变量的线性相关性越强,r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性。
二、典型例题解析
问题一:如何理解两个变量的相关关系
例1给出下列变量关系:
①人的身高与体重之间的关系;
②人的年龄与血压之间的关系;
③人的身高与数学成绩之间的关系;
④农作物的施肥量与产量之间的关系;
⑤正方形的边长与面积之间的关系。
其中是变量之间具有相关关系的有____(将所有符合条件的序号都填上)。
解:①人的身高与体重之间的关系是相关关系。②人的年龄与血压之间的关系是相关关系。③人的身高与数学成绩之间的关系既不是函数关系,也不是相关关系。④农作物的施肥量与产量之间的关系是相关关系。⑤正方形的边长与面积之间的关系是确定关系,即为函数关系。答案为①②④。
评析:利用定义区分相关关系与函数关系的关键要看两个变量间的关系具有“确定性”还是具有“伴随性”。
问题二:如何利用散点图判断两个变量的线性相关性
例2 观察下列各图形(如图1,图2,图3,图4)。
其中两个变量x,y具有很强相关关系的图形是( )。
解:相关关系有两种情况:若所有点看上去都在一条直线附近波动,则是线性相关;若所有点看上去都在某条曲线(不是一条直线)附近波动,则是非线性相关。图1,图4的相关性较弱,图2中两变量几乎没有什么关系,而图3相关性很强。应选C。
评析:观察散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量是线性相关的。
问题三:如何求线性回归方程
例3表1是某地搜集到的新房屋的销售价格y(万元)和房屋的面积x(m2)的数据,试求线性回归方程。
表1
解:由已知得
设所求回归直线方程为ˆy=b x+a,则b—1.65。故所求回归直线方程为1.65。
问题四:如何利用线性回归方程求参数的值
例4对于表2所示的五个散点,已知求得的线性回归直线方程为ˆy=0.8x—155,则实数m的值为( )。解:依题意得
表2
问题五:如何利用线性回归方程对总体进行估计
例5假设关于某设备的使用年限x(年)和所支出的维修费用y(万元),有如表3所示的统计资料。
表3
若由资料可知,y对x呈线性相关关系,试求:
(1)线性回归直线方程。
(2)根据回归直线方程,估计使用年限为12年时,维修费用是多少?
解:(1)列表,如表4所示。
表4
(2)当x=12时14.84(万元),即估计使用年限为12年时,维修费用是14.84万元。
评析:对于具有线性相关关系的两个变量,才能求出线性回归方程,才能利用线性回归方程对变量进行估计和预测。若回归直线方程为,则的估计值为(注意计算的值不一定是真实值)。