两个数字特征的教学探讨
2020-03-13张聪孙莉敏
张聪 孙莉敏
【摘要】本文从样本出发,通过绘制散点图的方式,对样本峰度和样本协方差的统计意义进行讨论,最终达到理解总体峰度和协方差的目的.
【关键词】峰度;相关系数;Matlab;教学探讨
【 基金项目】河南省教师教育课程改革研究项目2017-JSJYZD-068;信阳学院校级教育教学改革项目2018ZJG02.
数学定义是深入学习数学理论的基础,对进一步理解数学概念的内涵和外延,形成严密的数学思维,扎实推理能力起着关键作用.峰度和协方差是概率论中两个重要的数字特征,在医学影像、信号处理、金融工程中有广泛应用.如果学生没有对定义本身深刻的认识,何谈应用概率思想和统计手段解决实际问题.
现有的概率统计教材中,借助矩来定义方差和偏度,有效刻画了“波动”和“偏离”的含义,使其定义清晰易懂.但对峰度和协方差,为什么借助于二阶混合中心距和四阶中心矩来定义,这是教学过程中的一个盲点,且几乎没有教材展开相关的讨论.课堂教学如果仅仅在给出公式后提供两个例子计算了事,显然达不到良好的教学效果.
本文计划从一组样本出发,借助数学软件,讨论样本的峰度、协方差,直观展示上述数字特征的统计意义,进而帮助学生理解总体数字特征的含义.
一、峰度的含义
随机变量(总体)X峰度的定义为
K=E(X-E(X))4[E(X-E(X))2]2-3.
设x1,x2,…,xn是来自总体X的样本,若记x=1n∑ni=1xi,v4n=1n∑ni=1(xi-x)4,v2n=1n∑ni=1(xi-x)2,
则样本峰度可以定义为
kn=v4n(v2n)2-3=n∑ni=1(xi-x)4∑ni=1(xi-x)22-3.
若将X的观测值从小到大排列后得到
x1=-0.5,x2=-0.4,x3=-0.3,x4=-0.2,x5=-0.1,x6=0.1,x7=0.2,x8=0.3,x9=0.4,x10=0.5,
绘制散点图1-1.
为讨论方便,这里添加的数据x11=-1,x12=1关于原始样本的均值0对称,绘制图1-2.对比图1-1和图1-2可知,所添加的数据x11,x12,明显偏离了原始数据这个“群”,数据添加后,样本数据的离群程度从k10=-1.3818变大到k12=-0.2581.进一步,在均值附近添加x13=-005,x14=0.05后,x11,x12相对x1,x2,…,x14这个数据“群”的偏离程度更大且样本峰度从k12=-0.2581增大到k14=0.1886.在此基础上,继续添加x15=-0.01,x16=001后,x11,x12相对x1,x2,…,x16这个数据“群”的偏离程度再次加大且样本峰度从k14=0.1886增大到k16=0.6436.
从上述演变过程,学生可以清晰地观察样本数据对样本峰度的影响——在均值附近x13,x14或无穷远(为作图方便,我们取了离群较远的孤立数据x11,x12)处添加数据,可以增加样本峰度.注意到,我们所添加的数据x11,…,x16是带有随机性的,图1-3和圖1-4表明总体X在0的附近取值的可能性较大(尖峰情形);图1-2表明总体在无穷处也有取值可能(重尾情形).样本峰度kn作为总体峰度K的近似,学生就很容易通过直观观察,理解总体峰度K是刻画峰值位置尖峭性和尾部粗细程度的一个特征数.
二、相关系数的含义
随机变量(X,Y)的协方差通常定义为
Cov(X,Y)=E(X-EX)(Y-EY).
设(xi,yi),i=1,2,…,n是来自(X,Y)的一组样本,若记x=1n∑ni=1xi,y=1n∑ni=1yi,则样本协方差为
cn=1n∑ni=1(xi-x)(yi-y).
若将(X,Y)视为二维平面上的随机点对,考虑如下一组数据(0.2,2.2),(0.6,2.6),(0.9,3.8),(1.5,4),(1.8,5.5),(2.2,6.3),(2.9,7.6),(3.1,7.3),(3.8,8.9),(39,9.1),(4.2,10),(5,11.1),且x≈2.51,y≈6.53.
绘制散点图2,利用x和y将平面分为四个区域,不妨记为Ⅰ,Ⅱ,Ⅲ,Ⅳ.容易发现,绝大部分数据落在了Ⅰ,Ⅲ两个区域,此时(xi-x)>0,(yi-y)>0,cn=4095.这表明,cn>0时,X取值增大的同时,Y的趋势有增大的趋势,即X与Y正相关.类似地,可以给学生展示大部分数据落入Ⅱ,Ⅳ区域时,cn<0,X与Y负相关.由此,我们发现协方差是刻画两个随机变量关联程度的一个量.
三、结 论
我们以峰度和协方差为例,探讨了如何应用数学软件直观展示抽象定义的含义和本质.学生不再需要死记硬背抽象的定义式,研究内容一目了然.教学过程中,体现了学生的主体作用,充分调动学生的积极性,在观察发现随机变量的统计规律的同时,深刻理解了定义本身,课堂内容也更形象生动.
【参考文献】
[1]张微.对数学定义教学的一点思考[J].现代教育科学.2012(12):152-153.
[2]张萍.均值-方差-峰度资产组合优化模型[J].科学技术与工程.2008(1):16-20.