作为数学教育研究数据处理的卡方分析法
2016-11-25筅华中师范大学数学与统计学学院刘晓燕徐章韬
筅华中师范大学数学与统计学学院 刘晓燕 徐章韬
作为数学教育研究数据处理的卡方分析法
筅华中师范大学数学与统计学学院刘晓燕徐章韬
一、引言
定量取向的实证教育、心理研究所处理的数据层次较低,大多是一些定类、定序变量,这些数据有时候也称作质性数据.数据处理的精要之一是依据变量的不同特点而选用不同的处理方法,否则不仅得不到有益的结论,还误导了人们的认识.在数学教育研究中,人们常常会遇到各种分类变量,分类变量的不同取值表示个体所属的不同类别.例如,性别变量,其取值为男和女,表示按性别划分,研究对象的群体可分为两类;又如,对于某一事物的态度,其取值可以为喜欢、不喜欢,表示按态度划分,研究对象的群体可分为两类.在实证取向的数学研究中,我们常常关心两个分类变量之间是否有关系,即两个因素变量之间是彼此相关还是相互独立.如,学生对数学的态度是否与性别有关是一个常见的教育问题,显然不能用个案来说明问题.男生中有喜欢数学的,也有不喜欢数学的;女生的情况亦然.于是,人们发展了针对分类变量的卡方分析法,以检验分类变量与分类变量之间是否存在相关关系.
二、多角度理解卡方分析法的原理
卡方分析法充分体现了比较分析法的精神,可以从多方面理解.
1.尊重生活经验,从频次看卡方
各种统计方法得到的结论或者其之所以合理,如果能得到经验层次的支持,就容易得到理解.两个人关系密切的话,其来往必定密切.老死不相往来,久不往来走动,亲戚也会成路人.统计分类变量的频次及其在全体中所占的比例,是研究分类变量之间是否存在关系的突破口.
例如,学生对数学的态度是否与性别有关,也就是这两个分类变量的独立性检验问题.性别变量x有男x1和女x2两种取值,态度变量y有喜欢y1和不喜欢y2两种取值,为了研究x是否与y有关,其关键在于寻找合适的统计量.我们设想一下,如果态度与性别无关,那么无论是喜欢数学的,还是不喜欢数学的,是分不出性别上的差异的.先把数据进行分类,得到按两个分类变量进行交叉分类的频数分配表,即2×2的列联表(见表1).
表1 性别与态度的2×2列联表
其中n+1=n11+n21,n+2=n12+n22,n1+=n11+n12,n2+=n21+n22,n=n11+ n21+n12+n22.
如果性别与态度无关,那么男生中喜欢数学的比例应该与女生中喜欢数学的比例差不多,即,化简得n11n22-n12n21≈0;换言之,如果性别与态度无关,那么男生中不喜欢数学的比例应该与女生中不喜欢数学的比例差不多,即化简得n11n22-n12n21≈0.因此|n11n22-n12n21|越小,说明性别与态度之间的关系越弱;|n11n22-n12n21|越大,说明性别与态度之间的关系越强.
2.理论思考,从概率看卡方
基于上述分析,为了使不同样本容量的数据有统一的评判标准,可以通过各个变量的频次及其在全体中所占的比例来构造一个随机变量对其进行检验.从独立性的角度进行分析,当性别x与态度y无关时,即事件x与事件y独立,这时有P(x1y1)=P(x1)P(y1),P(x1y2)=P(x1)P(y2),
P(x2y1)=P(x2)P(y1),P(x2y2)=P(x2)P(y2)成立.
因为事件的概率都可用相应的频率来估计,如P(x1),
P(y1)的估计值分别为的估计值为很接近,即的值应该很小.上述四个式子应同时成立,左右两端估计值之差应很接近,故也应该比较小,上式化简得到χ2=,这就是卡方统计量的表达式.[1]
从这个统计量可以看出,|n11n22-n12n21|越小,χ2越小,即性别与态度之间关系越弱,|n11n22-n12n21|越大,χ2越大,即性别与态度之间关系越强,符合最初的分析.最后将χ2值与研究所得的临界值进行比较,进而得出性别对于数学态度是否有影响.上述是二分变量与二分变量间的独立性检验问题,并得到相应的2×2列联表的χ2值计算公式.
还可以从另一个角度进行分析.不妨把表中的数据看作理论频次,那么就有进行一下数学处理有,这个式子表明,如果变量间是相对独立的,那么变量的条件分布和边缘分布是相同的.这时可以得到.对下一行也可以进行同样的分析,得到类似的式子.当分类变量x可以分作c类,分别为x1,x2,…,xc;分类变量y可以分为r类,分别为y1,y2,…,yr.为了研究x分类是否与y分类有关,对r×c列联表用上述原理和方法可以得到通)表示.变形得到.所以如果列联表中的变量是独立的,则pij=pi*p*j.这样为什么要研究条件就看得很清楚了.
由于pi*和p*j是对于总体而言,一般都是未知的,可以利用样本数据对其进行估计,得到.若变量间是相互独立的,则pij与很接近,也就是说npij与很接近.令Eij=npij表示表中各个变量的期望频次,那么实际的频次nij与期望频次的值Eij很接近,这时我们构造统计量x2=(分子取平方是为了取其绝对差值,分母Eij是为了平衡Eij数值本身的大小).[2]实际频次与期望频次之间的差值越小,说明分类变量越接近独立,这是构建χ2统计量基本想法.把χ2值与临界值比较,就能得到两个分类变量究竟是彼此相关,还是相互独立.
很明显,2×2列联表是r×c列联表的特例,那么它们通过分析得出的χ2统计量是否一致呢?在r×c列联表中,令r=2,c=2时,根据前面的分析,可分别得到E11,E12,E21, E22的值,将其代入χ2=统计量中,也能得到特例公式
各种检验的精髓在于构造统计量.这种构造统计量的方法从理论分析入手,重视局部信息与整体信息之间的关系,同时又兼顾了经验直观.
卡方分析法的精致之处还在于基于小概率事件,运用比较法确定何为大,何为小.指定一个临界值k0,如果卡方的值大于这个值,就谓之为大,两个变量之间有关系;反之,则谓之为小,两个变量之间没有关系.细细品味起来,这有点极限定义中“ε-σ”语言的味道.“ε-σ”语言中,ε、σ辨证相依才能说明问题.然而,这种大小依据的制定合不合理,要根据小概率原理来确定.在卡方分析中,把“两个分类变量没有关系”错误地判断为“两个分类变量有关系”,这是一个不能容许事件,应该是一个小概率事件.确定这个事件发生概率的上界,然后确定相应的临界值.概率上界不同,相应的临界值也不一样,两者之间是一种依存关系.
三、卡方的应用
从上面的分析中可以看到,卡方分析法是判断两个分类变量之间是否相互独立的非常有效的方法.它尊重了生活经验,同时也得到了理论分析的支持.卡方分析法的思路非常精致,不同于在方差分析中通过对真实值与测量值之间的误差进行分析,得到分类变量与定距变量之间的相关性.[3]在卡方分析中,要判断两个变量是否独立,不妨先假设这两个变量独立,进行理论上的分析,得到一系列理论值.然后,以这些理论值为参照点,看实际值与理论值的绝对差距占理论值比例如何,从直观而言,如果两者很接近,在一定的条件下,就可以认为两者没有差别,即两个变量是相互独立的.这也符合物理测量经验.测量一个物体的长度,测量值T1和理论值T之间总会产生误差e,故有T1=T+e,如果测量是有效的,应有E(T1)=E(T),σ(T)=σ(T1),而且的值也不应太大.这也正是正态分布所要揭示的道理之一.事实上,正态分布可以看作是卡方分布的叠加.这样教材中关于分布的两块内容之间的内在关联性就找到了.
除了进行独立性检验之外,卡方分析法还可以根据样本数据对未知总体与某一假设或理论进行拟合度检验,即推断总体的分布.如,实际分布与正态分布的拟合度检验是检验来自总体的样本是否服从正态分布,或者说两者是否存在显著差异.如要判断某次考试学生的成绩是否符合正态分布,就可用卡方检验.首先假设数学成绩服从正态分布,并求出各组的理论频次,代入公式确定自由度和显著性水平后进行查表,得出的值与χ2值进行比较,从而接受或拒绝原假设,判断学生的考试成绩的频数分布是否属于正态分布,从而得出一些教学上的建议和思考.
卡方检验法对数据的要求不高,能够对定类或定序的变量进行假设检验;定比或定距数据如果视作定类数据,也可应用卡方检验法,所以卡方检验法在教育研究中的应用比其他检验法更为广泛.因此,要充分利用卡方检验法对教育研究中的数据进行合理的分析.
1.中学数学教材实验研究组.普通高中课程标准实验教科书数学(选修1-2)[M].北京:人民教育出版社,2007.
2.卢淑华.社会统计学[M].北京:北京大学出版社,2009.
3.徐章韬,赵弘.作为数学教育研究数据处理的方差[J].中学数学(上),2016(2).Z