APP下载

独立性检验的困难、对策与价值

2015-12-02朱源何小亚蔡倩

中学数学杂志(高中版) 2015年6期
关键词:假设检验独立性变量

朱源+何小亚+蔡倩

1 前言

近十年来,随着计算机科学的发展以及大数据时代的到来,算法、概率与统计等知识愈发受到基础教育的重视,而独立性检验作为一种重要的统计推断方法更是如此.在2003年中国颁布的《普通高中数学课程标准(实验)》中,独立性检验被安排在选修1-2和选修2-3,具体要求如下:“通过对典型案例的探究(如“肺癌与吸烟有关吗”等),了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.”[1]然而在独立性检验的实际教学中,学生的学习效果却不尽如人意.黄华胜关于学生对统计推断的理解研究发现,绝大部分学生不认可独立性检验和假设检验的说理方式,他们认为统计推断的结论存在运气成分,一次统计的结果不能说明问题[2].那么独立性检验究竟难在何处?有什么教学对策?又有什么教学价值?本文将分别进行探讨.

2 独立性检验难在何处

2.1 具体内容方面

2.1.1 数值变量与分类变量

数值变量是由测量或计数所得到的量,如温度、长度、速度等,其具有数值特征,也叫定量变量.分类变量则只有性质上的差异,具体分为有序变量和无序变量.有序变量即具有次序关系的变量,如将产品分为一等品、二等品和三等品;无序变量即不具有次序关系的变量,如性别(男、女)、人种(白人、黑人、黄种人)等.

学生过去在回归分析和函数的学习中,所遇到的变量都是数值变量,因此缺乏有关分类变量的认知经验.但现实生活中,分类变量是大量存在的,判断两个分类变量之间是否有关系,即独立性检验要解决的问题.如“吸烟与患肺癌是否有关系”的问题中,所涉及的两个分类变量分别是:是否吸烟(可取值“是”、“否”);是否患肺癌(可取值“是”、“否”),这两个分类变量的数据统计要用列联表的形式,而学生往往缺乏将两者视为变量的意识.

2.1.2 如何选择原假设H0

原假设H0是对所研究总体的一种假设,其目的应使后续所选的统计量在该假设之下,分布已知,进而通过实测样本,计算出统计量的值,并根据预先设定的显著性水平进行检验,做出拒绝或接受原假设的判断.例如在“吸烟与患肺癌是否有关系”的问题中,在“吸烟与患肺癌没有关系”的假设之下,统计量K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(当n充分大时)近似服从自由度为1的卡方分布.反之,若将“吸烟与患肺癌有关系”作为原假设,上述统计量的分布则未知,因而无法根据预先设定的显著性水平做出判断.这是独立性检验的一大教学难点,学生即使学完该节内容,往往还很困惑:根据数据,我们的直观判断明明是‘吸烟和患肺癌有关,为什么还要做出两者无关的假设呢?假设两者有关可行吗?

2.1.3 如何理解P(A)、P(B)的含义

《数学选修2-3》用A表示不吸烟,B表示不患肺癌[3].那么P(A)是指的是什么,学生容易将其理解为:生活中任意一个人不吸烟的可能性.事实上这是一种误解,因为针对具体的任意个体,其吸烟与否是确定事件,不吸烟概率要么为0,要么为1,随着时间的推移,个体可能从不吸烟状态转变为吸烟状态,这种转换概率则属于另一个概率空间.根据教材的意图,P(A)应是我们在日常生活中随意碰到一个不吸烟的人的概率,其精确值是吸烟人数与人口总数的比值.而根据统计数据,利用频率估计概率可得到其近似值,因此样本的容量不能太小.

2.1.4 如何理解随机变量K2

学生在对随机变量K2的理解上,第一个难点即如何区分K2、k与k0.K2是一个随机变量,随实测数据的变化而变化,根据实测数据可计算其观测值k,而k0是一个判断规则的临界值.

学生在对随机变量K2的理解上,第二个难点即这个统计量是如何构造出来的.实际上,K2即在原假设H0下,每个格子实际频数与理论频数差值平方除以理论频数的累加和:

K2=∑a,b,c,d(实际频数-理论频数)2理论频数=n(ad-bc)2(a+c)(b+d)(a+b)(c+d).

学生在对随机变量K2的理解上,第三个难点即为什么要选择这一统计量,而不是ad-bc.《数学选修2-3》[3]和《数学选修1-2》[4]的解释是:为了使不同样本容量的数据有统一的评判标准,但学生容易将其误解为:K2消除了样本容量的差异,则选择小样本和大样本对结果不会造成影响.对这句话的正确理解应是:与ad-bc相比,K2的优势在于无论样本容量怎么改变,K2将近似服从同一个分布,即自由度为1的卡方分布,而样本容量越大,近似程度越高.

2.1.5 如何理解“犯错误的概率不超过0.01”

为了避免使用显著水平的概念,旧版的人教版教材在解释独立性检验的结果时,为“把握”赋予了特定的含义[5]:在实际应用中,我们把k≥k0解释为有(1-PH0(K2≥k0))×100%的把握认为“两个分类变量之间有关系”;把k

但现有的不少教辅或试卷仍然采用老教材的解释方案,容易导致学生产生错误的理解.

2.1.6 能否构造其他统计量判断两个变量有关

答案是肯定的,只要该统计量的分布或近似分布已知即可.但为何几乎所有独立性检验都选择K2作为统计量,其优点是什么?对这个问题的解答至少应包括两个方面:①只要样本容量充分大,K2近似服从自由度为1的卡方分布,即是说K2提供了统一的评价标准;②如果一套统计规则已经成为解决某种问题的主流方法,那么在其他更优秀的替代规则出现前,研究者更倾向于选择现有的主流方法,既因为历史已证明该规则的有效性,也因为这是研究成果能在同行间进行交流的保证.

2.2 宏观认识方面

2.2.1 独立性检验的思想

独立性检验是考察两个变量是否独立的统计学方法,具体做法是:首先对两个变量的关系作假设(一般假设其独立),然后选取合适的统计量,根据实测样本计算出该统计量的观测值,最后根据预先设定的显著性水平进行检验,做出接受或拒绝原假设的判断.其本质即“小概率反证法”,是一种显著性假设检验.然而已有研究表明,绝大部分学生不认可独立性检验和假设检验的说理方式,他们认为统计推断的结论存在运气成分,一次统计的结果不能说明问题[2].

2.2.2 回归分析与独立性检验所研究的问题范畴

在统计学上,无论两个或多个的数值变量还是两个或多个的分类变量,都可以进行回归分析与独立性检验,并且这两种统计分析是相辅的:回归分析所得两变量的相关系数只是刻画了两者的相关程度,但判断其相关性是否显著则需要进行显著性检验.反之,独立性检验对两变量的相关性进行了显著性检验,但其相关关系是线性的还是非线性的、相关性有多强,则需要通过回归分析来解决.

囿于课程内容的统筹和学生的认知水平,在高中数学的统计案例一章中,回归分析只研究“两个具有相关关系的数值变量如何建立回归方程、它们的相关性多大”的问题,这两个数值变量要区分解释变量与预报变量,前者是确定的普通变量,后者是随机变量.而独立性检验只解决“两个分类变量之间是否相关,有多大把握做出判断”的问题,这两个分类变量都是随机变量,不分自变量与因变量.

3 困难的原因分析

3.1 数学证明的负迁移

Belle将证明进行了以下分类:①个人的经验;②权威的认可;③观察到的实例;④举不出反例;⑤结论的有效性;⑥数学的逻辑演绎推理[8].数学证明只是诸多证明方法中的一种,但学生所熟练的逻辑演绎推理的证明方式却容易对其他证明方法产生负迁移效应.这种效应在独立性检验的学习中突出表现为:从数学证明的角度(尤其是源于反证法的类比迁移)看待统计推断,不认可独立性检验的说理方式,认为既然小概率事件不是不可能事件,那么通过小概率事件的发生来拒绝原假设就有可能犯错,因此这种推断不可靠.除非在原假设之下,实测事件不可能发生,才能拒绝之.

3.2 认知图式中缺乏起固定作用的经验

奥苏贝尔的有意义学习理论提供有意义学习得以发生的三个先决条件,其中之一则是学习者认知结构中具备适当的观念.这一理论对解释学生学习独立性检验的认知困难具有重要意义,具体而言体现在以下两个方面:①学生在进行独立性检验的学习之前,缺乏运用“小概率反证法”的直观经验;②学生对独立性检验原理图式中所涉及的相关概念如分类变量、随机变量等的理解不够深刻、精确.

3.3 课标的界定不清楚

《普通高中数学课程标准(实验)》对独立性检验和假设检验的具体要求如下[1]:①通过对典型案例的探究(如“肺癌与吸烟有关吗”等),了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用;②通过对典型案例的探究(如“质量控制”“新药是否有效”等),了解实际推断原理和假设检验的基本思想、方法及初步应用.但独立性检验本质上就是假设检验,在课标中不应该将二者分开.参与人教版《数学选修1-2》和《数学选修2-3》编写工作的李勇教授,一方面承认:“独立性检验是一种特殊的假设检验”,另一方面又指出:“专家在审查教材时,认为‘假设检验的基本原理和‘聚类分析的基本思想不适应于高中的知识背景,建议删除这两方面的内容”[7],则未免有自相矛盾的嫌疑.

3.4 “考教悖论”

面对高考时,一线教师的态度是“考什么就教什么”,而命题专家的态度则是“教什么就考什么”,这一矛盾即所谓的“考教悖论”.一方面,由于课程标准对独立性检验的要求只是“了解”,因此高考很少考查或者只考查独立性检验的操作步骤;另一方面,高考的命题趋向又促使一线教师压缩独立性检验的教学时间,只教其操作步骤.

4 相关建议

4.1 课程标准的修正建议

将独立性检验视为一种特殊的假设检验,对中国、新加坡、美国、澳大利亚、芬兰的高中数学课程标准[9]~[13]中的假设检验内容进行对比,以期为中国后续新课标的制定提供有益建议.结果发现:

(1)新加坡非常重视统计知识,将H1、H2课程分为纯数学和统计两个部分.其中假设检验的内容非常全面(表1),并且H1与H2水平的要求体现了一定的差异性.

(2)美国高中数学课标的统计与概率部分有四项内容:①解释分类数据和度量数据;②做出推断与证明结论;③条件概率与概率规则;④利用概率做决策.每项内容之下还有若干具体的条目.虽然没有特别提出假设检验的概念和相关术语,但在“做出推断与证明结论”这一项中,共6个条目,其中2条(第2条和第5条)渗透了假设检验的思想:确定一个具体模型是否与给定数据产生过程的结果一致,例如一个模型认为抛一枚硬币正面朝上的概率是0.5,那么抛5次硬币全部反面朝上的结果会不会导致你怀疑上述模型;使用仿真推断两个参数是否存在显著差异.

(3)澳大利亚和芬兰的高中数学课程标准没有涉及独立性检验和假设检验的内容.

对比表明,五国对假设检验内容的重视程度有很大的差异.呈现这种差异的原因可理解为各国的数学理念和数学教育理念不同,但也从一个侧面反映了假设检验的原理和思想未必是高中生所必须具备的统计知识和统计观念.

反观中国高中数学课标,将独立性检验与假设检验的内容与聚类分析和回归分析一并归入统计案例一节,利用少数案例介绍这些原理及其初步应用,一方面占用了学生的课时,另一方面又浅尝辄止,使学生难以理解上述原理和其中的统计思想.为改变这一现状提出两点建议:一是参考新加坡,提高独立性检验和假设检验内容的要求层次,并为此分配更多的学时;二则是参考澳大利亚及芬兰,删掉独立性检验和假设检验的内容,使学生接受高等教育后再系统地学习这方面知识.另外,中、美两国的高中课标在处理假设检验的内容上具有一定的相似性,但两者的相异性则更为后续中国课标的制定提供有益启示.具体体现在以下两个方面:一、虽然同为渗透假设检验的思想,但美国课标没有限定具体课时和教学方式,为相应教材的编写和教学活动的开展保留了极大的自主性和灵活性.二、在具体要求的表述方面,美国课标更为清晰,因此具有较强的操作性.以上两点不仅针对假设检验的内容,对于中国高中课标中其他内容标准的制定亦有同样的启发意义.

4.2 教师教学的建议

4.2.1 明确教学目标

在独立性检验的实际教学中,有些教师受应试教育思想或相关专业知识所限,将本课的教学目标设定为:了解独立性检验的操作规则,会套用公式对两个分类变量的独立性做出判断.以这一教学目标指导教学,难免导致学生的上述认知障碍.为使学生达到更高层次的关系性理解,建议教师在本节内容的教学之前制定有效、可操作的教学目标,具体而言即根据授课对象的数学水平,确定其应突破上述认知障碍中的哪几条,分别应达到什么层次.

4.2.2 激活直观经验作为先行组织者

先行组织者是先于学习任务呈现的一种引导性材料,对当前学习的内容起到定向、引导的作用.在正式教学之前,可呈现一些与独立性检验有关的生活实例,以帮助学生积累或激活已有的“小概率反证法”的认知经验,进而将其与反证法做比较,作为学习独立性检验的先行组织者.如:①抛一枚硬币连续5次均正面朝上会不会让你怀疑其质地不均匀;②在转盘抽奖中,中奖与不中奖的区域各占一半,但连续5次指针都指向不中奖区域,你会不会怀疑其中有猫腻;③有一名陌生人给你发来邮件,预测了某只股票连续五天的涨跌情况,经过你一周的检验,确实吻合!一周后陌生人又发来邮件,表示可以继续为你提供预测信息,但需要收费,你愿意吗?

4.2.3 提供数学建模的机会

历史上,皮尔逊提出卡方检验的过程即根据实际问题建立统计模型进而解决问题的过程.而在实际教学中,让学生经历独立性检验的再创造过程,既能加深其对这一原理的理解,亦能培养其数据收集、整理、观察、分析与决策的能力.例如,选择“性别与喜欢数学是否有关”作为教学素材[14],现场收集数据、制作列联表、引导学生观察列联表判断两个变量是否有关、鼓励其提出理性的判断规则、选择其中几种较为典型的规则进行讨论、形成独立性检验的初步规则、教师补充部分知识完善规则.

5 教学价值

5.1 方法论层面

独立性检验是一种很重要的统计学方法,体现了假设检验的思想,在很多研究领域中均有广泛应用.该方法的教学贯彻了课程标准的总目标,即为学生适应现代社会的生产生活和进一步学习需要提供准备.

5.2 思维品质层面

学习独立性检验,最有价值、最精彩的就是要学习其思维方式,即小概率反证法——在一次试验中,若基于原假设的小概率事件发生了,则认为原假设不合理,推翻之.以上思维方式是很重要的统计素养,但我国的高中课标仅仅将其列为“了解”层次!鉴于独立性检验重要的思维训练价值与广泛应用,建议将相关目标提升到“理解”层次,并为具体教学提供更多课时.

5.3 情感领域目标的落实

三维目标包括知识与技能、过程与方法、情感态度价值观,然而在实际教学中,一线教师最容易忽视的就是情感态度价值观目标.具体原因有三:(1)情感态度价值观目标是课程目标,一些专家认为没必要在每节课的设计中撰写该目标;(2)课程标准缺少对情感态度价值观目标的内涵与外延的解读,导致一线教师无法具体践行;(3)教学任务重,在完成知识性和过程性目标之余,没有时间进行落实情感领域的目标.

独立性检验源于统计学家对生活直觉的总结和抽象化,其意义在于将变量间相关性的判断由直觉水平上升到科学水平.学生对独立性检验的深刻理解必将指引其体会原理中所蕴含的数理统计文化.

参考文献

[1]中华人民共和国教育部.普通高中数学课程标准(实验)[S].北京:人民教育出版社,2003.

[2]黄华胜.学生对统计推断的理解[D].上海:华东师范大学,2014.

[3]普通高中课程标准实验教科书.数学(选修2-3,A版)[M].北京:人民教育出版社,2009.

[4]普通高中课程标准实验教科书.数学(选修1-2,A版)[M].北京:人民教育出版社,2009.

[5]普通高中课程标准实验教科书.数学(选修2-3,A版)[M].北京:人民教育出版社,2006.

[6]何佐.独立性检验应注意的问题[J].数学通报,2008(7):19-25.

[7]李勇.关于高中教材中独立性检验知识呈现方式的思考[J].数学通报,2008(11):25-30.

[8]李士琦.PME:数学教育心理[M].上海:华东师范大学出版社,2001:129.

[9]Ministry of Education, Singapore.Mathematics Higher 1(syllabus8864)[PDF]. http://www.se-ab.gov.sg.

[10]Ministry of Education, Singapore. Mathematics Higher 2(syllabus9740)[PDF]. http://www.se-ab.gov.sg.

[11]NGA,CCSSO.Common Core State Standards for Mathematics[PDF]. http://www.corestandar-ds.org.

[12]ACARA.Senior Secondary Australian Curriculum:Mathematics [EB/OL]. http://www.australia-ncurriculum.edu.au/.Australian Curriculum.

[13]FNBE.National Core Curriculum for Upper Secondary Schools [EB/OL].http://www.oph.fi/do-wnload/47678_core_curricula_upper_secondary_education.

[14]余建国.独立性检验的教学和反思[J].中小学数学(中学版),2010(Z2):49-51.

猜你喜欢

假设检验独立性变量
独立品格培养
假设检验结果的对立性分析
统计推断的研究
做最好的自己
凤爪重量质量管理报告
基于改进隐马尔科夫模型的畜禽全基因组关联分析中的多重检验方法
分离变量法:常见的通性通法
不可忽视变量的离散与连续
关于事件独立性的两种判断
轻松把握变量之间的关系