如何正确运用Z检验——总体方差已知时两算术均值比较一般差异性Z检验及SAS实现
2020-11-26胡良平
胡良平
(1.军事科学院研究生院,北京 100850;2.世界中医药学会联合会临床科研统计学专业委员会,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
当研究者收集到单组设计或成组设计一元定量资料时,若分析目的是对定量的效应指标(通常为均值)进行一般差异性检验,此时,人们依据定量资料所满足的前提条件,拟从以下几种假设检验方法中选择一个最合适的,即“Z检验”“t检验”或“秩和检验”。本文将重点阐述选择“Z检验”的要领和用SAS实现计算的方法。
1 选用Z检验的前提条件
1.1 单组设计一元定量资料及选用Z检验的前提条件
【例1】文献[1]的目的是探讨新冠肺炎疫情期间封闭管理精神科医护人员焦虑抑郁症状及相关因素,为改善其心理健康状况提供参考。通过问卷调查的方式收集了包括“性别、年龄、职业、受教育程度”等12个变量(即项目)及其取值,涉及到两个量表,分别为“广泛性焦虑量表(简称GAD-7)”和“患者健康问卷抑郁量表(简称PHQ-9)”。共发放问卷124份,回收有效问卷121份。现假定全部121例受试者的PHQ-9评分的样本均值=5.12,该定量指标总体方差σ2=22;进一步假定PHQ-9评分的总体均值μ0=5.10。
针对评价指标“PHQ-9”,设文献[1]中样本(指n=121例受试者的PHQ-9测定值)所抽自的总体均值为μ(未知),试回答下列3个问题。
问题1:μ是否小于或等于μ0?
问题2:μ是否大于或等于μ0?
问题3:μ是否等于μ0?
以上3个问题可以采用统计学上“零假设”与“备择假设”严格地呈现出来:
式(1)叫做上(或右)单侧检验,式(2)叫做下(或左)单侧检验,而式(3)叫做双侧检验。这里的“名词概念(指上、下、双侧检验)”是基于“备择假设”而得出的。
解决上述3个问题都可采用Z检验,其检验统计量完全相同,但拒绝域(概念详见后文)是不同的;使用Z检验的前提条件:样本所抽自的总体为正态分布(但总体均值μ是未知的),总体方差为已知的常数(例如在题干中已假定σ2=22);同时,还需要给定待检验的总体均值(例如在题干中已假定μ0=5.10)。
1.2 成组设计一元定量资料及选用Z检验的前提条件
【例2】假定文献[1]中全部121例受试者中“行为类型”为“B型和中间型”的PHQ-9评分的样本均值±s1=4.41,n1=98;“A型”的PHQ-9评分的样本均值±s2=8.18,n2=23。进一步假定:该定量指标在两个总体中的方差分别为。
针对评价指标“PHQ-9”,设文献[1]中两组样本分别为:
第1组样本(指n=98例“B型和中间型”受试者的PHQ-9评分)所抽自的总体均值μ1;第2组样本(指n=23例“A型”受试者的PHQ-9评分)所抽自的总体均值μ2。
试回答下列3个问题:
问题4:μ1是否小于或等于μ2?
问题5:μ1是否大于或等于μ2?
问题6:μ1是否等于μ2?
以上3个问题可以采用统计学上“零假设”与“备择假设”严格地呈现出来:
式(4)叫做上(或右)单侧检验,式(5)叫做下(或左)单侧检验,而式(6)叫做双侧检验。这里的“名词概念(指上、下、双侧检验)”是基于“备择假设”而得出的。
解决上述3个问题都可以采用Z检验,其检验统计量是完全相同的,但拒绝域(概念详见后文)是不同的;使用Z检验的前提条件:各样本均抽自正态分布总体(但各总体均值μ1、μ2都是未知的),各总体方差均为已知的常数(例如,在题干中已假定两个总体的方差分别为)。
2 单组设计一元定量资料Z检验及SAS实现
2.1 Z检验统计量
对服从正态分布的单组设计一元定量资料进行均值比较,若已知总体方差并给定定量评价指标的标准值(即理论均值μ0)时,其对应的检验统计量见下式:
式(7)中的Z~N(0,1)。
2.2 拒绝域
依据随机变量的概率分布(本文指“标准正态分布”),在其横坐标轴上确定一个范围或区间,当检验统计量所代表的随机变量(本文指“Z”)的取值落入该区间内时,就有充足的理由(以一个较大的概率值来说话,单、双侧检验时均为“1-α”,其中,“α”为事先设定的检验水平)拒绝H0,从而接受H1。在统计学上,就称该区间为与特定检验假设对应的“拒绝域”。
与式(1)对应的拒绝域W见下式[2]:
与式(2)对应的拒绝域W见下式:
与式(3)对应的拒绝域W见下式:
【说明】在上面的三个式子中,不等号之后的内容均为标准正态分布横坐标轴上的“分位数”,其位置在标准正态分布曲线下左侧尾端概率分别为“1-α”、“α”和“1-α/2”的横坐标轴上。
2.3 例1的SAS实现
SAS程序如下:
【程序说明】“%let”定义“宏变量”,用户可根据资料的实际情况修改宏变量的取值;“&”后接宏变量名,表示引用宏变量;“absz”代表 z的绝对值;“za、z1_a、z1_ha”都是标准正态分布横坐标轴上的分位数(对应于标准正态分布曲线下左侧的概率分别为α、1-α、1-α/2);“α”为事先给定的显著性水平;PU、PL和PT分别代表上单侧、下单侧和双侧检验的概率。
输出结果的第1部分[回答上述式(1)所提出的问题]是“上单侧检验的结果”。上单侧检验结果的判定:若 z>z1_a,则接受(H1:μ>μ0);否则,就接受(H0:μ≤μ0);PU为上单侧概率。因检验统计量z=0.046904<1.64485,故只能接受“H0:μ≤μ0”,即认为样本所抽自的总体均值μ小于等于给定的均值μ0=5.10(P=0.48129>0.05)。
输出结果的第2部分[回答上述式(2)所提出的问题]是“下单侧检验的结果”。下单侧检验结果的判定:若 z<za,则接受(H1:μ<μ0);否则,就接受(H0:μ≥μ0);PL为下单侧概率。因检验统计量z=0.046904>-1.64485,故只能接受“H0:μ≥μ0”,即认为样本所抽自的总体均值μ大于等于给定的均值μ0=5.10(P=0.51871>0.05)。
输出结果的第3部分[回答上述式(3)所提出的问题]是“双侧检验的结果”。双侧检验结果的判定:若|z|>z1_ha,则接受(H1:μ≠μ0);否则,就接受(H0:μ=μ0);PT为双侧概率。因检验统计量|z|=0.046904<1.95996,故只能接受“H0:μ=μ0”,即认为样本所抽自的总体均值μ等于给定的均值μ0=5.10(P=0.96259>0.05)。
3 成组设计一元定量资料Z检验及SAS实现
3.1 Z检验统计量
对服从正态分布的成组设计一元定量资料进行均值比较,若已知两总体方差时,其对应的检验统计量见下式:
式(11)中的Z~N(0,1)。
3.2 拒绝域
与式(4)对应的拒绝域W见下式[2]:
与式(5)对应的拒绝域W见下式:
与式(6)对应的拒绝域W见下式:
3.3 例2的SAS实现
SAS程序如下:
【程序说明】显著性水平alpha=0.01,其他同“例1中的SAS程序说明”,从略。
输出结果的第1部分[回答上述式(4)所提出的问题]是“上单侧检验的结果”。上单侧检验结果的判定:若 z>z1_a,则接受(H1:μ1>μ2);否则,就接受(H0:μ1≤μ2);PU为上单侧概率。因检验统计量z=-5.24819<2.32635,故只能接受“H0:μ1≤μ2”,即认为受试者中“行为类型”为“B型和中间型”的PHQ-9评分的总体均值小于或等于“A型”的PHQ-9评分的总体均值(P=1>0.05)。
输出结果的第2部分[回答上述式(5)所提出的问题]是“下单侧检验的结果”。下单侧检验结果的判定:若 z<za,则接受(H1:μ1<μ2);否则,就接受(H0:μ1≥μ2);PL 为下单侧概率。因检验统计量z=-5.24819<-2.32635,故拒绝“H0:μ1≥μ2”,接受“H1:μ1<μ2”,即认为受试者中“行为类型”为“B型和中间型”的PHQ-9评分的总体均值小于“A型”的PHQ-9评分的总体均值(P=7.6799E-8<0.01)。
输出结果的第3部分[回答上述式(6)所提出的问题]是“双侧检验的结果”。双侧检验结果的判定:若|z|>z1_ha,则接受(H1:μ1≠μ2);否则,就接受(H0:μ1=μ2);PT为双侧概率。因检验统计量|z|=5.24819>2.57583,故拒绝“H0:μ1=μ2”,接受“H1:μ1≠μ2”,即认为受试者中“行为类型”为“B型和中间型”的PHQ-9评分的总体均值不等于“A型”的PHQ-9评分的总体均值。再结合实际数据,可得出结论:前者均值小于后者均值(P=0.000000154<0.01)。
4 讨论与小结
4.1 讨论
在解决实际问题时,一般对同一个问题只需要实施上述三个检验(指“上单侧”“下单侧”和“双侧”检验)中的某一个,而不是三个都同时要实施。一般来说,仅在已知总体服从正态分布且总体方差已知的条件下,均值比较才适合选用“Z检验”,否则,应根据具体情况,选择“t检验”或“秩和检验”[3]。
通常情况下,进行一般差异性检验时都采取“双侧检验”,因为双侧检验比单侧检验保守一些。而仅在有“专业知识为依据的场合下”,才可以采取“单侧检验”。例如,若在临床上可以认为“某两种药合用的效果”肯定比“单用其中一种药的效果”好,进行一般差异性检验时,可以考虑选用“单侧检验”(若拟进行非劣效性检验或优效性检验,其本身就要求进行单侧检验)。在选择采取“上单侧检验”还是“下单侧检验”时,需结合具体问题以及将何者视为第1组,在此基础上,再结合“备择假设”来确定“具体方向(指‘上’还是‘下’单侧检验)”。实际问题提示的方向应与“备择假设的方向”一致。例如,在本文例2中,若有理由进行单侧检验,则宜选用“下单侧检验”。
4.2 小结
本文结合两个实例,介绍了单组设计和成组设计条件下一元定量资料一般差异性Z检验及SAS实现。对常规的“双侧检验”及两种“单侧检验”都进行了介绍,以期为实际工作者合理选择假设检验方法开阔了思路、提供更多的备选方案。虽然本文所介绍的方法计算量并不大,但不便于直接采用国际通用的统计软件(SAS、SPSS、R等)[4-7]来实现。