APP下载

基于内部预试验的样本量重估计在成组序贯设计中的应用研究*

2021-01-09南方医科大学公共卫生学院生物统计学系510515吴海燕刘伟杰傅利强谭旭辉

中国卫生统计 2020年6期
关键词:成组重估估计值

南方医科大学公共卫生学院生物统计学系(510515) 吴海燕 刘伟杰 傅利强 谭旭辉

【提 要】 目的 使用内部预试验解决成组序贯设计中方差未知时样本量估计的问题,同时得出内部预试验适宜的样本量。方法 以两样本均数比较的优效性检验为分析目的,利用损耗函数法在拒绝型成组序贯设计下,通过设定不同的内部预试验样本量、方差真实值和方差估计值,计算方差重估法的Ι类错误、功效Power和平均样本量。结果 方差估计正确时,方差重估法能控制Ι类错误,功效和平均样本量随着内部预试验样本量n0的增加而增加,当n0≥20时能获得较好的功效和适宜的平均样本量;方差估计错误时,方差重估法同样能控制Ι类错误且不会出现传统成组序贯设计中功效过高或过低的情况,当标准差估计值s为10,标准差真实值σ分别为6、8、12和14时,该方法的功效分别为0.895、0.886、0.887和0.887。结论 方差重估法能有效解决成组序贯设计中方差未知的问题,避免了方差错误估计时导致的功效异常。

在临床试验中,成组序贯设计(group sequential design)由于能够有效降低试验所需样本量和提前结束试验而成为了较好的设计选择[1]。损耗函数法(error spending function method)[2]是成组序贯设计中一种常用的方法。为了使试验能够以一定的功效发现处理组间的差异,试验设计阶段必须合理估计所需的样本量,但在试验设计之初用于估计样本量的方差往往是未知的,其估计值通常来源于以往的经验和文献回顾。如果设计方差估计过大,会造成资源的浪费;反之,会导致功效不足。Wittes&Brittain[3]针对这一问题提出利用内部预试验(internal pilot studies,IPS)来重新估计方差。其中,重新估计方差可在盲态和揭盲状态下进行,为保证试验的完整性,一般在盲态下进行。故本文在大样本成组序贯设计的条件下,利用内部预试验在盲态条件下对设计方差进行重估,比较基于内部预试验的方差重估法和传统成组序贯设计的优劣,为该方法在成组序贯设计中的应用提供理论参考。

方法与原理

1.成组序贯设计

成组序贯设计能在试验过程中对已经累积的数据进行多次期中分析。由于期中分析[4]为试验提供了提前终止的可能,成组序贯设计可以显著减少试验样本量,缩短试验周期。从设计角度来看,成组序贯设计将试验划分成K个连续的阶段,每个阶段内都有新的受试者加入。当第k个阶段(k=1,2,…,K)结束后,把之前所有阶段的试验结果累积起来进行一次统计分析。对于拒绝型的成组序贯设计,如果拒绝H0则试验结束,否则继续下一阶段试验。在最后的试验阶段,其结果只能是接受H0或拒绝H0[5]。

损耗函数法是成组序贯设计临界值计算的一种方法,每阶段损耗的I类错误为αk,总I类错误α=α1+…+αK,具体损耗过程如下[6]:

α1=f(I1/IK)

(1)

αk=f(Ik/IK)-f(Ik-1/IK),k=2,…,K

(2)

每阶段分析的临界值ck满足以下条件:

Pr{Z1≥c1}=α1

(3)

Pr{Z1

(4)

其中Ik为第k阶段累积信息量,f(t)=min(αt3,α)为选定的损耗函数,Zk为第k次期中分析的检验统计量。

2.基于内部预试验的成组序贯设计

在功效一定的情况下估计样本量,往往需要知道一些未知参数的估计值,例如方差或事件率,而这些参数在试验设计阶段通常是无法准确获得的。解决这类问题的常用办法是在主要试验开始之前进行初步的预试验研究[6]。Wittes&Brittain[3]在其研究中利用内部预试验估计方差并重新估计试验所需的样本量。该方法允许利用首批进入试验的部分受试者信息对相关未知参数进行估计。相关研究表明,该方法可以解决试验设计中方差估计不准所导致的样本量偏差[7-10]。

现以两均数比较的优效性成组序贯设计为例,利用内部预试验对方差进行重新估计。在研究设计开始时,方差σ2的估计值大多数源于以往的经验或文献,假定其估计值为s2,在单侧检验水准为α、两均数之差为δ和总阶段数为K的情况下,为使功效达到1-β,试验所需总样本量由公式(5)算出。

n=R(K,α,β)nf(α,β,δ,s2)

(5)

(6)

其中,nf(α,β,δ,s2)={Φ-1(1-α)+Φ-1(1-β)}22s2/δ2

τ={Φ-1(1-α)+Φ-1(1-β)}22R(K,α,β)/δ2,R(K,α,β)是根据K,α,β确定的常数,其取值要满足检验所需的功效。

(7)

(8)

(9)

在大样本条件下,本文通过随机模拟研究,对拒绝型损耗函数法成组序贯设计条件下方差重估法的实际效果进行评估,并对内部预试验的样本量进行探讨。在此基础上,对方差重估法和传统成组序贯设计的优劣性进行比较。

模拟比较

本文以两样本均数比较的成组序贯为设计框架,采用SAS 9.4随机产生模拟研究的数据。本模拟过程分为两个部分,设计框架均为优效性假设检验H0:θ≤0,H1:θ>0(δ=2),单侧α=0.05,β=0.1(即Power=0.9),成组序贯设计方法为损耗函数法,其中损耗函数为f(t)=min(αt3,α),阶段数K=5,模拟次数为2000次;δ为效应差值,试验组均值Mt=5或7,对照组均值Mc=5,σ为标准差真实值,s为标准差估计值,每阶段每组样本量m=30、50或100,内部预试验样本量n0设定为20或根据内部预试验样本比例ρ计算,其中ρ=0.25,0.5,0.75。对于非劣效性假设检验H0:θ≤-Δ,H1:θ>-Δ(Δ为非劣效界值),当非劣效界值为0时,本文所设定的统计优效性假设检验实际上等价于非劣效性假设检验。

1.模拟比较一

在方差估计正确的条件下(即σ=s,其中σ为标准差真实值,s为标准差估计值),用不同的标准差σ、内部预试验样本量n0计算方差重估法的I类错误、功效(power)和平均样本量(average sample number,ASN)等指标,得出适宜的内部预试验样本量n0。具体参数设置如表1所示:

表1 参数设定(模拟一)

2.模拟比较二

在方差估计错误的情况下(即σ≠s),使用传统的成组序贯设计能控制住总体Ι类错误,但功效不能保持。当设计方差(即总体方差估计值)偏离总体方差真实值时,功效通常会出现低估或高估的情况。因此本研究采用方差重估法解决这一难点问题。根据模拟比较一的结果,我们在内部预试验样本量n0=20的情况下计算方差重估法的总体Ι类错误、功效和平均样本量等指标,评价该方法的优劣。具体参数设置如表2所示:

表2 参数设定(模拟二)

结 果

1.模拟比较一

在方差估计正确的情况下,按照表1的参数设置进行模拟研究,方差重估法的Ι类错误、功效(power)和平均样本量(ASN)如表3所示。由表3的模拟结果可以看出,方差重估法可以较好地将Ι类错误控制在0.05左右。在大样本条件下,总样本量和内部预试验样本量的变化对Ι类错误影响不大。阴性研究的平均样本量随着内部预试验样本量的增加轻微增加。

在阳性研究条件下,功效受内部预试验样本量的影响较大,内部预试验的样本量越大,功效越高。当σ=5.8且n0=8和σ=7.5且n0=13时,功效分别为0.875和0.878。由此可见,当内部预试验样本量较小时,功效偏低。阳性研究的平均样本量也随内部预试验样本量的增加而略微增加。在大样本成组序贯设计条件下,内部预试验样本量在20以上时,功效均能较好的维持在0.9左右。

2.模拟比较二

在方差估计错误的情况下,按照表2的参数设置进行模拟研究,方差重估法的Ι类错误、功效(power)和平均样本量(ASN)如表4所示。由表4的模拟结果可以看出,当内部预试验样本量为20时,在方差估错的情况下,方差重估法与传统的成组序贯设计一样能较好地控制Ι类错误在0.05左右。

表3 方差估对时Ι类错误、功效(power)和平均样本量(ASN)

就功效和平均样本量来看,方差重估法能较好地维持住功效和获得适宜的平均样本量。当方差真实值小于方差估计值时,传统成组序贯设计的功效均明显高于设定功效0.9,而方差重估法的功效均能控制在0.9左右,其平均样本量明显低于传统成组序贯设计;当方差真实值大于方差估计值时,传统成组序贯设计的功效明显低于设定功效0.9,而方差重估法的功效依旧能较好维持功效在0.9左右,其平均样本量相较于传统成组序贯设计有明显的提高。

表4 方差估错时Ι类错误、功效(power)和平均样本量(ASN)

讨 论

当方差估计错误时使用传统的成组序贯设计会导致功效得不到保证,当方差真实值小于方差估计值时会导致功效过高,造成样本量不必要的浪费;当方差真实值大于方差估计值时会导致功效过低,说明试验的样本量不足。通过模拟研究二我们发现方差重估法能较好的解决这个问题。从实际效果来看,当方差真实值小于方差估计值时,方差重估法能降低过高的功效,避免样本量的浪费。在使用内部预试验重估样本量的过程中,会存在重估样本量低于设计样本量的情况。而在实际临床试验的过程中,减少试验样本量有时是很难被人接受的。按照Wittes[3]和Birkett[9]的观点,当出现重估样本量低于设计样本量的时候,应继续使用原来设计时样本量,从而使得样本量在试验过程中只增不减。如果在方差重估法中使用这种样本量“只增不减”的策略,此时基于内部预试验的方差重估法必然也会导致功效过高和样本量增加的情形。因此,在试验过程中如要降低样本量并维持住功效,那么基于内部预试验所得的方差估计值必须足够精确和可信。这就需要内部预试验的样本比例ρ不能太低,我们认为内部预试验样本比例ρ在75%以上时,基于内部预试验的方差估计值是可信的。当方差真实值大于方差估计值时,该方法能提高功效,避免功效过低。在此过程中,方法重估法一般情况下并不会出现重估样本量低于设计样本量,即减少样本量的情况。

在临床试验中可能会存在早期试验数据不稳定的情况,这种不稳定会导致方差重估法估计方差时出现偏差,从而对样本量的重估计产生较大的影响。因此,针对早期数据不稳定的情形,可通过适当的增加内部预试验的样本量来减少估计偏差(例如ρ增大到75%)。另外,在每次期中分析后,利用已有的数据进行方差重估,并重新计算下一阶段的样本量,也可有效解决早期数据不稳定导致的样本量错估问题。由于此方法属于适应性设计,不属于经典成组序贯设计范畴,故本文不做讨论。

综上所述,在大样本成组序贯试验中,当设计方差大于真实方差时,对于重估样本量小于设计样本量的情况需慎重处理,尤其是要考虑内部预试验样本量和早期不稳定的试验数据对方差估计值的影响。当设计方差低于真实方差且早期试验数据较稳定时,可采用基于内部预试验的方差重估法对样本量进行重估计,从而避免因为设计方差的错误估计导致试验设计功效的异常。

猜你喜欢

成组重估估计值
2022年7月世界直接还原铁产量表
网络化时代的“经典重估”:评《经典重估与西方文学研究方法创新》
全球化背景下中国传统文化的价值重估与发展研究
文房雅士
一道样本的数字特征与频率分布直方图的交汇问题
浅谈既有线成组更换道岔
基于FirmSys平台的核电厂成组控制研究及应用
如何快速判读指针式压力表
大国崛起语境下国产电影中的中国梦表达
我国居民消费率的重新估算