APP下载

“功效和样本量”在验证中的应用

2021-08-11王阳马少华张晓红

上海医药 2021年11期

王阳 马少华 张晓红

摘 要 通过在验证中使用“功效和样本量”统计工具,确定更具有统计学意义的取样数量,以避免由于取样量不足导致的“第二类错误”。可用事先设计及事后评价两种思路来使用该工具。事先设计:设定功效,求样本量,根据所得样本量设计取样方案。事后评价:已有样本,求功效,根据所得功效是否足够来判断方案是否合理。

关键词 功效和样本量 验证方案设计 取样合理性

中图分类号:R951 文献标志码:C 文章编号:1006-1533(2021)11-0075-03

Application of “power and sample size” in validation

WANG Yang*, MA Shaohua, ZHANG Xiaohong

(Shanghai Shyndec Pharmaceutical Co., Ltd., Shanghai 200040, China)

ABSTRACT To determine the more statistically significant number of samples using the “power and sample size”statistical tool in validation so as to avoid a type Ⅱ error caused by insufficient sample quantity. This tool can be used in two ways which are pre-design and post evaluation. Pre-design is to set the power, calculate the sample size and design the sampling scheme according to the sample size. Post evaluation is to calculate the power according to the existing samples and judge whether the scheme is reasonable based on whether the obtained effect is enough.

KEy WORDS power and sample size; verification scheme design; sampling rationality

在药品生产质量管理过程中,“验证”或“确认”是不可避免的重要环节,尤其是在工艺验证或性能确认时,常常会通过对产品的抽样检验来证明工艺适用性或性能可靠性。然而,在设计取样方案时,起草人经常会遇到这样的问题:“样品数量的依据是什么?”“样品数量太多了,QC实验室变成了验证实施的瓶颈。”取多少样品是合适的,常常成为困扰验证人员的问题。

作为质量管理人员,往往會从法规或者指南中寻找关于取样方案的设计依据,事实上,指南并不能给出明确的解答。以口服固体制剂的混合均匀性为例,美国食品药品管理局(FDA)在2003年10月发布了“一项新的指导原则关于粉末混合和制剂完成品取样和评估”(powder blends and finished dosage units-stratified inprocess dosage unit sampling and assessment)[1],中提出“样本量:单位剂量1~10倍,一般不低于3倍取样位置:粉末或颗粒混合一般取上、中、下三层,混合设备出料口处必须取样,压片或者胶囊填充开始和结束两个时间点需取样”。(虽然该文件已于2013年8月予以撤销,对于阶段性生产仍然有借鉴意义。)国家食品药品监督管理局组织编写的《口服固体制剂GMP指南》中要求“混合均一度应该控制在85%~115%或更严格的工艺指标,相对标准偏差不应高于7.8,而对一般固体制剂,至少应在上中下三个水平位置进行多点取样,每个点的取样量应该相对适中” [2]。由上可以看出,指南更多考虑的是取样的位置是否具有代表性,对于样品数量则未做明确规定。

本文介绍了在验证方案设计阶段使用“功效和样本量”统计工具,以更加科学地确定取样数量,避免因取样数量过少,导致总体样本均值偏离预定标准的情况;或者用于评价一个取样方案所得到的验证结果的可信度。

1 取样因素分析

设计取样方案是为了用样本来探究总体的分布水平,所取的样本在总体存在一定波动的情况下,可能会存在所取的样品不能代表总体水平的风险,也就是说也许总体水平波动较大,而由于取的样品数据较少,导致通过样本来估算整体出现失误。这正好符合假设检验的思路,所以可以使用假设检验中的“功效和样本量”来确定样本数量是否足够代表总体水平,或者说有多大的把握代表总体水平,这可以作为设计取样数量的一个思路。已知假设检验有四种可能,总结如下[3]。

从表1可以看出,假设检验希望得到的结果是,实际为真时,接受H0,实际为假时,拒绝H0。功效就是当确实存在显著效应时能够将其认定的可能性,也就是能正确拒绝原假设错误的能力,通俗地讲就是当原假设为假时,有多大把握可以正确地拒绝原假设。功效越大,降低的是“纳伪风险”,也就是“第二类错误”。功效受到以下三个因素的影响[4]。

1)显著性水平(a) 在其他条件不变的情形下,显著性水平a增大,b随之减小,检验功效1-b随之增强。

2)样本量 在其他条件不变的情形下,增大样本容量,可以提高检验功效。

3)原假设与备择假设的差异程度 若原假设与备择假设之间的差异非常明显,这时取伪的可能性较小,检验功效增强;反之,若原假设与备择假设之间差异较小,就难以通过检验将二者区分开来,从而影响检验功效。

2 示例分析

2.1 事先设计,用功效计算样本量

在验证中,显著性水平往往不变,对于单样本,功效就受样本量和样品间的差异以及可接受标准影响。用功效来计算样本量时,需要先设定想要达到的功效,由于制药行业的高风险性,一般来说,期望拒绝错误假设的能力可以达到80%以上,所以一般假定功效在0.8以上。在验证中,往往需要证明的是总体在设定的可接受标准范围内围绕均值进行波动,所以,一般情况下设定原假设H0为样本均值μ1等于总体均值μ0。

假设需要验证某一产品“总混”含量是否均匀,这时,已知含量的可接受范围为均值±1,而通过小试已知样本含量的标准差(s)为0.8或者根据以往的取样已知含量总体的标准差(σ)为0.8,由于产品的含量较低,总混混合均匀度是关键质量属性,所以期望功效是0.9,设计多少份取样样品合理呢?可以通过使用统计软件Mintab 19以上版本中的“功效和样本数量”工具[5],输入条件选择:差值(D)=1,功效值(W)=0.9,标准差(V)=0.8。

可以看出需要9份样品才可以避免由于样品量不够导致的“纳伪风险”。这是通过功效来决定样本数量。

2.2 事后评价,用样本量计算功效

当不知道总体的标准差时,不能用上述办法预先判断需要多少份样品,可以先设计样品数量较多的取样方案,获得一些检验数据,这时,可以通过所得的样品检验结果来计算这个取样方案下的功效是多少,从而评价取样数量是否合适。只要在软件对话框中输入相应信息即可。假如上述例子,已知含量的可接受范围为均值±1,按照“总混”设备上、中、下位置各取2份样品,得知样品含量标准差为0.8,那么功效是多少呢?输入条件选择:样本数量(S)=6,差值(D)=1,标准差(V)=0.8。

可以看出,此时的功效为0.689,意味着第二类错误存在的概率为0.311。一般来说,总混混合均匀性对于药品质量是非常重要的,如果有31.1%的概率“纳伪”,是不可以接受的。这是通过样本数量来判断功效。

通过上述举例可以看出,通过使用“功效和样本量”工具,可以通过既定条件及想要达到的功效求得样本量来设计取样方案,也可以通过已有样本量的检验结果来计算可达到的功效。通过假设检验使取样数量更合理,或者判断原来的取样方案下得到的结果有效性如何。这种方法适用于对任意取样方案的检验。而且,第二类错误是由于总体波动存在而導致的,当总体波动越大时,对样本量的检验越有意义,而当样本结果标准差较小,且可接受范围较大时,则可不必进行功效检验。另外,需要特别指出的是,样本量并不是越大越好,当样本量达到一定数量后,会导致本来很小的差异非常显著。这种差异在实际工作中毫无意义,所以,功效与样本的检验在设计方案时是非常有意义的。

当存在两个待比较样本同时取样时,例如同时分析两种处方,同时比较两台总混机等,同样可以使用“功效和样本数量”中的双样本t来检验给定的样本数量是否有足够的能力证明两份样品的均值是否真的存在差异,或者根据给定的功效来预计需要多少数量的样本。与单样本不同之处在于,此时的“标准差”是已有样品的合并标准差或者两个总体水平的标准差估计值。由于只是使用统计工具的不同,此处不再赘述。

3 结语

综上所述,药品生产或研发验证人员在设计取样方案时,可以在符合指南给出的取样位置的基础上,通过科学使用统计工具“功效和样本量”使取样数量更具科学性和有效性。

参考文献

[1] FDA guidance 5381dft. Guidance for Industry Powder Blends and Finished Dosage Units - Stratified InProcess Dosage Unit Sampling and Assessment[EB/OL].(2011-02-25) [2020-12-14]. https://wenku.baidu.com/ view/66ac99eb81c758f5f61f677e.html.

[2] 国家食品药品监督管理局药品认证管理中心. 药品GMP指南·口服固体制剂[M]. 北京: 中国医药科技出版社, 2011: 185.

[3] 全国质量专业技术人员职业资格考试办公室. 质量专业理论与实务[M]. 北京: 中国人事出版社, 2011: 60.

[4] 叶仁道, 刘干, 薛洁. 统计学[M]. 西安: 西安电子科技大学出版社, 2016: 122.

[5] Minitab LLC. 用于估计的样本数量的示例[EB/OL]. (2019-06-05) [2020-12-14]. https://support.minitab.com/zh-cn/ minitab/19/help-and-how-to/statistics/power-and-sample-size/ how-to/sample-size/sample-size-for-estimation/before-youstart/example/.