APP下载

应用Excel进行药物有效期的统计分析及预测

2012-10-25曹悦兴刘新宁滕学厚

药学研究 2012年2期
关键词:平方和斜率残差

曹悦兴,刘新宁,滕学厚

(1.山东大学药学院,山东 济南250012;2.济南利民制药有限责任公司,山东 济南250200)

ICH指导原则Q1E附录B[1]介绍了货架寿命的评价方法,但对批的合并检验等未作详细说明,笔者利用常用数据处理软件Excel,通过对稳定性试验数据进行系统的统计学整理并预测了有效期。

1 稳定性数据的分类

ICH指导原则中需要用到统计学分析的有三种,一为各批的稳定性数据可以合并,即各批次不能拒绝斜率及截距均相同的假设;二为拒绝截距相同的假设,但不能拒绝斜率相同的假设;三为拒绝斜率相同的假设。这三种情况需要分别进行分析。

2 理论分析及实际应用

本内容根据逻辑关系分为两部分,第一部分为稳定性数据的处理及回归直线的合并分析,第二部分为合并后根据回归直线的置信区间以确定有效期。

2.1 第一部分[2~4]通过统计学分析确定稳定性试验数据并判断如何合并处理,每一个检验均用0.25的显著性水平来补偿由于正式稳定性试验时样本量限制所导致的设计上的不足。

2.1.1 本文的思路 稳定性试验数据中某定量特性y可以看做是时间x(或经函数转换)的函数,通常假设其是呈线性关系的。在回归方程中两个有相关关系的变量x和y的一元线性回归模型可表示为

①证明各回归方程有意义,即回归显著性检验,并在其基础上进行方差齐性检验,若方差齐性检验无法通过,则认为各直线存在显著性差异,不能进行合并统计分析;②证明各方程的斜率相等;③证明各方程的截距相等,确定合并的回归方程。

2.1.2 具体的理论分析及实际应用

2.1.2.1 回归显著性试验与方差齐性试验

2.1.2.1.1 理论分析 方差齐性检验首先利用Excel的回归功能,确定各回归方程具有显著意义。并计算出SSE1,SSE2,SSE3…;MSE1,MSE2,MSE3…,其意义为:

MSE=SSEi/γi,为的无偏估计量。式中γ为自由度,其值为 ni-2(i=1,2,3…k),ni是建立回归直线 Li时的样本容量)(i=1,2,3…)。

由于有k条直线,而F分布仅能证明两条直线方程误差项方差相等,因此需进行相应处理,又因为MSEi为的无偏估计量,因此我们可以选择MSE的最大与最小值,即误差项差别最大的进行比较,差别大方差相等,差别小自然相等。

判断标准:

2.1.2.1.2 实际应用 实验中测得某药品在稳定性研究长期试验中标示含量数据如下,该数据作为本文的应用案例(见表1)。

表1 某药品稳定性研究长期试验中标示含量数据(%)

利用Excel软件的回归功能得结果,见表2。

表2 使用Excel软件的回归功能所得结果

由回归显著性检验(F检验)可知,检验拒绝回归系数为零的假设,即回归显著。

从而可知第3批MSE3最大,第2批MSE2最小,则可得F 值为 MSE3/MSE2=1.317。

利用函数 FINV(p,γi,γj),求得 F0.25(4,4)=2.064 > F,因此可证明各直线误差项齐方差。

如果结论不能证明各直线误差项齐方差,则各直线无统计学意义,可采用ICH指导原则中其他有关规定。

2.1.2.2 等斜率试验

2.1.2.2.1 等斜率检验 基本思想为首先用最小二乘法计算出共同的斜率,假设各直线的斜率相等,利用斜率相等条件下计算得到的总的残差平方和与不采用斜率相等条件下计算得到的总的残差平方和的差异来设立F检验,根据F值的概率大小来判断斜率相等的条件是否成立。

式中m为数据组数,如有3批数据则m值为3,nk为各组数据中对应的数据组数,例如第 i组(xi,yi)(i=1,2,3…ni.)中有 ni个数组;的平均指的是各组数据的相应平均值。

共同斜率β的计算公式:及

各参数的自由度:SSE组间为m-1;SSE组内为SSE总为

判断标准:

2.1.2.2.2 回归显著性检验 基本思想为假设斜率为零的条件下计算得到的回归平方和与残差平方和的差异来设立F检验,根据F值的概率大小来判断假设是否成立。

回归平方和SSR=SST-SSE,即回归偏差=总偏差-剩余偏差。

SSR自由度为γ1=1,SSE自由度为2);

提出假设:H0:βi=0;H1:βi不全为 0

若 F≥Fα(γ1,γ2),则拒绝 H0,说明总体回归系数 β≠0,即回归是显著的。

2.1.2.2.3 实际应用 等斜率检验:

使用Excel函数 COVAR、DEVSQ求得 Sxy=-170;Sxx=630;Syy=46.38

β=Sxy/Sxx= -0.269 8;SSE总=0.508 7;SSE组内=SSE1+SSE2+SSE3=0.444 1;SSE组间=0.064 51。其中 SSE组间自由度为2,SSE组内自由度为12。

F=(SSE组间/γ组间)/(SSE组内/γ组内)=0.871 4

F0.75(2,12)=0.294 7 < F < F0.25(2,12)=1.560,接受斜率相等的假设。

回归显著性检验:

SSR=Syy- SSE=45.87,自由度为1;SSE=0.508 7,自由度为14。

F=(SSR/γ1)/(SSE/γ2)=1262 >=8.862,说明总体回归系数β≠0,即回归是显著的。

2.1.2.3 等截距试验

2.1.2.3.1 理论分析 基本思想为已证明斜率相等成立的基础上,在假设截距相等条件下计算得到的残差平方和与仅斜率相等条件下计算得到的残差平方和差异来设立F检验,根据F值的概率大小来判断假设是否成立。

在斜率、截距均相等的条件下,各组数据可以合并为一组,可计算残差平方和,其自由度为仅斜率相等的条件下的残差平方和为SSE总(上面内容已求得),其自由度为;其差值为SSE总,自由度为 γ3=γ1-γ2=m -1。

判断标准:

若 F0.75(γ3,γ2)< F < F0.25(γ3,γ2),则接受截距相等的假设,即截距不存在显著差异;若 F >F0.25(γ3,γ2)或 F <F0.75(γ3,γ2),则拒绝截距相等的假设,认为截距存在显著差异。

2.1.2.3.2 实际应用 等截距检验:将所有数据合并为一组,并用 Excel求得 SSE总'=0.556 4,其自由度为 16;可得SSE总'-SSE总=0.047 70,其自由度为2。

F0.75(2,14)=0.293 7 < F=0.656 4 < F0.25(2,14)=1.533,说明各组截距相等,数据组可以合并,合并后的方程为y=-0.269 8x+99.16。

2.2 第二部分 根据ICH指导原则中分为三类情况。

2.2.1 不能拒绝斜率及截距均相同的假设的情况 使用Excel预测药物有效期[5],原理:根据给定的显著水平 α,可得到对应于x0的预测值y0的区间估计。

根据各月的含量数据求得对应的 z=tα/2·S·,并求得估计数据y0,及其波动范围下限y0-Z,上限 y0+Z;分别对各组估计数据(x0,y0),下限(x0,y0-Z),上限(x0,y0+Z)作趋势线,以二次曲线进行回归,根据需要的限值代入进行计算。

计算时采用平均值单侧95%置信限,即双侧显著水平为0.1。如果为减少趋势,执行下限;如果为增加趋势,执行上限(图1)。

可得

图1 药品品有效期估算图

回归得曲线方程:y= -0.000 4x2-0.264 4x+99.051,如果限值为标示含量不得低于90.0%,将y=90.0代入,解得x值为32.6月。

2.2.2 拒绝截距相同的假设,但不能拒绝斜率相同的假设的情况 需要做的工作:本文的第一部分,第二部分斜率相同的检验及回归检验,截距相同假设被拒绝的检验,然后利用合并后的共同斜率,根据公式,分别求得各自的截距a,然后利用上述方法分别预测各自有效期,然后取较短者。

2.2.3 拒绝斜率相同的假设的情况 ICH指导原则要求:求得各批次截距、各个斜率及从全部批次计算得到的平均方差,来估算在稳定性研究中各个批次的再试验期和货架期。所有批号中最短的估测值应被选作全部批次的再试验期或货架期。

需要做的工作:本文的第一部分,分别求得各自的截距及斜率,第二部分斜率假设被拒绝的检验,然后利用全部批次计算得到的平均方差代入公式1中分别计算得各批的上限及下限,其它处理相同。

3 讨论

3.1 文中讨论了稳定性试验数据中某定量特性y与时间x呈线性函数关系的处理方法,对于呈非线性函数关系的可以通过适当的转换使之成为线性函数关系,然后进行相应的处理。

3.2 检验顺序一定要按σ2、β和α的顺序进行,因为后一步的检验将用到前一步检验的结果,如果有一步检验无法通过,则需要通过文中介绍的其他方法进行分析。

3.3 Excel是最常用的数据处理软件,数据处理简明、直观、准确,操作简便,易于掌握,采用此软件进行统计分析,便于学习者掌握,理解。

3.4 通过对多批稳定性试验数据进行系统的统计学整理并预测了有效期,解决了药品研发过程中的实际问题。

[1]周海钧.药品注册的国际技术要求(中英对照2007质量部分)[M].北京:人民卫生出版社,2006.

[2]盛骤,谢式千,潘承毅.概率论与数理统计[M].第4版.北京:高等教育出版社,2008.

[3]庄常陵.两条回归直线的比较[J].高等函授学报(自然科学版),2005,19(5):38 -40.

[4]王公恕.回归直线平行性检验的一个应用[J].数理医药学杂志,2001,14(6):526 -527.

[5]赵康虎,刘元瑞.利用电子表格Excel 2000预测药物有效期[J].中国现代应用药学,2001;18(6):478-479.

猜你喜欢

平方和斜率残差
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
巧甩直线斜率公式解数学题
基于深度卷积的残差三生网络研究与应用
利用平方和方法证明不等式赛题
求斜率型分式的取值范围
关于四平方和恒等式及四平方和定理的趣味话题
四平方和恒等式与四平方和定理
关于四奇数平方和问题