基于SAS的四参数回归计算法点估计
2020-01-06邓罗佳
黄 卓,邓罗佳,张 岳*
(1.上海市食品药品检验所药理毒理室,上海 201203;2.上海交通大学生命科学技术学院生物信息与生物统计系,上海 200240)
在生物活性的定量测定中,一般有两种反应类型,一种是直线型反应,另一种是曲线型反应[1]。曲线型反应中,标准品和供试品形成的剂量-反应曲线多成S形或反S形,四参数logistic回归模型被广泛应用于曲线型反应的生物学活性测定中[2]。基于细胞的生物学活性测定法(以下简称细胞法)属于生物鉴定法,其显著特点是变异度大,容易受细胞状态、细胞代谢、试剂、操作人员及操作方式等因素的影响。因此,加强对细胞法实验数据统计分析程序的规范化要求,对获得准确可靠的实验结果具有重要意义。关于细胞法实验数据的处理,国外很多药典中都收载到使用四参数回归计算法处理[3-4],但并未详细说明其原理。本研究的目的是建立计算四参数回归计算法中自由模型和平行曲线模型(约束模型)点估计值的SAS程序,并将其应用于药品、器械的审评审批中。
1 四参数logistic模型
1.2 约束模型 理论上,利用细胞法测定药品相对效价的一个重要前提是假设标准品(S)和供试品(T)具有相同的活性作用成分,供试品可视为由标准品稀释或浓缩一定倍数而得,故标准品和供试品具有生物相似性。这意味着在实验分析中会表现出统计学相似性,即当标准品和供试品的活性组分基本相同时,两拟合曲线应该平行,因此约束模型也经常被用来对标准品和供试品做平行曲线拟合。在对标准品和供试品剂量反应曲线进行平行曲线拟合后,分别获得标准品和供试品平行拟合曲线中A、B、C、D的估计值。该模型下标准品与供试品拟合方程的A、B、D的估计值完全相同,仅参数C的估计值不同[5-8]。方程形式如下:
2 粒细胞集落刺激因子(GCSF)生物学活性测定数据
数据来自于一次GCSF的生物学活性测定,用NFS-60细胞,采用MTT比色法测定。实验中将标准品和供试品用基础培养液稀释至每1 ml含200 IU的GCSF,然后做2倍系列稀释,共8个稀释度,每个稀释度设置2个平行孔,用酶标仪测定吸光度,结果见表1。
3 SAS程序模型拟合结果
使用SAS 9.4中的NLIN过程(PROC NLIN)对上述GCSF生物学活性测定数据进行四参数logistic回归模型拟合,并估计相应参数[9]。PROC NLIN中“data”用于给定数据集,“model”关键词用来输入模型的形式。在此项研究中,可以直接输入自由模型和约束模型的表达式。在默认状态下,PROC NLIN采用较为常用的非线性最小二乘法(nonlinear least-squares)估计参数,并用高斯数值计算方法寻找最优解。关键词“parms”或“parameters”用来声明需要估计参数的初始值。在这项研究中,所有参数的初始值都设为1,我们相信四参数logistic回归模型较为简单的方程形式不会有局部最优的情况。
表1 GCSF生物学活性测定数据Table 1 GCSF biological activity assay data
GCSF:粒细胞集落刺激因子
3.1 自由模型拟合 首先,对数据进行四参数logistic自由模型的拟合。拟合代码如下:
proc nlin data=S;
model y=D+(A-D)/(1+(x/C)**B);
/*语句中“**”为指数运算符*/
parms A=1 B=1 C=1 D=1;
run;
proc nlin data=T;
model y=D+(A-D)/(1+(x/C)**B);
parms A=1 B=1 C=1 D=1;
run;
/*S数据集包含标准品的数据,
T数据集包含供试品的数据,
数据集中含有x和y两个变量,
模型中x为浓度,y为吸光度的观测值,
A、B、C、D分别为4个参数*/
得到了自由模型拟合结果,点估计结果见表2,拟合曲线见图1。通过计算拟合优度R2,以及与软
表2 SAS和Softmax对GCSF自由模型拟合结果的比较Table 2 Comparison of SAS and Softmax fitting results to the free model of GCSF
GCSF:粒细胞集落刺激因子
件Softmax 6.5.1的拟合结果相比较,可以看出使用SAS 9.4中的PROC NLIN对四参数logistic自由模型具有较好的拟合效果,能够很好地给出各参数的点估计值。
图1 GCSF生物学活性测定数据的自由模型拟合曲线Figure 1 Free model fitting curve for GCSF biological activity assay data○:标准品;●:供试品;GCSF:粒细胞集落刺激因子
3.2 约束模型拟合 对GCSF生物学活性测定数据进行约束模型的拟合,在PROC NLIN中代入数据和方程,程序如下:
proc nlin data=assay;
model obs=D+(A-D)/(1+(iu/((cs*(sample=“S”)+Ct*(sample=“T”))))**(B));
/*语句中“*”为乘法运算符,“**”为指数运算符*/
parms D=1 B=1 Cs=1 Ct=1 A=1;
run;
/*assay数据集包含全部标准品和供试品的数据,
有3个变量,iu为浓度,obs为吸光度的观测值,
sample变量有两个取值,“S”和“T”分别表示该数据属
于标准品和供试品,
A、B、C、D分别为4个参数*/
得到了约束模型的拟合结果,点估计结果见表3,拟合曲线见图2。同样通过计算拟合优度R2并与Softmax软件计算结果做比较,发现使用SAS 9.4中的PROC NLIN对四参数logistic约束模型同样具有很好的拟合效果,给出的点估计值也很精确。
4 讨 论
采用SAS中的PROC NLIN程序可以非常准确地估计四参数logistic回归自由模型和约束模型的所有参数。与其他软件相比,SAS具有非常高的可信度,被广泛地应用于临床研究中,是FDA首推的统计分析软件。此外,PROC NLIN可以更加详细地展示计算结果,并且其灵活的参数设置功能也能为分析人员提供更多的选择和更加高效的质量控制。在结果中,PROC NLIN不仅有每个参数的点估计值,还提供了其标准误、相关性矩阵和协方差矩阵等,为后续的置信区间计算提供了一种可能的解决途径。因此,本研究建立的方法可以很好地利用SAS精确计算四参数logistic模型的点估计值。
表3 SAS和Softmax对GCSF约束模型拟合结果的比较Table 3 Comparison of SAS and Softmax fitting results to the constrained model of GCSF
GCSF:粒细胞集落刺激因子
图2 GCSF生物学活性测定数据的约束模型拟合曲线Figure 2 Constrained model fitting curve for GCSF biological activity assay data○:标准品;●:供试品;GCSF:粒细胞集落刺激因子