基于Logistic回归分析的中药注射剂不良反应预测研究
2017-01-19梁平陈艳芬
梁平陈艳芬
【摘要】目的:通过建立中药注射剂药物不良反应的Logistic回归模型,判断发生ADR时累及各组织器官的概率,为临床合理用药提供指导。方法:从广东省药品不良反应管理平台收集到阳江市2010至2015年间的有效中药注射剂不良反应报告1504份,对筛选出的数据进行清洗、属性规约和数据变换处理,运用SPSS Statistics 21统计分析工具,建立Logistic回归模型。结果:建立的Logistic回归模型总体预测正确率为633%,其中对皮肤及附件损害的预测正确率为846%,对全身性损害的预测正确率为836%,对其他组织器官系统的预测正确率均低于500%。结论:建立的Logistic回归模型能在一定程度上预测ADR时累及各组织器官的概率,该方法可为中药注射剂临床合理使用提供参考依据。
【关键词】中药注射剂;药物不良反应;Logistic回归
【中图分类号】R-3【文献标志码】 A【文章编号】1007-8517(2016)21-0115-05
Prediction of Adverse Drug Reaction of Traditional Chinese Medicine Injection Based on Logistic Regression Analysis
LIANG Ping1CHEN Yanfen2
1.Department of Pharmacy,Yangjiang Hospital of Traditional Chinese Medicine,Yangjiang 529500,China; 2.School of Traditional Chinese Medicine,Guangdong Pharmaceutical University,Guangzhou 510006,China
Abstract:Objective By establishing Logistic regression prediction model of Injection of traditional Chinese medicine,we can predict the probability of the occurrence of ADR in various tissues and organ to provide guidance for clinical rational use of drugs.Methods There are 1504 effective reports from 2010 to 2015 ,collected from the center for ADR monitoring of Guangdong.After cleaning, attribute reduction and data transformation, the data are obtained. With the Statistics SPSS 21 statistical analysis tools, a logistic regression model was established.Results The predict accuracy of Logistic regression prediction model of Injection of traditional Chinese medicine is 633% totality,in which damage to the skin and accessories of prediction accuracy is 846%, the systemic damage prediction accuracy is 836%, the accuracy of other tissues and organs system were lower than 500%.Conclusion The established Logistic regression prediction model of Injection oftraditional Chinese medicinecan predict the probability of the occurrence of ADR in various tissues and organto a certain extent.This method can provide reference for clinical rational use of Injection of traditional Chinese medicine.
Keywords:Injection of Traditional Chinese Medicine;Adverse Drug Reactions(ADR);Logistic Regression
中药注射剂是传统中医药理论与现代生产工艺相结合的产物,突破了中药传统的给药方式,是中药现代化的产物[1]。然而,中药成分复杂,随着中药注射剂应用日渐广泛,其引起的药物不良反应(Adverse Drug Reaction,ADR)也逐渐增多,它的安全性越来越受到重视。从决策论的角度看,用药实质上是一个在人(患者、医药人员),疾病和药物之间的信息运动过程[2]。临床用药过程每一刻都在产生大量的数据信息,由于卫生领域数据的特点(海量、非线性、高维度、干扰强等)[3]有必要采用新的信息技术,自动、智能地对临床用药过程产生的信息进行分析。
Logistic回归分析在医学研究中应用广泛,主要是用于流行病学研究中危险因素的筛选,根据危险因素预测某疾病发生的概率,但它同时具有良好的判别和预测功能,根据模型判断属于某种情况的概率有多大。比如某患者使用某中药注射剂发生ADR的可能性等[4]。Logistic回归不仅具有判别和预测功能,而且限制条件少,资料要求相对低,适用于定性的或半定量的指标,估计各种自变量组合条件下应变量各级别的发生概率,在临床判别诊断和危险人群筛检中,应用前景广阔[5]。本研究通过建立中药注射剂ADR的Logistic回归模型,判断发生ADR时累及各组织器官的概率,从而为临床合理用药提供指导。
1资料与方法
11数据来源进入广东省药品不良反应管理平台,以阳江市药品不良反应监测中心的用户名登录,检索从2010年1月1日至2015年12月31日发生的所有ADR报告,下载到Excel文件中。
12使用工具本文使用的是SPSS的统计分析工具SPSS Statistics 21,应用Logistic回归分析法对选取的ADR数据进行分析、建立模型,并进行分析。
2数据处理
在Excel文件中,剔除非中药注射剂的ADR报告。共筛选出有效中药注射剂报告1504份。按照设计的原始属性表,如表1、表2所示,对筛选出的数据进行清洗、属性规约和数据变换处理,得到预处理后的样本数据,见表3。
分析
SPSS Statistics 21在读入数据时,选择菜单:Analyze->Regression->multinomial logistic regression,将因变量“ADR累及组织器官”调入dependent,由于所有自变量均为分类变量,所以将“年龄、性别、原患疾病、过敏史、合并用药、给药途径、用药时间、不良反应结果、对原患疾病的影响”等自变量调入factor,其他均采用默认操作,建立模型,结果如下。
31预测变量的重要性模型变量对目标变量(ADR累及组织器官)的重要程度,在9个输入变量中,年龄、原患疾病、合并用药、对原患疾病的影响对ADR累及组织器官的影响较显著,其中年龄的重要性最强,为047,其次为原患疾病037,其他变量在02以下。
32模型显著水平从表4可以看出模型的显著水平(Sig)都小于005,说明年龄、原患疾病、合并用药和对原患疾病的影响4个变量与因变量(ADR累及组织器官)的线性关系是显著的。
33模型拟合优度从表5可知,模型的似然比检验的显著水平(Sig)为0000,小于005,说明模型的拟合优度较好,达到了预期效果。
34伪决定系数模型的三种伪决定系数cox & Snell 、Nagelkerke和McFadden分别为0476、0506、0228,这几个指标从不同角度反映了当前模型中自变量解释因变量的变异占因变量总变异的比例。对于分类数据而言,伪决定系数一般不会太高[6]。
35模型的分类从目标变量(ADR累及组织器官)的角度对模型进行分析,包括H1:皮肤及附件损害;H2:全身性损害;H3:呼吸系统损害;H4:神经系统损害;H5:循环系统损害;H6:消化系统害;H7:其他。得到的各目标变量(ADR累及组织器官)预测的正确率为:H1=846%,H2=838%,H3=0,H5=256%,H6=13%,H7=0。
36模型评估运用“分析”节点对建立的ADR累及组织器官模型的正确率进行分析,结果为1504个记录中有952个记录的模型预测值与实际值相匹配,即模型的预测正确率为633%。
4结果
本研究建立了中药注射剂Logistic回归模型,模型总体预测正确率为633%,模型对ADR累及组织器官为皮肤及附件损害的正确率为846%,对ADR累及组织器官为全身性损害的正确率为836%,对其他ADR累及组织器官系统的正确率均低于500%。说明模型在判别ADR累及组织器官为皮肤及附件损害和全身性损害时的结果还是比较好的,而在判别呼吸系统损害、循环系统损害、消化系统损害及其他损害时表现不理想。
该模型在ADR累及组织器官为呼吸系统损害、循环系统损害、消化系统损害及其他损害的正确率不高,原因有:首先是建立模型的数据集偏少;其次可能是数据预处理存在某些缺陷;最后,不良反应发生原因众多,如药物因素、使用因素、还有个体差异等,使得它的发生结果存在偏差。
5模型的预测
在做Logistic回归[7]时,如果因变量y有n个值,则以其中一个类别做为参考类别,其他类别都同它相比较生成n-1个非冗余的Logistic变量模型。如,y=n做为参考类别,则对于y=i,其Logistic模型为:
g=logP(y=i)P|(y=j)=βi0+βi1χ1+βi2χ2++βipχ1p
(公式1)
对于参考类别,其模型中所有系数均为0,SPSS中默认将最大类别作为参考类别。本例中,把不良反应累及组织器官作为因变量y,y分七类:H1:皮肤及附件损害;H2:全身性损害;H3:呼吸系统损害;H4:神经系统损害;H5:循环系统损害;H6:消化系统害;H7:其他。x为自变量,其中x1=性别,x2=年龄,x3=过敏史,x4=原患疾病,x5=合并用药,x6=给药途径,x7=用药时间。将H1:其他作为因变量的参考类别。因为“H1”做了参考类别,所以“H1”的所有系数均为0,执行结果中不显示。同样,A2、B9、C3、D9、E3、F2、G4,分别做为各个自变量的参考变量,其系数也均为0。
6根据回归模型判断因变量的概率
根据得到的以上回归结果,判断七类因变量情况的概率有多大。假设已知一患者,其性别=A1(男性),年龄=B10(68岁),过敏史=C3(不详),原患疾病=D4(冠心病),合并用药=E2(抗菌药物),给药途径=F1(静脉滴注),用药时间=G1(当次用),预测该患者发生ADR累及组织器官的概率。
根据Logistic回归分析的结果,找到假设条件对应的Logistics回归模型系数β,截取相应数据,如表6所示:
第一步:根据公式1计算各种应答水平的g值。
因为ADR累及组织器官为皮肤及附件损害是因变量y的参考组,所有系数均为0,所以,ADR累及组织器官为皮肤及附件损害,即g1= 0。
全身性损害:g2=-3700-0340+0191+0+2637+0839+0+0849=0476;
呼吸系统损害:g3=-18404-0189+0440+0+2269+1427-0460+14081=-0836;
循环系统损害:g5=-3029+0045+0335+0+3221+0959+0385-0624=-3268;
消化系统损害:g6=-4751+0023+0382+0+2290+2504-0405-0436=-0393;
其他:g7=-16112-0588+0647+0+0124+13838-0108-0682=-2881
注:由于数据样本中没有收录到H4(神经系统损害)的病例,所以在模型信息中没有出现H4相关的数据。
第二步:根据公式2计算各种应答水平的P值。
P(Yi)=exp(gi)∑JK=1exp(gk)(公式2)
P(H1)=e0/(e0+e0476+e-0836+e-3268+e-0393+e-2881)=0262
P(H2)=e0476/(e0+e0476+e-0836+e-3268+e-0393+e-2881)=0422
P(H3)=e-0836/(e0+e0476+e-0836+e-3268+e-0393+e-2881)=0114
P(H5)=e-3268/(e0+e0476+e-0836+e-3268+e-0393+e-2881)=0010
P(H6)=e-0393/(e0+e0476+e-0836+e-3268+e-0393+e-2881)=0177
P(H7)= e-2881/(e0+e0476+e-0836+e-3268+e-0393+e-2881)=0015
P(H1)+P(H2)+P(H3)+P(H5)+P(H6)+P(H7)=1
通过计算,该患者发生ADR累及组织器官为全身性损害的概率最大P(H2)=0422;其次为皮肤及附件损害P(H1)=0262;消化系统损害和呼吸系统损害的概率分别为0177和0114,发生概率最小的为循环系统损害(P=0010)。
7结论
本研究建立的Logistic回归模型能在一定程度上预测ADR累及各组织器官的概率,该方法可为中药注射剂临床合理使用提供参考依据。引起中药注射剂不良反应的原因较多,包括药物因素、患者机体因素和环境因素[8]。本文只探究了部分患者因素如性别、年龄、过敏史、原患疾病、用药时间等对不良反应发生的影响。由于Logistic回归模型是基于大样本统计规律的,需要大量样本数据的支持;另外,药品本身的特点及患者个体的差异,使得分析得出的结果有一定的局限性,其他方面的影响因素还有待验证。随着药品不良反应制度的完善与健全,记录的数据量和完整性不断增加,有效性不断增强,所得分析结果也将会更加全面可信,对临床合理用药将起到重要的指导作用。
参考文献
[1]林育华.中药注射剂若干问题刍议[J].中国现代中药,2006,8(9):4.
[2]胡爱东,曹丽萍.现代信息技术在合理用药中的应用[J].医学信息,2008,21(8):1244.
[3]VillmannT.Neural map for faith data modelling inmedicinestate-of-the-art and exemplary applications[J].Veurocomputing,2002,48(1):229.
[4]毛林,陆全华,程涛.基于高维数据的集成逻辑回归分类算法的研究与应用[J].科技通报,2013,29(12):64.
[5]陈广,陈景武.Logistic回归分析的判别预测功能及其应用[M].数理医药学杂志, 2007,3:280-281.
[6]武松,潘发明.SPSS统计分析大全[M].北京:清华大学出版社,2015:272.
[7]张良均,杨坦,肖刚,等.MATLAB数据分析与挖掘实战[M].北京:机械工业出版社,2015:74-80.
[8]卢海儒,文友民.中药注射剂的不良反应[M].北京:中国医药科技出版社,2006:14-19.
(编辑:程鹏飞)