基于Apriori关联规则算法分析中药注射剂不良反应
2017-06-24梁平陈艳芬
梁平,陈艳芬
(1.广东药科大学中药学院,广东 广州 510006;2.阳江市中医医院,广东 阳江 529500)
基于Apriori关联规则算法分析中药注射剂不良反应
梁平1,2,陈艳芬1
(1.广东药科大学中药学院,广东 广州 510006;2.阳江市中医医院,广东 阳江 529500)
目的:探究发生中药注射剂药品不良反应(ADR)与患者性别、年龄、过敏史、原患疾病、合并用药、用药时间、给药途径等相关因素之间的关联,为临床合理使用中药注射剂提供参考。方法:采用数据挖掘关联规则Apriori算法,对阳江市2012-2016年发生并上报的中药注射剂ADR报告进行分析,采用支持度和置信度作为衡量关联规则的强度。结果:发生ADR累及组织器官与过敏史、原患疾病、合并用药的关联性较强。有过敏史和合并用药的患者发生ADR的概率较高;原患疾病为心血管系统、神经系统疾病发生ADR累及的组织器官主要为全身性损害;而患有呼吸系统疾病的患者发生ADR主要为皮肤及附件损害;年龄>70岁的患者,发生ADR累及组织器官主要是全身性损害。结论:利用关联规则算法能有效分析发生中药注射剂ADR的规律,为进一步分析ADR的发生提供有效参考。
中药注射剂;药物不良反应;关联规则
随着中药注射剂在临床上的广泛应用,关于中药注射剂安全性问题的报道逐渐增多。2001-2003年,77.32%的中药不良反应是由中药注射剂引起的,2004-2007年,中药注射剂所引起的不良反应占中药不良反应的80%左右[1]。2004-2012年,中药注射剂引起的不良反应事件影响逐步升级,2015年广东省收到的《药品不良反应/事件报告表》中,中成药占12.30%,例次数排名前20名的品种全部为中药注射剂[2],中药注射剂带来的药害事件越来越多,必须对其安全性引起高度重视。
数据挖掘技术应用医学、生物信息学、统计学、计算机学等相关领域知识,跟踪、发现和评估药品不良反应信号,提高药品不良反应(ADR)检测和分析的效率。相对传统的ADR信息探索而言,数据挖掘方法能够更快和更准确地识别潜在的ADR问题,而且扩展了药品安全的视野和知识,能够更好地为医药行业和监管部门决策提供支持[3-4]。开展ADR监测工作的根本目的就是通过对信息的分析,及时发现风险因素,采取有力措施有效控制,防范严重事件的重复发生。本文通过收集阳江市上报到广东省ADR管理平台的中药注射剂不良反应报告,利用数据挖掘技术,对ADR数据进行分析,找出发生ADR时累及各组织器官与患者年龄、性别、原患疾病、过敏史、合并用药、给药途径等的相关性,从而为研究中药注射剂ADR发生规律提供参考,为临床合理用药提供指导。
1 资料与方法
1.1 数据来源
本文数据来源于阳江市药品不良反应监测中心提供的2012-2016年发生并上报的ADR报表,共15863份,保留所有中药注射剂的ADR报告,剔除与挖掘目标不相关的ADR报告,共筛选出有效中药注射剂报告1620份。
1.2 使用工具
使用IBM SPSS Modeler 14.1软件中的数据挖掘分析组件,使用关联规则Apriori算法对选取的ADR数据进行挖掘分析。
1.3 数据预处理
研究的数据属性及其数据处理见表1。对形成的数据集进行预处理与数据探索分析,包括探索各个字段的分布状况、规约冗余属性、识别上报数据的缺失值,并对缺失值进行处理,根据建模的需要进行数据变换,得到标准化处理数据。
表1 原始属性表
1.4 方法
1.4.1 关联规则的定义 关联规则[5]主要反映了事物之间的关联性,对反映同一事物的一条记录而言,若其具有特征属性A的同时,也具有特征属性B,则称特征属性A和B是关联的,即A→B。本研究的目的就是通过这种关联挖掘分析,提出有价值的发生ADR相关属性间的相互关系。这种关联性仅表现为“共生现象”,即两者同时存在,但并不一定表现两者之间必然存在前后因果的关系。
1.4.2 关联规则的判定指标 通过数据挖掘得到的关联规则也要进行验证,可通过支持度和置信度作判断。支持度表达了某一关联规则在总体中发生的概率,是关联规则重要性的定性度量。置信度表达了构成关联规则的一个特征属性A发生时,另一个特征属性B的发生概率,反映了这两个特征属性之间关联的强度。关联规则时支持度和置信度分别满足用户给定阈值的规则。支持度阈值是指用户指定的支持度的上下限。最小支持度是用户或专家定义的衡量支持度的一个阈值,表示项集在统计意义上的最低重要性;最小置信度是用户或专家定义的衡量置信度的一个阈值,表示关联规则的最低可靠性,同时满足最低支持度阈值和最小置信度阈值的规则称为强规则[6]。
2 结果
2.1 ADR属性连接强度网络图
在创建关联规则模型节点之前,为了更直观地看到ADR相关属性之间的关联程度,将“网络”节点加入到流中,构建“ADR属性连接强度网络图”,见图1。
图1 ADR属性连接强度网络
网状图中,线的粗细和深浅代表联系的强弱,其中强链接有51条。可以直观地看到发生ADR累及组织器官与过敏史、原患疾病、年龄、合并用药、用药时间的联系程度比较强。由图1可以得知,ADR累及组织器官为皮肤及附件损害与过敏史、原患疾病、用药时间、合并用药、性别几个属性关联性较强;ADR累及组织器官为全身性损害则与年龄、原患疾病、过敏史、合并用药有较强关联性;发生循环系统损害的强关联属性主要是过敏史、原患疾病、合并用药。
2.2 关联规则Apriori分析
用关联规则Apriori算法对建模数据进行挖掘,经过多次调整并结合实际应用分析,选取建模的输入参数为:最低支持度为10%、最低置信度为30%,设定“ADR累及组织器官”为输出项,其他项为输入项,得到121条规则,见图2。
图2 Apriori算法所形成的模型和部分关联规则
结合临床实际,对得出的规则进行评价,筛选出符合实际情况、有临床参考意义的规则,列举其中10条规则解读如下。
规则1:原患疾病=D3,过敏史=C2,用药时间=G1→ADR累及组织器官=H1,即当患者原患有呼吸系统疾病、无过敏史、用药时间为当次用时,有68.85%的概率会发生累及皮肤及附件损害的ADR。
规则2:年龄=B12,合并用药=E2→ADR累及组织器官=H2,即当患者年龄≥80岁、合并应用其他静脉注射剂时,有67.68%的概率会发生累及全身性损害的ADR。
规则3:原患疾病=D4 ,性别=A2 ,合并用药=E2→ADR累及组织器官=H5,即当患者原患心血管系统疾病,女性,合并应用其他静脉注射剂时,有35.48%的概率会发生累及循环系统损害的ADR。
规则4:年龄=B11,过敏史=C2→ADR累及组织器官=H2,即当患者年龄处于70~79岁,无过敏史时,有60.51%的概率会发生累及全身性损害的ADR。
规则5:年龄=B11,用药时间=G1→ADR累及组织器官=H2,即当患者年龄处于70~79岁,用药时间为当次用,有63.82%的概率会发生累及全身性损害的ADR。
规则6:年龄= B9,原患疾病=D5,过敏史=C1→ADR累及组织器官=H2,即当患者年龄50~59岁,原患神经系统疾病,有过敏史时,有53.82%的概率会发生累及全身性损害的ADR。
规则7:年龄 =B11,合并用药=E2→ADR累及组织器官=H2,即当患者年龄70~79岁,合并应用其他静脉注射剂时,有63.35%的概率会发生累及全身性损害的ADR。
规则8:年龄=B8,原患疾病=D2,合并用药=E2→ADR累及组织器官=H5,即当患者年龄处于40~49岁,原患疾病为内分泌系统疾病,合并应用其他静脉注射剂时,有42.68%的概率会发生累及循环系统损害的ADR。
规则9:年龄=B9,性别=A2,合并用药=E2,用药时间=G1→ADR累及组织器官=H6,即当患者年龄50~59岁,女性,合并应用其他静脉注射剂,用药时间为当次使用时,有40.13%的概率会发生累及消化系统损害的ADR。
规则10:原患疾病=D5 ,合并用药=E2→ADR累及组织器官=H2,即当患者原患有神经系统疾病,合并应用其他静脉注射剂时,有55.26%的概率会发生累及全身性损害的ADR。
3 讨论
本研究将发生ADR累及的组织器官分别与患者的性别、年龄、过敏史、原患疾病、合并用药、给药途径、用药时间进行关联分析,得出以下结论:ADR累及组织器官与过敏史、原患疾病和合并用药的联系程度比较强。有过敏史和合并用药的患者发生ADR的概率较高,原患疾病为心血管系统、神经系统疾病发生ADR累及的组织器官主要为全身性损害,而原患呼吸系统疾病的患者发生ADR主要为皮肤及附件损害。发生ADR累及皮肤及附件损害的除了与过敏史、原患疾病、合并用药几因素关联较强外,还与用药时间(当次用)和性别(女性)关联较强,而发生全身性损害的关联因素中,年龄也是一个强关联因素,年龄>70岁的患者基础疾病较多,发生不良反应的程度较为严重,主要涉及到全身性损害。
数据挖掘研究在中药注射剂不良反应分析中有一定的优势,但它的准确性受多种因素的影响,首先,数据挖掘是基于大样本统计规律的,需要大量样本数据的支持,由于受到数据量的限制,所得的结论难免存在片面和不完整;其次, ADR报告系统固有的局限性,如报告不完整、不准确、随意性等问题也会影响到分析结果;再次,数据挖掘的结果要与专业知识相结合才能对其做出正确判断。它不能充分考虑到患者的临床信息,其测定的是不良反应数据库中报告的观察到的药物与不良反应之间的相关性,必须要有详尽的临床病例随访和其他的调查,来验证数据挖掘得出的假设。随着ADR制度的完善与健全,记录的数据量和完整性不断增加,有效性不断增强,所得分析结果也将会更加全面可信,对临床合理用药将起到重要的指导作用。
[1]Ji K,Chen J,Li M,et al.Comments on serious anaphylaxis caused by nine Chinese herbal unjections used to treat common colds and upper respiratory tract infections[J]. Regul Toxicol Pharmacol,2009,55(2):134-138.
[2]国家食品药品监督管理总局.国家药品不良反应监测年度报告(2014年)[J].中国药物评价,2015,32(4):252-256.
[3]王大猷.药物警戒信号检测的新工具——不相称性测定技术[J].中国处方药,2007,6(1):50-53.
[4]Almenoff J,Tonning JM,Gould AL,et al.Perspectives on the use of data minging in pharmacovigilance[J].Drug Safety,2005,28(11):981-1007.
[5]丁福蕾.Apriori关联规则挖掘算法的设计与分析[J].工程技术(引文版),2016,6(6):121-122.
[6]Tan pang-Ning,Steinbach M,Kumar V.范明,范宏建,译.数据挖掘导论[M].北京:人民邮电出版社,2012:201-257.
本文编辑:苏日力嘎
Analysis of Adverse Drug Reaction of Traditional Chinese Medicine Injection Based on Apriori Association Rule
Liang Ping1,2, Chen Yan-fen1
(1.School of Traditional Chinese Medicine, Guangdong Pharmaceutical University, Guangdong Guangzhou 510006, China; 2. Yangjiang Hospital of Traditional Chinese Medicine, Guangdong Yangjiang 529500, China)
Objective:To explore the association of adverse drug reaction (ADR) of traditional Chinese medicine (TCM) injection with the age, gender, allergic history, original disease of patients as well as combined medication, time for medication, administration route and other related factors, so as to provide a reference for the rational use of TCM in clinic. Methods:The reported ADRs caused by TCM in Yangjiang City, Guangdong Province from 2012 to 2016 were analyzed by Apriori association rules algorithm in data mining technology, with support and confidence as a measure of the strength of the association rules. Results:The ADR involvement of tissues and organs was significantly associated with the allergic history, primary disease and combined medication. The probability of ADRs in patients with allergic history and combined medication was relatively high. The ADRs in patients with original diseases in cardiovascular or nervous system were mainly involved in systemic lesion. However, the ADRs in patients with respiratory diseases were mainly involved in the lesion of skin and appendages. The ADRs in patients at ages of more than 70 years were mainly involved in systemic lesion. Conclusion:By using association rule algorithm, the rule of ADRs of TCM injection may be analyzed effectively, which provides an effective reference for further analysis of the occurrence of ADR.
Traditional Chinese Medicine Injection; Adverse Drug Reaction (ADR); Aassociation Rule
TP311.13
A
10.3969/j.issn.2096-3327.2017.04.017
2017-02-24
梁平,女,研究生,主管中药师。研究方向:临床中药学。E-mail:liangping7342@163.com
陈艳芬,女,博士,教授。研究方向:中药药理。E-mail:xwnai@163.com