采用Apriori算法挖掘分析某医院多西他赛不良反应数据*
2022-06-01王梦丹刘欢郭芷汛李刚
王梦丹,刘欢,郭芷汛,李刚
(1.电子科技大学医学院,成都 610054;2.四川省交通运输厅公路局医院医务部,成都 611731;3.四川省肿瘤医院·研究所,四川省癌症防治中心,电子科技大学医学院GCP中心,成都 610041;4.四川省医学科学院·四川省人民医院药学部,成都 610072 )
多西他赛是M期周期特异性的细胞毒性抗肿瘤药物,为半合成紫杉烷类类似物,其作用机制与紫杉醇相同。2020年中国临床肿瘤学会(CSCO)的各类肿瘤诊治指南推荐多西他赛用于乳腺癌、非小细胞肺癌、胃癌和前列腺癌的全身治疗[1-4]。多西他赛的常见药品不良反应(ADR)有骨髓抑制、胃肠道反应、变态反应、神经毒性等[5]。由于个体差异、联用药物等因素,不同个体使用多西他赛进行化学治疗(化疗)发生ADR的时间、类型、严重程度都不尽相同。如何避免与降低ADR的发生是患者进行化疗亟待解决的问题。既往关于多西他赛ADR分析研究样本量少,多采用传统统计学分析方法,对ADR发生的潜在规律挖掘不够深入。笔者在本文中将使用四川省肿瘤医院2012年1月1日—2018年12月31日上报至国家药品不良反应监测系统的病例数据,采用数据挖掘中关联规则分析方法对多西他赛ADR发生情况进行分析,挖掘数据间隐藏的关系,总结多西他赛ADR发生规律,为临床合理用药、降低ADR发生率提供参考。
1 资料与方法
1.1资料来源 资料来源于四川省肿瘤医院2012年1月1日—2018年12月31日上报至国家药品不良反应监测系统,使用多西他赛的ADR报告。收集到多西他赛ADR报告共226例。
1.2纳入排除标准 去除重要信息缺失的病例,按照国家药品不良反应中心ADR评价标准[6],纳入符合ADR判断标准的多西他赛不良反应病例,最终纳入研究的报告共225例。
1.3研究方法
1.3.1描述性方法 将纳入研究的225例报告采用回顾性分析方法,对患者的性别、年龄、原患疾病、化疗方案、ADR发生时间、ADR累及器官或系统以及主要临床表现等数据进行统计分析,同时对患者发生ADR进行关联性评价。ADR因果关系关联性判定根据国家药品不良反应中心ADR评价标准进行评价[6],将患者发生的ADR事件判定为肯定、很可能、可能、可能无关、待评价、无法评价6个等级。
1.3.2基于Apriori算法的关联规则分析方法 Apriori算法是经典的挖掘频繁项集和关联规则的数据挖掘算法,通过限制候选产生发现频繁项集,由频繁项集产生关联规则[7]。Apriori算法步骤如下。①寻找频繁项集:此过程是一个不断迭代的过程,每次迭代都包含两个步骤,第一,产生候选集Ck,所谓候选集,就是有可能成为频繁项集的项目集合;第二,基于候选集Ck,计算支持度并确定频繁项集Lk。②依据频繁项集产生简单关联规则:选择置信度大于用户指定最小置信度阈值的关联规则,组成有效规则集合。对每个频繁项集L,计算L所有非空子集L'的置信度,
如果用户CL'→(L-L')大于用户指定的最小置信度阈值,则生成关联规则L'→(L-L')。
本研究对收集到的数据进行分类、清洗,整理成Excel表格,使用数据挖掘平台SPSS modeler18.0中[建模]选项卡[Apriori]进行数据分析,以患者年龄、原患疾病、联用化疗药物情况、ADR发生时间为规则前项,ADR报告的严重程度、ADR类别、转归情况为规则后项。设置最低条件支持度为10.0%,最小规则置信度为85.0%,最大前项数为5,Apriori计算结果以置信度降序排列,输出结果使用图形中的网络输出网状图。流程图见图1。
图1 基于Apriori算法关联规则数据流流程图
2 结果
2.1描述性研究结果
2.1.1患者基本情况 在225例发生ADR的患者中,男38例,女187例,男女比例为1:4.9。41~50岁发生ADR的人数最多,共97例,占43.11%。见表1。
表1 患者不同性别和年龄段的分布情况
2.1.2患者原患疾病分布情况 在所有发生ADR的患者中,原患疾病为乳腺恶性肿瘤排名第一,其次为宫颈恶性肿瘤、肺癌、鼻咽癌等。见表2。
2.1.3化疗方案分布情况 从发生ADR患者中分析其化疗方案分布情况,其中单独使用多西他赛化疗148例,联用铂类抗肿瘤药物60例,联用表柔比星15例,联用卡培他滨1例,联合两种抗肿瘤药物1例。见表3。
表2 患者原患疾病分布情况
表3 化疗方案分布情况
2.1.4ADR发生时间分布情况 ADR发生时间参照国家不良反应监测报告中患者ADR发生的过程描述以及化疗周期与ADR发生事件的相关性进行划分。同一患者在同一治疗过程中在一定的时间节点,发生多种ADR事件。225例患者中,发生ADR事件238例次,其中142例次ADR事件发生在2~10 d内,占59.49%,其次有35例次ADR事件发生在用药后1~24 h内,占比14.77%。见表4。
2.1.5ADR累及器官或系统及主要临床表现 按照ADR累及器官或系统,发生ADR事件238例次。其中血液系统损害137例次,占57.56%,其次为胃肠系统损害、全身性损害。见表5。
2.1.6ADR因果关系评价、ADR严重程度及临床转归情况 225例ADR中,肯定1例,很可能177例,可能46例,可能无关1例。新的ADR 3例,严重ADR 46例,所有发生ADR患者,对其进行停药减量、对症处理等相关措施,痊愈111例,好转114例,无死亡病例。
表4 多西他赛ADR发生时间分布情况
表5 ADR累及器官或系统的分布情况
2.2关联分析结果
2.2.1Apriori算法关联规则结果 使用建模选项卡中Apriori算法进行计算,按照设定限制进行计算,Apriori计算结果以置信度降序排列,结果见表6。
2.2.2Apriori关联规则网络图 Apriori算法关联规则的计算结果采用网状图来展现,见图2。由网状图得知:联用化疗药物=无→ADR报告严重程度=一般,为强关联规则,关联数为128;ADR发生时间=2~10 d→ADR类别=血液系统损害,关联数为121。
3 讨论
3.1描述性统计结果 在纳入的225例ADR中,因果关系评价肯定、很可能比例达到79.11%,可能比例为20.44%。被判定为肯定、很可能、可能的患者,基本认定ADR的发生与多西他赛应用存在一定的时间关系,因此数据能够很好用于此次分析研究。收集到发生ADR的患者中,多西他赛用于治疗女性恶性肿瘤的比例超过70%,因此男性患者较少,女性患者较多。分析发生ADR患者的年龄发现,41~50岁、51~60岁、61~70岁年龄段患者发生ADR构成比较高,而<40岁患者构成比较低,考虑ADR的发生与年龄存在一定的关系,与中老年患者生理机能下降、常伴有其他并发症有关。而>70岁患者ADR发生构成比较低,可能是由于研究样本数量较少所致。对于41~50岁、51~60岁、61~70岁年龄段构成比高的患者,也考虑可能与此研究样本中将多西他赛用于原患疾病为乳腺癌、宫颈癌有关,可能与乳腺癌、宫颈癌发病年龄流行病学特点有关。ADR累及的系统中,血液系统损害占最大的比例,陈卓等[8]报道,多西他赛血液学毒性呈现出剂量依赖性,随着多西他赛剂量的增加,骨髓抑制程度加重。因此,骨髓抑制是多西他赛的剂量限制性毒性。在临床应用过程中,应规范使用多西他赛,严格掌握用法用量,有条件者可进行血药浓度监测。应密切监测患者血液学毒性,一旦发生与血液学相关的ADR,应密切关注,并采取相应的措施,如减量、停药、良好的护理措施、必要时使用粒细胞集落刺激因子来应对ADR所导致的不良后果。
表6 Apriori算法关联规则结果
图2 Apriori算法关联规则网络图
在出现ADR的患者中,除单药使用多西他赛进行化疗外,有较大比例患者联用顺铂、卡铂、洛铂等铂类药物进行。国内外文献报道[9-12],多西他赛与铂类抗肿瘤药物联用可能提高ADR发生率及严重程度。在联合用药前应对患者基础情况进行风险评估,联用过程中应加强对患者不良反应的监测,出现ADR应及时处理。
3.2关联规则网络图 联用化疗药物=无→ADR报告严重程度=一般关联性最强,提示患者不联用其他化疗药物,单独使用多西他赛化疗时,出现ADR的严重程度评价为一般。不同种类化疗药物可能会导致相似类型、不同严重程度的ADR,因此多西他赛与其他化疗药物联用可能会增强不良反应的严重程度。临床应用中,联合使用应有循证医学证据,联用剂量应参照相应的标准,不得超过循证医学、说明书所推荐的剂量范围。使用过程中,对患者ADR进行严密监测,并采取相应的应对措施。
ADR发生时间=2~10 d→ADR类别=血液系统损害为强链接,提示ADR发生时间为2~10 d,其ADR类别为血液系统损害,这与多西他赛血液系统损害发生时间一致。多西他赛所导致的骨髓抑制是以中性粒细胞减少为主,中性粒细胞减少一般在用药后7 d处于最低点[5]。
3.3Apriori关联规则计算结果 Apriori关联规则结果中,筛选出强规则11条。前项联用化疗药物=洛铂,后项ADR类别=血液系统损害,其置信度为100%,支持度为12.605%,提示本研究中当使用多西他赛联用洛铂化疗,100%患者发生血液系统损害;前项ADR发生时间=21~30 min,后项ADR类别=胃肠系统损害,置信度为96.15%,支持度10.924%,提示ADR发生时间为用药后21~30 min内,有96.154%患者发生胃肠系统损害相关的不良反应。支持度最高的规则为:前项ADR发生时间=2~10 d,ADR类别=血液系统损害,置信度为85.211%,支持度为59.664,提示ADR发生时间为用药后2~10 d,有85.211%患者发生血液系统损害相关的不良反应。通过以上关联规则分析,可以得出:用多西他赛化疗后21~30 min内,应对患者胃肠系统不良反应重点关注,一旦发生及时处理;在用药后2~10 d,应重点关注血液系统不良反应,警惕发生严重血液系统不良反应。对于“ADR发生时间=21~30 min和联用化疗药物=无” 与胃肠系统的损害关联性强于“ADR发生时间=21~30 min”这类关联规则表示:不联用其他化疗药物的胃肠道反应要更小一点,“ADR发生时间=21~30 min和联用化疗药物=无”这个规则,表示:不联用化疗药物。而针对“联用化疗药物=洛铂”与“转归=好转”这类问题,出现这种结果影响因素较多,比如样本量的多少,这种结果可以理解为在本次样本条件下,“联用化疗药物=洛铂”与“转归=好转”存在一定的关联,但对于指导临床并不存在一定的实际意义。主要原因也在于关联规则分析方法是判断一项规则与另一项规则之间的关联性,可以用前项规则来推测后一项规则发生的可能性,但不一定代表两者间具有一定的因果关系。
综上所述,基于数据挖掘的关联规则分析方法能够在冗杂繁多的ADR报告中对患者基本情况、疾病状况、用药情况、ADR处理过程、转归情况等进行关联分析,得到ADR信息之间的相互关系,总结出ADR发生的规律,为医护人员、患者提前预判ADR的发生提供一定的参考。Apriori算法优点是适合稀疏数据集。不良反应数据稀疏,选用Apriori算法对ADR数据分析具有很多优点。然而数据挖掘关联分析结果会受到多种因素的影响,在本研究中,收集的样本数量较少,可能得出的关联规则结果较为片面或存在一定的偏倚;同时,由于样本数据缺乏患者体表面积信息,无法对患者用药剂量进行准确地判断,无法得到药物剂量与ADR情况之间的直接关联情况,因此关联结果不够全面。本研究中缺乏使用多西他赛化疗的病例总数,无法计算ADR的发生率。在今后的工作中,临床医生与药师要加强ADR监测、上报,尽可能全面收集患者的信息,从而有助于ADR关联性评价,提高数据挖掘对ADR风险监测的准确率。随着电子病历数据与ADR报告系统数据的快速膨胀,数据挖掘算法可以从海量数据中发现隐含和潜在的关系,为临床合理制定用药决策、降低ADR发生率提供参考依据,从而保障患者的用药安全。