一种基于SPSS Clementine关联规则分析联合用药规律的方法
2020-01-03沈陈军朱文芳
王 勇,沈陈军,朱文芳
0 引言
榄香烯是从中药姜科植物温郁金(温莪术)的根茎中提取的,具有抗癌作用的活性有效成分,其制剂榄香烯注射液广泛用于临床,对多种癌症具有明显的抗肿瘤作用[1]。目前,中药联合用药信息关联分析已有报道[2-4],但对于如何使用SPSS Clementine软件分析榄香烯注射液合并用药规律等方面无相关文献报道。为进一步挖掘临床肿瘤患者使用榄香烯注射液联合用药的特征以及SPSS Clementine软件使用方法,本研究通过SPSS Clementine软件并利用关联规则方法对我院肿瘤住院患者榄香烯注射液的联合用药情况进行分析[5],并逐一介绍该软件进行Apriori算法及关联规则进行关联性分析的方法步骤,从而为发现联合用药规律、挖掘新方法和临床合理使用榄香烯注射液提供参考。
1 资料与方法
1.1 研究对象 收集2016年1月1日至2018年12月31日在我院住院使用榄香烯注射液的所有肿瘤患者病例。通过东华医院信息管理系统、嘉禾电子病历管理系统、美康临床药学管理系统等收集患者使用榄香烯注射液及联合用药信息。
1.2 纳入及排除标准 肿瘤患者合并用药为使用榄香烯注射液期间使用的全部用药,并不是该患者住院期间使用的全部药品。为便于统计,将所有纳入合并用药信息统一标准,即将相同化学成分但剂型不同的药品分为一种药物,以上合并用药信息统计均为标准化后的信息,所有列出药品均为药物名称,无剂型等其他信息。
1.3 统计分析 采用Excel 2003对上述收集的信息进行登记,对每位患者用药信息进行逐一标记,如使用某一种药物标记T,未使用标记F,关联性分析使用SPSS Clementine 12.0软件,建立Apriori模型节点分析,并网络图形化各合并用药药品的关联性情况,关联规则分析及相关统计设置最小支持度为10.0%,最小置信度为60.0%,提升度>1。
1.4 SPSS Clementine 12.0软件操作步骤 下载安装SPSS Clementine 12.0软件,使用SPSS Clementine 12.0软件进行关联规则分析的方法主要有6个步骤:①数据源准备及导入:将Excel 2003收集到的全部患者用药信息进行标记,选择“源”选项卡中“Excel”节点并拖入数据流,双击后添加文件从而导入数据源信息,见图1~图3;②查看及检验数据源导入情况:选择“输出”选项卡中的“表”节点并双击,然后点击“执行”按钮,可以查看数据源导入情况,见图4、图5;③清洗数据源:选择“字段选项”选项卡中的“类型”节点,将数据源与类型节点连接后并双击,然后点击“读取值”按钮,设置字段类型,姓名类型为“集”,其他类型为标志,方向为“两者”,最后点击确定,见图6;④建模,选择算法进行关联规则分析:选择“建模”选项卡中的“Apriori”节点并双击,连接类型与Apriori节点后,再双击Apriori节点,弹出选项界面,单击“执行”按钮,见图7;⑤查看数据挖掘结果:界面右侧管理器界面选择“模型”选项卡,双击“22字段”模型图标,在流区域查看22字段图标并双击,查看结果,见图8、图9;⑥建立网络关联图:选择“图形”选项卡中的“网络”节点并双击,连接类型与网络节点后,再双击网络节点,弹出选项界面选择全部字段,勾选“仅显示真值标志”,单击“执行”按钮,见图10、图11。
图1 准备数据源信息
图2 选择数据源导入表节点
图3 导入数据源表信息
图4 查看数据源信息
图5 查看执行导入数据源信息
图6 数据清洗设置字段类型与方向
图7 使用Apriori算法构建关联规则模型
图8 执行输出关联规则结果
图9 查看数据挖掘结果
图10 构建网络关联规则模型
图11 查看网络关联模型图
2 结果
2.1 肿瘤患者使用榄香烯注射液合并用药支持度 952例肿瘤住院患者在使用榄香烯注射液时最常用的药品是地塞米松,频率为47.4%,使用频率≥20%的药品依次为氯化钾、泮托拉唑、甲氧氯普胺以及维生素C。具体合并使用情况按支持度排序见表1。
表1 榄香烯注射液合并使用药品支持度情况
2.2 肿瘤患者榄香烯注射液合并用药关联分析 对952 例肿瘤住院患者使用榄香烯注射液合并用药品种进行关联性规则分析,发现合并最常见的2种药品组合为地塞米松+氯化钾,其次为地塞米松+泮托拉唑、维生素B6+维生素C。合并最常见的3种药品组合为氯化钾+维生素B6+维生素C,其次为地塞米松+维生素B6+维生素C、地塞米松+维生素C+氯化钾,合并最常见的4种药品组合为地塞米松+氯化钾+维生素B6+维生素C。见表2~表4。
表2 榄香烯注射液合并使用2种药品关联分析
表3 榄香烯注射液合并使用3种药品关联分析
表4 榄香烯注射液合并使用4种药品关联分析
2.3 肿瘤患者榄香烯注射液合并用药网络关联分析 对常用的前5位药品、前10位药品及全部常用药品进行关联分析,所得关联网络图,其中线段越粗表示关系越密切,表示该药物同时出现的可能性越大,即联用的可能性越大。见图12~图14。
图12 榄香烯注射液合并用药支持度前5位药品网络关联图
图13 榄香烯注射液合并用药支持度前10位药品网络关联图
图14 榄香烯注射液合并多种用药网络关联图
3 讨论
3.1 肿瘤患者使用榄香烯注射液常见联合用药情况 目前,β-榄香烯相关的药理研究较多,其对多种实体肿瘤及转移瘤白血病等具有明显的抗肿瘤作用[6-8],同时,对多种恶性肿瘤导致的胸腹腔积液有较好疗效[9]。分析结果发现,榄香烯注射液与地塞米松、氯化钾、维生素C、维生素B6以及泮托拉唑联用最为密切,符合一般肿瘤患者用药基本规律[10]。大部分肿瘤患者在放化疗期间会发生胃肠道反应,因此需要使用质子泵抑制剂、D2受体拮抗剂、5羟色胺受体拮抗剂和激素来预防或治疗化疗药物导致的胃肠道反应或其他不良反应[11]。美国国家综合癌症网络建议在激素、神经激肽受体拮抗剂和5羟色胺受体拮抗剂常规止吐方案不能控制的情况下加用奥氮平[12],对于腹泻或呕吐严重的患者需要给予一定的电解质及维生素营养药物补充。因此,在使用榄香烯注射液期间,合并使用上述药物的情况较多。榄香烯注射液患者联用化疗药物的情况并不常见,对以上所有患者的医嘱信息再次查询可以发现,大部分患者通常在放化疗前后合并使用榄香烯注射液,而不是同时联合使用。肿瘤患者治疗主要分为放化疗、外科手术以及对症支持治疗等。由于榄香烯注射液可增强放化疗的效果,所以放化疗与该药的联用情况减少,因此,在关联分析中,榄香烯注射液与化疗药物的合并使用并不密切,但并不影响该药物与放化疗对肿瘤患者在治疗期间的协同治疗作用[13-14]。
3.2 SPSS Clementine 12.0软件使用情况 该软件是SPSS公司旗下integral solutions用于处理各种类型不同数据的产品,目的是为企业解决多种商业问题,目前医药行业也通过该软件在医药管理、中医药研究、合理用药分析等方面挖掘数据之间的联系[15-16]。笔者检索数据库发现,关于该软件使用的文献报道较少,具体注意事项更少,在使用中需要注意的事项有:①数据源准备阶段可以使用Excel和文本文档,如果选择Excel表作为数据源表,应使用Excel 2003软件,其他版本不能识别。通常操作说明建议使用文本文档,但本研究发现,直接使用Excel软件导入数据源会更加便捷,且前期很多统计数据使用Excel软件,省去了将Excel数据转换为文本文档的过程。②SPSS Clementine 12.0软件关联算法模型有Apriori法、GRI法、序列法和Carma法等,简单关联规则分析中主要使用Apriori法和GRI法。其中Apriori法只能处理分类型变量,无法处理数值型变量,数据可以按事务表和事实表存储,而GRI法中数据前项则可以为分类型或数值型,且数据存储只能为事实表方式。数据资料类型直接决定统计分析方法的选择,联合用药数据一般多为分类变量资料。本研究数据全为分类变量资料,且分析某一单一事件连带另一事件发生的情况使用Apriori法较为适用。③Apriori算法构建关联规则模型时,通过设定不同的最低条件支持度、最小置信度和最大前项数,可以得出不同条件下的数据关联结果信息。支持度和置信度是关联规则中主要的有效性测量指标,其中支持度是关联规则普遍性的指标,表示事务A和事务B同时发生的概率。置信度是关联规则准确度的指标,表示包含事务A同时也包含事务B的概率。在理想的关联规则分析模型中规则支持度和规则置信度应该有一个较高的数据指标。④通常关联分析结果表列出2对结果,即支持度与置信度,在查看数据挖掘结果表中,通过显示和隐藏标准菜单键,对支持度、置信度、规则支持度和提升度进行显示和隐藏,同时,使用内容排序功能,对上述内容进行升序或降序排列。⑤网络关联模型图可实现快速形象地找出各事务之间的关联情况及相互关系。构建网络关联规则模型时勾选仅显示真值标志,可以在网络关联模型图中直接查看各事务之间的相互关系,各事务之间置信度越高,线段则越粗,表示二者关系越密切。
3.3 关联规则分析在用药规律研究中的运用 SPSS Clementine软件具有强大的数据转换和处理功能且界面操作简单,不需要额外数据编程的分析工具,集成了贝叶斯网络分析法、决策树分析以及支持向量机法等,是挖掘中医药学数据规律中的重要技术。通过特定模型算法,可以发掘大量数据中重要且有意义的关联关系和规律[17]。
3.3.1 在用药配伍规律的挖掘中发现名老中医经验和精髓用药规律 洪倩[18]利用Clementine关联规则分析陈纪藩风湿关节炎治疗用药的规律,以渗湿利水、补虚、除湿祛风以及活血化瘀等治疗处方为特点。
3.3.2 辨证论治在中医症状与中药用药规律分析中 蒋文星[19]利用Clementine软件对症状与中药用药之间进行关联规则分析,发现多囊卵巢综合征的肾虚、血瘀、脾虚等病因与中药常用组对为红花与桃仁、柴胡与栀子、陈皮与半夏。
3.3.3 以病类方用药规律分析中药方剂的治疗规律 文玉敏等[20]对早期糖尿病肾病的中药方剂治疗进行关联性分析,发现生黄芪、丹参、生地黄、山药、川芎及山茱萸存在强关联性。
3.3.4 古代中医药文献关联分析方剂组用药规律 钱冬晨等[21]利用Clementine关联规则对138篇中医药文献分析发现,在治疗筋断外敷中主要采用活血行气、止血补血、止痛续筋等方,具体中药有当归、川芎、骨碎补等12味。宋亚南等[22]对《儒门事亲》中全部方剂进行关联规则分析发现,脾胃补益用药在中药使用频率和方剂配伍占有主要地位。中药类目和性味功效研究中,杨雪梅等[23-24]对《中华本草》在中药功效及五脏归经方面进行Clementine关联规则分析,得出甘、辛、苦与功效之间具有密切联系,并在五脏归经方面得到32条关联规则,为临床用药和中药资源开发提供了线索。由此可见,SPSS Clementine软件在中医药数据挖掘中有了广泛应用。
3.4 本研究的不足与展望 中西药联用治疗有较强的优势,但也会导致不良反应,影响临床疗效[25-26]。中药注射剂适应证的选择、用法用量、配液时间以及联合用药是中药注射剂不良反应的独立危险因素[27]。与其他药物联合应用时可能会发生一系列物理化学反应导致不良反应的发生[28]。榄香烯注射液中含有β、γ、δ结构成分,对β榄香烯研究较多,但其他对映体药理、药效及药动等研究不足,加之临床使用时联用多种药物,其安全性及有效性需要进一步评估。为此在深入挖掘榄香烯注射液联合用药特征的同时进一步评估其联合用药的合理性、安全性和有效性也尤为重要。
本研究为回顾性数据分析,且样本量较小,研究目标字段较单一,其结果可能会有一定偏倚,还需要进一步开展大样本且合理的前瞻性研究,进一步挖掘和评估榄香烯联合用药特征,为临床合理用药提供参考。
SPSS Clementine 12.0软件总体使用容易且直观,利用流节点形式将数据处理简单化,同时在数据预处理和转换等方面为广大使用者提供了十分灵活与丰富的算法和数据挖掘模型。作为最基本、最核心的简单规则算法,Apriori法已在医药数据挖掘方面发挥极其重要的作用。然而,本软件在关联规则数据挖掘中也存在不足,例如,首先数据源的质量无法保证,质量较差的数据源可能在关联分析中导致大量无效甚至错误的规则,从而使得到的结果并不可信[29]。其次,关联规则模型设置时对支持度、置信度等参数的设置无有效权威的依据,多数研究对这些参数的设置依据个人经验[30]。最后,在SPSS Clementine 12.0软件使用方面,如何建立一套有效的数据源评价体系和模型参数设定依据还需要不断的完善。