关联规则数据挖掘技术在儿童肺炎用药选择的应用
2014-01-25
昆明市官渡区妇幼保健中心,云南 昆明 650000
关联规则数据挖掘技术在儿童肺炎用药选择的应用
李学
昆明市官渡区妇幼保健中心,云南 昆明 650000
目的分析儿童肺炎药物使用频次,为合理用药提供临床依据。方法利用关联规则挖掘的经典 Apriori 算法对儿童肺炎用药数据中药物治疗效果进行了数据挖掘及分析研究。结果通过数据挖掘可以发现儿童肺炎联合用药有价值的规则4条。结论通过数据挖掘可为临床医师在儿童肺炎治疗药物选择上提供参考。
数据挖掘;关联规则;儿童肺炎
肺炎是一种实质性炎症,可由多种病原体引起,儿童体质弱,免疫力低下,感染肺炎几率较大。目前主要治疗方法是抗感染治疗、对症和支持治疗。由于儿童肺炎病原体种类多,临床症状表现复杂,临床上治疗标准不统一,药物滥用,不合理用药广泛存在,给患者经济损失及身体损害。
1 资料与方法
1.1 一般资料 数据来源:医院儿童治疗数据中提取诊断为肺炎的儿童诊断记录,2011年4月至2012年7月儿科门诊数据,12195条。
1.2 方法 将儿童肺炎治疗药物确定为挖掘对象,按照药物治疗效果分类,统计药物使用频次,选用关联规则挖掘中的Apriori 算法分析研究药物治疗效果[1-2]。利用关联规则挖掘进行分析,将儿童肺炎用药的8类常用药物作为挖掘对象(A头孢菌素类、B青霉素类、F抗过敏类、G抗病毒类、C大环内酯类、H镇咳类、D解热类、E化痰类)。将文本数据转换weka数据挖掘软件可应用的数据模式,yes表示使用了该类药物,no表示未使用该类药物。应用weka挖掘软件Apriori 算法进行挖掘[3-4]。本研究选用Weka挖掘软件,Weka全名为怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一个基于java、用于数据挖掘和知识发现的开源产品 。Weka是现今最完备的数据挖掘工具之一,而且被公认为是最著名的数据挖掘开源产品[5]。
2 结果
设置minsupport=55%,minconfidence=80%,设置关联规则,然后点继续挖掘。Best rules found:
1. A=no 158 ==> B=yes 154 conf:(0.98)
2. F=no 211 ==> G=no 202 conf:(0.96)
3. C=no F=no 176 ==> G=no 168 conf:(0.95)
4. D=no 185 ==> G=no 167 conf:(0.9)
5. H=no 178 ==> G=no 160 conf:(0.9)
6. B=yes 206 ==> G=no 185 conf:(0.9)
7. E=yes 176 ==> G=no 158 conf:(0.9)
8. C=no 232 ==> G=no 204 conf:(0.88)
9. F=no 211 ==> C=no 176 conf:(0.83)
10. F=no G=no 202 ==> C=no 168 conf:(0.83)
结果说明:①如果头孢菌素药未使用,那么使用青霉素类药物的置信度为98%;②未使用抗过敏药,那么不使用抗病毒药的置信度为96%;③未使用大环内脂药,未使用抗过敏药,那么不使用抗病毒药的置信度为95%;④未使用解热类药,那么不使用抗病毒药的置信度为90%; ⑤未使用镇咳药,那么不使用抗病毒药的置信度为90%;⑥使用青霉素类药物,那么不使用抗病毒药的置信度为90%;⑦使用了化痰药,那么不使用抗病毒药的置信度为90%;⑧不使用未使用大环内脂药,那么不使用抗病毒药的置信度为88%;⑨未使用抗过敏药,不使用未使用大环内脂药的置信度为83%;⑩未使用抗过敏药,同时未使用抗病毒药,那么不使用未使用大环内脂药的置信度为83%。
3 讨论
规则1表明:头孢菌素和青霉素类药物使用广泛,临床工作中如果头孢菌素药未使用,那么使用青霉素类药物的置信度为98%,表明临床上治疗儿童肺炎对头孢菌素和青霉素具有较高依赖,同时提示,在儿童肺炎治疗中头孢菌素类和青霉素类一般不联合应用。
规则2表明:未使用抗过敏药,那么不使用抗病毒药的置信度为96%;抗过敏药主要用上上呼吸道病毒引起的流清浓鼻涕、病毒疹等过敏反应,常常和抗病毒药合用,临床上儿童肺炎多为细菌或支原体感染引起,因而抗病毒药和抗过敏使用较少。
规则3表明:在儿童肺炎治疗中大环内酯类药物使用较少,由于大环内酯类药物相对头孢菌素类和青霉素类药副作用大,且抗菌谱主要针对衣原体和支原体感染,大环内酯类药为广谱抑菌类药物,与青霉素和头孢菌素类杀菌药和用,降低青霉素和头孢菌素类的杀菌作用,临床上不作为治疗儿童肺炎首选药。
规则6表明:使用青霉素类药物,那么不使用抗病毒药的置信度为90%,表明抗菌药与抗病毒药在肺炎中很少联合应用。
本研究利用关联规则挖掘分析了儿童肺炎感染常用药物间的关系,得出了儿童肺炎治疗药物间的关联规则。如:头孢菌素类和青霉素类药物在治疗儿童肺炎时不联合使用;肺炎治疗常选择抗生素,而不同时选择抗病毒药;化痰药和镇咳药一般不联合应用等关联规则。
4 结论
通过挖掘发现儿童肺炎联合用药间的规则,可为临床医师在儿童肺炎治疗药物选择上提供参考。该方法不仅可以作为儿童肺炎治疗药物分析,还可应用其他疾病治疗药物分析,其结果对提高医师合理用药,科学制定治疗方案具有积极意义。
[1] 徐刚.数据挖掘及其在医学领域中的应用和展望[J].实用临床医学,2006.7(11):119.
[2] 王寅同.医学数据挖掘过程的研究[J].软件工程师,2011(8):54-57.
[3] 冯宏亮.数据挖掘中若干关键算法的研究. 西安科技大学硕士论文[D],2010:13-14
[4] 许娅.最简有效关联规则及其挖掘算法[J].电脑与信息技术,2009(5):24-27.
[5] 程苗.关联分析在数据挖掘中的应用[J].激光杂志,2007(28):13.
R725.6
A
1007-8517(2014)08-0076-01
2014.02.18)