数据挖掘技术在类风湿关节炎中医诊疗研究中的应用进展*
2021-03-27尚存芸李延萍
尚存芸 李延萍 张 莹
类风湿关节炎(Rheumatoid arthritis,RA)以滑膜炎为基本病理改变,临床以侵蚀性、对称性多关节肿痛为主要表现,可出现心、肺等系统受累,晚期导致关节特征性改变和功能丧失,影响患者生活质量。中医药治疗可有效改善患者疼痛及并发症,减缓RA病情的进展,减少西药的不良作用。为此,临床上产生了大量有效的中医药数据,而数据挖掘技术可直观、高效地总结中医药辨证施治RA的规律。本文对中医诊疗RA应用数据挖掘技术的进展进行综述。
1 数据挖掘的概念
数据挖掘(Data Mining,DM),又称数据库中的知识发现(Knowledge Discovery in Database, KDD),指在含糊的、随机的、多样性的海量信息中快速准确地锁定有意义数据的过程;当数据表达模糊不清或数据概念模棱两可时,深入探究数据,阐明数据本质的过程;并对多种信息进行采集、整合、分析,从而得出数据之间关联的过程。数据挖掘用以处理模糊、不确定的数据表达,能以网络状态输出信息,优化全局问题,涉及了数据库、人工智能、机器学习、统计学等多个领域的理论和技术,常用关联规则等分析方法[1]。
数据挖掘首先需肯定所研究数据的积极意义,其次剔除基本无效的数据,避免数据过于庞大,高效地整合数据,最后通过计算机技术深入剖析数据潜在价值,从而获得有效信息或有意义的结论[2]。中医药为人类防治疾病做出了不可磨灭的贡献,在中医药各个领域引入数据挖掘技术,以更客观的新方法挖掘中医药潜在价值,形成系统的、综合的大数据应用平台,为中医药蓬勃发展带来新机遇[3]。
2 数据挖掘在RA中医诊疗的研究
中医医籍中记载有“尪痹”“痛风”“白虎历节”“风湿”等,均可属于RA的中医病名范畴。肝、肾、脾三脏亏虚,风、寒、湿、热邪外侵,致经络、肌肉、骨节痹阻,气机失调、血运不畅,而发本病。病程日久,可耗气伤血,导致痰瘀互结,虚实夹杂[4]。不论是病因、病机、病变过程等关于RA的中医基础理论,还是辨证、处方、用药、预后等关于RA的中医临床实践,DM技术均可在各方面进行研究。主要涵盖以下6个方面:①挖掘名老中医诊治RA临床用药规律,客观传承其学术思想,形成能指导临床实践的理论和方法;②研究各家诊疗RA的辨证规律,规范四诊诊疗,降低人为因素的主观影响;③归纳遣方用药规律,从用药频数、药症关系、最佳治疗剂量、药对配伍、药性等方面入手发现最佳药物配伍,经典处方原则,为临床疗效提高和新药新方研发奠定基础;④挖掘外治法治疗RA的价值,通过研究针灸取穴规律、中药外敷等,为临床治疗RA缩短起效时间、缓解症状给予新方法;⑤将传统中药与药理学联合,为中成药研制带来新的机遇;⑥中医古籍是传承中医的重要载体,通过DM技术探究古籍医案的规律,探究其潜在的巨大价值,以便古为今用。
2.1 数据挖掘在RA名中医诊治经验的研究名老中医是中医药诊治RA的带头人。通过DM技术提炼其诊疗经验、学术思想、用药规律等,可丰富中医药治疗RA的理论体系,总结名老中医经验,优化新一代中医传承途径,发现新的思路、新的方法[5]。张昭等[6]挖掘分析了李济仁教授治疗活动期RA的用药规律,总结出多个核心组合和新处方,总结出经验方清络饮,得到治疗活动期RA最常用的药为青风藤,与其寒热平调、固本培元为主要治则的学术思想相呼应。朱亚梅等[7]基于复杂网络分析反映周仲瑛治疗RA的用药及配伍规律,排列出处方配伍核心的药物,周仲瑛国医大师认为RA的主要病因为风湿热邪为主。卜祥伟等[8]应用R型聚类方法分析孟凤仙治疗RA的高频药物,聚类所得五类药物分别运用于RA活动期热毒炽盛证、活动期寒湿痹阻证、缓解期湿瘀痹阻证、缓解期胃阴耗损证、活动期湿热盛者证,该结果客观总结孟凤仙临床用药规律。马珂等[9]基于中医传承辅助平台研究刘祖贻治疗RA的用药规律,采用频数统计分析法总结出高频药物,运用关联规则归纳核心组合及常用药对为青风藤-忍冬藤,通过无监督熵层次聚类算法提取新处方,体现国医大师善用藤类、虫类、枝类3种通络药,兼寒凉药和温热药并用。
2.2 数据挖掘在RA中医辨证方面的研究RA目前没有统一的证型分类标准,中医医家通过个体的视觉、嗅觉、听觉、触觉等感观进行数据采集、临床辨证,所得数据易受主观因素的影响,缺少客观统一的标准。运用DM技术将RA的证候进行规范化总结。朱震等[10]通过计算机检索建立关于RA证型文献研究数据库,利用中医药关联规则挖掘软件归纳RA最常见的证型,病位以肾、肝为主,涉及经络、脾、胃,规范了RA的病因、病性、病位等理论。李增变等[11]对300例急性期RA患者四诊信息进行因子分析,将提取的症状因子在代表证候的权重进行量化,而分析出主次症,为急性期RA证候量化提供客观依据。李文杰等[12]学者在广东地区采集RA患者病历,通过DM技术从临床症状中总结出可明确辨证的相关公因子,以对应3种最常见的证候,将症与证做到了较为精确的映射。沈姗姗等[13]基于文本挖掘技术从CBM检索的6763篇文献中,构建网络图摘出以肝肾阴虚为最常见证型,关节肿胀为RA最主要的临床表现,反映RA的证-症规律,为简化辨证过程提供客观支持。
2.3 数据挖掘在RA中药、方剂的研究治疗RA的中药种类繁多,数量庞大,通过DM技术可从中汲取核心药物、优势药对、高频药性,为老药新用提供新思路。方剂有严格的主次组方规律,其加减药味、增减剂量、辨析方证关系的过程中生成了庞大的数据,通过DM技术可高效挖掘出核心方剂,总结名老中医处方规律,为研究新处方奠定数据基础[14]。陈攀等[15]通过系统聚类分析,选用欧氏距离平方测量,以树形图形式清晰展示治疗RA的高频药物。侯阿美等[16]基于HIS数据以频数分析、关联分析的方法在3881张处方中研究出治疗RA的中药药性及药对配伍规律,为临床中药创新使用奠定基础。王颖等[17]在中医传承辅助平台建立治疗RA的相关文献数据库,以无监督的熵层次聚类等分析方法总结出核心方剂并创立新处方,使新处方的创立更具有科学性、逻辑性。肖红等[18]搜集2007—2017年治疗RA的处方,运用集成关联等数据挖掘技术在144味中药发现姜泉治疗RA以清利热湿、活血化瘀为主,其核心处方为“清热活血方”“二妙丸”,并创立了7个新处方,挖掘临床用药中潜在的规律。
2.4 数据挖掘在RA外治的研究中医外治法具有经济、不良作用小、易操作、显效迅速的特点,是治疗RA的重要手段,临床主要以针刺、贴敷、熏蒸、灸法、穴位注射等方法[19]。但因不同临床医师自身临床经验的不同,外治法的选择及疗效也大不相同。故通过DM技术将外治法治疗RA标准化。目前,外治法的数据挖掘以针灸治疗为主,主要总结取穴规律及针灸方式的选择,以提高选穴精准率和临床疗效,其他外治法仍有广阔的研究空间。周莉等[20]运用文献计量学,归纳了针灸治疗RA常见穴位、最佳穴位配对及优势针灸方式。王海瑜等[21]对针刺治疗RA的取穴规律进行关联分析、复杂系统熵聚类等研究,总结出高频穴位及穴位组合,进而总结出阳经腧穴及特定穴是治疗RA的选穴主体,对临床取穴模式、处方提出指导。张阔等[22]基于中医传承辅助平台对针灸治疗RA的文献进行挖掘分析,总结出RA炎性累及不同关节的取穴规律。端淑杰等[23]经Aprior模块分析得出中药外敷可降低RA炎症及凝血指标,基于关联规则证明中药内服联合外治可有效改善RA的实验室指标,通过客观数据提高中医治疗RA的说服力。
2.5 数据挖掘在RA中成药的研究利用现代药理学研究,在常用治疗RA的中药中提取了苷类等多种有效成分[24],研发了诸多中成药,如雷公藤多苷片、正清风痛宁片、火把花根片、木瓜丸,可有效控制RA病情。中成药相对中药汤剂具有便捷性,通过DM技术发现治疗RA的核心药对及组方规律,为开发中成药成分、剂型提供数据支持,规范中成药使用。对于中成药的开发,何小娟[25]课题组以RA为例,利用MS SQL数据库构建治疗RA的中药网,与相应的PPI网络做重合及对比分析,从而得出有效靶点。另一方面利用Pub Chem数据库建立药-靶点网,逆向预测治疗RA的中药,为研发新型治疗RA中成药提供数据支持及新方向。董文哲等[26]利用关联分析证明雷公藤制剂与RA相关检验存在关联性,并运用随机行走模型分析单味与复方雷公藤制剂存在差异,为中成药有效改善RA病情呈递客观指标。有学者运用SQL对4455篇文献进行可视化处理,结果显示最频繁使用的治疗RA的中成药为正清风痛宁片,中西药联用时最常用的中成药为雷公藤苷片,系统总结临床中成药使用规律,为中西医结合治疗RA奠定基础[27]。
2.6 数据挖掘在RA医案古籍的研究中医对于RA的认识源于《黄帝内经》,纵观各代医家均有对RA的相关认识,产生了“尪痹”“鼓槌风”“周痹”等具有RA症状的病名。历代的医案古籍是中医传承的重要载体,其中蕴含着丰富的中医理论及临床实践。而中医医案古籍数量庞大,个人无法逐一阅览,运用DM技术可提取核心药物、基础处方,客观、全面总结医案古籍中治疗RA的用药规律。刘孟敏等[28]运用apriori算法及聚类算法对60份全国名老中医医案进行数据挖掘,反映名老中医在诊断RA证候的普遍规律,为继承名老中医治疗RA的学术思想提供量化的方法。温万鑫[29]基于《中华医典》对RA相关的检索词进行规范化,多次筛查结果确保数据准确率,通过频数统计等DM技术推测出可能为RA的医案、治疗RA强关联的药对、潜在的药物组合。王楠[30]利用数据挖掘技术统计分析出《伤寒论》中治疗痹证的中药使用的频数、频率、药物归经及四气五味,从经方角度挖掘治疗RA的相关线索。
3 讨论
如今,DM技术应用于中医诊疗RA的研究日益广泛,利用该技术可研究中医证候规律,规范中医四诊,总结临床各医家的辨证规律,使诊断更具客观性、规范性,奠定了临床实践的基石。方剂组合、中药药性、药对、有效成分等研究基于DM技术更为简捷,使中成药的研制、新处方的创立更为高效。DM技术用于外治法的研究不断增加,内外合治RA使临床疗效进一步提高。运用DM技术可在浩如烟海的古籍中抽丝剥茧,缩短研究时间,降低人工主观性,挖掘出其中的方药规律,以服务临床。另一方面对于中医药人才培养、中医传承及创新另辟蹊径。目前已有相关研究,但仍存在不足,如因子分析是通过计算各个症状在证候中的相对重要性来分析辨证过程,如何将定量分析适当地应用到患者的临床诊断中,仍需进一步探讨实现[11];古籍中记载的症状、诊断等精简凝练,无法与RA进行一一对应,如何提高两者之间的相关性仍存在问题;数据挖掘得到的新药对、新处方的临床疗效仍需进一步考证。
未来,该研究技术将广泛应用于RA中医诊疗中,规范四诊采集,建立RA的中医诊疗流程。运用DM技术将治疗RA的中药与现代药理相结合,实现中医药的信息化,为中西医结合治疗RA 提供新的机遇。