APP下载

数据挖掘在现代中医药研究中的应用进展

2020-07-04封继宏张鹏宇

中国医药导报 2020年13期
关键词:综述数据挖掘中医药

封继宏 张鹏宇

[摘要] 数据挖掘是一门新兴学科,优势在于从庞大的数据库中提取、分析潜在的规律,并从不同侧面反映事物的本质。数据挖掘技术的应用可以使中医药信息更加直观,有助于从大量文献中快速获取中医药知识资源,发现新的问题,拓宽研究思路。本文分析了近年来中医学领域多位学者运用数据挖掘技术的研究成果,总结了数据挖掘技术在中药、方剂、证候、治法、名家经验、古典医籍以及疾病预防等多方面应用情况,以期为其在中医药研究中的进一步应用提供参考。

[关键词] 数据挖掘;中医药;应用;综述

[中图分类号] R2-03          [文献标识码] A          [文章编号] 1673-7210(2020)05(a)-0054-04

Application progress of data mining in modern Chinese medicine research

FENG Jihong1   ZHANG Pengyu2

1.Department of Respiratory, the Second Affiliated Hospital of Tianjin University of Traditional Chinese Medicine, Tianjin   300143, China; 2.Yaqian Town Community Health Service Center of Xiaoshan District in Hangzhou City, Zhejiang Province, Hangzhou   311209, China

[Abstract] Data mining is an emerging discipline. Its advantage lies in extracting and analyzing potential laws from huge databases and reflecting the essence of things from different aspects. The application of data mining technology can make traditional Chinese medicine information more intuitive, help to quickly obtain traditional Chinese medicine knowledge resources from a large number of literatures, discover new problems, and broaden research ideas. This paper analyzes the research results of data mining technology used in the field of traditional Chinese medicine in recent years by many scholars, and summarizes the application of data mining technology in traditional Chinese medicine, prescriptions, syndromes, treatment methods, famous experts′ experience, classic medical records and disease prevention, in order to provide reference for its further application.

[Key words] Data mining; Traditional Chinese medicine; Application; Review

中華文明源远流长,在五千年的华夏文明中形成了自己独有的医学体系——中医。文献作为中医传承的重要载体,是历代医家通过长期的临床实践及不断地探索所凝聚的智慧结晶,同时也是了解医学思想的重要途径。但由于百家争鸣,论著众多,使后世对于中医药文献的研究步履维艰。随着社会的发展,科技的进步,大量新兴科技应用于文献研究中,其中,数据挖掘技术发挥了重要作用,极大提高了文献研究的效率。数据挖掘是一门诞生于20世纪80年代的新兴学科,最早面向商业用人工智能领域,它试图从庞大的数据库中提取、分析一些潜在的规律,从而获得辅助决策的关键信息。数据挖掘技术的特点在于可处理巨大数据量以及不可预知性,擅长于从海量的数据信息中找到新的具有意义的关系、模式或趋势[1],并从不同侧面反映事物的本质。目前中医药的信息数据挖掘大致可分为关联、分类、聚类、预测四大类。通过数据挖掘的应用,可以使中医药信息更加直观,有助于从浩如烟海的文献中快速获取中医药知识资源,发现新的问题,拓宽研究思路。

1 数据挖掘在中医证候研究中的应用

辨证论治是运用中医理论辨析有关疾病的临床资料从而确立治法方药的过程,是中医理论体系的重要指导原则,也是中医学的基本特点。近来年应用数据挖掘方法进行的中医证候研究越来越多,通过对中医证候数据的分类研究,可以得到某证候的核心及预测因子,对反复采集的证候信息进行分析,建立模型,使中医辨证更加规范化、客观化。雷蕾等[2]采用数据挖掘的方法分析名老中医在治疗慢性肾衰竭时的组方规律,发现脾肾气虚证为慢性肾衰竭的主要本证,而湿浊、血瘀为主要兼证。

2 数据挖掘在中药研究中的应用

张玉娇等[3]通过循证方法评价数据挖掘在中药性效研究中的应用发现,与“回归判别分析”相比,“支持向量机”在中药药性判别中的预测效果更具优势。彭琳[4]用100首常用药方为研究基础,对方中常用的中草药特点进行分析,采用K近邻的中医药药方分类方法,发现其可有效地反映中医药用药规律与治疗效果的关联性。数据挖掘的研究内容主要集中在中药配伍规律的相互联系及某类疾病治疗中的用药频率探索,单独的中药研究较少。

药对是指临床常用的相对固定且疗效显著的一对药物。吕建军等[5]对“桔梗-甘草”这一药对进行统计分析,发现其治疗疾病88种,包括感冒、咳嗽等,主治证候89种,主要包括风热犯表证、风寒束表证,存在于315首方剂中,包括银翘散、杏苏散、藿香正气散等,对临床应用及新药开发提供了依据。

3 数据挖掘在方剂研究中的应用

方剂是连接中医基础与临床的“桥梁”,通过数据挖掘从“方”入手,可以通过用药规律的分析,指导临床应用及中药新药的研发[6]。数据挖掘技术与重要组方规律的结合是必然趋势。数据挖掘在中药方剂中的应用主要通过关联分析和聚类方法来实现。

李廷保等[7]在对敦煌医方的用药规律探讨中发现,敦煌医方在临证用药中注重补血益气、益气养阴、清热解毒。甘草、桂枝为应用频次较高的药物,同时为治疗天行病小阴旦汤的主要药物,为桂枝汤的方剂演变。虽然数据挖掘在方剂应用中取得了一定成就,但仍存在局限性,如数据挖掘领域及结果分析深度的局限性,有待今后进一步的进步与完善。

4 数据挖掘在名家用药规律研究中的应用

名老中医学术思想及临床用药经验是中医学的宝贵财富,通过数据挖掘可将隐性的规律进行总结,实现“可言传、可验证”的目的。通过文献计量分析,发现对于名老中医经验的数据挖掘,主要从某一疾病的用药规律出发,约占87.43%[8]。目前主要为定性与定量研究并重,验证性与探索性相结合。

王文龙等[9]通过对国医大师梅国强251个病案、179个处方的统计及挖掘,分析其治疗肺系病证的用药,发现梅老重视整体观念,效法伤寒,注重使用清热解表、止咳化痰类中药,同时擅于配伍虫类药。张维骏等[10]运用数据挖掘技术探讨国医大师路至正治疗肺癌的用药规律,发现中药使用频次由高到低依此为仙鹤草、炙甘草、姜半夏、大枣、泽漆。根据关联规则分析,信度最高为石见穿、泽漆,支持最高的药物组合为姜半夏、仙鹤草。由此可见,用数据挖掘方法探讨中医用药规律具有一定的意义。杨聪宾等[11]通过名老中医学术思想挖掘平台,总结出张燕萍教授诊断支气管扩张的主要证型为痰热郁肺证,治法为清热化痰,主用千金苇茎汤为基础方进行加减,常用冬瓜子、芦根、鱼腥草、桔梗等,遵循“通利肺道”“火郁发之”之意。李晓辉等[12]应用中医传承辅助平台进行药物及药物关联分析,总结出刘爱东教授在胸痹的治疗中多采用四物湯及四君子汤化裁,补中有行,通中寓补,借助数据挖掘的方法客观展现了刘教授的用药经验,为优化胸痹的临床诊疗提供了依据,具有一定的指导意义。

5 数据挖掘在治法研究中的应用

文献挖掘在研究疾病的治疗方面较为完善成熟,包括该疾病的主要病因病机、证候特点、治法治则、方药分析等。以疾病为核心,以数据挖掘为手段,总结出此类疾病的常见用药及方剂,为临床治疗该疾病提供相对客观、规范的理论指导。在中国古代常无西医病名,主要以西医的临床症状命名,此可以划分为西医病名的中医文献研究,或者某一中医病名的文献研究。

潘家文等[13]通过对近十年中药治疗老年肺炎的文献研究发现,常用药为甘草、茯苓、苦杏仁、桔梗等,主要归经为肺、脾、胃经,以健脾益胃、清热化痰、止咳平喘为主。王莉新等[14]运用关联算法,探讨肺癌与用药规律之间的联系,发现治疗肺癌的用药主要以补益药为主,其中关联较强的药物为人参与甘草、人参与茯苓、人参与白术,提示这些药对可优先应用于临床,为临床治疗肺癌的方药选择提供了参考。张浩洋等[15]通过频数、因子、聚类、关联等分析方法得出,肺间质疾病的主要治疗以扶正祛邪为主,运用温阳益气、滋阴养血以补虚,清热、化痰、止咳、解表以泻实,常用甘草、茯苓、桔梗、人参,其中茯苓与人参、桔梗与甘草关联性强,对临床应用具有指导作用。张稚鲲等[16]运用Apriori算法,对比古今文献治疗肺系疾病的用药特点,得出古今用药的相似在于多用清热药,并配伍解表、化痰、理气药,不同在于古代更多使用辛散之药,有散邪治疫的特点,而现代更注重清泻热邪为主。杨勤军等[17]使用中医传承辅助平台系统,得出咳嗽以风、痰、寒、热所致的急性咳嗽最为常见,常用中成药为丸、散剂,常用药为陈皮、茯苓、甘草。谭丽博等[18]运用聚类分析及关联规则分析,总结中医药治疗失眠的用药规律,发现中药治失眠以补益安神为主,兼以清热、祛湿、活血、理气等为主要治法。多以酸枣仁作为君药,甘草作为使药,常用药物组合有远志配伍酸枣仁、夜交藤配伍酸枣仁、茯神配伍酸枣仁、远志联合甘草配伍酸枣仁等,并得出中医药治疗失眠多从心、肝论治。该研究借助数据挖掘的方法,得以对中医药治疗失眠的相关文献进行较为全面的分析,因而其研究结果较为可信,对临床实践及新药物的研发具有一定的参考价值。孙远等[19]应用文献数据挖掘方法,分析明清医家在瘿病治疗中的用药规律,发现其治疗以祛邪为主,且邪正兼顾,多用理气、化痰、散瘀之品,且多用含碘丰富的药物,如海藻、昆布、海蛤壳等,对现代临床治疗甲状腺疾病具有重要指导意义。阮哲等[20]通过中医传承辅助平台,分析中药外用治疗痛风性关节炎的用药规律,得出中药外用治疗痛风性关节炎以祛邪为主,较少采用扶正、补虚等药物,以清热除湿,活血止痛为主要治法,并借助数据挖掘技术得到了4条新的处方,为日后的临床实践及科研提供了新的思路。

6 数据挖掘在古典医籍研究中的应用

从古至今,对古代医家的用药分析及学术思想多为主观分析,现通过数据挖掘技术可以将学术经验的传承更加标准化、客观化。王炳权等[21]通过复杂系统聚类分析《湿热病篇》的用药规律,发现薛生白治疗湿热病以化湿药、行气药为主,不忌用温药,其用药核心为刘完素所创的六一散,即滑石与甘草。李付平等[22]通过采用频次分析、关联规则和复杂聚类分析对《脾胃论》的研究,发现李东垣的用药核心以补中益气汤为核心,其药物配伍为甘温益气药和辛散升阳药,常用药物为炙甘草、陈皮、升麻、人参、当归、白术、黄芪、柴胡等,并根据无监督层次聚类分析结果演化出4首新的方剂。田玉君等[23]通过规则分析、关联分析、熵层次聚类分析等数据挖掘方法分析清代叶天士《临证指南医案》中呕吐病的用药规律,总结出叶氏治疗呕吐注重温通,长于使用辛开苦降以及甘补之法,并通过系统分析演化得到了治疗呕吐的5个新处方,这些新处方的发现拓宽了临床诊疗与科学研究的思路。王晓琳等[24]整理《名医类案》中内伤湿热病的方药信息,挖掘其中规律,得出《名医类案》中治疗该病证以健脾运湿为主,辅以祛风、利水、清热,兼以和胃助运、通脉活血,为现代临床治疗内伤湿热病证的处方用药提供了参考。

7 数据挖掘在疾病预防研究中的应用

运用数据挖掘技术可以更加方便快捷地总结中医学在疾病治疗中的遣方用药特点及医家经验,因而也便于快速研究一些新发疾病,以期为其及时预防提供参考。2019年12月以来,新型冠状病毒肺炎疫情的迅速传播,对人民健康造成较大威胁。

赵新等[25]收集了全国17省市的中医药预防方案,对其中的中药处方进行数据挖掘,发现各地多以补虚扶正之法预防新型冠状病毒肺炎,多从肺、脾、胃着手,并得到8个常用药物组合及7个潜在新方。李衍达等[26]采集了2019年12月8日至2月10日各中医专家团队方案及相关中医专业文献,通过数据挖掘总结出甘草、苍术、藿香等高频使用药物,以及芳香避秽、清热泻肺、解毒通腑等主要治法。白明等[27]则整理了中医古籍中相似疾病的组方,通过数据挖掘总结其中规律,寻找潜在的中药配伍规律,得到甘草与桔梗、甘草与防风、甘草与羌活等关联度较高的药对12个。这些研究一定程度上可以为新型冠状病毒肺炎的预防提供思路与参考。

综上所述,数据挖掘技术近年来取得了长足进步,已在中医药研究中广泛应用,相关方法众多,有聚类、关联、分类分析等,这些高效的数据处理技术为中医药数据分析提供了更丰富的途径与手段,在中药、方剂、证候、治法、名家经验、古典医籍以及疾病预防等多方面的研究中都发挥着举足轻重的作用,为指导临床实践提供了宝贵的参考。同时,数据挖掘技术在中医药研究中的应用尚有一定的局限。其一,数据挖掘技术的最大优势在于发现隐藏在大量信息中的共性规律,研究结果往往与中医普适性理论较为相近,对中医药个体化诊疗的帮助有限。其二,在医学领域中,一些发病率不高的疾病从文献中可以获得的信息较少,目前的数据挖掘技术不适于此类疾病信息的分析与总结。若可以进行一定的改良,则无疑会在医药研究的领域发挥更为强大的作用,这些也是今后继续探索研究的方向。

[参考文献]

[1]  周秀娟,富晓旭,雷远洪,等.基于数据挖掘对中药复方治疗代谢综合征用药规律分析[J].辽宁中医杂志,2019, 46(3):449-453,669.

[2]  雷蕾,骆言,任静,等.基于数据挖掘对中医治疗慢性肾衰竭组方规律的分析[J].中成药,2019,41(12):3079-3082.

[3]  张玉娇,章新友,谈荣珍,等.基于循证的中药药性判别数据挖掘方法评价[J].中华中医药杂志,2019,34(3):1223-1226.

[4]  彭琳.基于数据挖掘的中医药治疗效果与用药规律关联性分析[J].科技通,2019,35(1):77-81.

[5]  吕建军,郝瑞春,门九章,等.基于数据挖掘探讨含“桔梗-甘草”药对成方制剂的证治规律[J].中国药房,2018, 29(20):2813-2816.

[6]  邹天骏,林江,童远明,等.数据挖掘技术在方剂学研究中的应用[J].广西医学,2018,40(24):2936-2937,2948.

[7]  李廷保,尚菁,张花治,等.基于数据挖掘的敦煌医方用药规律研究[J].中国中医药信息杂志,2019,26(2):102-105.

[8]  王海燕.名老中医经验数据挖掘文献计量分析[J].世界中西医结合杂志,2019,14(2):166-170.

[9]  王文龙,向庆东,齐凤军,等.基于数据挖掘探索梅国强教授治疗肺系疾病用药规律[J].中国临床研究,2019,32(2):250-255,259.

[10]  张维骏,刘润兰,崔长虹,等.国医大师路志正教授治疗肺癌专方研究之数据挖掘[J].世界中西医结合杂志,2019,14(1):9-12.

[11]  杨聪宾,樊茂蓉,张燕萍,等.基于数据挖掘方法总结张燕萍教授治疗支气管扩张症用药经验[J].河北中医,2018,40(11):1609-1613.

[12]  李晓辉,刘迎辉,辛宇咛,等.基于数据挖掘技术对刘爱东教授治疗胸痹用药规律分析[J].吉林中医药,2020, 40(1):117-120.

[13]  潘家文,刘琼,郑升鹏,等.基于数据挖掘的老年肺炎用药规律研究[J].山东中医杂志,2019,38(2):135-139.

[14]  王莉新,李明,吴文斌.基于数据挖掘方法研究中医治疗肺癌方药的用药规律[J].数理医药学杂志,2018,31(10):1423-1426.

[15]  张浩洋,庞立健,刘创,等.基于数据挖掘中药复方治疗肺间质疾病用药规律探究[J].辽宁中医药大学学报,2018, 20(7):109-113.

[16]  张稚鲲,王若尧,陈仁寿.古今肺系疫病方配伍特点对比研究[J].中医药息,2018,35(4):73-76.

[17]  杨勤军,李泽庚,胡健,等.基于数据挖掘的新安医家治疗咳嗽用药规律及特色研究[J].中国中医基础医学杂志,2018,24(6):828-831.

[18]  谭丽博,刘燕,吴凤芝,等.基于文献数据探讨中药治疗失眠的用药规律[J].现代中医临床,2020,27(1):35-42.

[19]  孙远,徐禄玉,黄桃,等.基于数据挖掘分析明清医家治疗瘿病用药规律[J].河南中医,2020,40(2):258-261.

[20]  阮哲,覃文儀,刘明岭,等.基于数据挖掘的治疗痛风性关节炎外用方剂组方规律研究[J].中国中医急症,2019, 28(12):2088-2090,2121.

[21]  王炳权,刘春柳.基于数据挖掘的《湿热病篇》组方用药规律研究[J].亚太传统医药,2019,15(1):164-166.

[22]  李付平,康立英,杨贵真,等.基于数据挖掘分析《脾胃论》用药组方规律[J].广州中医药大学学报,2019,36(2):288-291.

[23]  田玉君,范发才.基于数据挖掘的《临证指南医案》呕吐病用药规律研究[J].光明中医,2020,35(2):183-185.

[24]  王晓琳,呼兴华,禹思宏,等.基于数据挖掘的《名医类案》内伤湿热病证组方用药规律[J].陕西中医,2020,41(3):394-397.

[25]  赵新,张林旭,路雪婧.基于数据挖掘初探预防新型冠状病毒肺炎中医方药[J/OL].中草药:1-6[2020-03-11].http://kns.cnki.net/kcms/detail/12.1108.R.20200228.1909. 004.html.

[26]  李衍达,赵振宇,孙嘉惠.基于数据挖掘的新型冠状病毒肺炎用药规律研究[J/OL].中国现代中药:1-16[2020-03-11].https://doi.org/10.13313/j.issn.1673-4890.202002 18007.

[27]  白明,李杨波,苗明三.基于古籍数据挖掘的中医防治疫病用药规律分析[J/OL].中药药理与临床:1-15[2020-03-11].https://doi.org/10.13412/j.cnki.zyyl.20200228.001.

(收稿日期:2020-03-19  本文编辑:李亚聪)

猜你喜欢

综述数据挖掘中医药
中医药在恶性肿瘤防治中的应用
中医药在治疗恶性肿瘤骨转移中的应用
探讨人工智能与数据挖掘发展趋势
SEBS改性沥青综述
NBA新赛季综述
从《中医药法》看直销
基于并行计算的大数据挖掘在电网中的应用
中医药立法:不是“管”而是“促”
JOURNAL OF FUNCTIONAL POLYMERS
一种基于Hadoop的大数据挖掘云服务及应用