基于数据挖掘的《金匮要略》妇人病用药规律分析*
2023-08-25陈景海高惠敏黄华花2
陈景海 高惠敏 黄华花2,△
《金匮要略》是从《伤寒论》中摘录出中国现有的最早研究临床各项疾病的专著,其中关于妇科疾病的记录内容可谓完备,堪称中国历史上妇科辨证治疗的先驱,塑造了中医妇科学科的雏形,是中医妇科奠基之作[1,2]。习近平总书记指出:“中医药是中华民族的瑰宝,一定要保护好、发掘好、发展好、传承好”[3]。2022年3月30日,国务院印发的《“十四五”中医药发展规划》对新时代中医药工作进行了全面部署[4],要求中医药工作者注重利用现代科学技术和方法,深入发掘中医药精华,在创新中形成新特色新优势,促进中医药特色发展。当前,全国上下正掀起运用现代科学方法研究传统中医药理论的热潮,传承精华,守正创新。其中,基于数学方法的数据挖掘技术(Data Mining Technology,DM)是研究热点之一。研究者可以应用Microsoft Excel、Python语言、SPSS Modeler、SPSS Statistics、Gephi、中医传承辅助平台、古今医案云平台等工具,以中医经典方剂或优质的现代组方为研究对象,挖掘隐藏具重要参考价值的用药规律,促进中医药的进一步发展[5-9]。本研究采用中医传承辅助平台,运用关联规则和熵聚类等数据挖掘方法,研究《金匮要略》妇人病3篇(以下简称妇三篇)的用药规律,将为中医临床合理治疗妇科疾病提供新思路和新组方。
1 资料与方法
1.1 资料来源系统整理归纳《金匮要略》[10]中3篇妇科相关 “妊娠病”“产后病”“杂病”中的条文、方剂内容。
1.2 方剂筛选
1.2.1 纳入标准原著所载的附方均作一首独立方剂来统计,如“三物黄芩汤”“内补当归建中汤”。
1.2.2 排除标准同一首方剂出现在不同条文篇幅时,不重复录入(仅在记录药物的性味、归经、频数时叠加计算);有方无药的方剂不录入,如“胶姜汤”等;“妇人杂病脉证并治”篇中的“小儿疳虫蚀齿方”是治疗小儿方,鉴于本研究的是妇科相关疾病,所以虽然出现在原著篇幅中,但也不录入。
1.3 数据规范化处理和数据库建立规范化的中药名称、性味、归经以《中华人民共和国药典·一部》[11]为参考标准,分类以《中华人民共和国药典临床用药须知(中药饮片卷)》[12]为参考标准。如干地黄规范为生地黄;因炮制而产生不同功效的中药,则保持原炮制方式所对应的中药命名方式,如“炙甘草”等。
将符合制定标准的方药一一录入 Microsoft Excel 2019软件,建立数据库,将收录的中药按照性味、归经、药类进行归类排序。通过中医传承辅助平台V 2.5系统软件(由中国中医科学院中药研究所与中国科学院自动化研究所联合开发,以下简称平台)[13],选择 “平台管理系统”,将符合条件的处方手工录入“方剂管理”模块。由双人负责审核以确保数据录入的准确性。
1.4 数据分析
1.4.1 用药频数 性味 归经 类别统计分析应用系统平台中的“统计报表系统”,结合Excel对符合标准的药物进行频数分析,统计方剂内全部药物的用药频次、性味、归经及所属药物门类。
1.4.2 基于关联规则下的组方规律分析基于关联规则挖掘方法,应用平台“组方规律”模块,设置支持度个数=4,置信度=0.6,分析所得药对的用药关联规律。
1.4.3 基于聚类分析的组方规律探索①基于复杂系统熵聚类的核心组合分析:基于复杂系统熵聚类,以平台改进的互信息法的药物间关联度分析结果为基础,应用平台的“新方分析”模块,设定相关度=8,惩罚度=2,得到核心组合。②基于熵层次聚类的新方分析:基于无监督熵层次聚类方法,在提取的核心组合基础上,应用平台的“提取组合”功能,得到含有核心组合的新方。应用“网络图”功能,可展现可视化网络图。
2 结果
经归纳整理,妇三篇原文记载条文共计46条,收录与妇科疾病相关的方剂40首(包含不同病例条文出现的重复方剂及2首附方)。其中妊娠病篇原始文本共有11条,载有方剂9首;产后病篇原始文本共有13条,载有方剂11首(其中包含附方2首);杂病篇原始文本共22条,载有方剂20首(合重出方6首,以及其中有2首载方名无列药物:附子汤、胶姜汤)。按照筛选标准,最终录入统计分析的方剂共35首。
2.1 用药频次统计分析将筛选出的35首方剂进行用药频次统计,涉及67味中药,出现次数≥3的中药有20味,前5位的中药分别是桂枝、白芍、生姜、大枣、当归。见表1。
表1 《金匮要略》妇三篇药物应用频数(频数≥3)
2.2 性味 归经 药类统计分析对使用频数≥3的20种中药的性味、归经与药类进行统计。相应归属的性味共计出现28次,归经共计56次。药味以甘(11种,39.29 %)、苦(9种,32.14%)、辛(6种,21.43%)为主,药性主要集中在温(7种,36.84%),寒(6种,31.58%)平(5种,26.32 %)。见图1。药物归经主要分布于脾经(11种,19.64%)、肝经(9种,16.01%)和心经(8种,14.29%)、肺经(7种,12.50%)。见图2。按功效统计,仲景治疗妇科病的首选药类属补虚类药物,并以其分类下的补气类药物的使用最为之多,补血类药物及解表类药物中的发散风寒类药物次之。见图3。
图1 《金匮要略》妇三篇药物的性味雷达分布图(使用频数≥3)
图2 《金匮要略》妇三篇药物的归经分布图(使用频数≥3)
图3 《金匮要略》妇三篇药物的药类分布图(使用频数≥3)
2.3 组方规律分析基于关联规则挖掘方法,将支持度个数设置设为4,即采用所纳经方数目的11.43%(支持度=11.43%),根据常用药物组合用药模式,提取出关联强度最高的药对组合13组,其中位居前5的药物组合分别为生姜-大枣、生姜-桂枝、大枣-桂枝、白芍-桂枝、当归-白芍。见表2。
表2 《金匮要略》妇三篇基于关联规则的常用药物用药模式
选取置信度≥0.6的药物组合来反映其常用药物配伍规律,得出几组置信度最高的组合为川芎-白芍、川芎-当归、大枣,桂枝-生姜等。见表3。
表3 《金匮要略》妇三篇常用药规则分析(置信度≥ 0.6)
用网络视图表达药物间的关联规则,其中居于视图中心位的白芍、桂枝均为中医临床治疗妇科疾病最常用的补虚、解表类中药。见图4。
图4 关联规则下的《金匮要略》妇三篇药物关系网络展示图
2.4 核心组合分析基于复杂系统熵聚类,以平台改进的互信息法的药物间关联度分析结果为基础,应用平台的“新方分析”模块,设定“相关度”为8、“惩罚度”为2,系统演算出10组核心组合,包括白芍-川芎-麦冬、白芍-当归-麦冬等。见表5。
表5 基于复杂系统熵聚类的《金匮要略》妇三篇药物核心组合
2.5 新方分析基于无监督熵层次聚类方法,在提取的核心组合基础上,应用平台的“提取组合”功能,演化出5个潜在新方,即白芍-川芎-麦冬-白术、白芍-当归-麦冬-白术、川芎-阿胶-麦冬-艾叶、阿胶-当归-麦冬-艾叶、甘草-大枣-防风-白薇。新处方药物间关联的网络图见图6。
图6 无监督熵层次聚类下的《金匮要略》妇三篇新方网络展示图
3 讨论
数据挖掘就是利用统计学或人工智能,从大量的数据之中挖掘出数据蕴含的潜在规律、提炼出具有价值的知识的过程,常用的数据挖掘方法包括频数分析、关联规则、聚类分析、因子分析和人工神经网络等[14]。本研究主要采用中医传承辅助平台系统进行统计分析,该平台集合了现代化数理统计分析技术、人工智能及网络化信息技术等,以采集的医案或者经方数据为核心,可以简单高效地对中医方药数据进行研究[15]。
根据数据分析结果,可以直观看出张仲景治疗喜用甘温之药,以补益气血、平补阴阳为主;重视活血补血,辅以清热;同时调理脾、肝、心、肺,使脏器之间协调运行来治疗妇科疾病。林杰等[16]对《伤寒杂病论》辨治腹痛用药规律进行研究,结果表明经方治疗腹痛多用补法、泻法及和法,善于运用温热之品,若使用寒凉之药,偏于运用微寒之品;药物多为甘味、辛味和苦味,归脾经的药物最多,结论与本文基本一致。由此,可以总结张仲景在妇三篇中的用药思想如下:①补血养血为主,助以温化瘀血;②擅用解表药避邪气,养正气;③重视脾胃调和,“保胃气,存津液”;④调冲任,善理气机;⑤组方内容简练;⑥治法精妙,博采众法。
本研究对妇科经方用药的隐性信息进行了挖掘,同时利用采集的方剂信息演化出一定的组方规律及新处方,其结果有待于临床上进一步去验证,该研究为进一步探索妇科疾病的组方用药规律提供了参考。