基于医案文献的葛根芩连汤、黄芩汤、白头翁汤三方分类鉴别研究*

2017-02-21倩傅延龄陈文强黄小波

中国中医急症 2017年1期

关键词：葛根芩白头翁医案

王倩傅延龄陈文强黄小波△

（1.首都医科大学宣武医院，北京 100053；2.北京中医药大学，北京 100029）

·研究报告·

基于医案文献的葛根芩连汤、黄芩汤、白头翁汤三方分类鉴别研究*

王倩1傅延龄2陈文强1黄小波1△

（1.首都医科大学宣武医院，北京 100053；2.北京中医药大学，北京 100029）

目的建立葛根芩连汤、黄芩汤、白头翁汤分类模型，为三方合理选用提供客观参考依据。方法以明代至今三方的临床个案医案为研究对象，纳入符合标准医案共605例，其中葛根芩连汤医案310例，黄芩汤医案64例，白头翁汤医案231例，将医案信息录入Excel数据表并进行规范化及数字化预处理，选取决策树算法建立模型。结果得到三方分类规则9条，所得决策树分类模型的正确分类率达61.57%。结论决策树分类模型具有一定的临床实践意义，可为中医师对三方的临床选用提供直观、有效的参考依据。

葛根芩连汤黄芩汤白头翁汤分类决策树

作为《伤寒论》治疗热性下利的主要方剂，葛根芩连汤、黄芩汤、白头翁汤三方在主治范围、处方组成及常用加味药等方面均存在部分交集，并常常在临床中相兼为用，难以截然区分，为中医临床医师，特别是初学者对三方的临床合理选用带来了困扰。针对此问题，本文将以三方临床医案文献作为研究对象，采用机器学习的方法对其中所蕴含的应用规律进行提炼，并尝试建立三方分类模型，从而为中医师对三方的合理选用提供客观的参考依据。

1 资料与方法

1.1 研究目的基于纳入医案，建立葛根芩连汤、黄芩汤、白头翁汤分类模型，提炼三方各自临床使用规则与规律，为三方的合理选用提供客观的参考依据。

1.2 研究对象 1）医案纳入标准：经文献研究，由于临床中仅用原方者甚少，为避免数据量过小所致的分析误差，通过讨论与专家咨询，拟定医案纳入标准如下。（1）明言以《伤寒论》热利三方之一，即葛根芩连汤、黄芩汤或白头翁汤为主方，或含有三方之一至少3味组成药物，且全方总药味不超过8味。（2）对于处方非原方者，需结合具体医案所载四诊信息，其中符合三方证型诊断标准者方予录入。（3）以“下利”为主症或主症之一。（4）给药方式为口服。（5）个案医案。（6）选取的医案年代跨度：基于文献研究与课题组对《伤寒论》Top50各药味历代用量流域的统计结果，笔者看到历代医家在方药用量上存在很大差异，自明代开始逐渐趋于平稳。为避免由年代间用量起伏所带来的分析误差，故以明代为截点，选取自明代至今这一历史时期作为纳入文献的时间跨度。其中，数据文献检索部分的发表时间选定在1949至2014年6月（本文文献检索截止时间），并手工检索了建国初期的部分期刊文献。2）医案排除标准：（1）医案类别中医案处方未明言以《伤寒论》热利三方之一为主方，所含三方之一的组成药味少于3味，或虽含3味以上的三方之一组成药味，但全方药味大于8味，或处方非原方，且医案所载四诊信息不符合三方证型诊断标准；无“下利”症状；给药方式为外用；文献类型为临床观察、实验研究等非个案医案者。（2）医案年代为明代以前的各个朝代者。（3）医案疗效为原文中明确注明为无效或恶化者。

1.3 研究方法数据来源：1）中华医典（索引），其收录了新中国成立以前的历代中医古籍1000部，基本涵盖了至民国为止的主要中医著作与中医文化建设的主要成就，为本文明代至建国前医案的主要来源。对于自《中华医典》索引所得的文献出处，选择相应专著的纸质版本进行数据校对以确认数据准确性。2）已发行的医案集选：如《二续名医类案》，古今名医内科医案赏析，中华名医医案集成，近代名老中医经验集，国医大师临床经验实录，中医临床家系列丛书，伤寒六经病证治验选录，世医临证笔录秘验集，继承发挥临证录，新安医学名医医案精华，龙华名医临证录，重庆名医证治心悟，江苏省中医院中医临床家，程门雪医案，经方实验录等汇编及单本医案。3）文献数据检索平台：中国知网、万方数据知识服务平台、维普中文期刊数据库、中国生物医学文献数据库，以“葛根芩连汤”“葛根黄芩黄连汤”“葛根连芩汤”“黄芩汤”“白头翁汤”为关键词进行检索。同时配合手工检索以尽可能地弥补上述文献数据库在起始年代上的限制，手工检索部分在北京中医药大学图书馆期刊阅览室（过刊）完成。

1.4 数据收集与录入通过《中华医典》、已发行医案集选与数据检索平台，按照数据纳入与排除标准，对医案进行检索、筛选，并对重复的医案予以剔除，最终纳入符合标准者共605例，其中葛根芩连汤医案310例，黄芩汤医案64例，白头翁汤医案231例，将所纳入的医案信息依次录入预先设计的Microsoft Excel 2007数据表。

1.5 数据预处理 1）名词术语的规范化处理：参照《中医药学名词》［1］《中医症状鉴别诊断学》［2］《中医诊断学》［3］《中医内科学》［4］对相关术语用语进行规范化处理，包括中医病名、症状、舌脉象等。2）语言描述性信息的数字化处理：年龄参照中国现行年龄划分标准，并结合目前临床儿科接诊年龄限制对“儿童”年龄段进行划分，将医案所载患者年龄进行分段，儿童（≤14岁），青少年（15～40岁），中年（41～65岁），老年（＞65岁）。性别1为男，2为女。发病时间按照医案所载发病时间归入相应季节，1春（3-5月），2夏（6-8月），3秋（9-11月），4冬（12-2月）。病程参照《中药新药临床研究指导原则》［5］《中医内科学》［4］《内科学》［6］对泄泻、痢疾病程的划分，将医案所载患病时间归入相应病程阶段，＜2周为1，2周～2月为2，2月～1年为3，＞1年为4。以上信息医案中无记载者均记为“0”。3）症状的数字化处理：采用2种方法处理。一按“有”与“无”处理，医案中有某一症状，则赋值为1，反之为0。二按照严重程度分级处理，参照《中医量化诊断》［7］《中药新药临床研究指导原则》［5］，及由中国中西医结合学会消化系统疾病专业委员会于2003年公布，2010年修订的“胃肠疾病中医症状评分表”［8］，结合具体研究，改制完成症状分级量化表，用于医案所载各症状的轻重分级与赋值，如表1所示。表中以1、2、3分别代表症状的轻、中、重，若无该症状，则赋值为0。考虑到医案语言信息的模糊性特点，表中共采用了5种方法来进行衡量分级，（1）计数标准，如“发热”项，体温37.1～37.9℃为轻度，38.0～38.5℃为中度，38.6℃以上为重度。（2）比拟标准，如“面赤”项，面色略红为轻度，面色潮红如出热浴为中度，面红如火为重度。（3）病情标准，如“肛门灼热”项，灼热感较轻为轻度，灼热感可忍为中度，灼热感难忍为重度。（4）习语标准，即采用医者惯用的描述性语言作为衡量的标准，如“舌红”项，舌色红为轻度，舌色赤为中度，舌色绛为重度。（5）互参标准，即对同时可能出现的伴随症状予以描述，如轻度发热可有头身微痛、面微赤、脉微数等症，中度发热多有头身痛、面热赤、口渴、脉数等症，重度发热可有面赤气粗、头痛烦渴、脉洪数或滑数等症。对于难以分级的症状或体征，如脉象，则以0、1分别代表症状或体征的“无”“有”。本部分由2人独立完成，对于其中存在争议的内容，由2人共同讨论商定，仍难以达成一致者，由第3人进行裁定。

1.6 数据分析采用K-miner软件系统。结合本研究数据特点及研究目的，通过对多种数据分析方法进行评估与对比，最终选取决策树算法［9］用于本研究的数据处理与建模。决策树是一种很直观的分类模式表示形式，可以很方便地转化为分类规则。其在学习过程中不需要了解许多领域知识，只要训练例子能够用属性-结论的方式表达出来即可。但在构造决策树时，由于许多分枝可能反映的是训练数据中的异常，如噪声或孤立点，因此就需要进行剪枝，通常采用统计度量的方法剪去最不可靠的分枝。通过检测和剪枝，可较快分类，提高该树独立于测试数据的正确分类率，保证未知数据上分类的准确性［9］。1）数据处理：基于方剂的选用不仅与不同的症状集合有关，同时也受症状严重程度的影响，所以在建立决策树分类模型时，选择症状的字符型（取值0、1化）和数值型（将0、1、2、3等作为数值字段处理，即3＞2＞1＞0）全部字段及相关信息字段（患者年龄、性别，发病季节，病程）作为分析字段来预测方剂（目标字段）。其中字符型字段可体现症状群的不同类别，即不同的症状集合，数值型字段可体现症状的数值型关系即3＞2＞1＞0，即症状的严重程度。设葛根芩连汤、黄芩汤、白头翁汤分别为方名1，方名2，方名3。2）参数设置：选取60%的数据作为训练数据，40%的数据作为模型评估数据，建立决策树分类模型及评估任务。算法参数设置如下图所示，选择二叉树结果，以置信边界法进行剪枝。

表1 症状分级数字化标识表（部分）

图1 算法参数设置图

2 研究结果

图2 方剂分类鉴别预测结果的决策树展示

2.1 模型结果见图2。如图所示，决策树分类算法可用树状结构直观展示相关信息及症状与方剂选用之间的关系。1）规则解释：上图绿色枝线显示的规则可解释为：咽干咽痒症状＝0，2，3，且恶心呕吐症状＝0，1，2，且里急后重症状＝1，2，3，且汗出症状＝0，且恶寒症状＝0，且神昏症状＝1，2，3，则方名＝3，满足该规则的记录数有7条，该规则的置信度为100%，该规则为经由模型得到的规则集之中的第21条规则（规则21）。2）规则中的置信度体现规则的可靠度。置信度越高，说明规则越可靠。经决策树模型得出的部分置信度较高的规则如下。（1）规则6：咽干咽痒＝0，2，3，且腹痛＝0，2，3，且恶心呕吐＝1，且里急后重＝0，则方名＝1，满足该规则的记录数为13条，该规则的置信度为100%。（2）规则19：发病季节＝4，0，3，1，且性别＝2，0，且恶寒＝0，且汗出＝0，且神昏＝0，且咽干咽痒＝0，2，3，且腹痛＝0，2，1，且恶心呕吐＝0，2，1，且便血＝2，且里急后重＝2，1，3，则方名＝2，满足该规则的记录数为6，该规则的置信度为100%。（3）规则17：发病季节＝2，且恶寒＝0，且汗出＝0，且神昏＝0，且咽干咽痒＝0，2，3，且腹痛＝0，2，1，且恶心呕吐＝0，2，1，且便血＝2，且里急后重＝2，1，3，且舌红＝2，1，3，则方名＝3，满足该规则的记录数为7，该规则的置信度为100%。（4）规则7：咽干咽痒=0，2，3，且腹痛=0，2，3，且恶心呕吐=0，2，且肛门灼热=2，且里急后重=0，则方名=1，满足该规则的记录数为7，该规则的置信度为100%。（5）规则21：恶寒=0，且汗出=0，且神昏=3，1，2，且咽干咽痒=0，2，3，且恶心呕吐=0，2，1，且里急后重=2，1，3，则方名=3，满足该规则的记录数为7，该规则的置信度为100%。（6）规则14：汗出= 3，2，1，且咽干咽痒=0，2，3，且腹痛=0，2，3，且恶心呕吐=0，2，且肛门灼热=0，1，3，且里急后重=0，则方名= 1，满足该规则的记录数为18，该规则的置信度为94.44%。（7）规则13：汗出=0，且咽干咽痒=0，2，3，且咳嗽=3，2，1，且腹痛=0，2，3，且恶心呕吐=0，2，且肛门灼热=0，1，3，且里急后重=0，则方名=1，满足该规则的记录数为14，该规则的置信度为85.71%。（8）规则23汗出=3，2，1，且咽干咽痒=0，2，3，且恶心呕吐=0，2，1，且里急后重=2，1，3，则方名=1，满足该规则的记录数为5，该规则的置信度为80%。3）决策树算法能够直观地显示规则数据的特点，且易于解释和理解。通过对上述规则进行简化与转换，得到表2。结合决策树算法规则与中医临床理论，表2所示可解释为：若患者在下利同时，见有汗出、咳嗽等表证表现，恶心呕吐等里热失和之象，及肛门灼热等热性下利之征，则推荐选用葛根芩连汤；若见里急后重，则不推荐本方，或需合用他药。若下利并见便中带血，并有里急后重表现，则黄芩汤与白头翁汤均可能选用，需结合他症进行鉴别，如有神昏者，则推荐选用白头翁汤。另外，若症见恶寒、汗出等表证者，黄芩汤与白头翁汤均不宜选用。由此可见，决策树所得规则与三方方义相符。葛根芩连汤除热性下利，还可用治兼有表证、表里同病者，其药味组成均偏属于气分，故罕有便血者［11］。黄芩汤中白芍有敛阴凉血之效，白头翁汤中白头翁有苦寒清热，凉血止痢之用，二者均入血分，故可用治下利便血者［12-14］。另外，黄芩汤证病在少阳，白头翁汤证病在厥阴［15-16］，肝胆互为表里，均以气机郁滞为病，故临证亦多见里急后重症状。而由于肝为风木刚脏，其性暴急，倘若肝风肝阳挟火热之邪上攻于脑，则可导致神昏见症，此时需要在白头翁汤原方基础之上，适当加用平肝熄风，通窍醒神之品。此外，以规则23为例，里急后重一症本非葛根芩连汤证所有，但回看所录医案，以本方用治里急后重，或便脓便血者亦不罕见，而这则是与加味药乃至合方而治的普遍使用密切相关的。4）又以40%的测试数据对模型的评估结果。见表3~表5。结果显示，决策树分类模型的正确分类率达到了61.57%，表明其对于临床实践具有一定的参考意义。

表2 热利三方与决策树算法规则关系

表3 40%的测试数据对模型的评估结果——总体评估指标

表4 40%的测试数据对模型的评估结果——各个目标评估指标（%）

表5 40%的测试数据对模型的评估结果——混淆矩阵

2.2 模型应用通过模型评估，判断该模型可为《伤寒论》热利三方葛根芩连汤、黄芩汤、白头翁汤的临床鉴别选用提供参考依据。现以病案一则测试模型性能。病案信息：1）中年女性。2）急性起病。3）就诊时间2014年7月。4）就诊时症状发热，体温38.2℃，口略干，小便短少、色黄，大便每日6～8次。5）舌红，苔薄黄，舌面略干，脉数。选择已建立模型，输入各字段取值。信息录入及结果，如表6、7所示，根据模型分析结果所示，表明三方之中选用方名=1（葛根芩连汤）的概率最高，此结果与病案的实际辨治结论相符。

3 讨论

葛根芩连汤、黄芩汤、白头翁汤同中有异，目前既有的三方鉴别方法多为语言描述性的信息，具有经验性、模糊性等特点，而缺乏客观量化的标准。本研究以此为立足点及出发点，采用决策树的方法，通过对三方已有的验案、效案进行分析、归类，得到了具有一定客观性和直观性的三方分类模型，可作为中医师，特别是缺乏经验的年轻医师临床诊疗工作的补充。

表6 模型应用的病案信息录入表

表7 模型应用的预测结果

本文在研究过程中，针对中医医案文献的特点，如模糊性、非线性等，对数据挖掘的众多方法进行了筛选与评估，并择优锁定了彼此最为匹配的决策树算法，所得到的研究结果也具有一定的合理性与实践应用价值。但另一方面，由于本研究所存在的一些问题。1）数据总量与比例方面：纳入研究医案仅605例，且由于检索过程所存在的随机性而致三方医案的纳入比例存在较为悬殊的差距；2）医案文献质量方面：纳入医案时间跨度大，医案记载详略不一；3）研究方法与研究者方面：研究者对于分级量化标准掌握的主观性，对于算法选用的片面性等，均会降低模型精度进而影响研究结果及其实践意义。基于上述，在今后的研究当中，需要在数据采集与数据处理等多方面进行改进，并通过研究者培训，多领域合作等方式，提高研究的精确性与有效性，从而为临床选方用药提供更为全面、科学、客观的参考依据。

［1］中医药学名词审定委员会.中医药学名词（内科学，妇科学，儿科学）（2010）［M］.北京：科学出版社，2011.

［2］姚乃礼.中医症状鉴别诊断学［M］.北京：人民卫生出版社，2001.

［3］朱文峰.中医诊断学［M］.北京：中国中医药出版社，2007.

［4］田德禄.中医内科学［M］.北京：人民卫生出版社，2003.

［5］中华人民共和国卫生部.中药新药临床研究指导原则［M］.北京：中国医药科技出版社，2002.

［6］王世成.内科学［M］.上海：上海科学技术出版社，2000.

［7］徐迪华，徐剑秋.中医量化诊断［M］.江苏：江苏科学技术出版社，1997.

［8］中国中西医结合学会消化系统疾病专业委员会.胃肠疾病中医症状评分表［J］.中国中西医结合消化杂志，2011，19（1）：66-68.

［9］朱明.数据挖掘［M］.中国科学技术大学出版社，2008：86-99.

［10］郭翠翠.基于神经网络的数据挖掘方法研究［D］.武汉：武汉理工大学，2007.

［11］陈烨文，陈一江.张仲景辨治“下利”证浅析［J］.浙江中医药大学学报，2013，37（1）：15-17.

［12］朱明民.《伤寒论》下利证治浅析［J］.中国中医急症，2004，13（3）：171-172.

［13］齐卫东，白洁丽，倪美琴.《伤寒论》治热痢4方分析［J］.临床合理用药，2014，7（2A）：68.

［14］章浩军.探寻张仲景下利证治规律兼谈应用体会［J］.中医药通报，2012，11（6）：18-20.

［15］冯标婵.《伤寒论》对下利的辨治及其对后世的影响［D］.广州：广州中医药大学，2012：6.

［16］王富梅.《伤寒论》下利证的辨析体会［J］.光明中医，2010，25（2）：186-187.

Research on the Classification of Gegen Qinlian Decoction，Huangqin Decoction and Baitouweng Decoction Based on the Three Prescriptions'Medical Literature

WANG Qian，FU Yanling，CHEN Wenqiang，et al.
Xuanwu Hospital of Capital Medical University，Beijing 100053，China.

Objective：To establish the classification model of Gegen Qinlian decoction，Huangqin decoction and Baitouweng decoction in order to provide objective reference for the three prescriptions'reasonable usage.Methods：Clinical medical cases of the three prescriptions which were recorded from Ming dynasty to June 2014 were taken as the research objects.According to the criteria，605 cases were brought into this research in all，with 310 cases of Gegen Qinlian decoction，64 cases of Huangqin decoction，and 231 cases of Baitouweng decoction which were put into an EXCEL database that was built in advance.Then these data were pre-processed and decisionmaking tree was selected to build the model.Results：9 classification rules were obtained and the correct classification rate was 61.57%.Conclusion：The decision-making tree classification model has clinical practice significance，which can provide direct and useful reference for the clinical identification of the three prescriptions.

Gegen Qinlian decoction；Huangqin decoction；Baitouweng decoction；Classification；Decision-making tree

R289.5

1004-745X（2017）01-0033-05

10.3969/j.issn.1004-745X.2017.01.010

2016-09-13）

北京市卫生系统高层次人才专项（2013-2-31）；北京市中西医结合老年疾病研究所项目（2012-191）

△通信作者（电子邮箱：huangxiaobo@xwh.ccmu.edu.cn）