基于决策树法探析高颖教授辨治失眠主方主症规律
2021-09-18迟辉高颖
迟辉 高颖
摘要 目的:探索高颖教授辨治失眠主方的关键适用症状应用规律,为临床诊疗提供参考。方法:采集高颖教授2015年5月至2020年1月门诊病例数据库中204例(349诊次)失眠患者的诊疗信息,采用SPSS Modeler软件进行决策树分析,用CHAID与CART算法构建主方关键适用症状的分类模型。结果:共建立丹栀逍遥散类方、一贯煎类方、小柴胡汤类方、柴芩温胆汤类方4个主方主症的分类模型,各模型的准确率分别为88.24%、90.68%、91.18%、94.61%,各模型的曲线下面积(AUC)值分别为0.87、0.92、0.89、0.90;共筛选出21个重要预测变量;共得到22项判断规则。结论:通过决策树法建立的分类模型能够有效反映高颖教授辨治失眠的主方主症规律,具有较高的准确度、灵敏度和特异度,可为失眠的临床诊治提供参考和指导。
关键词 失眠;辨证论治; @ 高颖;决策树;数据挖掘
Analysis on the Law of Professor GAO Ying′s Syndrome Differentiation and Treatment of Insomnia Based on Decision Tree
CHI Hui,GAO Ying
(Dongzhimen Hospital of Beijing University of Chinese Medicine,Beijing 100700,China)
Abstract Objective:To explore the key applicable symptoms of Professor GAO Ying′s main prescription for insomnia,and provide reference for clinical diagnosis and treatment.Methods:We collected the diagnosis and treatment information of 204 insomniac patients(349 consultations) in the physician′s outpatient case database in the past 5 years,using SPSS Modeler software to make a decision tree analysis,and used the CHAID and CART algorithm to build a classified model of the key applicable symptoms.Results:A total of 4 main models for the classification of the main symptoms of Danzhi Xiaoyao San Recipe,Yiguan Jianlei Recipe,Xiao Chaihu Tang Recipe,Chaiqin Wendan Decoction Recipe were established,and the accuracy rates of each model were 88.24%,90.68%,91.18%,94.61%.The AUC values of each model were 0.87,0.92,0.89,0.90; 12 important predictors were screened out,and 22 judgment rules were obtained.Conclusion:The classification model established by the decision tree method can effectively reflect Professor GAO Ying′s principle of treating insomnia with high accuracy,sensitivity and specificity.It can provide reference and guidance for the clinical diagnosis and treatment of insomnia.
Keywords Insomnia; Syndrome differentiation; @ GAO Ying; Decision tree analysis; Data mining
中圖分类号:R242;R749文献标识码:Adoi:10.3969/j.issn.1673-7202.2021.16.022
失眠在中医学称之为“不寐”,是当今社会的常见病症,严重影响人们的学习、工作和生命质量。既往研究多集中在失眠药物配伍规律,某类方剂疗效观察以及医师个体经验方药,缺乏对方剂或药物核心适用症状的精准分析[1-9]。决策树法常用于归纳名老中医辨证过程、挖掘中医临证诊疗规律[10]。由于其产生的分类规则简单直观,分类准确率较高,因此该方法适用于方药适用症状的精准分析。决策树是树形结构的模型,具有清晰的属性结构和较好的分类、预测能力,属于有监督学习中的一种,广泛使用于分类与预测任务中[11]。当目标变量是分类变量时,决策树完成分类任务;当目标变量为连续变量时,决策树完成预测任务。本研究基于医师门诊病例数据库中已有的主方资料,通过决策树法建立主症与主方的分类模型,探索医师治疗失眠主要方剂的核心适用症状,为失眠的临床诊治提供参考。
1 资料与方法
1.1 一般资料 选取2015年5月至2020年1月北京中医药大学东直门医院高颖教授门诊病例数据库中失眠患者的病例资料,共纳入患者204例(349诊次),其中女135例(66.2%),236诊次(67.6%);患者年龄19~86岁,平均年龄(51.2±14.1)岁;病程1个月至48年,中位病程2.5年。
1.2 纳入标准 1)以失眠为主诉且第一诊断为失眠的患者;2)年龄在18周岁以上的患者;3)病案书写完整的患者,包括人口学特征、主诉与病史、四诊资料、治疗方案。
1.3 排除标准 1)诊断或病史记录中,合并尚未得到有效控制的、妨碍睡眠的其他器质性病变的患者,如神经系统器质性疾病、严重呼吸循环系统疾病、严重疼痛、严重精神障碍等疾病;2)孕期或哺乳期的患者。
1.3 方法
1.3.1 数据采集 从门诊病例数据库中筛选符合研究标准的病例,将患者一般资料和诊疗资料导出为Excel文件。该数据库由随诊医师同步录入,包含患者完整的诊疗资料,库内有原始病历及处方的影像存档,保证原始资料可溯源,数据存疑时调阅原始资料核查。
1.3.2 数据预处理 参照业内相关标准制定预处理规则[12-14],对症状及药物名称进行统一和规范,其中症状名称规范参照《中医症状鉴别诊断学》和《中医临床常见症状术语规范》;药物名称规范参照《中华人民共和国药典》(2015版)。
1.3.3 数据挖掘 数据挖掘以频次分析为基础,以高频症状为条件构建主方应用的分类决策树模型,分别运用CHAID、QUEST、CART和C5.0算法进行建模,选取准确率最高的算法展示结果,最终的总体分类模型选用卡方自动交互检测(Chi-squared Automatic Interaction Detector,CHAID)算法;各具体类方的决策树模型选用分类与回归树(Classification and Regression Tree,CART)算法。为提高数据分类的准确性,具体建模中随机将原始数据集分为60%训练集和40%测试集,将高频症状作为输入变量,将患者主方类别作为目标变量,使用训练集数据建立模型,再用测试集数据对该模型的性能进行评估。数据挖掘采用SPSS Modeler18.0软件。
1.3.4 模型评估 模型准确度评估采用增益曲线描述;模型灵敏度与特异度评估采用受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC)描述,曲线下面积(Area Under Curve,AUC)的大小代表灵敏度与特异度的高低。
模型灵敏度和特异度采用ROC曲线描述,曲线下面积(AUC)越大,表示模型灵敏度和特异度越高,即辨别力越强。
增益曲线是描述模型预测准确性的方法,在此即为对使用不同主方人群分类正确率的评估,是衡量与不利用模型(红色基线)相比,模型的预测能力提高了多少。蓝色线为理想曲线,代表模型的绿色曲线越接近理想线表示分类正确率越高,
1.3.5 决策树分析 总体分类模型:总体分类模型选择CHAID算法,该算法基于目标变量自我分层,以χ2检验为核心,对每个自变量进行分类并计算分类的χ2值,如果几个变量的分类均显著,则比较各分类的显著程度(P值的大小),选择最显著的分类法作为子节点。该方法能自动归并自变量中的类别,使之显著性达到最大。
具体分类模型:上述总体分类模型共纳入一贯煎类方、丹栀逍遥散类方、小柴胡汤类方、柴芩温胆汤类方等4个主方,其他类和归脾汤类方未进入模型。对以上4类主方进一步采用CART算法构建具体的主方分类决策模型。CART算法使用基尼系数作为划分标准,基尼系数越小,区分越彻底。
1.4 统计学方法 采用SPSS 20.0统计软件对采集信息进行一般描述统计,正态分布的计量资料用均值±标准差(±s)描述,非正态分布计量资料采用中位数描述,计数资料采用频次、百分率等描述。
2 結果
2.1 频次分析
2.1.1 症状频次 本研究共涵盖失眠相关症状139种,其中主症6种,次症107种,舌脉26种。选取出现频率在10%以上(频次≥35次)的症状共计41种纳入决策树分析。其中主症6种,次症21种,舌脉14种。见表1~3。
2.1.2 主方频次 医师的门诊病例数据库中记录有每个诊次处方的主方名称,均为随诊医师同步录入并经医师本人审核确认后实时保存。以患者所用处方的主方类别作为人群分类标准,根据主方出现频次的高低,共划分为6类不同功效的主方群:养阴清热类、清热化痰类、疏肝健脾类、和解阴阳类、补益气血类和其他类。以各类别中频次最高的方剂名称来命名类别属性,分别为一贯煎类方(含百合地黄汤、百合知母汤等),柴芩温胆汤类方(含温胆汤、黄连温胆汤等),丹栀逍遥散类方(含逍遥散、四逆散等),小柴胡汤类方(含柴胡加龙骨牡蛎汤、柴胡加桂枝龙骨牡蛎汤),归脾汤类方和其他类,以上6类属性作为目标变量纳入决策树分析模型。
2.2 决策树分析结果
2.2.1 总体分类模型 共筛选出多汗、舌尖红、舌体胖大、双目干涩、焦虑、苔腻、口苦、情绪低落8个重要属性,共得到9项判断规则。见表4。构建的总体分类模型中,决策树的节点为16,终端节点树为9,深度为5。模型正确分类数为290例,准确率83.09%;误分数为59例,误分率为16.91%。见图1。
2.2.2 具体分类模型 丹栀逍遥散类方模型:共筛选出纳差、情绪低落、舌边齿痕、疲倦、舌体胖大、便溏6个重要预测变量,获得5项判断规则,树状图见图2。
规则①:IF“纳差=是”AND“情绪低落=是”,Then丹栀逍遥散类方=YES。
规则②:IF“纳差=是”AND“情绪低落=否”AND“舌边齿痕=是”,Then丹栀逍遥散类方=YES。
规则③:IF“纳差=是”AND“情绪低落=否”AND“舌边齿痕=否”AND“疲倦=是”,Then丹栀逍遥散类方=YES。
规则④:IF“纳差=否”AND“舌体胖大=是”,Then丹栀逍遥散类方=YES。
规则⑤:IF“纳差=否”AND“舌体胖大=否”AND“情绪低落=是”AND“便溏=是”,Then丹栀逍遥散类方=YES。
一贯煎类方模型:共筛选出双目干涩、舌红、健忘、少苔、多汗、手足心热6个重要预测变量,获得4项规则,树状图见图3。
规则①:IF“双目干涩=是”,Then一贯煎类方=YES。
规则②:IF“双目干涩=否”AND“舌红=是”AND“健忘=是”,Then一贯煎类方=YES。
规则③:IF“双目干涩=否”AND“舌红=是”AND“健忘=否”AND“少苔=是”,Then一贯煎类方=YES。
规则④:IF“双目干涩=否”AND“舌红=否”AND“手足心热=是”AND“多汗=是”,Then一贯煎类方=YES。
小柴胡汤类方模型:共筛选出抑郁、烦躁、口苦、脉沉、双目干涩5个重要预测变量,获得2项规则,树状图见图4。
规则①:IF“抑郁=是”AND“烦躁=否”,Then小柴胡汤类方=YES。
规则②:IF“抑郁=否”AND“口苦=是”AND“脉沉=是”AND“双目干涩=否”,Then小柴胡汤类方=YES。
柴芩温胆汤类方模型:共筛选出苔腻、苔黄、抑郁、头痛、舌体胖大5个重要预测变量,获得2项规则,树状图见图5。
规则①:IF“苔腻=是”AND“苔黄=是”AND“抑郁=否”AND“舌体胖大=否”,Then柴芩温胆汤类方=YES。
规则②:IF“苔腻=是”AND“苔黄=否”AND“头痛=是”,Then柴芩温胆汤类方=YES。
2.2.3 预测变量重要性 总体分类模型中,前5位最重要的预测变量为情绪低落、双目干涩、口苦、苔腻、多汗。见图6。具体分类模型中,小柴胡汤汤类方以抑郁、口苦為主,柴芩温胆汤类方以苔腻、苔黄为主,一贯煎类方以双目干涩为主,丹栀逍遥散类方以舌体胖大、情绪低落、纳差为主。各具体模型的预测变量重要性见图7。
2.2.4 模型准确率 模型预测的准确性采用增益曲线评估,该曲线(图8~9)能够反映出模型的预测能力比未建模状态所提高的程度,即实际曲线(绿色)越接近理想曲线(蓝色),表示分类的准确率越高。各类主方模型均具有较高的准确率(>80%),其中柴芩温胆汤类方模型的准确率在各分集内均为最高(均>90%),训练集中的丹栀逍遥散类方模型和验证集中的小柴胡汤类方模型,二者的准确率略低于同集中的其他模型具体评估结果见表5。
2.2.5 灵敏度与特异度 ROC曲线(图10~11)能够描述模型的灵敏度与特异度,曲线下面积(AUC)越大,则模型的辨别力越强,通常AUC值介于0.5~1.0之间。Gini系数是模型影响力的指标,间接反映了模型的灵敏度与特异度,与AUC的意义相近,通常AUC越大,Gini也越高。各模型的灵敏度与特异度均较高,分别为:丹栀逍遥散类方0.91、0.95,一贯煎类方0.85、0.98,小柴胡汤类方0.80、0.96,柴芩温胆汤类方0.81、0.96。训练集中,各模型的辨识能力均为强(AUC>0.8,Gini>0.7);验证集中,小柴胡汤类方模型的辨识能力略低于其他主方模型,但仍具有较强的辨识能力(AUC>0.7,Gini>0.5),具体评估结果见表6。
4 讨论
总体分类模型中,未归其他类及脾汤类方,究其原因,其他类中包含多个使用频次低的方剂,各方剂特征分散,故无法形成规律明显的分类模型。而归脾汤类方样本量较少,比例较低,故未能进入模型。进入总体模型的四类主方,其增益曲线在各具体模型中比较接近理想线,提示各模型的分类准确率均较高;通过ROC曲线可知结果说明,可以结果出现反映出各模型的灵敏度和特异度均较高,提示各模型的分类预测能力均较强。综合准确度、灵敏度和特异度结果,提示本研究的分类模型能够有效反映医师辨证论治失眠主方主症的经验。
4.1 一贯煎类方模型 本组模型提示,当出现1)“双目干涩”;2)“无双目干涩”但有“舌红”且“健忘”;3)“舌红”且“少苔”;4)“无舌红”但有“手足心热”且“多汗”4种类型症状组合时,主方倾向于使用一贯煎类方,具体包括百合地黄汤、百合知母汤等。该模型的预测变量中,双目干涩的权重最大,肝开窍于目,肝肾同源,肝肾阴精不足易见双目干涩、健忘等症;舌红、少苔、手足心热多为阴虚内热之象;多汗常由热盛迫津外出,实热者多自汗,虚热者多盗汗。此组症状总体反映了阴虚、内热的核心病机,而该类方滋养肝肾,养阴清热,适用于阴虚内热之证,临床研究亦显示以上方剂对阴虚火旺型失眠具有良好效果[15-18]。高颖教授临床常合用二至丸等方,对肝肾阴虚者效果颇佳。
4.2 丹栀逍遥散类方模型 本组结果提示“纳差、情绪低落、舌边齿痕、疲倦、舌体胖大、便溏”是应用丹栀逍遥散类方的核心推荐适应证,具体方药包括逍遥散、四逆散等方。预测变量中以舌体胖大、情绪低落、纳差最为重要,诸症综合提示病机以肝郁脾虚为主,脾虚湿盛,故见舌体胖大、舌边齿痕;脾气不足,运化无力,故见纳差、疲倦;中焦虚弱,脾气不升,“清气在上则生飧泻”,故见便溏。情绪低落多见于肝郁气滞,肝脏属木,性喜调达,主疏泄,与情绪密切相关。肝气郁结不得舒畅,则易横逆克脾犯胃,影响脾胃功能。脾胃相表里,“胃不和则卧不安”,脾胃功能失调,间接影响心神,故治法应疏肝解郁,健脾补中,使中焦健运,气机通畅,心神自安。临床中,气郁容易化热,故丹栀逍遥应用较多。现代临床研究发现逍遥散类方对肝郁气滞型、肝郁脾虚型、肝郁化火型失眠均有疗效,能够明显提高睡眠质量,改善临床症状,值得临床应用[19-21]。实验研究提示其作用机制可能是通过激活PI3K/AKT/mTOR信号通路,从而达到调节神经系统治疗失眠的目的[22]。
4.3 小柴胡汤类方模型 本组模型提示,当出现“抑郁”且“非烦躁”时,以及“非抑郁”且“口苦”且“脉沉”且“非双目干涩”时,多偏于应用和解类方剂,如小柴胡汤、柴胡加龙骨牡蛎汤、柴胡加桂枝龙骨牡蛎汤等。以上诸方多以柴胡为君,功效以和解少阳,疏肝解郁、潜镇摄纳为主,适用于少阳病类诸症。而模型中抑郁与口苦在预测变量中权重最大,以上两点与张仲景的论述也较为相似,如《伤寒论》中言及少阳病的主症和主方时讲到“少阳之为病,口苦,咽干,目眩也”,小柴胡汤主之。规则中“非烦躁”“非双目干涩”提示此类方不适宜直接用于热证明显或阴伤明显者,用之则需以清热、养阴之品相佐。有学者认为失眠症的病机与少阳枢机不利密切相关,应从少阳论治,治宜和解少阳,调达枢机,代表方为小柴胡汤[23]。孙卓和刘龙涛[24]认为小柴胡汤治疗失眠临床选方的关键为脉弦、口苦、口干、便干、烦躁。研究显示小柴胡汤治疗失眠症的病机为少阳胆热内郁,热扰心神,临床选方的关键为脉弦、口苦、口干、便干等;古方多配伍清热药,现代多配伍安神药[24]。多项Meta分析也显示柴胡加龙骨牡蛎汤加减治疗失眠具有较好的临床疗效和安全性[25-26]。临床研究提示柴胡加龙骨牡蛎汤能有效调节神经功能,治疗气郁质失眠疗效显著,并能改善焦虑、抑郁状态,控制失眠症状[27]。
4.4 柴芩温胆汤类方模型 研究结果提示“苔腻”是应用柴芩温胆汤类方的主要判别症状,在本模型的预测变量中权重最大,当出现苔腻伴舌黄、或苔腻伴头痛时,主方更侧重温胆汤系列方剂,包括柴芩温胆汤、黄连温胆汤等。高颖教授认为中医象思维具有主体性,舌象乃象思维之主体,在四诊信息中十分重视舌象[28]。苔腻主湿浊、痰饮、食积,痰浊属湿邪,其性黏着,最易壅滞气机,易于夹热、化火,痰热上扰于心则心神不安,上扰头目可见头晕头痛,犯于中焦则胆胃不和,临床多见白腻、灰腻、黄腻之苔,治宜清胆、和胃、燥湿、运脾、行气、化痰,温胆汤类方剂首选。临床研究显示应用温胆汤系列方剂治疗失眠具有较好疗效[30-32]。
在真实诊疗过程中,患者的症状描述常常冗杂繁多,需要医师化繁为简,从复杂信息中高效、快速地提取最有价值的信息,作出精准辨证,因此掌握主方的关键适用证,对提高辨证论治的效率和准确率具有重要意义,这点也与抓主症的思维有异曲同工之妙。刘渡舟讲抓主症时谈到,抓主症是以少知多,以点见面,主症既是诊断标准,也是投方指征[33]。主症多与首选方剂联系在一起,抓主症具有“汤证辨证”的特点,抓住主症就选择到了对证的方药,才能取得理想疗效。
综上所述,本研究通过决策树法分析了医师辨治失眠主方关键适用症状的规律,建立了四类主方主症的决策模型,各模型的准确度、灵敏度、特异度均较高,所挖掘的规律能够为临床精准、高效辨证论治失眠提供参考。
参考文献
[1]王翰,陈勇毅.基于数据挖掘探讨陈勇毅治疗不寐用药规律[J].浙江中西医结合杂志,2020,30(4):276-277.
[2]譚丽博,刘燕,吴凤芝,等.基于文献数据探讨中药治疗失眠的用药规律[J].现代中医临床,2020,27(1):35-42.
[3]蔡晓.归脾汤加减用于不寐证合并焦虑抑郁患者的效果观察[J].实用中医内科杂志,2019,33(10):34-36.
[4]徐陈,郭小草,王敬卿.加味酸枣仁汤治疗阴虚火旺型焦虑性失眠障碍的临床疗效[J].实用中医内科杂志,2020,34(4):94-96.
[5]李悦婷,张伟.小柴胡汤合桃红四物汤加龙牡治疗瘀热互结型不寐的个案报道[J].世界睡眠医学杂志,2019,6(6):838-839.
[6]王泰勇,谢晓菲,郭睿.益肾宁心汤治疗心肾不交型失眠38例临床观察[J].湖南中医杂志,2019,35(11):46-47.
[7]张元忠,赵冬梅.逍遥散加味治疗肝郁型失眠[J].吉林中医药,2018,38(1):49-51.
[8]和吉仙,顾石松.顾石松运用扶阳法治疗失眠的用药经验[J].内蒙古中医药,2020,39(3):91-92.
[9]贾林娜,汤玲,肖承悰.肖承悰自拟更欣汤治疗女性更年期失眠症经验[J].中医杂志,2020,61(6):479-481.
[10]马梦羽,沈璐,文天才,等.数据挖掘技术在中医诊疗数据分析中的应用[J].中国中医药信息杂志,2016,23(7):132-136.
[11]马强.数据挖掘中决策树算法的优化应用研究[J].电子测试,2016(8):30-31.
[12]国家药典委员会.中华人民共和国药典[M].北京:中国医药科技出版社,2015:1-34.
[13]姚乃礼,朱建贵,高荣林.中医症状鉴别诊断学[M].2版.北京:人民卫生出版社,2013:35.
[14]黎敬波,马力.中医临床常见症状术语规范[S].北京:中国医药科技出版社,2015:43.
[15]新昕.百合地黄汤加减治疗阴虚型不寐的疗效分析[J].中国医药指南,2018,16(33):183-184.
[16]张忠,于翔,李子全,等.百合地黄汤治疗阴虚火旺型失眠临床观察[J].光明中医,2019,34(10):1509-1511.
[17]袁莉,李贵明,姚祖培,等.百合知母汤加减治疗尿毒症患者顽固性失眠2例[J].中国中西医结合肾病杂志,2019,20(8):737-738.
[18]白志芹.一贯煎加减治疗阴虚火旺型不寐61例[J].中国中医药信息杂志,2011,18(11):77-78.
[19]陈艳.丹栀逍遥散加减治疗肝郁化火型失眠临床观察[J].中医临床研究,2019,11(20):92-94.
[20]薛玲,张智明.逍遥散加味治疗肝郁型失眠的临床观察[J].光明中医,2019,34(14):2155-2156.
[21]张元忠,赵冬梅.逍遥散加味治疗肝郁型失眠[J].吉林中医药,2018,38(1):49-51.
[22]王韵桥.逍遥散对肝郁证失眠大鼠模型海马mTOR信号通路的影响[D].南宁:广西中医药大学,2019.
[23]孙卓,刘龙涛.从少阳论治失眠症的临证体悟[J].中国医药导报,2019,16(36):132-135.
[24]程茜.小柴胡汤治疗失眠症的古今文献对比研究[J].中医文献杂志,2015,33(6):5-7.
[25]芮轶群,吕阳,李文婷,等.柴胡加龙骨牡蛎汤加减治疗失眠的Meta分析[J].山东中医杂志,2019,38(12):1123-1130.
[26]何姗姗,陈晓锋,王雪男.柴胡加龙骨牡蛎汤加减治疗失眠的Meta分析[J].湖南中医杂志,2019,35(7):125-128.
[27]孙小添.柴胡加龙骨牡蛎汤对气郁质失眠患者疗效及焦虑抑郁状态影响[J].辽宁中医药大学学报,2020,22(1):89-92.
[28]王永炎,张启明.象思维与中医辨证的相关性[J].自然杂志,2011,33(3):133-136.
[29]高颖,方祝元,吴伟.中医内科学[M].北京:人民卫生出版社,2015:27.
[30]郭雪松,黄进学,解欢欢,于小刚,杨文媛,卢玉俊.高血压伴失眠的发病机制及与气郁质关联的研究进展[J].中国医药,2021,16(3):467-469.
[31]周润津,林兴栋.林兴栋采用加味柴胡温胆汤治疗失眠体悟[J].广州中医药大学学报,2020,37(1):167-171.
[32]张蕾,张永华.张永华名中医运用加味黄连温胆汤治疗失眠临床分析[J].世界睡眠医学杂志,2019,6(9):1209-1210.
[33]傅延龄,刘渡舟.抓主症方法的认识与运用[J].中国医药学报,1993(4):43-44.
(2020-07-04收稿 责任编辑:张雄杰)