基于症状间关系及其对证候的贡献度初步建立新冠肺炎常见证候诊断依据*
2021-07-15冯贞贞李建生赵虎雷韩伟红王晓春
春 柳,冯贞贞,李建生,**,谢 洋,赵虎雷,韩伟红,王晓春
(1.河南中医药大学呼吸疾病中医药防治省部共建协同创新中心/河南省中医药防治呼吸病重点实验室 郑州 450046;2.河南中医药大学第一附属医院 郑州 450000)
证候研究已经成为制约中医药发展的一个主要问题,尤其体现在明确诊断方面[1],辨证的准确与否,是决定临床疗效的关键。多数研究[2-5]都致力于采用统计方法筛选与证候相关的症状,并计算各症状对证候的贡献度,以 “主症+次症” 的模式建立诊断模型,这些对证候诊断规范建立有一定意义。然而,症状作为辨证的依据往往不是孤立的,而是相互联系的,一些相关症状共同出现时,可以形成各自构成者原先不具备的新的辨证价值,或大于原先构成者各自辨证价值的累加[6]。因此,在明确常见证候主要症状的前提下,探讨症状间关系及其对证候的贡献度,进一步明确证候诊断依据,对提高证候诊断标准的诊断效能具有重要意义。已往基于597例654份新冠肺炎临床调查数据,探讨了新冠肺炎10个常见证候及其症状特征;并以湿热蕴肺证为例,结合关联规则与贝叶斯网络技术,初步建立了明确证候的症状间关系及其对证候贡献度的方法[7]。本研究进一步探讨新冠肺炎各常见证候中常见症状群及其对证候的贡献度、初步建立常见证候诊断依据,以期为建立新冠肺炎中医证候诊断标准提供依据。
1 资料与方法
1.1 数据来源
本研究数据来源于2020年2月1日-2020年2月26日河南省定点医院采集的597例654份新冠肺炎患者临床调查资料。具体西医诊断及中医辨证标准、纳排标准、调查内容与质量控制参见有关文献[4]。
1.2 数据挖掘及处理方法
1.2.1 关联规则
采用SPSSModeler 14.1软件,构建 “数据源-类型-Apriori-网络” 数据流。筛选各个证候中频率≥10.0%的症状输入到关联规则模型中,设置最小支持度10%,最小置信度80%,指定前项中包含的最大项目数为1。构建各常见证候中关联较强的症状组合。
1.2.2 贝叶斯网络
基于SPSSModeler14.1软件,以各个证候为目标变量,以筛选出频率≥15.0%的症状为输入变量,建立贝叶斯网络模型。构建各个证候中症状间的因果关系,并用条件概率定量的方式表示其强弱程度。
1.3 常见症状群的划分及贡献度的确定
将同时满足以下条件的症状组合作为各证候中常见症状群:①关联规则中支持度>10%、置信度>80%及提升度>1的二项关联组合;②贝叶斯网络条件概率≥0.45的症状组合。最终得出新冠肺炎各常见证候的常见症状群。并经贝叶斯公式进一步推导,得出每组症状群出现时各个常见证候出现的条件概率,将其作为证候诊断的贡献度。
2 结果
2.1 湿遏肺卫证
2.1.1 频数分布
涉及病例90份。频率≥10.0%的症状25个,包括乏力(44.44%)、发热(40.00%)、咳嗽(40.00%)、舌质淡(37.78%)、苔白腻(28.89%)等。
2.1.2 症状间的关联规则分析
二项关联分析显示强关联规则有6条,包括咳嗽⇒胸闷,舌质淡⇒脉濡,发热⇒恶寒等(表1)。
表1 湿遏肺卫证症状间二项强关联规则
2.1.3 症状间的贝叶斯网络分析
存在直接因果关系且条件概率≥0.45的症状组合有5组,分别是:头身困重、乏力(0.45);脉浮、苔白腻(0.73);咳嗽、痰少(0.54);胸闷、咳嗽(0.47);恶寒、发热(0.53)(表2)。
表2 湿遏肺卫证症状群条件概率
2.2 寒湿郁肺证
2.2.1 频数分布
涉及病例140份。频率≥10.0%的症状25个,包括舌质淡(55.71%)、咳嗽(44.29%)、乏力(44.29%)、发热(41.43%)、苔白腻(30.71%)等。
2.2.2 症状间的关联规则分析
二项关联分析显示强关联规则有6条,包括肢体酸痛⇒头痛,舌质淡⇒苔白腻,舌质淡⇒脉濡等(表3)。
表3 寒湿郁肺证症状间二项强关联规则
2.2.3 症状间的贝叶斯网络分析
存在直接因果关系且条件概率≥0.45的症状组合有5组,分别是:苔白腻、舌质淡(0.53);恶寒、发热(0.45);痰少、痰白(0.58);乏力、苔厚(0.66);咳嗽、痰白(0.91);头痛、肢体酸痛(0.94)(表4)。
表4 寒湿郁肺证症状群条件概率
2.3 风热犯肺证
2.3.1 频数分布
涉及病例34份。频率≥10.0%的症状28个,包括发热(47.06%)、恶寒(41.18%)、气短(41.18%)、乏力(41.18%)、鼻塞(38.24%)等。
2.3.2 症状间的关联规则
二项关联分析显示强关联规则有9条,包括咽痛⇒咽干,咽干⇒咽痛,咳嗽⇒痰黄等(表5)。
表5 风热犯肺证症状间二项强关联规则
2.3.3 症状间的贝叶斯网络分析
存在直接因果关系且条件概率≥0.45的症状组合有5组,分别是:流涕、鼻塞(0.83);咽干、咽痛(0.96);舌质红、脉浮数(0.81);痰黄、咳嗽(0.96);胸闷、胸痛(0.70)(表6)。
表6 风热犯肺证症状群条件概率
2.4 湿热蕴肺证
2.4.1 频数分布
涉及病例121份。频率≥10.0%的症状36个,包括发热(53.72%)、咳嗽(47.93%)、舌质红(45.45%)、脉数(43.80%)、苔腻(42.15%)等。
2.4.2 症状间的关联规则分析
二项关联分析显示强关联规则有11条,包括咳嗽⇒痰黄,胸闷⇒气促,舌质红⇒舌质紫暗等(表7)。
表7 湿热蕴肺证症状间二项强关联规则
2.4.3 症状间的贝叶斯网络分析
存在直接因果关系且条件概率≥0.45的症状组合有12组,主要包括:口渴、发热(0.50);痰粘稠、痰黄(0.78);脉数、口渴(0.61);舌质红、脉数(0.57)(表8)。
表8 湿热蕴肺证症状群条件概率
2.5 湿阻肺胃证
2.5.1 频数分布
涉及病例93份。频率≥10.0%的症状29个,包括低热(55.91%)、咳嗽(46.24%)、纳呆(43.01%)、乏力(41.94%)、苔白腻(39.78%)等。
2.5.2 症状间的关联规则分析
二项关联分析显示强关联规则有7条,包括头身困重⇒脘痞,苔白腻⇒脉濡,咳嗽⇒胸闷等(表9)。
表9 湿阻肺胃证症状间二项强关联规则
2.5.3 症状间的贝叶斯网络分析
存在直接因果关系且条件概率≥0.45的症状组合有6组,分别是:舌质淡、脉滑(0.59);苔白腻、脉濡(0.93);痰少、痰粘稠(0.64);胸闷、咳嗽(0.76);纳呆、呕恶(0.96);脘痞、头身困重(0.77)(表10)。
表10 湿阻肺胃证症状群条件概率
2.6 疫毒闭肺证
2.6.1 频数分布
涉及病例93份。频率≥10.0%的症状33个,包括纳呆(44.09%)、发热(41.94%)、咳嗽(40.86%)、胸闷(40.86%)、乏力(40.86%)等。
2.6.2 症状间的关联规则
二项关联分析显示强关联规则有9条,包括大便秘结⇒腹胀,咳嗽⇒痰黄,胸闷⇒气促等(表11)。
表11 疫毒闭肺证症状间二项强关联规则
2.6.3 症状间的贝叶斯网络分析
存在直接因果关系且条件概率≥0.45的症状组合有7组,分别是:胸闷、气促(0.88);痰黄、咳嗽(0.47);痰少、痰粘稠(0.60);发热、烦躁(0.46);大便秘结、腹胀(0.99);舌质红、苔黄腻(0.94);脉滑数、舌质紫暗(0.76)(表12)。
表12 疫毒闭肺证症状群条件概率
2.7 内闭外脱证
2.7.1 频数分布
涉及病例29份。频率≥10.0%的症状24个,包括呼吸困难(44.83%)、气促(41.38%)、发热(41.38%)、纳呆(41.38%)、神昏(37.93%)等。
2.7.2 症状间的关联规则
二项关联分析显示强关联规则有8条,包括胸闷⇒喘息,苔厚腻⇒舌质紫暗,大汗淋漓⇒四肢逆冷等(表13)。
表13 内闭外脱证症状间二项强关联规则
2.7.3 症状间的贝叶斯网络分析
存在直接因果关系且条件概率≥0.45的症状组合有6组,分别是:气促、呼吸困难(0.83);苔厚腻、舌质紫暗(0.95);大便秘结、口唇紫暗(0.45);四肢逆冷、大汗淋漓(0.96);大汗淋漓、口唇紫暗(0.45);神昏、口唇紫暗(0.66)(表14)。
表14 内闭外脱证症状群条件概率
2.8 肺脾气虚证
2.8.1 频数分布
涉及病例55份。频率≥10.0%的症状26个,包括发热(56.36%)、纳呆(43.64%)、咳嗽(40.00%)、呕恶(32.73%)、舌质淡(29.09%)等。
2.8.2 症状间的关联规则分析
二项关联分析显示强关联规则有9条,包括乏力⇒自汗,咳嗽⇒气短,纳呆⇒呕恶等(表15)。
表15 肺脾气虚证症状间二项强关联规则
2.8.3 症状间的贝叶斯网络分析
存在直接因果关系且条件概率≥0.45的症状组合有7组,分别是:苔薄、脉浮(0.45);脉沉细、苔白腻(0.89);咳嗽、胸闷(0.50);气短、咳嗽(0.46);腹胀、便溏(0.88);纳呆、呕恶(0.93);乏力、纳呆(0.46)(表16)。
表16 肺脾气虚证症状群条件概率
2.9 气阴两虚证
2.9.1 频数分布
涉及病例27份。频率≥10.0%的症状26个,包括咽干(44.44%)、干咳(44.44%)、乏力(44.44%)、自汗(44.44%)、舌质红(44.44%)等。
2.9.2 症状间的关联规则
二项关联分析显示强关联规则有8条,包括咳嗽⇒便溏、咳嗽⇒痰少、咽干⇒口渴等(表17)。
表17 气阴两虚证症状间二项强关联规则
2.9.3 症状间的贝叶斯网络分析
存在直接因果关系且条件概率≥0.45的症状组合有5组,分别是:口渴、咽干(0.90);咳嗽、痰少(0.59);神疲、苔薄(0.59);舌质红、口渴(0.63);自汗、乏力(0.90)(表18)。
表18 气阴两虚证症状群条件概率
2.10 新冠肺炎常见证候诊断依据的初步建立
综合以上结果,将最终得到的常见症状群作为证候的诊断依据,并经贝叶斯公式,得出各常见症状群对证候的贡献度。
2.10.1 湿遏肺卫证
①发热,恶寒;②咳嗽,胸闷;③头身困重,乏力;④苔白腻,脉浮。对证候诊断的贡献度分别为0.32、0.18、0.49、0.86。
2.10.2 寒湿郁肺证
①发热,恶寒;②咳嗽,痰白;③头痛,肢体酸痛;④舌质淡,苔白腻。对证候诊断的贡献度分别为0.41、0.33、0.70、0.49。
2.10.3 风热犯肺证
①咳嗽,痰黄;②鼻塞,流涕;③咽干,咽痛;④舌质红,脉浮数。对证候诊断的贡献度分别为0.10、0.37、0.18、1.00。
2.10.4 湿热蕴肺证
①发热,口渴;②咳嗽,痰黄;③胸闷,气促;④纳呆,头身困重;⑤苔黄腻,脉滑数。对证候诊断的贡献度分别为0.47、0.49、0.46、0.61、0.95。
2.10.5 湿阻肺胃证
①咳嗽,胸闷;②纳呆,呕恶;③头身困重,脘痞;④苔白腻,脉濡。对证候诊断的贡献度分别为0.34、0.42、0.82、0.53。
2.10.6 疫毒闭肺证
①胸闷,气促;②痰黄,咳嗽;③烦躁,发热;④大便秘结,腹胀;⑤舌质红,苔黄腻;⑥脉滑数,舌质紫暗。对证候诊断的贡献度分别为0.37、0.31、0.53、0.63、0.70、0.72。
2.10.7 内闭外脱证
①呼吸困难,气促;②大汗淋漓,四肢逆冷;③舌质紫暗,苔厚腻。对证候诊断的贡献度分别为0.44、
0.55、0.50。
2.10.8 肺脾气虚证
①咳嗽,气短;②乏力,自汗;③纳呆,呕恶;④腹胀,便溏;⑤苔白腻,脉沉细。对证候诊断的贡献度分别为0.20、0.42、0.21、0.56、0.91。
2.10.9 气阴两虚证
①咳嗽,痰少;②口渴,咽干;③乏力,自汗;④舌质红,脉细数。对证候诊断的贡献度分别为0.16、0.52、0.46、0.60。
3 讨论
缺乏规范的证候诊断标准是目前制约中医药疗效提高的关键问题之一[8]。近年来,随着多种数据挖掘方法[9-13]逐步引入到中医证候研究领域,越来越多的研究着力于证候诊断标准的建立。然而在中医证候诊断标准建立的过程中,以往研究[14-17]多针对单一症状或症状间关系,只考虑单独症状对证候的影响,如此将忽略具有密切联系的症状群,具有一定的局限性。证候对应的症状组合有哪些?症状组合中,症状对证候的贡献度如何以定量的形式表示出来[9],需要进一步探索。例如单独的 “发热” 这一症状对诊断表证的贡献度有限,而当其与 “恶寒” 同时出现,作为症状群的时候,基本上就可以确定为表证。因此,在进行证候诊断规范建立的过程中要考虑到症状之间客观存在的联系,而不是把症状孤立起来,从单一症状研究走向对症状群的研究[18]。
关联规则分析中支持度是症状在证候中同时出现的概率,置信度是衡量关联规则的可信程度,二者结合来量化高频症状之间的相互关系,使之作为证候中一组强关联症状组合。贝叶斯网络主要由节点和弧组成,其中每个节点代表一个随机变量,而每条弧代表一个概率依赖[19]。如果两个节点间有箭头连接,说明两者之间有因果联系,并用条件概率表达事件变量间关系的强度。结合贝叶斯及关联规则,能筛选出证候中关联较强、具有普遍性的症状组合。因此,本研究结合运用两种数据挖掘方法,将同时满足 “关联规则中支持度>10%、置信度>80%及提升度>1的二项关联组合且贝叶斯网络条件概率≥0.45” 的症状组合作为常见症状群。如在湿遏肺卫证中苔白腻&脉浮,支持度21.11%、置信度100.00%、提升度3.46,且在贝叶斯网络中二者存在直接因果关系(条件概率为0.71)。通过贝叶斯公式进一步推导,得出苔白腻&脉浮对湿遏肺卫证的证候诊断贡献度为0.86。最终得出湿遏肺卫证中发热&恶寒、咳嗽&胸闷、头身困重&乏力、苔白腻&脉浮4组常见症状群,其中苔白腻&脉浮对该证诊断贡献度最大(0.86),该证多见于新冠肺炎轻型[20],新冠肺炎病因多为外感湿毒之邪[21],初期病在肺卫,当见苔白腻、脉浮等表证,故两症状同时出现时对湿遏肺卫证证候诊断贡献度较大;初期病位在表,为邪气客于皮毛肌表,故有发热、恶寒之表证;又因湿性重浊,为阴邪,易阻遏气机,故见头身困重、乏力,这两组症状群对诊断湿遏肺卫证具有一定贡献;此次新冠肺炎主要表现为肺系症状,多个证候均可见咳嗽、胸闷等肺系病症状,故这两个症状同时出现时对诊断湿遏肺卫证特异性不强,贡献度较小。此外,其他证候常见症状群及其对证候诊断的贡献度与临床较为相符,据此初步建立新冠肺炎常见证候诊断依据。
本研究中,肺脾气虚证中的自汗、乏力,气阴两虚证中的舌质红、脉细数,贝叶斯网络分析显示其条件概率分别为0.39、0.42,考虑以下原因,亦将其作为常见症状群:①本研究纳入的肺脾气虚证、气阴两虚证样本量较小,研究结果可能出现偏倚;②关联规则显示以上两组症状的支持度、置信度均较高;③结合专业知识,以上两组症状对其证候的诊断具有重要意义,经贝叶斯公式得出其对证候的贡献度较高,分别为0.42、0.60,故将其列为证候的诊断依据。由于样本量较少的原因,邪陷心包证的计算无法实现预期目标。
综上所述,在对新冠肺炎常见证候及其临床特征进行分析的基础上,进一步综合关联规则与贝叶斯网络技术对主要症状进行相关性分析并计算贡献度,建立常见证候诊断依据,具有较好的可行性。这不仅为新冠肺炎证候诊断标准的建立提供客观依据,也为其他疾病的证候标准研究提供新的方法。然而,对于初步建立的证候诊断依据,如何将其组合形成具体的诊断条件,尚需进一步深入研究。