APP下载

基于数据挖掘技术的慢性肾脏病中医症候规律研究

2020-06-30王要强吴瑞管传涛解中跃程昆林毕昌韦章鑫罗冬梅李文喜

世界中医药 2020年24期
关键词:循证医学关联规则数据挖掘

王要强 吴瑞 管传涛 解中跃 程昆林 毕昌韦 章鑫 罗冬梅 李文喜

摘要 目的:遵循循证医学的原则,对201例肾病患者的中医药临床研究数据进行挖掘,发现慢性肾脏病的中医症状,为慢性肾脏病的诊断和治疗提供有效的参考。方法:运用频数分析法和关联规则分析对201例肾病患者临床数据进行分析。结果:患者的舌质主要是红和淡红,其频率分别为39.7%,33.3%;舌苔主要是白、白腻和薄白,其频率分别为34%,17.6%和15%;脉象主要是细,细滑,沉细脉象,其频率分别为20.5%,13.5%,10.3%。另外,患者的中医辨证主证主要是气阴两虚证和肝肾阴虚证,其频率分别达到46.3%,24.4%;中医兼证中湿热证、湿浊证和血瘀证占比较高,其频率分别为32.6%,29.4%与23%。且由关联规则分析可以得到中医主证和兼证与所对应的舌质、舌苔和脉象的关联性的强弱。结论:频数分析法和关联规则分析能够清楚地展示慢性肾脏病的中医征候规律,有助于慢性肾脏病的精准诊断和个性化治疗。

关键词 循证医学;慢性腎脏病;数据挖掘;频数分析;关联规则

Study on Traditional Chinese Medicine Syndromes of Chronic Kidney Disease Based on Data Mining Technique

WANG Yaoqiang,WU Rui,GUAN Chuantao,XIE Zhongyue,CHENG Kunlin,BI Changwei,ZHANG Xin,LUO Dongmei,LI Wenxi

(School of Mathematical Science and Engineering,Anhui University of Technology,Ma′anshan 243002,China)

Abstract Objective:To mine the data of 201 patients with kidney disease from TCM clinical research,and find the TCM symptoms of chronic kidney disease,which can provide an effective reference for the diagnosis and treatment of chronic kidney disease following the principle of evidence-based medicine.Methods:Frequency analysis and association rule analysis were used to analyze the clinical data of 201 patients with nephropathy.Results:The tongue of the patients was mainly red and light red,with frequencies of 39.7% and 33.3%,respectively.The tongue coating was mainly white,white greasy and thin white,with the frequencies of 34%,17.6% and 15% respectively.The pulse was mainly fine,smooth and sinuous,with frequencies of 20.5%,13.5% and 10.3%,respectively.In addition,the main syndromes of TCM syndrome differentiation in patients were qi and yin deficiency syndrome and liver and kidney yin deficiency syndrome,with the frequency of 46.3% and 24.4% respectively.Among the TCM syndromes,dampness and heat syndrome,dampness and turbidity syndrome and blood stasis syndrome were relatively high,accounting for 32.6%,29.4% and 23%,respectively.The correlation between the main syndrome and the concurrent syndrome and the corresponding tongue texture,tongue coating and pulse can be obtained by association rule analysis.Conclusion:Frequency analysis and association rule analysis can clearly demonstrate the Chinese medicine symptom rule of chronic kidney disease,which is helpful for accurate diagnosis and personalized treatment of chronic kidney disease.

Keywords Evidence-based medicine; Chronic kidney disease; Data mining; Frequency analysis; Association rules

中图分类号:R242文献标识码:Adoi:10.3969/j.issn.1673-7202.2020.24.029

循证医學崛起于20世纪90年代[1-2],狭义上的循证医学为循证临床实践,强调医生在临床工作中应依据最佳的研究证据[3],结合自己的临床经验,医疗条件及患者的情况与选择,制定合理的诊治方案。广义上的循证医学是在一切医疗卫生服务的循证实践中,强调制定宏观医疗卫生决策时遵循研究证据的重要性和必要性[4]。

循证医学不同于传统医学。传统医学是以经验医学为主,即根据非实验性的临床经验、临床资料和对疾病基础知识的理解来诊治患者。而循证医学强调的是:任何医疗决策应建立在最佳科学研究证据的基础上,以便更好地对症下药,更快的诊治好患者。

慢性肾脏病(Chronic Kidney Disease,CKD)是各种肾脏病于急性阶段未经控制后的共同转归,它是一种临床综合征[5]。目前国际上公认的定义为:肾脏损害≥3个月,表现下列症状之一者:肾脏病理异常和/或尿成分异常(如有血尿、电解质异常、PH值异常)和/或影像学异常;肾小球滤过率(GFR)<60 mL(min·1.73 m)≥3个月,有或无肾损伤依据[6,7]。该病的病因病机十分复杂,虚实并见,阴阳平衡的失调和寒热的错杂等,但以脾肾衰败为主要病机,受损脏腑广泛,以脾肾两脏为主。湿毒潴留体内不能得到及时的排除是病机的关键。其基本发病机制是由于慢性肾脏病迁延日久,脏腑的功能受到损害而变虚,加之外邪对机体的侵入以及饮食劳倦过度所伤、情志不畅、就医时的误诊误治,以及各种原因导致疾病治疗不及时等。

基于中医药在减轻慢性肾脏病患者临床症状体征以及生化指标方面的很多优势,随着大数据时代的到来,越来越多的数据挖掘和统计分析方法被用到慢性肾脏病的中医诊断和治疗研究中[8-9]。本文将从循证医学的角度,借助数据挖掘技术,通过分析201例肾病患者临床数据去探索该病的中医症候规律。

1 资料与方法

1.1 数据来源 数据来源于“国家人口健康科学数据中心数据仓储PHDA”(http://www.ncmi.cn)[10]。数据包括201例肾病患者临床数据。具体包括病史摘要、基本信息、西药、西医诊断、中药方剂、中医诊断等信息。

1.2 基本信息

从表1~2可以看出201例肾病患者临床数据的基本信息:男性患者119例,女性患者82例,各占总体的59.2%和40.8%;有头晕症状的患者3例,无头晕病状的患者198例,各占0.015%和0.985%。.

1.3 数据挖掘方法

首先,采用频数分析法分析慢性肾脏病的中医辨证分型、舌象及脉象的统计学规律。把患者的证型、舌象和脉象的分布情况在柱状图上展示出来,这样可以直观地观察并找到每种分布中频率最大的几种情况,为慢性肾脏病的诊断和治疗提供一些参考依据。

其次,分析了解每种证型在患者中发生的频率,运用关联规则,把症状与舌质、舌苔及脉象关联起来,得到患者普遍出现某种症型的可能性。患者在就诊时,医生可将患者出现的症状与其舌象、脉象相关联,结合自己的经验,在遵循循证医学原则的基础上,推断出患者患慢性肾脏的可能性,并在此基础上对患者进行有针对性的专项检查从而得出患者是否患慢性肾脏的结论。

关联规则分析的模型为:1)项集:组成所以情况的集合。2)关联规则:一般记为X->Y的形式,X表示先决条件,Y表示相应的关联结果。3)支持度:指所有项集中,同时发生X和Y的可能性,数学表达式可表示为:

supp(X=>Y)≡σ(TX∩TY)N=X和Y同时出现的事务数目事务数总和

4)置信度:表示关联规则X-->Y中,发生X的前提下也出现了Y,为条件概率,其数学表达式为:

conf(X=>Y)≡supp(X=>Y)supp(X)=σ(TX∩TY)σ(TX)

该指标可以控制哪些项集为强关联项集,即为发生X的情况下,有多大概率发生Y。

2 中医症候诊断标准

参照《慢性肾衰竭的诊断、辨证分型及疗效评定标准》(2006年试行方案)[11]及2002年《中药新药临床研究指导原则》[12]制定[13]。

2.1 中医主证

2.1.1 脾肺气虚证 主症:乏力,精神差,纳呆腹胀,大便泄泻。次症:表卫不固,泡沫尿。舌淡、苔白,脉沉细或细。

2.1.2 肝肾阴虚证 主症:少气乏力,大便干结。次症:口燥咽干。舌红,苔黄,脉细滑或弦细。

2.1.3 脾肾阳虚证 主症:畏寒肢冷,泛吐清水,腰膝冷痛。次症:口淡,夜尿频多或小便清长。舌淡胖或边有齿痕,苔白,脉弦细、沉。

2.1.4 气阴两虚证 主证:口干,咽干,目涩,心烦失眠,大便干结。次证:血虚,如面黄无华。舌质淡白,脉细弱。

2.1.5 肺肾气虚证 主证:泡沫尿,口干咽燥,乏力。次证:咽喉肿痛,表卫不固。舌质暗红,舌苔白,脉象细滑。

2.2 中医兼证

2.2.1 寒湿证 症状:面色发白、发青、发暗;反复的口腔溃疡;腹痛。舌质淡红,舌苔白腻,脉细或滑。

2.2.2 湿热证 症状:口苦,小便涩痛不利,小腹胀满。舌苔黄腻。

2.2.3 湿浊证 症状:腹大胀满,少尿,大便不爽。舌质暗红,苔白,脉细沉缓,细滑。

2.2.4 血瘀证 症状:唇甲紫暗,肌肤甲错,肢体麻木。舌质紫暗或舌有瘀点、瘀斑,脉涩或细涩。

2.2.5 外感证 症状:心烦失眠,血尿,眩晕,全身酸痛。舌质淡红,苔白,脉沉细。

3 数据分析

3.1 分析指标 1)舌质;2)舌苔;3)脉象;4)中医主证;5)中医兼证。

3.2 舌象分析

运用频数分析法对201例患者就诊时的舌象进行分析,其中舌质分布情况见表3。对应的频率分布图见图1。

运用頻数分析法对201例患者的舌苔进行分析,舌苔分布情况见表4。

从表3、4及图1、2知道舌质主要是红和淡红,其频率分别为39.7%,33.3%;舌苔主要是白、白腻和薄白,其分别占有的频率为34%,17.6,15%。从中我们可以看出:患有慢性肾脏病的大部分患者都有红或淡红的舌质,舌苔为白,白腻或薄白。舌质红提示体内有热像;而舌苔白、白腻说明患者有寒证或痰湿或湿困于脾,薄白属于正常,寒证在体表而未入里。所以患者大多表现为湿热证。

3.3 脉象分析

运用频数分析法对201例患者的脉象进行分析,脉象分布情况见表5。

从表3及图3知,出现细、细滑、沉细脉象的患者占比最多分别为20.5%,13.5%,10.3%,细脉主病为气血俱虚及湿证,慢性肾脏病多为沉细脉。

3.4 中医主、兼证分析

3.4.1 中医主证分析

运用频数分析法对201例患者的中医主证进行分析。见表6。

从表6及图3、4知道慢性肾脏病中医主证主要是气阴两虚证,和肝肾阴虚证,分别达到46.3%,24.4%。所以慢性肾脏病以虚为主。

3.4.2 中医兼证分析

运用频数分析法对201例患者的中医兼证进行分析。见表7。

从表7及图5知道湿热证,湿浊证,血瘀证占比最高,分别为32.6%,29.4%,23%,由此可知慢性肾脏病的病性以湿热,湿浊为主,血瘀次之。

4 关联规则分析

将舌质、舌苔、脉象的信息分别与中医主证、中医兼证的信息相关联,用R软件进行数据关联分析。最小支持度阈值取1%,最小置信度阈值取80%。

利用R软件我们可以得到11条与中医主证相关联的规则,由这些关联规则我们可以画出导向图图6。分析结果显示:所得关联规则置信度基本上都达到100%,支持度都在1.5%附近。其中舌质、舌苔或者脉象只要出现{淡暗}、{淡红,有齿痕}、{薄腻}、{少}、{少,细}、{薄黄腻,淡红}、{红,弦}、{薄白,细弱}、{淡红,细弱}等组合中的一组就可说明该患者患有气阴两虚证,而出现{白,红,滑}的症状说明该患者患肝肾阴虚证。它们的支持度都在2%附近,置信度都是100%。只有{细弦}=>{气阴两虚证}的支持度为2.63%,置信度为80%。因此我们可以相信患者在出现这些症状后大部分是气阴两虚证或者肝肾阴虚证。由图6知道,和气阴两虚证关联的症状组合最多,和肝肾阴虚证相关联的症状组合只有一个,这从侧面印证了患有气阴两虚证的患者居多。

同样地,我们可以得到舌质、舌苔及脉象与中医兼证的关联规则有15条,它们与中医兼证关联结果的导向见图7。分析结果显示,它们的支持度大部分是1%,置信度都是100%。特别的有{薄白,淡红}=>{湿浊证}的支持度是3%,置信度为85.71%;{沉}=>{湿浊证}与薄黄腻}=>{湿热证}的支持度是1.5%,置信度是100%。

从图7我们还可以了解到:湿热证,湿浊证,血瘀证这3个兼证,在中医诊断中可以很好地根据患者的舌质、舌苔与脉象进行判断,这与频数分析法得到的最高比例几个证型是相同的。

由以上分析,我们可以得到如下结论:舌质,舌苔,脉象这些患者体征都与中医主证--气阴两虚证和肝肾阴虚证,中医兼证--湿热证,湿浊证,血瘀证这些症候有较强的关联性。在中医诊断中,医生可以结合这些分析结论对慢性肾脏病患者进行组合判断。

5 结论

本文主要研究了慢性肾脏病患者的证型、舌象以及脉象出现的频率,以此来发现慢性肾脏病患者主要的中医主证和兼证,在临床上尽早发现患者的确定证型,使患者得到及时有效的治疗。

我们运用频数分析法得到了舌质、舌苔、脉象、中医主证以及中医兼证在患者中各自占的比例。舌质主要症状是红和淡红,其频率分别为39.7%,33.3%;舌苔主要症状是白、白腻和薄白,其频率分别为34%,17.6%,15%;脉象主要症状是细,细滑,沉细,其频率分别为20.5%,13.5%,10.3%;慢性肾脏病中医主证主要是气阴两虚证和肝肾阴虚证,其频率分别达到46.3%,24.4%;中医兼证主要是湿热证、湿浊证和血瘀证,其频率分别为32.6%,29.4%,23%。

运用关联规则分析将舌质、舌苔、脉象的信息分别与中医主证、中医兼证的信息相关联。我们发现:气阴两虚证和肝肾阴虚证这2种中医主证,湿热证、湿浊证和血瘀证这3种中医兼证根据患者的舌质,舌苔,脉象这3种体征可以容易的辨别出来。这与频数分析法得到的结论相类似。

2种分析方法结论的一致性说明了:我们慢性肾脏病患者大多具有气阴两虚证和肝肾阴虚证中医主证和湿热证、湿浊证和血瘀证中医兼证这些症候的。所以我们在对慢性肾脏病患者诊治时可以优先依据舌质、舌苔及脉象对患者进行初步判断,再根据其他中医体征相互应证,最后得出精确的慢性肾脏病的中医证候诊断,并给出合理的治疗方案。

致谢:数据来源于“国家人口健康科学数据中心数据仓储PHDA”(http://www.ncmi.cn)[10]。感谢为我们提供数据支持,数据详细,真实可靠,使得分析结果真实可信。感谢导师对我们悉心指导和帮助,感谢课题组的所有伙伴在本次论文中提供的支持。

参考文献

[1]李幼平.循证医学[M].2版.北京:高等教育出版社,2009:4.

[2]Guyatt G,Cairns J,Churchill D,et al.Evidence-Based Medicine:A New Approach to Teaching the Practice of Medicine[J].The Journal of the American Medical Association,1992,268(17):2420-2425.

[3]Jenicek M.Foundations of evidence-based medicine[J].Revista Portuguesa De Pneumologia,2016,22(1):4-5.

[4]刘露,崔馨月,张宇晶,等.系统综述、循证医学与医疗器械上市前临床评价的探讨[J].中国医疗设备,2019,34(9):157-160.

[5]王文凤.杨霓芝教授治疗慢性肾脏病学术思想及临床经验总结研究[D].广州:广州中医药大学,2015.

[6]Kidney F N.K/doqi clinical practice guidelines for chronic kidney disease:Evaluation,classification,and stratification[J].American Journal of Kidney Diseases,2002,39:S1-S266.

[7]AlebiOSU CO,Ayodele OE.The global bu-en of chmnic-dneydisense and the way forward[J].EthnicitySLDisease,2005,15:418-423.

[8]關鹏飞.中医药治疗慢性肾脏病(CKD)临床随机对照试验的Meta分析[D].兰州:甘肃中医学院,2014.

[9]杨芳,李外姣,何泽云.基于数据挖掘分析何泽云教授治疗CKD的用药规律[J].湖南中医药大学学报,2017,37(6):642-645.

[10]北京中医药大学东直门医院.糖尿病肾病的中医药临床研究数据集.国家人口健康科学数据中心数据仓储PHDA,2019.CSTR:A0006.11.A0001.201905.000432.

[11]何立群.慢性肾衰竭的诊断、辨证分型及疗效评定(试行方案)[J].上海中医药杂志,2006,40(8):8-9.

[12]国家药品监督管理局.中药新药临床研究指导原则(试行)[S].北京:中国医药科技出版社,2002.

[13]邓森.基于数据挖掘分析中药治疗慢性肾脏病3-5期的临床疗效[D].成都:成都中医药大学,2018.

(2019-12-09收稿 责任编辑:徐颖)

基金项目:安徽省自然科学基金项目(1808085MG220);安徽省教学研究项目(2017jyxm1168);安徽省大学生创新创业项目(201710360353)作者简介:王要强(1998.03—),男,本科,研究方向:数据分析与处理,E-mail:1580806003@qq.com通信作者:罗冬梅(1979.04—),女,博士,讲师,研究方向:生物统计,E-mail:3334997@qq.com

猜你喜欢

循证医学关联规则数据挖掘
数据挖掘综述
软件工程领域中的异常数据挖掘算法
中药注射剂治疗冠心病的系统评价再评价
医学院校开展药理学循证医学
关联规则挖掘Apriori算法的一种改进
基于关联规则的计算机入侵检测方法
基于R的医学大数据挖掘系统研究
循证医学在医学教育中的实践
大疱性类天疱疮合并脑血管病的循证护理体会
一本面向中高级读者的数据挖掘好书