基于粗糙集理论的心悸阴虚火旺证辨证系统的建立
2012-09-26刘白洁孟凡波杜雪翠李运伦
刘白洁,解 君,孟凡波,杜雪翠,李运伦
(1.山东中医药大学,山东济南250355; 2.山东中医药大学附属医院心内科,山东济南250011)
基于粗糙集理论的心悸阴虚火旺证辨证系统的建立
刘白洁1,解 君1,孟凡波1,杜雪翠1,李运伦2
(1.山东中医药大学,山东济南250355; 2.山东中医药大学附属医院心内科,山东济南250011)
收集心悸古今医案病例573例,对其症状和体征进行语言规范化处理及量化赋值,使用基于粗糙集理论的KDD决策分析系统Rosetta软件约简病证属性,获取心悸阴虚火旺证的专家知识,并提供该系统决策规则的统计信息,为进一步研究心悸阴虚火旺证奠定基础。
心悸;阴虚火旺证;Rosetta软件;约简;决策规则;证候客观化
粗糙集(rough set)理论作为一种新的处理模糊和不确定性知识的数学工具,可以在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则,能够将中医四诊思辨性的经验描述和宏观性概括过渡到高层次的分析与综合相结合,使中医能够从宏观症状学的角度进行证的规范化研究[1]。本文以心悸阴虚火旺证和心悸非阴虚火旺证的古今医案为研究对象,将粗糙集理论应用到中医证候研究中,构建心悸阴虚火旺证的辨证要素系统,为心悸阴虚火旺证的防治提供依据。
1 资料收集和证候的规范化
本研究收集心悸医案573例,其中心悸阴虚火旺证医案428例,心悸非阴虚火旺证医案145例,作为学习数据论域,进行症状及体征的研究。对病案的四诊资料信息,包括原始症状、二便、舌、苔、脉象进行语言规范化处理。统计涉及到的症状和体征数目,删除出现频数很小的症状和体征(如频数小于4),计算最后入选的指征数目,最后入选的条目共有44个。选取了44个条目作为条件属性,包括:心悸、胸闷、胸痛、乏力、活动后气短气促、面色无华、面赤、眠差、失眠、多梦、善惊易恐、五心烦热、急躁易怒、易饥、纳呆、口舌生疮、口干咽燥、口苦、潮热盗汗、恶心呕吐、头晕、眼花、腰膝酸软、咳嗽、下肢浮肿、畏寒肢冷、大便不爽、便溏、便秘、尿赤、尿少、尿道灼热或涩痛、舌暗、苔薄黄、舌质鲜红、苔白、苔腻、舌质红、苔少/剥/无苔、脉弦、脉数、脉滑、脉细、脉结代。变量采取0,1赋值,症状及体征出现认定对象的该属性值为1,否则为0。是否阴虚火旺作为决策属性,是为利用Excel建立决策表。
2 利用Rosetta约简病证属性
设U为本研究对象的集合,R为U上的一个等价关系。定义x∈U的 R等价类为:[x]R:={y∈U│(x,y)∈R}。若 PR,且P≠Φ,则P中所有等价关系的交也是一个等价关系,记为ind(P)。显然,等价关系R决定U的划分,U/R是关于U的一个知识库。这样,一个知识库就是U上的一个关系系统K=(U,R),其中U为非空有限集(论域),R是U上的一族等价关系。
知识约简是粗糙集理论的核心内容之一,是在保持知识库分类能力不变的条件下,删除其中不相关或不重要的知识。令R为一族等价关系,R∈R,如果 ind(R)=ind(R-{R}),则称 R 是 R 中不必要的,否则称R是R中必要的。设QP,如果每一个R∈Q 都是必要的,且 ind(P)=ind(Q),则称 Q 是 P 的一个约简。采用Rosetta软件来处理数据,该软件为基于粗糙集理论的KDD决策分析系统,可以处理文本数据和数据库数据等多种格式的数据,这些数据将以决策表的形式存在于Rosetta系统中。当决策表成功装载入project后,系统便可以根据粗糙集理论逐步分析数据,最后得到约简的属性。
装载决策表后,利用Rosetta提供的John算法对决策表进行属性约简后,得到属性约简结果,包括心悸、胸闷、乏力、气短、失眠多梦、善惊易恐、五心烦热、纳差、口舌生疮、口干咽燥、潮热盗汗、头晕、便秘、尿赤、舌质红、苔少/剥/无苔、脉弦、脉数、脉细、脉结代。
3 获取决策规则
对于U上的任意等价关系R,pawlak粗糙集X的上下近似分别为:
采用Rosetta对已经约简了条件属性的决策表求决策规则,得出了172条决策规则,其中确定性规则167条,不确定性规则5条。正规则136条,负规则31条。部分证候规则见表1。
进一步统计136条正决策规则,发现心悸、眠差、脉数、口干、脉细、舌红、胸闷、盗汗、乏力等证候出现的频率较高,而且包含该属性值的规则平均支持病案数较多,亦即包含该属性值的病案数较多,这正是心悸阴虚火旺证的典型表现。频数较高的证候统计信息列表,结果见表2。
如表1所示,若患者症状包含心悸、失眠多梦、五心烦热、口干咽燥、少苔、脉细数,则符合该证候规则列表的第一条,则该患者100%诊断为心悸阴虚火旺证,若患者症状为心悸、乏力、气短、失眠多梦、脉细,符合表2中第三条诊断规则,则该患者有79%的可能性诊断为心悸阴虚火旺证。
4 讨论
辨证论治是中医学的特点与精华,在统一辨证体系下,建立科学的证素辨证定性、定量标准,不仅是中医临床医生的需要,也是信息社会中新的医疗模式建立的基础[5]。当前,医生采用证素辨证方法时,对证素的确认知识主要来自文献、专家等各种途径通过收集、总结形成的知识。由于文献记载长期以来对证候的辨识主要是采取主观定性的方法,使得辨证论治带有较强的经验性和主观性,导致从文献或专家等多种途径得到的辨证知识具有模糊性和不一致性,因此建立科学的证素辨证定性定量标准,是辨证统一体系推广应用的关键[6]。
表1 部分证候规则列表
表2 出现频数较高的证候统计表
粗糙集理论作为智能信息处理技术的一个新成果,是由波兰科学家Pawlak Z教授提出来的对不完整数据进行分析、推理、学习、发现的新方法。它能有效地处理许多涉及不确定性的问题,主要包括不确定或不精确知识的表达,经验学习并从经验中获取知识,不一致信息的分析,根据不确定、不完整的知识进行推理,在保留信息的前提下进行约简、近似决策分类,识别并评估数据之间的依赖关系等[7]。从它在许多领域成功应用的情况来看,粗糙集是一种优秀的机器学习方法,利用它来分析中医症状,辨证要素间相关性,建立定性定量标准。
随着学习数据的增加,专家知识系统中的知识也会不断完善。应用粗糙集理论和方法分析中医治疗心悸阴虚火旺证医案中的四诊、病因、病位和证候信息,获取了心悸阴虚火旺证的诊断系统。利用这个诊断系统,可对现有的病人是否为心悸阴虚火旺证进行诊断,从而为心悸阴虚火旺证的中医证候规范提供依据,对本病的临床诊疗也具有指导价值。
[1]陈素玲,付爽,高云,等.基于粗糙集理论的原发性高血压肝阳上亢证辨证系统的建立[J].山东中医药大学学报,2010,34(3):201-203.
[2]张珊珊,贺立娟,李运伦.原发性高血压中医历代医案数据库规范化建设探索[J].山东中医药大学学报,2009,33(2):103-107.
[3]李园白,崔蒙.关于中医医案的综合性分析研究近况[J].中国中医药信息杂志,2006,13(2):91-93.
[4]傅爽,李运伦.基于多元统计分析方法的原发性高血压肝阳上亢证判别模型的建立[J].山东中医药大学学报,2010,7(3):12.
[5]朱文锋.辨证统一体系的创立[J].中国中医基础医学杂志,2001,7(4):13.
[6]晏峻峰,朱文锋.粗糙集理论在中医证素辨证研究中的应用[J].中国中医基础医学杂志,2006,12(2):90-93.
[7]Pawlak Z.Rough Sets[J].Int J Inf comp Sci,1982,11(5):341-356.
Construction of Differential Diagnosis System About Syndrome of Hyperactivity of Fire Due to Yin Deficiency in Palpitation Based on Rough Set Theory
Liu Baijie1,Xie Jun1,Meng Fanbo1,Du Xuecui1,Li Yunlun2
(1.Shandong University of TCM,Jinan Shandong 250355;2.Hospital Affiliated to Shandong University of TCM,Jinan Shandong 250011)
573 cases of palpitation were collected from ancient and modern medical records,then symptoms and signs of the cases were standardized and quantized.Syndrome characteristics were simplified by KDD decision analysis system Rosetta software based on rough set theory.Experts knowledge system about syndrome of hyperactivity of fire due to yin deficiency in palpitation was acquired and statistical information of decision rules was provided.The above research results established foundation for further study of syndrome of hyperactivity of fire due to yin deficiency in palpitation.
palpitation;syndrome of hyperactivity of fire due to yin deficiency;Rosetta software;simplify;decision rules;syndrome objectification
R256.2
A
1671-0258(2012)04-0039-03
教育部新世纪优秀人才支持计划(NCET-07-0522)
刘白洁,女,在读硕士,从事中医药治疗心系病证的研究
李运伦,博士,教授,博士研究生导师,E-mail:li_yunlun@163.com
2012-04-28