基于温病古籍数据挖掘的风温病证候研究*
2012-08-22唐丹丽张华敏
佟 琳,唐丹丽,张华敏△
(1.中国中医科学院中医药信息研究所,北京 100700;2.中国中医科学院医学实验中心,北京 100700)
基于温病古籍数据挖掘的风温病证候研究*
佟 琳1,唐丹丽2,张华敏1△
(1.中国中医科学院中医药信息研究所,北京 100700;2.中国中医科学院医学实验中心,北京 100700)
中医温病古籍中较少涉及对风温证候描述性的语言,其论述较多的是对该疾病症状或症状群的描述,而中医辨证论治的核心是“证”,找到风温证候是诊治的关键所在。本文运用因子分析与聚类相结合的方法去探索风温的证候,目的是找到古籍中风温疾病的“证”,从而将古人对该疾病的认识加以提炼,为医者诊治疾病提供借鉴。
风温;中医古籍;证候;因子分析;聚类分析
风温这个名词最早见于《伤寒论·辨太阳病脉证并治》,是现今较为常见的疾病,大多起病急骤、传变较快,且多数具有程度不等的传染性、流行性,相当于西医学中的流行性感冒、急性支气管炎、支气管肺炎、病毒性肺炎、大叶性肺炎、麻疹合并肺炎等病。近年来,不断出现的突发传染性疾病重新把传染病对人类健康与生存的威胁摆到了世人面前,因此对风温证候的研究有助于指导临证辨治,为现代突发瘟疫诊疗提供借鉴与参考。
1 资料与方法
1.1 数据来源
资料选自21种中医温病古籍,分别是《温热类编》、《温热朗照》、《温热经纬》、《重订广温热论》、《温病浅说》、《四圣悬枢》、《时病论》、《治疫全书》、《温病诠真》、《温热逢源》、《四时病机》、《温病合编》、《松峰说疫》、《温热病指南集》、《伤寒温疫条辨》、《温热论笺正》、《温病指南》、《温病条辨》、《瘟疫发源》、《温证指归》、《温热病类方》。其中《温热类编》、《温热朗照》、《温热经纬》、《重订广温热论》、《温病浅说》、《四圣悬枢》对风温病的症状的论述较多,累计频率达到77.54%。本研究对风温病进行症状的提取,以“风温”为检索词,出现风温的章节共有179条相关记录。规范后共涉及症状131个,以身热、汗、脉浮、渴、咳嗽等症状为多见。
1.2 文献入选与排除标准
①温病病名明确。温病病名必须在文献中出现或列在著作目录下;②对检索到的文献进行筛选,仅提取文献中对理论内容的陈述,对病案类的文献不予纳入。
1.3 数据库建立与规范处理
采用Microsoft Office Access 2007建立风温症状数据库,字段名包括症状、出处。对症状进行赋值,存在标记为1,不存在标记为0。
借助工具书《中医药主题词表》和《温病学大辞典》等对采集到的数据进行术语规范与拆分。如古籍中记载的症状“喘渴”、“脉浮数”,将其拆分为“喘”、“渴”、“脉浮”、“脉数”。
1.4 统计学方法
采用SPSS 19.0软件进行频数统计分析,运用因子分析与聚类相结合的方法对数据进行分析以探索古籍中风温证候。
本研究运用因子分析法对中医症状群进行提取。因子分析[1]在某种程度上可以被看成是主成分分析的推广和扩展,将具有错综复杂关系的变量或样品综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,探讨多个能够直接测量且具有一定相关性的实测指标是如何受少数几个内在独立因子所支配的,同时根据不同因子还可以对变量进行分类,属于多元分析中处理降维的一种统计方法。本研究选取频次大于8的症状进行因子分析。
将上述因子分析的得到的公因子矩阵结果进行聚类找到“证”。聚类分析[2]针对对象的某些特征,根据最大化类内的相似性、最小化类间的相似性的原则进行聚类或分组,使得每个组内的对象具有很高的相似性,而与其他组中的对象差别较大。
2 结果
2.1 因子分析对风温症状群的提取
选取症状次数≥8次,检验KMO度量为0.674>0.5进行因子分析,Bartlett的球形度检验(P<0.001),可以进行因子分析。特征根>1,存在10个公因子,其累计贡献度为72.597%。根据统计学原理,将公因子按照每个症状与其相关系数(载荷大小)大于0.4进行提取,与此同时对原始公因子采用最大四次方值法进行旋转,从而使各因子的含义更加清楚,并得到合理直观的解释。共得到如下10个公因子。
Factor 1:身重、多眠、语言謇涩、鼾、汗、脉浮;Factor 2:失溲、直视、小便不利;Factor 3:咳嗽、恶风、烦、渴;Factor 4:脉弦、脉数;Factor 5:发黄、瘛疭;Factor 6:谵语、利、神昏;Factor 7:喘、痰、躁;Factor 8:头痛;Factor 9:热、身热、疹;Factor 10:咽痛、舌白。
2.2 症状群聚类得到风温证候
对因子分析得到的矩阵进行聚类,当将其聚为6类时,对证候分类的解释较为合理。图1显示,第一类别包括公因子3、4,咳嗽、恶风、烦、渴、脉弦、脉数可归纳为邪郁卫表证;第二类别包括公因子2、10,失溲、直视、小便不利、咽痛可归纳为风热蕴内证;第三类别包括公因子 7、8,喘、痰、躁、头痛可归纳为邪热壅肺证;第四类别包括公因子5、6,谵语、瘛疭、发黄、神昏、利可归纳为邪犯心包证;第五类别包括公因子9,热、身热、疹可归纳为热入营分证;第六类别包括公因子1,身重、多眠、语言謇涩、鼾、汗、脉浮可归纳为湿热内蕴证。
3 讨论
本研究采用因子分析与聚类两种方法相结合,因子分析得到风温症状群可以概括为证候要素,证候要素是指辨证的基本要素,是对治病因素作用于人体特定部位,引起机体特殊病理反应等多因素的概括[3]。当我们进行因子分析后提取的证候要素较多,即表示其分析的主成分较多,每个公因子多是代表症状、体征的变化规律,或是主、次症状的特征性表现的提取。因此,我们在因子分析的基础之上对公因子进行聚类分析,从而更好地理清各因子之间的关系。最终得到6类证候分别概括为邪郁卫表证、风热蕴内证、邪热壅肺证、邪犯心包证、热入营分证、湿热内蕴证。
图1 聚类结果树状图
风温多为感受风热之邪引起,其发展过程是由表入里。初期邪在肺卫卫分,以发热、微恶风寒、头痛、咳、脉浮数为主要特征;由卫分进入气分出现高热、汗出、咳喘、舌红苔黄、脉数等是热邪壅肺的气分证候;若出入阳明气分为顺传,或出现身热灼手、神昏谵语或昏愦不语、舌謇肢厥、脉细滑数等邪热蒙蔽心包的症状为逆传心包。由上述对风温病的证候分析可见,本研究所运用的数据挖掘方法对中医古籍中风温症状进行挖掘而得到的风温证候分类,即邪郁卫表证、风热蕴内证、邪热壅肺证、邪犯心包证、热入营分证、湿热内蕴证,较好地反映了上述对风温证候的描述,总结而言即较为集中地反映与概括了温病古籍中理论部分对风温症状整体特征的描述。
多年来,对风温证候的研究思路和方法主要集中在实验研究、临床观察和专家经验上,其对“证”这种群体集合现象缺乏全面把握,多数还仅仅停留在经验积累层面。而以往对于中医古籍的证候分类研究也较多集中于医案,或即使运用了知识发现方法也均为较单一的数据挖掘方法。本研究考虑到医案的不完整、语言的夸张和个案性等特点,选取中医古籍的疾病理论部分为研究对象,运用两种数据挖掘方法相结合的知识发现方法与技术,探讨风温的辨治特点,得到的数据及挖掘的结果能够更加全面、详实、可信。本研究将采集到的风温症状进行因子分析找到症状群,然后将因子分析后得到的矩阵进行聚类,并找到古籍中的较为概括的风温“证”。由此可见,从中医温病古籍的风温症状入手,归纳风温疾病的中医证候具有量化信息的科学基础是可行的。
[1]张文彤.SPSS统计分析高级教程[M].北京:高等教育出版社,2007:218.
[2]李雄飞,董元方,李 军,等.数据挖掘与知识发现[M].2版.北京:高等教育出版社,2010:43.
[3]张玉辉,曹洪欣,张华敏.民国时期温病医案证候要素分析[J].中国中医基础医学杂志,2010,(2):101-102.108.
Study on the syndromes of wind-warm disease based on data mining of ancient books
TONG Lin1,TANG Dan-li2,ZHANG Hua-min1△
(1.Institute of information on traditional Chinese medicine,CACMS,Beijing100700;2.Experimental Research Center,CACMS,Beijing100700)
Epidemic febrile disease(warm disease)ancient books involving little Descriptive language in wind-warm syndrome,it always talk about symptoms or group of symptoms not syndromes.The kernel of TCM syndrome differentiation is syndromes.This paper used the factor analysis and cluster method to explore syndromes of epidemic febrile disease,in order to find out the syndrome of epidemic febrile disease in TCM ancient books and provide a medical treatment reference for healers.
epidemic febrile disease;TCM ancient books;syndromes;factor analysis;cluster analysis
R254
A
1006-3250(2012)01-0029-02
中国中医科学院基本科研业务费自主选题项目(Z02037)
△通讯作者:张华敏,E-mail:zhanghm@mail.cintcm.ac.cn。
2011-04-17