APP下载

基于信息熵的乙肝后肝硬化证素提取及病机分析

2016-12-09郭志忠孙继佳王文海苏式兵

世界中医药 2016年10期
关键词:证素信息熵脾虚

郭志忠 魏 滨 孙继佳,3 王文海 苏式兵

(1 上海中医药大学中医复杂系统研究中心,上海,201203; 2 河南中医学院第二附属医院肿瘤内科,郑州,410100; 3 上海中医药大学中药学院数理教研室,上海,201203; 4 上海中医药大学附属第七人民医院肿瘤科,上海,200137)



基于信息熵的乙肝后肝硬化证素提取及病机分析

郭志忠1,2魏 滨1孙继佳1,3王文海4苏式兵1

(1 上海中医药大学中医复杂系统研究中心,上海,201203; 2 河南中医学院第二附属医院肿瘤内科,郑州,410100; 3 上海中医药大学中药学院数理教研室,上海,201203; 4 上海中医药大学附属第七人民医院肿瘤科,上海,200137)

目的:提取乙肝后肝硬化证候要素(证素)并分析其组成及分布规律,探讨肝硬化的病机特点。方法:收集294例病毒性乙型肝炎(乙肝)后肝硬化患者的四诊资料,采用基于信息熵的复杂系统划分方法(信息熵法)提取证候要素(证素),确定症状贡献度,并通过诊断阈值,分析乙肝后肝硬化证素组成及分布规律。结果:乙肝后肝硬化患者存在着脾虚、肾气虚、肝阴虚、痰湿、气滞、肝郁、湿热7个主要证素,并有1个至多个证素存在,其中脾虚、气滞、湿热出现频率较高。结论:信息熵法可以用于乙肝后肝硬化证候要素的提取。乙肝后肝硬化的病机复杂,其中脾虚、气滞、湿热可能是其主要的病机因素。

证素;辨证;信息熵;病机;乙肝后肝硬化

证候是中医对疾病认识、临床诊疗和疗效评价的核心基础[1],现代中医临床实践表明,在“病证结合、辨证施治”的理论指导下,中医药治疗慢性肝病等复杂难治性疾病具有明显的特色优势[2]。然而,中医证候是一个非线性的复杂系统,证候研究需要合适于复杂系统的研究方法。以往的研究[3-4]提出,在阐明中医辨证规律和原理的基础上,构建以证候要素(证素)为核心的辨证新体系,是完善中医辨证方法、提高中医辨证水平的有效途径。因此,本研究通过运用基于信息熵的复杂系统划分方法[5-6](简称信息熵法),采集并分析慢性病毒性乙型肝炎(乙肝)后肝硬化的临床症候信息,提取证素,并分析证素的组合与分布规律,探讨其病机特点。

1 资料与方法

1.1 临床资料 全部病例来源于上海市传染病医院、上海中医药大学附属曙光医院及龙华医院、普陀区中心医院的住院部及门诊部。将2002—2006年收集的临床表征信息和实验室检查数据等临床资料完整的294例乙肝后肝硬化患者作为研究对象。

1.2 中医四诊信息的采集 根据调查要求,制定“乙肝后肝硬化患者中医四诊信息调查表”,信息采集内容包括临床症状、体征等资料,包括神疲乏力、畏寒肢冷、盗汗、自汗、五心烦热、皮肤痒、抑郁、急躁易怒、多梦寐差、视物模糊、两目干涩、耳鸣、口干苦、口臭、脘胀腹胀、两胁不适、恶心呕吐、泛酸、嗳气、头重、目眩、尿少、夜尿多、便秘、便溏、齿龈衄、鼻衄、肌衄、纳谷不馨、肢体困重、腰膝酸软、腹痛、脘痛、胁胀痛、下肢水肿、身黄、目黄、尿黄、蜘蛛痣、朱砂掌、面萎黄、面晦暗、舌色淡白、舌色淡红、舌色红、舌色绛、舌色紫暗、舌色瘀斑、舌色暗红、舌苔薄白、苔白厚腻、苔白薄腻、苔薄黄、苔黄厚、苔薄黄腻、苔黄厚腻、苔质花剥、齿痕、脾大、脉沉、脉儒、脉数、脉滑、脉弦、脉细。

1.3 数据的处理与分析

1.3.1 症状术语的规范化与数据的录入 参照《常见症状中医鉴别诊疗学》的症状标准术语进行规范化。由专人负责采集相关资料和四诊信息,将所有的数据输入电脑,采用Access数据管理,建立乙肝后肝硬化中医四诊信息数据库,将输入的数据逐项核对无误后,用Matlab工程软件进行分析处理。

1.3.2 变量的处理 将收集症状、体征、舌象、脉象设为自变量矩阵X,症状分4级赋值量化,无症状者为0,有症状者根据轻、中、重赋予1、2、3分。体征、舌象、脉象有者为1分,无者0分。

1.3.4 诊断阈值的建立 我们用症状贡献度分值进行症状的赋分,并计算各证型中症状总积分,以专家辨证作为状态变量(由2位副主任或主任中医师一致性诊断确定),证素症状得分作为检验变量,将数据输入Matlab软件,利用诊断性试验受试者工作特征曲线建立各证素诊断阈值。诊断阈值(限定值)被设定为0.13。

1.3.5 统计学方法 根据诊断阈值对294例乙肝后肝硬化患者的四诊信息实施证素辨证,并且对证候要素进行描述性统计分析(统计软件SPSS 15.0)。

2 结果

2.1 证素提取结果 通过对经过量化的294例肝炎后肝硬化病例中的65个症状进行信息熵计算,提取出证素相关的症状熵值矩阵见表1。

从无监督的原始症状关联度分析来提取乙肝后肝硬化证素,发现乙肝后肝硬化存在肝郁、气滞、湿热、痰湿、脾虚、肝阴虚、肾气虚7个主要证素。根据熵值所提取出乙肝后肝硬化证素及其阈值见表2。

2.2 乙肝后肝硬化证素组合与分布频率 提取的证素在乙肝后肝硬化患者中的组合与分布频率见表3。其中,294例乙肝后肝硬化患者中脾虚、湿热、气滞为最多,分别为244例(83%)、189例(64.3%)、177例(60.2%),而肾气虚95例(32.3%)、肝郁87例(29.6%)、肝阴虚74例(25.2%)、痰湿71例(24.27%),这4种证素所占比例较为相近。

如表3所示,乙肝后肝硬化可出现单一证素,也可表现为2个、3个或4个证素,最多可见7个证素并存。其中单个证素45例(15.3%),2个证素52例(17.7%),3个证素64例(21.8%),4个证素41例(14%),5个证素31例(10.5%),6个证素23例(7.8%),7个证素20例(6.8%),无法辩别证素的有18例(6.1%)。

表1 证素相关症状的熵值上三角相似矩阵

注:限定值≥0.13;“-”表示小于限定值。

表2 采用信息熵方法提取的证素及其熵值

注:限定值≥0.13。

表3 294例乙肝后肝硬化患者的证素分布

3 讨论

辨证论治又称辨证论施治,是中医认识疾病和治疗疾病的根本原则,辨证论治就是根据收集的四诊信息,辨别证候,并针对其证候,确定治疗方法的过程。只有在明确证候才能有效的论治,准确的辨证是施治的前提条件。上个世纪80年代,朱文峰等[3-4]提出了以证素为核心的辨证体系。证素是通过辨识症状、体征等临床四诊信息,对疾病的病因、性质、部位以及邪正之间的关系等的概括及判断。证素是辨证的基本诊断单元,临床所作的具体证名诊断都是由证素相互组合而构成的。因此,证素是辨证的核心。把握每一证素的临床表现及其证候属性,认识各证候对相关证素的诊断贡献度,是准确辨证的重要环节[7]。以证素辨别为核心,构建新的中医辨证体系,阐明中医辨证的规律,不仅能够促进中医证候的研究,而且可以为中医临床辨证提供简便易行的方法,符合中医临床的需要。

“熵”是指体系混乱的程度又称混沌度,是系统内部无序结构的总量,被广泛用于热物理学、信息论、控制论、概率论、数论、天体物理、生命科学等领域的复杂系统研究和应用。1856年由德国物理学家克劳修斯首次提出,用来表示任何一种能量在空间中分布的均匀程度。1948年香农在《通信的数学原理》中,把通信过程中信息源的信号不确定性称为信息熵,将熵的概念引入了信息论。信息熵法是信息论中熵方法在非线性相关模式识别领域的具体应用[5]。

前期的中医证候研究发现,与聚类分析比较,信息熵法可以按照数据内在关联进行自主聚类,能够无监督地处理来源于中医四诊信息的多变量、多层次复杂数据,对于提取证素相关症状,分析其症状间的非线性关系有重要应用价值[8]。孙继佳等[9-10]采用信息熵方法研究中医证候与季节之间的关联,同时利用熵权来确定评价指标的权重,从而减少了评价中的主观因素。贾振华等[11]采用信息熵对冠心病心绞痛证候诊断良好标准进行了研究。王天芳等[12]通过运用信息熵关联度系数分析方法对1 787例抑郁症、慢性乙型肝炎、慢性肾功能衰竭患者的37个四诊症数据进行分析,获取的一些症状组合可为中医常见证候及证候要素的研究提供依据。唐仕欢等提出了用熵的理论方法研究证候、方剂的相关性(证-熵-方)。余江维等提出了用术语频率-逆文档频率(TF-IDF)相对熵作为证候量化的表示方法,显示了一个症状在肾阳虚证、肝气郁结证、脾气虚证和肝脾不调证中出现的频率越高,则区分该证候方面的能力越强,反之在所有证候中出现的范围越广,它区分某证候的能力就越低。余学杰等[13]使用信息熵算法建立决策树的工具,进行了专家辨证与证候的规律知识有效的获取。

在本研究中,我们运用信息熵法提取294例乙肝后肝硬化患者的证候要素,研究结果发现,在单一证候要素中,脾虚证最为常见,为28例,占62.2%,其他证素分布无明显差别,说明在乙肝后肝硬化早期,患者脾虚是其主要病机特点,现代医学也标明了在早期乙肝后肝硬化患者中,免疫功能低下是其主要矛盾。在具有2个证素中的患者中,脾虚患者为44例,占84.6%,而湿热、气滞也分别达到了28例,占51.9%和20例,占38.5%,提示我们在临床上患者在脾虚的基础上,往往较多合并湿热、气滞,从而出现虚实夹杂的病机特点。

随着病程日久,患者兼有证素增加,患者肝阴虚和肾气虚明显增加,说明随着病程延长及病情复杂程度的加重,所谓久病则虚。乙肝后肝硬化存在气滞(郁)生热化火,湿热伤阴,脾气亏虚日久导致肾气亏虚的病机转变。由此可见,乙肝后肝硬化病机特点属本虚标实,在疾病早期是以脾气虚为主要表现,中期则在脾虚基础上出现气滞、湿热等虚中夹实的特点,而疾病后期在上述病机特点上可出现肝阴虚、脾肾亏虚等虚实错杂的病理特点。

然而,由于样本量的偏少、采集临床症候信息方案设计的不足以及研究方法的局限性导致一些很有希望提取的证素在研究中未能显现出来。例如,肝火证素,我们发现便秘与两目干涩(0.11)、口干苦(0.10)、五心烦热(0.09)有较强的关联,但是未能达到诊断阈值,我们推测可能与样本量偏小、数据失真有关;又如,血瘀证素,舌色紫暗与胁胀痛、五心烦热、肌衄有较强的关联度,但是也未能达到诊断阈值,我们推测在早期课题设计中,症状收集仅有脘痛、腹痛、胁胀痛,从而导致血瘀的主要症状胁刺痛固定不移的信息部分散埋在上述症状之中,至使信息不易被挖掘出来。因此,如何依据中医思维的特点,把握中医症候信息的采集质量,是探讨证素及证候演变规律的前提和保证。而且,研究中还有18例未提取出合适的证素,提示我们基于信息熵的复杂系统划分方法在证素提取使用中的局限性。

4 结语

本研究表明基于信息熵的复杂系统划分方法能够用于乙肝后肝硬化患者的证素提取,且有可能推广应用于其他疾病的中医临床辨证。乙肝后肝硬化的病机复杂,其中脾虚、气滞、湿热可能是其主要的病机因素。随着中医辨证研究方法探索的不断深入,科研设计的不断完善,并通过开展多中心、大样本的临床研究,我们将进一步证明中医辨证的多维性、复杂性及科学性。

[1]Su SB,Lu A,Li S,et al.Evidence-based ZHENG:a traditional Chinese medicine Syndrome[J].Evid Based Complement Alternat Med,2012:246538.

[2]Song YN,Sun JJ,Lu YY,et al.Therapeutic effect of Fuzheng-Huayu tablet based traditional Chinese medicine syndrome differentiation on hepatitis B caused cirrhosis[J].Evid Based Complement Alternat Med,2013:709305.

[3]朱文锋.创立以证素为核心的辨证新体系[J].湖南中医学院学报,2004,24(6):38.

[4]朱文锋.构建“证素辨证”新体系的意义[J].浙江中医药大学学报,2006,30(2):135.

[5]西广成.复杂系统分划的熵方法[J].自动化学报,1987,13(3):216-220.

[6]孙占全,西广成,易建强,等.基于熵的广义指标建立方法在中医学中的应用[J].北京中医药大学学报,2006,29(6):370-373.

[7]朱文锋,晏峻峰,黄碧群.贝叶斯网络在中医证素辨证体系中的应用[J].中西医结合学报,2006,4(6):567-571.

[8]陈静,西广成,易建强,等.中医复杂系统中两类分划方法的比较[J].烟台大学学报:自然科学与工程版,2006,19(专集):430-434.

[9]孙继佳,蒋健,朱蕾蕾,等.基于信息熵的中医证候与季节气候关联性评价方法[J].中西医结合学报,2007,5(5):502-505.[10]孙继佳,蒋健,严广乐,等.多属性决策方法在中医学研究中的应用[J].数理医药学杂志,2009,22(1):9-12.

[11]贾振华,吴以岭,高怀林,等.基于熵的复杂系统分划方法与冠心病心绞痛证候量化诊断标准研究[J].中医杂志,2008,49(5):459-461.

[12]王天芳,吴秀艳,陈建新,等.基于信息熵关联度系数法的证候/证候要素提取研究[J].天津中医药,2009,26(4):274-276.

[13]余学杰,李书珍,李晓燕,等.基于决策树技术分析证候与四诊信息关联的初步研究[J].中医学报,2014,29(B07):60-61.

(2015-12-22收稿 责任编辑:徐颖)

Syndrome Element Summary and Pathogenesis Analysis of Hepatitis B Caused Cirrhosis Based on the Information Entropy

Guo Zhizhong1, 2, Wei Bin1, Sun Jijia1,3, Wang Wenhai4, Su Shibing1

(1ResearchCenterforTraditionalChineseMedicineComplexitySystem,ShanghaiUniversityofTraditionalChineseMedicine,Shanghai201203,China; 2SecondAffiliatedHospitalofHenanUniversityofTraditionalChineseMedicine,Zhengzhou410100,China; 3CollegeofChinesePharmacology,ShanghaiUniversityofTraditionalChineseMedicine,Shanghai201203,China; 4No.7People′sHospitalofShanghaiUniversityofTraditionalChineseMedicine,Shanghai200137,China)

Objective:To summarize the syndrome elements of hepatitis B-caused cirrhosis (HBC), to analyze its composition and distribution and to explore the characteristics of its pathogenesis in HBC patients. Methods:The four-diagnostic information of 294 HBC cases was collected. The summary of syndrome elements and the symptoms contribution degree were carried out by an entropy-based complex systematic classification method and the composition and distribution rules were analyzed according to the diagnostic threshold value. Results:There were7 syndrome elements in HBC, namely spleen deficiency, kidney qi deficiency, liver yin deficiency, dampness-phlegm, qi stagnation, liver depression and dampness-heat. Moreover, at least one or more syndrome elements can be concluded from one patient. Spleen deficiency, qi stagnation and dampness-heat were those with highest frequency. Conclusion:The entropy-based complex system method may be used to summarize syndrome elements for HBC. The pathogenesis of HBC is complicated and its main factors may be related to spleen deficiency, qi stagnation and dampness-heat.

Syndrome element; Pattern identification; Entropy; Pathogenesis; Hepatitis B-caused cirrhosis

国家自然科学基金重点项目(编号:81330084);上海市中医临床重点学科建设项目(编号:ZYXK202010);浦东新区卫生系统重点学科群建设项目(编号:PWZxq2014-12)


R241

A

10.3969/j.issn.1673-7202.2016.10.063

猜你喜欢

证素信息熵脾虚
基于信息熵可信度的测试点选择方法研究
糖尿病前期中医证型及证素特点分析
2型糖尿病合并肥胖患者的相关危险因素和中医证素分析
基于因子分析及聚类分析的241例感染后咳嗽中医证素证型研究
瘦成一道闪电先过“脾虚”这关
为什么那么多人“脾虚”
一种基于信息熵的雷达动态自适应选择跟踪方法
《伤寒论》三阳三阴病证的证素辨证研究
基于信息熵的IITFN多属性决策方法
推拿结合热敏灸治疗脾虚湿滞型假性近视的临床疗效观察