APP下载

基于症状/体征群的慢性胃炎常见证候特征选择

2019-09-02朱春梅顾巍杰杨德才曹阳王灼龙颜建军刘国萍

中国中医药信息杂志 2019年7期
关键词:慢性胃炎特征选择证候

朱春梅 顾巍杰 杨德才 曹阳 王灼龙 颜建军 刘国萍

摘要:目的  在慢性胃炎常见中医症状/体征的特征组基础上,对脾胃湿热证、湿浊中阻证、脾胃气虚证、脾胃虚寒证、肝气郁滞证、肝胃郁热证共6种慢性胃炎常见证候进行特征挑选,探讨辨证理论与证候规范化的内涵。方法  采用基于特征组的特征选择方法,对82个慢性胃炎症状/体征经近邻传播聚类算法分析后聚成22个症状/体征群,运用特征选择算法对其症状/体征群进行取舍,以分类器的分类准确率作为评价标准,进行慢性胃炎常见证候的症状/体征群选择。结果  慢性胃炎症状/体征群选择结果分别为脾胃湿热证8个、湿浊中阻证4个、脾胃气虚证8个、脾胃虚寒证5个、肝气郁滞证5个、肝胃郁热证6个。结论  慢性胃炎6种证候所选特征总体上与中医理论基本吻合,部分结果与中医理论有出入,可能与临床证候具有兼挟性、动态性、复杂性有关。

关键词:特征选择;症状/体征群;慢性胃炎;证候

中图分类号:R259.73    文獻标识码:A    文章编号:1005-5304(2019)07-0016-06

Abstract: Objective To conduct feature selection of the six common syndromes of chronic gastritis of spleen-stomach damp-heat syndrome, dampness obstruction syndrome, spleen-stomach qi deficiency syndrome, spleen-stomach deficient cold syndrome, liver qi stagnation syndrome, and liver-stomach heat syndrome on the basis of the characteristic group of common TCM symptoms of chronic gastritis; To explore the connotation of TCM syndrome differentiation theory and TCM syndrome standardization. Methods Adopting the feature group-based selection method, 82 chronic gastritis symptoms (signs) were analyzed by affinity propagation clustering algorithm and then clustered into 22 symptom/signs groups. The feature selection algorithm was used to select the symptom group, and the classification accuracy of the classifier was used as the evaluation standard to select the symptom group of the common syndrome of chronic gastritis. Results The results of symptom/signs group selection of chronic gastritis were 8 groups of spleen-stomach damp-heat syndrome, 4 groups of dampness obstruction syndrome, 8 groups of spleen-stomach qi deficiency syndrome, 5 groups of spleen-stomach deficient cold syndrome, 5 groups of liver qi stagnation syndrome, and 6 groups of liver-stomach heat syndrome. Conclusion The selected features of six common syndromes of chronic gastritis are generally consistent with the TCM theories. Some of the results are different from TCM theories, which may be caused by the mixing, dynamic and complex clinical syndromes.

Keywords: feature selection; symptom/signs group; chronic gastritis; syndromes

证候是由具有内在联系的症状与体征组成的症状/体征群总称,是对病因、病位、病性、正邪关系及病势等作出的高度概括[1]。刘渡舟教授[2]指出,每一种病证都有其特异性主症,可以是一个症状,也可能由若干个症状组成。因此,如何找出主症是提高临床辨证准确性的关键。特征选择旨在去除不相关特征和冗余特征,力求以最少的特征来表达原始信息,达到最优的预测或分类精度[3],与寻找主症的目的吻合。但传统的特征选择算法主要针对单个特征,忽略了特征之间的关系,而基于症状/体征群的特征选择算法,通过对症状/体征群的取舍,以分类器的分类准确率作为评价标准,达到特征选择目的,这不仅可去除病例中冗余和无关症状/体征信息,更能反映中医证候本质。本研究基于症状/体征群的特征选择算法,对慢性胃炎6种常见证候进行症状群挑选,旨在探讨中医辨证理论与中医证候规范化的内涵。

1  资料与方法

1.1  一般资料

于2008年9月-2010年10月上海中医药大学附属龙华医院、上海中医药大学附属曙光医院、上海交通大学医学院附属新华医院、普陀区中心医院、上海市中医医院消化内科门诊、住院部及胃镜室进行病例采集。采用中医脾系问诊量表进行资料采集,去除信息不完整及不符合慢性胃炎诊断的量表,共采集有效样本919例。其中男性354例(38.5%),平均年龄(44.61±14.54)岁;女性565例(61.5%),平均年龄(48.70±12.74)岁。

1.2  西医诊断标准

依据《中国慢性胃炎共识意见》[4]确定慢性胃炎诊断标准。①临床表现:多数患者无任何症状,有症状者主要为消化不良,且为非特异性。②胃镜及病理检查。内镜下慢性非萎缩性胃炎可见黏膜红斑、黏膜出血点、黏膜粗糙伴充血等表现,慢性萎缩性胃炎可见黏膜红白相间,以白相为主,皱襞变平甚至消失,部分黏膜血管显露;慢性萎缩性胃炎病理活检显示固有层腺体萎缩。

1.3  中医辨证标准

参照《慢性胃炎中西医结合诊断、辨证和疗效标准(试行方案)》[5]、《中医临床诊疗术语·证候部分》[6]制定。①脾胃湿热证:脘腹痞闷,口苦口腻,口渴,小便黄;舌质红、苔黄厚腻,脉滑数。②湿浊中阻证:胃脘胀满,纳呆泛恶,肢体困重,泄泻或便溏;舌淡或淡红、苔白腻,脉濡。③脾胃气虚证:胃脘隐痛,食欲不振,食后胀闷,痞满,泄泻或溏薄,神疲乏力;舌淡白或淡红、齿痕舌、苔薄,脉细或虚。④脾胃虚寒证:腹痛喜温喜按,畏寒,手足不温;舌淡胖或有齿痕、苔白或白腻,脉虚或沉。⑤肝气郁滞证:胃脘胀满,胁胀胁痛,嗳气频作,受情绪影响;舌淡红、苔薄白或白厚,脉弦。⑥肝胃郁热证:胃脘疼痛,胁肋胀满,泛酸嘈杂,口干、口苦、口臭;舌红、苔黄,脉弦。

1.4  纳入标准

①以胃脘部不适为主要症状就诊,性别不限;②符合上述西医诊断标准和中医辨证标准者;③患者对研究知情,并签署知情同意书者。

1.5  排除标准

①精神病患者及伴有其他系统重度疾病者;②语言表达能力较差,病情叙述有困难者;③拒绝配合者。

1.6  数据采集方法

1.6.1  量表制作

由上海市消化系统疾病资深中西医结合临床专家、临床医生及研究者组成研究小组。参考以往量表经验[7],查阅中医脾胃病古今文献及近15年相关文献,尤其是慢性胃炎证型与证候有关的症状/体征频率的报道,初步制定调查表。经过2轮专家咨询及统计学检验,完善修改量表。最终确定中医脾系问诊量表共包括寒热、汗、头身胸腹、二便、饮食口味、睡眠、情绪、妇女共8个维度,及既往史、望诊、切诊等,共113个变量[8]。

1.6.2  数据处理及质量控制

采用Epidata3.1软件建立数据库。独立双遍录入。软件中对2份录入数据进行对比核查。数据质量监控包括以下2个方面:①调查方法。参考相关文献[9-13],制作量表操作指南,明確定义量表中症状/体征,指出问诊时具体操作方法和顺序。采样人员经统一培训,小组成员定期集中,对典型病例进行讨论,保证资料一致性。②诊断方法。邀请3位临床经验丰富的高年资主任医师,对信息完整的病例进行辨证,选取2位专家诊断一致的数据进行录入;对诊断不一致的数据,再与专家讨论,辨证一致后再录入。

1.7  统计学方法

1.7.1  特征预选择

对原始特征进行筛选,剔除无关特征与频次过小特征。由既往研究报道[14]可知,在慢性胃炎中医证候的诊断中,脉象信息所具有的辨证贡献度偏小,故在特征挑选时将不考虑脉象特征。另外,对频次<10的特征,其贡献率也可忽略不计。

1.7.2  特征聚类

采用近邻传播聚类(affinity propagation clustering,APC)算法[15]对症状/体征进行症状/体征群划分。APC算法是无监督聚类算法,此方法能更快更好地处理大规模数据。它将数据中每个变量均看作潜在的类代表点,通过迭代更新每一个点的可信度与可用度的值,直到达到迭代次数或迭代过程中收敛为止,同时将其余数据点分配给最近的类代表点,形成聚类。

APC算法在迭代的过程主要更新2个矩阵,代表矩阵R=[r(i,k)]N×N和适选矩阵A=[a(i,k)]N×N。这2个矩阵初始化为0,N为所有样本的数目。r(i,k)表示第k个样本适合作为第i个样本的类代表点的代表程度,a(i,k)表示第i个样本选择第k个样本作为类代表样本的适合程度。迭代公式如下:

如果i=k,样本i即为自身聚类的类代表点,如果i≠k,i则属于k所属的聚类。在算法迭代过程中,当2个或多个点同时适合作为某一类的代表点时,算法便可能出现震荡且无法收敛。故在算法迭代过程中引入阻尼因子λ,使每一次迭代r(i,k)与a(i,k)均受上一次迭代值约束,提高算法稳定性,计算公式如下:

1.7.3  特征组与标签间的关系评价

利用每一个特征组与对应标签之间的相关性进行排序,优先考虑相关性大的特征组。互信息(mutual information,MI)是信息论里一种有用的信息度量[16],它表示一个随机变量中包含的关于另一个随机变量的信息量。2个事件X、Y的互信息定义为:

2  结果

2.1  基于近邻传播聚类的慢性胃炎症状/体征聚类

本研究主要对中医问诊信息和舌象信息进行分析。通过对原始特征的筛选,得到82个症状/体征和舌象特征,再利用APC算法进行聚类,得到22个症状/体征群,涉及慢性胃炎特征性症状/体征、全身性症状/体征、面诊与舌诊症状/体征、特征性饮食偏嗜等。聚类结果见表1。

2.2  慢性胃炎常见证候的特征性症状/体征群选择

笔者对慢性胃炎的脾胃湿热、湿浊中阻、脾胃气虚、脾胃虚寒、肝气郁滞、肝胃郁热6个临床常见证候分别与22个症状/体征群进行关联,挑选对每个证候分类准确率最高的症状/体征群。当特征子集里的特征数>30时停止特征搜索。这样不仅符合中医辨证思想,且能降低计算复杂度,节省计算时间。

2.2.1  脾胃湿热证症状/体征群选择

脾胃湿热证又称中焦湿热证,由湿热内蕴、中焦气机升降失常、脾湿胃热互相郁蒸所致,可见全身湿热症状/体征的病理变化[17]。多因感湿邪或饮食不节、过食肥甘,酿成湿热,内蕴脾胃所致。脾胃湿热证候中,当特征子集为前8个症状/体征群时,分类器的分类准确率达到最高,故选择前8个症状/体征群包含的特征作为特征子集(见图1、表2)。其中序号1~8表示症状/体征群与对隐特征互信息大小的排序。

2.2.2  湿浊中阻证症状/体征群选择

湿浊中阻证是指湿浊内蕴于脾胃,导致脾胃虚弱、运化无力所表现出的证候[18]。湿浊中阻证候中,当特征子集在前4个症状/体征群时,分类器的分类准确率达到最高,故选择前4个症状/体征群包含的特征作为特征子集(见图2、表3)。

2.2.3  脾胃气虚证症状/体征群选择

脾胃气虚证是指脾胃之气不足,胃的受纳和脾的运化功能减退所表现的证候[19]。脾胃气虚证候中,当特征子集在前8个症状/体征群时,分类器的分类准确率达到最高,故选择前8个症状/体征群包含的特征作为特征子集(见图3、表4)。

2.2.4  脾胃虚寒证症状/体征群选择

脾胃虚寒证多因脾虚日久,波及脾阳,使脾阳也虚,或者贪食生冷,损伤脾阳,导致脾阳虚不能温暖胃肠,寒气自内而生[20]。脾胃虚寒证候中,当特征子集在前5个症状/体征群时,分类器的分类准确率达到最高,故选择前5个症状/体征群包含的特征作为特征子集(见图4、表5)。

2.2.5  肝气郁滞证症状/体征群选择

肝气郁滞证,又称肝气郁结,是指肝失疏泄,气机郁滞所表现的证候[21]。肝气郁滞证候中,当特征子集在前5个症状/体征群时,分类器的分类准确率达到最高,故选择前5个症状/体征群包含的特征作为特征子集(见图5、表6)。

2.2.6  肝胃郁热证症状/体征群选择

肝胃郁热证多由肝气郁滞证发展而来,气滞日久则化热[20]。肝胃郁热证候中,当特征子集在前6个症状/体征群时分类准确率达到最高,故选择前6个症状/体征群包含的特征作为特征子集(见图6、表7)。

3  讨论

本课题组运用APC算法获得的22组症状/体征群并将其分别与慢性胃炎的6种常见证候进行关联,结果与中医理论呈现较好的一致性。

脾胃湿热证症状/体征群挑选中,症状/体征群1(嗜睡、苔薄、苔白)、症状/体征群3(苔厚、苔燥、苔腻)和症状/体征群4(舌体胖大、舌边齿痕、舌苔遍布全舌)是“湿”的病性要素特点。湿浊内蕴,上泛舌面见苔白厚腻;湿痰中阻则舌苔遍布全舌;湿浊内阻,津液输布障碍不能上承舌面见苔燥;体内水湿停滞则舌体胖大、边齿痕;湿困脾胃,清阳不升则嗜睡;症状/体征群2(嘈杂、唇色红、舌色红、苔黄)、症状/体征群6(口酸、手足心热、小便色黄、舌色紫黯、舌瘦薄、舌苔偏于舌根)、症状/体征群7(口涩、口气重、面色红、舌中裂、黄白相兼)和症状/体征群8(胃脘灼痛、喜冷、胸骨后烧灼感)是“热”的病性要素特点。热迫血行,致使面、舌、唇部脉络扩张充盈,则面、舌、唇色红;热邪熏灼,故苔黄、小便黄;燥热伤津,故口涩、舌瘦薄、舌中裂;胃有湿热,浊气上泛则口气重;邪热犯胃可见嘈杂、胃脘灼痛、喜冷、胸骨后烧灼感。但症状/体征群5(面色淡白、唇色淡白、舌色淡白)与该证候关联度不大。

湿浊中阻证症状/体征群挑选中,症状/体征群1(苔厚、苔燥、苔腻)、症状/体征群2(舌体胖大、舌边齿痕、舌苔遍布全舌)和症状/体征群4(嗜睡、苔薄、苔白)是“湿”的病性要素特点。但症状/体征群3(嘈杂、唇色红、舌色红、苔黄)与该证候关联度不大。

脾胃气虚证症状/体征群挑选中,症状/体征群1(食少纳呆、口渴、乏力、肢体沉重活动则减、失眠)、症状/体征群2(舌体胖大、舌边齿痕、舌苔遍布全舌)、症状/体征群4(嗜睡、苔薄、苔白),癥状/体征群6(面色淡白、唇色淡白、舌色淡白)和症状/体征群8(泄泻、便质偏稀)是“气虚”的病性要素特点。元气亏虚,脏腑机能减退,故乏力,运化功能减退,则食少纳呆、泄泻、大便偏稀;气虚血亏,心神失养,则失眠,血不能上荣于面、唇、舌,则见面、唇、舌色淡白;气血不畅,肢体濡养不足则肢体沉重,活动后症状减轻;中气不足,脾失健运,若水液化生障碍则津液不足,故口渴;若水湿困脾,则嗜睡、舌胖大、边齿痕。但症状/体征群3(嘈杂、唇色红、舌色红、苔黄)反映“热”的证候病性要素特点。症状/体征群5(苔厚、苔燥、苔腻)、症状/体征群7(口苦、口甜、头晕、胸闷、舌边红)与该证候关联度不大。

脾胃虚寒证症状/体征群挑选中,症状/体征群2(胃脘冷痛、胃脘隐痛、痛有定处、喜暖、喜按、得食则减、肢冷或手足欠温、腐苔)、症状/体征群4(嗜睡、苔薄、苔白)是“虚寒”的病性要素特点。阳气不足,脏腑经络失去温煦,机体失养,则胃脘冷痛、隐痛、痛有定处、喜暖、喜按、得食则减、肢冷或手足欠温、苔薄白;寒湿化热可见腐苔。但症状/体征群1(嘈杂、唇色红、舌色红、苔黄)与该证候关联度不大。

肝气郁滞证症状/体征群挑选中,症状/体征群1(胃脘痛无定处、因情绪而加重、胁胀或痛)、症状/体征群4(胃脘胀、胃脘刺痛、嗳气)和症状/体征群5(食少纳呆、口渴、乏力、肢体沉重活动则减、失眠)是“气滞”的病性要素特点。肝失疏泄,经气不利,故胁胀或痛、胃脘胀或刺痛、食少纳呆、肢体沉重活动则减;肝气不疏,情志失调,则胃脘痛无定处、因情绪而加重、嗳气。但症状/体征群2(胃脘冷痛、胃脘隐痛、痛有定处、喜暖、喜按、得食则减、肢冷或手足欠温、腐苔)与该证候关联度不大。

肝胃郁热证症状/体征群挑选中,症状/体征群1(嘈杂、唇色红、舌色红、苔黄)、症状/体征群2(胃脘灼痛、喜冷、胸骨后烧灼感)和症状/体征群6(便秘、便质偏干、排便不爽)是“热”的病性要素特点。热邪伤津则便秘、大便偏干;湿热内蕴,阻滞肠道气机则排便不爽;症状/体征群5(胃脘痛无定处、因情绪而加重、胁胀或痛)是“气滞”的病性要素特点。但症状/体征群3(嗜睡、苔薄、苔白)与该证候关联度不大。

綜上所述,6个证候的症状/体征群选择结果总体与中医理论基本吻合。但一些特征值与标签的关系不符合中医理论,这些负相关的特征组可能是临床证候的兼挟性、动态性、复杂性等所致[22]。此外,本研究表明,基于症状/体征群的慢性胃炎常见证候特征选择的研究是切实可行的,这不仅为慢性胃炎证候标准的建立提供客观依据,也为其他疾病的中医证候规范化研究提供新思路。但本研究仍有一定局限性,如临床样本区域性较明显,今后应进行多中心、大样本临床研究。

参考文献:

[1] 王忆勤.中医辨证学[M].北京:中国协和医科大学出版社,2003:4-5.

[2] 傅延龄,刘渡舟.抓主症方法的认识与运用[J].中国医药学报,1993, 8(4):43-44.

[3] YU L, LIU H. Efficient feature selection via analysis of relevance and redundancy[J]. Journal of Machine Learning Research,2004,5(12):1205-1224.

[4] 房静远,杜奕奇,刘文忠,等.中国慢性胃炎共识意见(2017年,上海)[J].胃肠病学,2017,22(11):670-687.

[5] 周建中,陈泽民,危北海.慢性胃炎中西医结合诊断、辨证和疗效标准(试行方案)[J].中西医结合杂志,1990,10(5):318-319.

[6] 国家技术监督局.中医临床诊疗术语:证候部分[M].北京:中国标准出版社,1997.

[7] 刘国萍,王忆勤,董英,等.中医心系问诊量表的研制及评价[J].中西医结合学报,2009,7(1):20-24.

[8] 刘国萍,王忆勤,董英,等.基于探索性因子分析的脾系疾病问诊症状分布及证候要素初探[J].上海中医药大学学报,2012,26(2):32- 35.

[9] 邓铁涛.中医诊断学[M].上海:上海科学技术出版社,1984:1-190.

[10] 王忆勤.中医诊断学[M].北京:中国中医药出版社,2004:8-189.

[11] 王永炎.中医内科学[M].上海:上海科学技术出版社,1997:100-132.

[12] 张伯臾.中医内科学[M].上海:上海科学技术出版社,2000:103-116.

[13] 周仲瑛.中医内科学[M].北京:中国中医药出版社,2003:80-120.

[14] LIU G P, LI G Z, YAN S X, et al. Association analysis between symptoms (signs) and syndromes of chronic gastritis based on associated density[J]. Journal of Computational Information Systems,2012,8(19):131.

[15] FREY B J, DUECK D. Clustering by passing messages between data points[J]. Science,2007,315(5814):972-976.

[16] HANCHUAN P, FUHUI L, CHRIS D. Feature selection based on mutual information:criteria of max-dependency, max-relevance, and min-redundancy[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence,2005,27(8):1226-1238.

[17] 张声生,黄恒青,方文怡,等.脾胃湿热证中医诊疗专家共识意见(2017)[J].中医杂志,2017,58(11):987-990.

[18] 王忆勤,郎庆波,李果刚,等.慢性胃炎中医湿证证候诊断标准研究[J].中国中西医结合杂志,2005,25(11):975-979.

[19] 张心海,程玲.脾胃病常见证型中西医辨证要点[J].四川中医,2008, 26(6):20-23.

[20] 张万岱,李军祥,陈治水,等.慢性胃炎中西医结合诊疗共识意见(2011年天津)[J].中国中西医结合杂志,2012,32(6):738-743.

[21] 王忆勤.中医诊断学[M].北京:高等教育出版社,2012:126.

[22] 徐玮斐,刘国萍,王忆勤,等.近5年中医证候诊断客观化研究述评[J].中医杂志,2016,57(5):442-445.

猜你喜欢

慢性胃炎特征选择证候
肥胖中医证候动物模型研究进展
Kmeans 应用与特征选择
幽门螺杆菌相关性胃病中医体质与中医证型的关系研究
兰索拉唑联合克拉霉素治疗慢性胃炎的临床观察
奥美拉唑联合克拉霉素治疗慢性胃炎50例效果观察
联合互信息水下目标特征选择算法
昆明地区儿童OSAHS中医证候聚类分析
基于特征选择和RRVPMCD的滚动轴承故障诊断方法
基于二元搭配词的微博情感特征选择
慢性乙型肝炎的中医证候与辨证论治