APP下载

基于潜在类别模型的云南临沧艾滋病中医证候分布研究

2021-11-28温伟波

中国医药导报 2021年28期
关键词:脾虚类别证候

王 兴 周 青 李 钦 叶 芳 曲 源 温伟波

1.云南中医药大学基础医学院,云南昆明 650000;2.云南中医药大学附属医院 昭通市中医医院急诊科,云南昭通 657000;3.临翔区中医医院中医药治疗艾滋病项目办公室,云南临沧 677000;4.云南中医药大学第一附属医院 云南省中医医院内分泌科,云南昆明 650000

艾滋病全称为获得性免疫缺陷综合征(acquired immunodeficiency syndrome,AIDS),是感染人类免疫缺陷病毒(human immunodeficiency virus,HIV)引起的一种临床表现复杂的、死亡率极高的免疫性缺陷性疾病。自20 世纪80 年代我国首次报道AIDS 以来,在经历了传染期、扩散期、增长期后,目前疫情仍呈流行趋势。根据国家卫生健康委员会报道:2020 年,我国(不含港澳台)AIDS 发病人数62 167 例,死亡人数18 819 例,发病率为4.4283/10 万,死亡率为1.3405/10 万,报告死亡数居国家法定传染病最高[1];截至2020 年10 月底,我国现存活的AIDS 患者104.5 万例[2]。由此可见,AIDS 是严重威胁我国公众健康的重要公共卫生问题。云南省临沧地区地处中缅边境,AIDS 疫情防空形势严峻,为了更精准地发挥中医药在临沧地区AIDS的防治优势[3-4],本研究采用潜在类别模型(latent class model,LCM)对流行病学调查收集的复杂非线性的AIDS 中医四诊信息进行分析与整理,提取最为关键与核心的证型,最大程度地完善AIDS 诊断系统并提高临床疗效。

1 资料与方法

1.1 资料来源

本研究运用前期制作的《HIV/AIDS 中医证候调查表》[5]采取面对面的现场调查的方式收集2020 年6 月至2021 年1 月就诊于云南省临沧市临翔区中医医院的150 例AIDS 患者的四诊信息。

1.2 诊断标准

AIDS 诊断标准和疾病分类标准,西医参考《中国AIDS 诊疗指南》(2018 版)[6],中医辨证参考《AIDS 中医诊疗指南》(2013 版)[7],《中医药治疗AIDS 临床技术方案》(试行)[8],《中医临床诊疗术语(证候部分)》[9]。

1.3 纳入标准

①符合AIDS 诊断;②患者自愿参加本研究,并签署知情同意书。

1.4 排除标准

①患有原发性或其他继发性免疫缺陷病;②伴有其他慢性重大疾病(如癌症、慢性肾功能衰竭等);③具有精神疾病及不能配合临床问卷的收集。

1.5 数据管理

由3 名经过系统、规范培训的人员采用Excel 表统一录入调查表中信息指标,将各指标转化为“无”“有”的二分类变量。指标以“0”表示无此症状;以“1”表示有此症状。最后再由1 名人员对录入的数据进行二次检查,对错误的、遗漏的数据进行修改和完善,以保证数据的真实性和有效性。

1.6 数据分析

运用SPSS 22.0 建立AIDS 中医症状数据库,再应用Latent GOLD 5.0 软件完成LCM。LCM 的分析步骤包括其分析过程包括模型参数化、参数估计、模型识别、模型评价、潜在分类等[10-13]。

1.6.1 概率参数化 LCM 参数涉及两种类型的分类变量即外显变量和潜在变量,以及两种类型的参数即潜在类别概率和条件概率。LCM 的基本假设是:如果有3 个二分变量A、B、C,同时其水平数依次为I、J、K,其彼此之间不相互独立。如果存在一个具有T 个潜类别的潜变量X,其即能解释A、B、C 三者间的关系,又可以在X 的每个类别中维持A、B、C 的局部独立性。

1.6.2 参数估计、模型识别与评价 当研究者提出假定模型后,后面最关键的就是求出模型中参数的最终值。在LCM 中常用的参数估计方法是极大似然法,其迭代过程常用的算法有EM、NR 等,其中以EM 算法最为常用。参数估计上的另一个问题就是识别问题,模型识别是为了找出拟合度最优的模型。目前LCM常用的评价标准有Pearson χ2、似然比χ2(G2)、赤池信息量准则(Akaike information criterion,AIC)、贝叶斯信息准则(Bayesian information criterion,BIC)。其中AIC 和BIC 是LCM 中选择最优模型的最为广泛运用的指标,两个指标越小说明模型拟合越佳。

1.6.3 潜在分类 在确定最佳模型后,LCM 最后的步骤就是将各组观察值分类到合适的证候分类中,也就是创造一个新的类别变量来说明观察值的后验类别属性,即潜在聚类分析。

2 结果

2.1 AIDS 患者的基本情况

本研究共纳入150 例AIDS 患者,年龄18~80 岁,平均(45.12±10.74)岁;男80 例,女70 例;性接触感染97 例,占64.67%,静脉吸毒50 例,占33.33%,其他途径3 例,占2.00%;150 例患者平均病程(136.93±52.93)个月。

2.2 AIDS 中医症状筛选

本研究为提高参数估计的准确性,剔除出现频率≤10%的四诊信息,最终共纳入85 个症状指标进行LCM 分析。其中排在前20 位的症状依次为腻苔、白苔、乏力、健忘、沉脉、腰膝酸软、多梦、舌淡红、神疲、腰痛、滑脉、口苦、失眠、关节疼痛、脱发、夜尿、胖大舌、面色少华、身体困重、月经量少。见表1。

表1 AIDS 主要症状的发生频率

2.3 模型拟合

为了选择最优的AIDS 中医证候潜变量类别模型,从潜类别数为1 的初始模型开始,共拟合了6 个潜变量模型。6 个模型中,以3-Cluster 模型有最低的BIC 值(12 496.6106),在增加到4 个潜类别数后,模型拟合优度未见明显改善。如此,选择包含3 个潜类别数的Model 3 作为分析的最佳模型。各模型拟合指数见表2。

表2 AIDS 中医证候潜变量模型拟合优度指标

2.4 参数估计及命名

为排除主观因素对证候判定存在的偏倚,病例诊断时不对证候做出判定,而是通过聚类分析方法,探寻样本各症状间的关系。运用EM 算法对参数进行估计,得到85 个症状潜在类别概率和各类别下的条件概率。见表3。

表3 AIDS 中医证候潜在类别概率及条件概率

2.4.1 潜在类别概率 本研究的各潜在类别概率值分别是0.4704、0.4678、0.0618,总和为1。其比重排序:Cluster1>Cluster2>Cluster3。这里的潜在类别概率值类似于因子分析中的因子贡献率,其大小决定了该类别在潜变量中的地位,即潜在类别的概率值越大也就对显变量的影响越大。因此,认为模型中潜在类别1 的作用最大,其次是潜在类别2,最后是潜在类别3。

2.4.2 条件概率 在模型参数化之后,依据各类别下条目的条件概率特点对各潜类别进行解释。表3 中列出每个类别中条件概率在0.3 以上的指标。根据中医理论对各潜在类别中医证候要素进行综合分析:Cluster1 中证候要素为气虚,病位在脾肾,与心肺相关,综合辨证为“脾肾气虚证”;Cluster2 中证候要素为气虚、痰湿,病位在脾,综合辨证为“脾虚痰湿证”;Cluster3中证候要素为气虚、阴虚、血虚、阳虚,病位在脾肾,与心、肺、肝相关,综合辨证为“脾肾两虚证”。

2.5 AIDS 中医证候类型的建立(潜在分类)

拟合LCM 时,根据Bayes 公式可算出每个个体取值的后验概率,再根据后验概率来判断每个个体所属的类别,从而达到聚类的目的。如第1 例患者类别的后验概率最高(1.0000),因此该患者归属于Cluster 2,其他患者亦根据其后验概率进行分类。最终,本研究将150 例AIDS 患者分类为脾肾气虚证71 例,占47.33%;脾虚痰湿证70 例,占46.67%;脾肾两虚9 例,占6.00%。见表4。

表4 AIDS 中医证候潜在分类结果

3 讨论

3.1 LCM 在AIDS 中医证候研究应用

AIDS 是一种新发的、难治的传染性疾病,中医研究者将其归于“疫病”“伏气温病”“虚劳”“癥瘕”“阴阳易”等范畴[14]。因此,AIDS 的证候指标往往繁多而复杂,需要从众多的变量中提炼出少而精炼的指标,且根据四诊信息所归纳出来的中医证候是一个无法直接测量的潜变量,大多无法用确切数据定量表述。因此各研究者运用因子分析、聚类分析、结构方程模型等统计学技术给AIDS 证候研究赋予了量化标准,但每种统计手段都有其局限性。如因子分析、结构方程模型均具有要求可测变量为服从正态分布的连续性变量的缺点[15]。聚类分析只能一维降维解释,无法解释显变量与潜变量之间的多维、多层次的复杂关系[16]。鉴于AIDS 中医证候高维高阶、动态性的特点,本研究应用探索性潜在类别分析方法,基于两分类观察变量提出的潜变量分析方法[17],通过LCM 对AIDS 的四诊资料进行潜在聚类。其优点在于[18-20]:①结构功能上,LCM 引入结构方程模型与对线性模型的思想,兼具因子分析与聚类分析的功能;②变量要求上,该模型的潜在类别聚类分析假设变量服从混合分布,对数据分布的要求较为宽松,能弥补因子分析、结构方程模型、聚类分析等仅能处理服从正态分布的连续潜变量的缺点;③与传统的聚类方法比较,本研究该模型分析数据时还能辨别出最佳的类别数目,可以很直观的看出每个证型的构成比及构成成分,同时给各类别下的每个条目提供分类精度高的概率。而且此技术正逐渐运用于中医证候的研究领域[21-23]。

3.2 云南临沧地区AIDS 患者症状分布特点

本研究中150 例AIDS 患者主要症状为乏力、健忘、腰膝酸软、多梦、神疲、腰痛、口苦、失眠、关节疼痛、脱发、夜尿、面色少华、身体困重、月经量少;舌苔以腻苔、白苔、舌淡红、胖大舌为较为常见,脉象以沉脉、滑脉为主要特征。《素问·评热病论》指出:“邪之所凑,其气必虚。”表明无论任何病邪的入侵,气虚都是重要的前提条件,AIDS 也不例外。AIDS“疫毒”侵袭人体,潜伏于内,逐渐消耗人体正气致气虚,致使临床表现为一系列与气虚相关的症状。因此,本研究的AIDS患者的临床症状提示了气虚是临沧地区AIDS 的主要病机。《景岳全书》指出“脾为土脏,……以五脏中皆有脾气……。”HIV 感染者通过各种途径感染外来之“疫毒”,久病迁延难愈,归于脾虚,脾虚贯穿AIDS 的全过程[24]。后天之本受损,运化失职,气血生化不足,机体失去濡养,从而表现出神疲、乏力、面色少华、失眠、多梦等脾虚症状。《灵枢》云:“脾气虚……五藏不安”。由于患者在经历了漫长的无症状期后,久病及肾,此期以肾为五脏病变的中心,故AIDS 期以病位以肾为主[25],则出现腰膝酸软、腰痛、脱发、夜尿等肾虚症状。综上所述,云南临沧地区AIDS 患者以气虚为主要病机,病位主要在肾脾。

3.3 云南临沧地区AIDS 证候特点

本研究以潜类别模型技术为手段,最终将临沧地区150 例AIDS 患者聚类分为脾肾气虚证、脾虚痰湿证、脾肾两虚证3 个类别。提示了云南临沧地区AIDS证候虚实夹杂,病位主要在肾脾两脏。从所占比例看,本研究以脾肾气虚证与脾虚痰湿证为主要证型,两证型所占比例相当,分别占47.33%、46.67%;脾肾两虚证最少,仅占6.00%;由此可以得出云南临沧地区AIDS 证候以虚证为主,主要证型为脾肾气虚证、脾虚痰湿证。

3.4 云南临沧地域特点的致病因素

本研究发现,在潜在分类时,云南临沧地区AIDS患者不管是脾肾气虚,还是脾虚痰湿,亦或是脾肾两虚均表现出了痰湿的临床特征,考虑可能与以下几个因素有关:①疾病因素,中医认为“脾为生痰之源”,而气虚作为AIDS 的为主要病机,脾为主要病位,脾气亏虚,不能通调水道,津液传输不利,水湿内停,聚而生痰,故脾脏受损是内湿的主要来源。②环境因素,临沧地区位置在云南省的西南方向,属亚热带低纬度山地季风气候,全年气温恒定,降雨量强,气候潮湿。脾为湿土,喜燥恶湿,易感受湿邪,再加上AIDS 患者脾虚痰湿内生,内外合邪,终形成痰湿的临床变现。③体质因素,中医学认为人体体质是生命活动过程中相对稳定的,决定着个人对不同致病因素的易感性及其发病后病理变化的倾向性,也影响疾病的转归、传变[26]。云南临沧地区由于气候条件及生活习惯,加上AIDS患者本身的因素,易形成痰湿体质倾向。综上,痰湿是临沧地区AIDS 的主要病理要素,故在治疗该地区AIDS 患者时应注重痰湿之要。

综上,本研究采用新的统计学技术应用于AIDS中医证候研究,最终得出脾肾气虚、脾虚痰湿、脾肾两虚是云南临沧地区主要证候群,证候虚实夹杂,以虚证为主,气虚是主要病机,痰湿是主要病理要素,主要病位在脾肾。本研究数据局限于云南临沧地区,望今后的AIDS 调查研究中,按照AIDS 的发生发展规律,多中心、多区域、大样本的收集病例,多种数理统计方法紧跟潜在类别分析的前沿成果共同研究,从而规范AIDS 的中医诊疗,推动AIDS 的中医药发展。

猜你喜欢

脾虚类别证候
肥胖中医证候动物模型研究进展
瘦成一道闪电先过“脾虚”这关
为什么那么多人“脾虚”
服务类别
昆明地区儿童OSAHS中医证候聚类分析
推拿结合热敏灸治疗脾虚湿滞型假性近视的临床疗效观察
论类别股东会
中医类别全科医师培养模式的探讨
脾虚证的辨证要点与临床举隅
慢性乙型肝炎的中医证候与辨证论治