基于因子分析和隐结构探讨纤维化性间质性肺疾病的症—证规律
2023-10-11吴聪罗成王玉光
吴聪 罗成 王玉光
纤维化性间质性肺疾病(fibrosing interstitial lung disease,F-ILD)是一组以肺纤维化为主要病变特征的异质性疾病,是大多数间质性肺疾病(interstitial lung disease,ILD)的转归[1]。既往研究表明与ILD的病因相比,影像学或组织病理学是否存有纤维化对患者的预后影响更为显著,不可逆的纤维化会导致肺脏结构破坏和功能丧失,出现呼吸衰竭甚至死亡[2]。相关研究表明中医药可改善F-ILD患者的咳痰喘等症状,提升患者的生存质量,在诊治F-ILD时具有独特的优势[3]。
传统医学诊治重在辨证,中医辨证的准确性与临床疗效密切相关,因此明确F-ILD的证素分布有助于中医药诊治方案的制定,提高临床疗效。《丹溪心法》云:“欲知其内,当以观乎外,诊于外者,斯以知其内。盖有诸内者,必形诸外。”传统医学基于“见外察内”的学术思想,通过观察临床症状、舌脉等外在表现归纳总结疾病的证候要素(病位证素、病性证素),从而明确疾病发生发展的本质。本团队前期通过研究F-ILD患者咳痰喘的特点,据此制定了中医症候量表,但对本病病因病机研究尚未清晰,故本研究基于前期的F-ILD中医症候量表进一步调整,通过采集F-ILD患者四诊信息,运用因子分析和隐结构等算法,归纳总结F-ILD症—证规律从而阐述F-ILD的病机,为临床提供新的诊治思路。
1 资料与方法
1.1 数据资料来源
病例来源于2016年1月1日至2022年1月1日于北京中医中医院呼吸科门诊就诊及病房收治的F-ILD患者,共268例患者数据纳入本研究,其中男性168例,女性100例。年龄范围为29~93岁,平均年龄为(66.53±11.07)岁。
1.2 诊断标准
参照2013年ATS/ERS修订的IIP国际多学科新分类标准的非IPF的间质性肺疾病[4],具体标准如下:(1)临床明确诊断为某一种间质性肺疾病,IPF的诊断参照2018年Fleichner学会发表的特发性肺纤维化诊断标准[5],结缔组织疾病参考各自的分类标准明确诊断,干燥综合征、系统性硬化症、类风湿关节炎等均采用相应的国际通用诊断标准进行诊断[6-8]。(2)运用胸部高分辨率CT(high resolution,HRCT)检测肺纤维化,具体表现:网格影伴牵拉性支气管扩张,伴或不伴蜂窝影[9]。
1.3 纳入标准
(1)符合F-ILD诊断标准,病例资料及诊断报告详实;(2)年龄18岁以上;(3)患者知情并自愿加入本项研究。
1.4 排除标准
(1)妊娠期或哺乳期妇女;(2)心功能不全、肝肾功能异常、造血系统、肿瘤等严重合并症;(3)有精神病病史和沟通困难的患者;(4)存在活动性感染的临床证据,例如急性支气管炎、肺炎等;(5)拒绝配合量表信息采集或组织病理学报告资料不全的患者。
1.5 中医四诊信息采集表制定
基于前期临床观察研究及相关文献[10],参照《中药新药临床研究指导原则(2002年版-试行)》、《中医临床常见症状术语规范》综合制定F-ILD患者中医四诊信息采集表[11-12],其具体内容包括:一般资料(姓名、年龄、性别)、病历信息(症状、舌脉信息、体征、病程、用药史、既往史及家族史)、西医诊断、中医诊断。
1.6 统计学处理与数据分析
将所得的临床资料录入Microsoft Excel 2019建立数据库,重复检查排除录入错误,筛选出四诊信息出现频率>10%的信息条目。应用SPSS Modeler 18.0软件进行关联规则,选用Apriori算法绘制四诊信息核心组合网络图,建立模点分析,设置最小支持度20%,最小置信度80%。
所有数据运用SPSS 25.0软件进行统计,首先应用KMO统计量进行因子分析的适用性检验,通常KMO值在0.5以上就适合进行因子分析检验。按照多因素分析原则,样本量应为变量数的5~10倍以上才符合因子分析的条件,本研究共有32个变量,总样本量为268例,因此可进行因子分析。因子分析采用主成分分析法,引用最大方差法进行旋转。因子中变量的载荷值越大,则它对因子的影响越大,故提取载荷值>0.3的变量为公因子的最终变量。
采用Lantern 4.3软件(香港科技大学研制),运用双步隐树分析LTM-EAST算法,对四诊信息出现频率>20%的症状进行隐结构模型构建,并对各个隐变量进行模型诠释,诠释类型为直连分析,累积信息覆盖度为95%,对隐变量的两两互信息及信息覆盖度、累积信息覆盖度进行模型诠释。结合医学专业知识,分析F-ILD中医病位、病性证素分布。
2 结果
2.1 F-ILD患者四诊信息分布
本研究将采集的F-ILD患者四诊信息进行频数频率统计,共提取四诊信息条目124条,其中出现频率大于10%命名为常见症状共60条,具体信息见表1。
表1 F-ILD患者四诊信息频次分布统计(n=268)
2.2 四诊信息关联规则分析及因子分析
2.2.1 四诊信息关联规则分析 参照表1统计结果,应用关联规则Apriori算法对上述60个变量间关联度进行分析测量。基于设置支持度和置信度筛选标准绘制四诊信息复杂网络图(见图1),关联规则部分结果见表2。
图1 常见症状关联规则网络图
表2 四诊信息关联规则节选表
为了进一步精简F-ILD的四诊信息,得到F-ILD核心的症状群,将网络图中显示连线频数值的阈值限提高,隐藏部分关联程度低的四诊信息。结果显示将阈值限提高至100~240时,绘制的四诊信息关联规则网络图最终由14个信息条目组成(见图2)。在网络图2中可以看出活动后气短、咳嗽、咳痰三者关联性最强,痰色白—咳嗽,活动后气短—苔白,活动后气短—口燥咽干之间关联度较大。通过关联规则得到F-ILD核心四诊信息症状群为:活动后气短、咳痰、咳嗽、口燥咽干、乏力、苔白、脉细、脉滑、脉弦、胸闷、痰黏难咯、痰色白、痰少、畏寒怕冷。
图2 核心症状群关联规则网络图
2.2.2 主成分提取及公因子提取 本研究共纳入268例患者信息,根据因子分析样本量应超过变量数的5~10倍以上,筛选四诊信息>20%的条目作为变量,共提取出32个变量。应用SPSS 25.0统计软件采用KMO和Bartlett球形度检验方法对纳入的变量进行分析,KMO检验结果为0.538>0.5,根据KMO度量标准可知,本结果提示本研究适合进行因子分析,Bartlett球形度检验结果近似卡方值为1850.871,P=0.000<0.1认为存在显著性差异。按照特征值≥1.0的原则对F-ILD症状主成分进行提取,得到其总方差解释表。通过总方差解释表发现公因子共有13个,累及方差贡献率为65.607%,碎石图见图3。
图3 F-ILD因子碎石图
采用凯撒正态化最大方差分析法对主成分进行进一步旋转,经10次迭代后收敛,得到因子载荷矩阵(见图4)。参考《证素辨证学》[13]等,对公因子所代表的的病位、病性证素进行分析,结果见表3。
图4 F-ILD的主成分旋转后的空间组件图
表3 F-ILD各组公因子包含的四诊信息及证素结果归纳
2.3 F-ILD证素隐结构分析
参照因子分析要求,继续对32条四诊信息作为显变量进行爬山法LTM-EAST分析构建F-ILD的隐结构模型,共得到10个隐变量,以Y0、Y1、Y2、Y3……Y9表示(见图5)。其中隐变量分类个数用隐变量后括号内数字显示,2个取值代表是/否2个隐类,变量间连线提示两者之间存在相关性,连线粗细代表隐变量间的联系密切与否。为诠释隐变量Y含义,Lantern会选取若干个与隐变量相关度最高的显变量,并基于这些显变量来进行诠释。
图5 证素隐结构模型
累积信息覆盖度决定了所得到的诠释结果覆盖了多少隐变量Y所包含的信息。在累积信息覆盖度为95%时,Y0由憋气、气短、口干喜热饮、口燥咽干、咽痒共5个显变量来诠释(见图6),隐变量Y0将数据分为2个隐类,即Y0=S0和Y0=S1。Y0~Y9隐变量模型见表4。
图6 Y0互信息及信息覆盖度结果
表4 F-ILD患者证素隐变量模型诠释表
通过隐结构模型构建挖掘F-ILD病位病性证素,共得到主要病位证素包括肺、脾、心,病性证素包括气虚、阴虚、阳虚、痰、湿、火热。
基于隐结构分析共得到10个隐变量,可归纳为3个病位证素、7个病性要素。与因子分析结果对比发现两种算法所揭示的证素基本相同(见表5),并且与既往相关研究结果基本相符,可为F-ILD的病机阐述提供了依据[14-15]。
表5 基于隐结构和因子分析的F-ILD中医证素分布
3 讨论
3.1 核心症状—证素分析
症状群是指3种或更多相互关联的症状同时出现,由于症状之间的协同作用,症状群对患者的影响要比单一症状更为严重[16]。核心症状群的提出有助于临床医生动态监测患者的疾病发展趋势,既往有研究表明活动后气短与肺功能下降和生活质量密切相关,并能够预测疾病进展和死亡率[17]。症状学特点亦有助于探讨疾病的规律,与其他慢性呼吸系统疾病的异同,更好的掌握疾病的本质。本研究通过关联规则提取出F-ILD核心症状群共包含14个四诊信息。其中咳、痰、喘常伴随出现,提示三者之间关系最为密切,是困扰F-ILD患者最常见的症状。本团队前期针对其咳痰喘特点分析发现其多具有“类风咳”“虚喘”等属性特点,而其他症状如口燥咽干、痰少质粘、脉细滑提示阴虚有热,乏力、畏寒怕冷、苔白提示阳虚,苔白、脉弦滑、胸闷提示内有痰湿。四诊信息繁多亦表明F-ILD病机复杂,既有正气亏虚又有邪阻标实,《黄帝内经》云:“正气存内,邪不可干。”正气虚馁则万邪蜂起,内邪丛生。
3.2 F-ILD中医归属及证素特点分析
证候是疾病发展不同阶段病理特点的概括,具有动态性、阶段性、个体性等特点。证素是证候的最小单位,是统一辨证方法的最佳方式,可针对不同疾病个性化匹配,形成完整的病证诊断模型,反应疾病发展的客观规律[18]。本研究基于临床病例资料,通过因子分析和隐结构两种统计方法模型共同探索并验证F-ILD的中医证素分布规律。研究结果提示F-ILD病位证素包括肺、脾、心等脏器,提示当ILD发展为F-ILD时病位已不仅仅局限于肺这一先受之地,而是累及他脏他腑,此时治疗不仅从肺而论,亦要重视他脏,先安未受邪之地,防已受邪之变,遏制疾病的进一步发展[19]。
F-ILD在病性证素中虚性证素包括气虚、阳虚、阴虚。现代医家根据临床表现将F-ILD归属于“肺痹”“肺痿”范畴,但各家认知仍存在较大争议。《辨证录》云:“肺痹之成于气虚,尽人而不知也……肺气受伤,而风寒湿之邪遂填涩肺窍而成痹矣”,可见肺痹虽以气虚为本,整体仍以实邪内舍为主,此时阴阳未伤。《金匮要略》中言肺痿“或从汗出,或从呕吐,重亡津液,故得之”,ILD早期以干咳少痰多见,随着病情的进展逐渐变为痰多易咳,痰湿之邪乃津液运化失调不循常道而生,久咳不愈痰液难尽则“重亡津液”变为肺痿。孙思邈曾云:“肺痿无论寒热,皆属虚损之证。”故肺痿以气阴两虚有热、阳气亏虚为主,故笔者认为F-ILD患者当属为“肺痿”而非“肺痹”。
但本研究中未明确体现出与肾相关病位证素特点,原因可能在于本研究样本量较少,相关症状纳入不足。F-ILD患者因久病咳喘,病位可由肺逐渐累及他脏,肾为金之子,母虚则其子化源不足,肾为封藏之官主纳气,肾阴虚不足难以载气故可出现呼吸表浅、吸气尤难。《景岳全书》云“五脏所伤,穷必及肾”,F-ILD作为各种间质性肺疾病发展的最终结局,病机与肾密切相关,既往亦有研究指出运用补肾法可以在一定程度上减轻患者的症状,增加运动耐量[20-21]。另外,现代医家认为瘀血贯穿于ILD疾病始终,瘀血既是病理产物,又可作为致病因素导致病情不断进展,恶性循环[22-24]。瘀血证表现不仅包含舌象的异常等显性因素[25],又包含肺微血管内皮细胞的结构变化、细胞因子变化、凝血—纤溶系统失衡等微观变化[26]。本研究未明确显示瘀血证的原因在于黯紫舌、舌有瘀斑、肌肤甲错等特异表现较少;另一原因未能收集患者的血液动力学等微观变化指标。笔者认为肾证、瘀血证是F-ILD重要的病机,因此下一阶段应进一步扩大样本获得更全面的F-ILD相关证素,且应针对瘀血证等难辨证素寻找新的敏感诊断依据,为F-ILD的诊治转归提供参考。
4 小结
综上所述,本研究通过证素研究和症状群分析相结合的方式,提炼出F-ILD的14个核心症状,归纳分析可以反映疾病本质的3个病位证素、7个病性证素,进一步为F-ILD属“肺痿”范畴提供了依据。虽然本研究基于因子分析和隐结构两种分析方法初步得出了F-ILD的症—证规律,但仍存在样本量不足、部分证素敏感度弱、病人GAP分期不明的不足之处,此后应进一步扩大样本量,开展各期F-ILD患者证素的临床研究,动态把握F-ILD疾病的发展规律,提高对其病因病机的认识。