APP下载

基于Lasso回归构建生物标志物影响代谢综合征的风险预测模型

2024-02-18黄茜郑少燕张志英朱丹萍范雪婷杜彪刘松坚

中国疗养医学 2024年1期
关键词:单核细胞胆固醇计数

黄茜,郑少燕,张志英,朱丹萍,范雪婷,杜彪,刘松坚

代谢综合征(metabolic syndrome,MetS)是一种与多种已知心血管危险因素同时发生的疾病,包括胰岛素抵抗、肥胖、致动脉粥样硬化性血脂异常和高血压[1]。随着我国经济的发展和人们生活方式的改变,MetS 的患病率呈快速上升趋势[2]。与欧美人相比,亚洲人更有可能患有MetS[3]。李燕萍等人[4]的研究结果显示,中国老年人MetS 的患病率高达23.9%。许多研究表明[1],MetS 的发生会增加2 型糖尿病、心血管疾病、肾损害等的风险。因此,MetS 的预测对于上述疾病的早期预防非常重要。

已有研究证实[5],三酰甘油(triglyceride,TG)、血清胆固醇、血糖、身高和体质量、血压等常规检查生物标志物可作为MetS 的有效预测因子。许多其他研究[6-9]发现了一些与MetS 相关的生物标志物,为研究者建立MetS 风险评估模型提供了便利。本研究开发了一种新的基于常规生物标志物的老年人MetS 风险预测模型,现报告如下。

1 资料与方法

1.1 研究人群 选择2020 年1 月至2021 年12 月到某中心疗养体检的人群作为研究对象。MetS的诊断标准采用中国成人血脂异常防治指南(2016 年修订版)。将研究对象中符合MetS 者纳入为实验组,另根据研究对象的性别和年龄(±5 岁),匹配非MetS 者为对照组。本研究一共纳入MetS组161 例,非MetS 组192 例。

1.2 选取标准 纳入标准:年龄≥60 岁;有完整的临床诊疗数据;完成血常规、血脂、空腹血糖(fasting blood glucose,FBG)、超敏C 反应蛋白(highsensitivity C-reactive protein,hs-CRP)检测者;获得研究对象知情同意。排除标准:有严重心血管疾病者;严重肝肾功能不全者;恶性肿瘤者;自身免疫学疾病者;失访、中途退出或者死亡者。

1.3 资料收集 收集研究对象的人口学特征资料如年龄、性别、吸烟史、饮酒史;测量研究对象的身高、体质量、腰围、血压,并检测FBG、血脂、血常规和hs-CRP,根据血小板计数、中性粒细胞计数、淋巴细胞计数、单核细胞计数和高密度脂蛋白胆固醇(high-density lipoprotein cholesterol,HDL-C)水平,计算中性粒细胞/淋巴细胞比值(neutrophil/lymphocyte ratio,NLR)、血小板/淋巴细胞比值(platelet/lymphocyte ratio,PLR)、单核细胞计数/HDL-C 比值(monocyte count/HDL-C ratio,MHR)。

1.4 统计学方法 采用STATA 16.0 软件进行统计分析。连续性变量且符合正态分布的数据用均数±标准差(±s)表示;对于不符合正态分布的计量资料,数据用中位数(P25,P75)表示;计量资料和分类变量用百分比(%)表示;使用单因素Logistic 回归分析得出MetS 的临床特征及生物标志物的两组水平比较,将单因素Logistic 回归分析P<0.05 的变量纳入到Lasso 回归分析中,用以构建老年人MetS 风险预测模型,根据Lasso 回归分析结果,描绘受试者工作特征(receiver operator characteristic,ROC)曲线并计算曲线下面积(area under curve,AUC)及其比值比(odds ratio,OR)和95%置信区间(confidence interval,CI)评估预测模型的性能。画出列线图,将预测模型进行可视化呈现。所有检验统计量均以P<0.05 为差异具有统计学意义。

2 结果

2.1 MetS 的临床特征及生物标志物指标比较单因素Logistic 回归分析结果显示,在MetS 与非MetS 间,腰围、体质量指数(body mass index,BMI)、高血压、FBG、2 型糖尿病(type 2 diabetes,T2DM)、TG、HDL-C、低密度脂蛋白胆固醇(LDL-C)、单核细胞计数、MHR、血小板计数(platelet,PLT)、中性粒细胞计数(neutrophils)、淋巴细胞计数(lymphocytes)、白细胞计数(white blood cells)、MHR、NLR、PLR、hs-CRP 在两组间的分布差异均有统计学意义(P值分别为<0.001、<0.001、<0.001、<0.001、<0.001、<0.001、<0.001、0.008、<0.001、<0.001、0.018、<0.001、<0.001、<0.001、<0.001、<0.001、0.003),被确定为具有潜在预测作用的因子,被纳入到老年人MetS 风险预测模型中,并进行筛选建模,见表1。

表1 代谢综合征的临床特征及生物标志物指标比较[(±s),n(%)]

表1 代谢综合征的临床特征及生物标志物指标比较[(±s),n(%)]

注:BMI=体质量指数,FBG=空腹血糖,TG=三酰甘油,TC=总胆固醇,HDL-C=高密度脂蛋白胆固醇,LDL-C=低密度脂蛋白胆固醇,MHR=单核细胞计数/高密度脂蛋白胆固醇比值,PLT=血小板计数,PLR=血小板/淋巴细胞比值,NLR=中性粒细胞/淋巴细胞比值;hs-CRP=超敏C 反应蛋白,下同;1 mmHg=0.133 kPa。

实验组(n=161)69.55±6.60 91(56.5)106(65.8)64(39.8)96.47±4.04 28.50±1.88 145.91±11.64 94.71±4.99 145(90.1)7.05±1.79 85(57.8)2.23±0.53 5.17±0.17 0.80±0.22 3.02±0.21 0.42±0.05 0.59±0.26 225.07±13.73 4.06±0.32 1.78±0.27 129.92±5.79 2.35±0.48 2.56±0.47 5.67±0.88对照组(n=192)70.40±8.10 103(53.6)124(64.6)70(36.5)80.47±4.16 24.51±2.27 128.04±10.68 83.34±14.07 97(50.5)5.63±0.97 22(11.5)1.53±0.36 5.15±0.11 1.12±0.17 2.94±0.24 0.36±0.02 0.34±0.08 213.75±10.91 3.83±0.27 2.17±0.28 100.18±14.94 1.81±0.35 1.55±0.23 5.53±0.91 P 值0.287 0.589 0.805 0.526<0.001<0.001 0.013 0.002<0.001<0.001<0.001<0.001 0.196<0.001 0.008<0.001<0.001 0.018<0.001<0.001<0.001<0.001<0.001 0.003变量年龄/岁男性吸烟饮酒腰围/cm BMI/(kg·m-2)收缩压/mmHg舒张压/mmHg高血压FBG/(mmol·L-1)2 型糖尿病TG/(mmol·L-1)TC/(mmol·L-1)HDL-C/(mmol·L-1)LDL-C/(mmol·L-1)单核细胞计数/(×109·L-1)MHR PLT/(×109·L-1)中性粒细胞计数(×109·L-1)淋巴细胞计数(×109·L-1)PLR NLR hs-CRP/(mg·L-1)白细胞计数/(×109·L-1)OR(95%CI)0.98(0.95,1.01)0.89(0.58,1.35)0.95(0.61,1.47)1.15(0.75,1.76)17.94(10.31,31.21)75.46(65.57,157.22)1.11(1.08,1.13)1.14(1.11,1.18)8.87(4.92,15.99)1.89(1.57,2.28)8.64(5.03,14.84)6.27(3.77,10.40)2.33(0.19,1.55)4.82(3.06,7.57)3.70(1.41,9.74)70.41(49.83,78.35)8.96(3.48,23.12)1.02(1.00,1.04)7.82(3.59,17.00)0.05(0.02,0.10)1.04(1.02,1.05)8.73(4.87,15.64)20.49(11.07,37.92)1.44(1.12,1.84)

2.2 预测模型的构建

2.2.1 λ 值的选择 对上述20 个变量纳入Lasso 回归进行变量选择,见图1,图1A 显示了10 倍交叉验证得到最优(一个方差范围内得到的最精简模型)的λ 值。本研究选择的λ=0.012,此时进入模型的7 个变量为:BMI、T2DM、FBG、TG、HDL-C、MHR和hs-CRP。图1B 显示了每个候选变量系数的变化轨迹曲线,随着λ 值的增大,模型压缩程度加大,进入模型的候选变量个数相应减少。

图1 基于Lasso-Logistic 回归模型的变量选择图

2.2.2 Lasso-Logistic 回归模型的构建 将Lasso 回归模型筛选出的7 个变量作为自变量,以MetS 为因变量,构建多因素Logistic 回归模型,见表2。

表2 Lasso-Logistic 回归模型的构建

2.2.3 风险预测模型的评价 入选的7 个变量组成的Lasso-Logistic 回归模型构建的模型ROC 曲线下的面积为0.985 7,预测模型的灵敏度、特异度、阳性预测值和阴性预测值分别为98.17%、96.35%、95.76%和98.40%,见图2。

2.2.4 预测模型的列线图 根据Lasso-logistic 回归模型的结果可绘制研究对象是否患有代谢综合征的预测列线图。每个预测变量可在评分轴分别得到一个具体分值,再将7 个评分值相加得到总评分,在总评分轴上找到相应得分位置,即可得到患者是否患有MetS 的概率。如研究对象的FBG为8.67 mmol/L、MHR为1.20、HDL-C<1.0 mmol/L、TG≥1.7 mmol/L、未合并有T2DM、hs-CRP为2.55 mg/L以及BMI>25 kg/m2,则总评分为28.5 分,对应的总评分风险轴上的预测概率为0.96,因此该研究对象被判定为MetS 的高危人群,见图3。

图3 Lasso-Logistic 回归模型的nomogram 列线图

3 讨论

已有较多的研究表明,高BMI 值与MetS 的发病风险升高显著相关,本研究使用了机器学习中的Lasso-Logistic 回归方法,得出了BMI、TG 等同样是MetS 患病的危险因素之一。本研究结果与国内外的研究结果一致,均证明了BMI 是预测MetS 模型准确性最为重要的关键性特征之一,如在一项使用伊斯法罕队列研究[10]的数据中,研究者基于各种健康特征构建了支持向量机的机器学习法和基于决策树的预测模型,得出的结论是TG、血压和BMI 是最重要的危险因素,其敏感性分别为0.774 和0.758。另一项前瞻性队列研究结果显示[11],基线高BMI 和BMI 动态增加均可升高MetS 的发病风险。如另一项研究[12]显示,肥胖、胰岛素抵抗、血糖增高和血脂代谢紊乱是绝经后MetS 妇女的危险因素,表明BMI 等特征是女性中MetS 的有用指标。由于BMI 可以在日常生活中轻松测量获得数据,因此其在预测肥胖和MetS 患病风险中具有优越性。

2 型糖尿病是一种以慢性高血糖为特征的代谢性疾病,常伴有肥胖、高血压、高脂血症等代谢性疾病。MetS 与心血管疾病(CVD)、中风和T2DM的增加有关[13]。MetS 与T2DM 密切相关,流行病学调查显示中国T2DM 的MetS 患病率高达68.1%[13]。在本研究中,T2DM 是预测MetS 患病的较好预测因子之一,与文献[14]报道的T2DM 与MetS 患病密切相关一致。MetS 的主要特征是胰岛素抵抗、糖代谢紊乱、超重、腹部脂肪分布、血脂异常和高血压,常见于大多数糖尿病前期或T2DM 患者[15]。已有研究[16]显示,FBG 在筛查MetS 患者未确诊T2DM 方面表现最好,AUC-ROC 值为0.785,本研究结果与上述研究结果相似,FBG 和T2DM 均是预测MetS 患病的较好预测因子之一。

慢性低浓度炎症、细胞功能障碍和氧化应激参与T2DM 和MetS 的发生和发展[13]。循环单核细胞是由免疫因子调节的血细胞簇,包括肿瘤坏死因子α 和Toll 样受体(TLR)2、TLR4 和TLR8 配体,可与血小板和内皮细胞相互作用,导致过度炎症和增加的氧化应激。这些生物学特征为单核细胞参与系统性炎症疾病(如MetS、T2DM 和CVD)的发展提供了基础[17]。高密度脂蛋白被认为是“好胆固醇”,可以结合TG 和胆固醇等脂质分子并参与胆固醇清除,从而降低CVD 风险[18]。高三酰甘油血症和低水平的HDL-C 以及其他代谢参数的改变和相互作用会导致氧化应激、内皮功能障碍和慢性低度炎症,从而导致患者心血管疾病患病率增加[2]。

HDL-C 能够与脂质分子结合,确保其具有抗炎作用,这也被认为是抗炎因子的理想标志物。单核细胞与HDL-C 的比率也被认为是氧化应激和全身炎症的指标,已被确定为慢性炎症性疾病如PCOS[19]等的预测标志物。此外有研究者发现MHR 与普通人群的全因死亡率和心血管死亡率显著相关[20]。以上的临床发现表明MHR 可以作为诸如MetS 在内的慢性炎症性疾病的预测标志物,且已有较多文献显示了MHR 是MetS 的预测标志物,MHR 越高,MetS 的患病风险越高[7]。本研究结果显示,T2DM、HDL-C、MHR 和hs-CRP 均是MetS 较好的预测标志物,表明慢性炎症在MetS和T2DM 的发生发展中起着关键作用。以上几种关键的预测标志物预测MetS 的患病风险,ROC 曲线下的面积达到了0.985 7,表明预测能力较好。

本研究结果存在以下不足之处:首先,本研究仅为单一中心研究,仅入选了300 多例研究对象,缺乏多中心大样本量的前瞻性队列研究,可能存在偶然因素作用,研究未具备外推性;此外,本研究为回顾性分析,非前瞻性研究,导致研究的因果推断能力不够,未来需要多中心大样本量的前瞻性队列研究来确定研究结果的因果关系。

综上所述,基于Lasso-Logistic 回归模型构建的7 种预测因子对MetS 患病风险的预测能力较强,可以帮助临床医生提早识别MetS 的高危人群,从而针对性地及早开展干预性服务,进一步提高临床干预效果。

猜你喜欢

单核细胞胆固醇计数
谈谈胆固醇
降低胆固醇的药物(上)
降低胆固醇的药物(下)
古人计数
递归计数的六种方式
古代的计数方法
胆固醇稍高可以不吃药吗等7题…
这样“计数”不恼人
单核细胞18F-FDG标记与蛛网膜下腔示踪研究
类风湿性关节炎患者外周血单核细胞TLR2的表达及意义