APP下载

基于LASSO 的多重线性回归在预测血管性痴呆大鼠学习记忆能力中的应用

2022-02-18王一帆雷贵月田寅魁孟娜娜朱坤杰

中国医药导报 2022年1期
关键词:生化线性血液

王一帆 许 慧 雷贵月 黄 歆 田寅魁 孟娜娜 朱坤杰

齐齐哈尔医学院,黑龙江齐齐哈尔 161000

血管性痴呆(vascular dementia,VD)根据病因分类,包括隐匿性、缺血性、出血性、脑血管病合并阿尔茨海默病(Alzheimer’s disease,AD)等,具有病因复杂、异质性强等特点[1]。我国60 岁及以上AD 患病率约为3.99%,其中VD 患病率约为0.85%,仅次于AD[2],一旦测出基本上是隐匿性VD 晚期,对家庭和社会都会造成巨大负担。临床上主要使用简易精神状态检查(mini-mental state examination,MMSE)和临床特征进行诊断。MMSE 主要是用于检测AD,而AD 和VD 在神经精神特征上存在很大重叠[3-4],所以对VD 的检测准确率不高,故寻找一个简便易于操作的方法尤为重要。本研究以Morris 水迷宫潜伏期指标为标准,结合痴呆程度相关的血液生化特征性指标,构建早期预测VD 的数学模型,旨在为实验性VD 动物模型的早期诊断及干预提供参考。

1 对象与方法

1.1 实验对象

1.1.1 主要仪器与试剂

Morris 水迷宫系统(上海移数信息科技有限公司);移液枪(德国Eppendorf 公司);真空采血管(浏阳市三力医用科技发展有限公司);5%水合氯醛(广州沛瑜生物科技有限公司);75%乙醇(广州沛瑜生物科技有限公司)。

1.1.2 实验动物

SD 大鼠40 只,鼠龄3~5 个月,雄性,体重(175±25)g,购于辽宁长生生物技术股份有限公司[SCXK(辽)2015-0001]。饲养于齐齐哈尔医学院动物实验室[SYXK(黑)2016-001]。饲养期间自由饮水,饲喂普通维持饲料(沈阳茂华生物科技有限公司)。饲养环境:昼夜各半循环照明,温度控制在22~25℃。所有操作均符合实验伦理学要求。

1.2 实验方法

1.2.1 大鼠VD 模型分组与复制

将40 只大鼠通过随机数字表法分为模型组、假手术组,每组20 只。采用黄文革等[5]改良的方法复制VD 模型。采用随机数字表法每组各选5 只,用作预测模型验证,其余各15 只用作预测模型建立。

1.2.2 学习记忆能力指标检测

大鼠造模12 周后参考周娇娇等[6]Morris 水迷宫动物学习记忆水平的检测方法,观察其行为学差别,通过潜伏期反映大鼠学习记忆能力[7]。当两组潜伏期比较差异有统计学意义(P <0.05),提示造模成功[8-9]。

1.2.3 血液生化指标检测

在动物行为学实验后,采用腹主动脉采血法对两组大鼠进行血液采集。用5%水合氯醛(0.35 ml/100 g)对大鼠进行腹腔麻醉后,仰卧位固定,在腹正中线位置“V”字型剪开腹部皮肤,暴露内脏,腹壁脊柱两侧找寻腹主动脉。用真空采血管收集4 ml 血液,采集结束后立即前往齐齐哈尔医学院附属第二医院送检,检测得到大鼠42 项血液生化指标。

1.2.4 数学模型建立

1.2.4.1 预测模型初建立及多重共线性检测 以大鼠血生化指标为解释变量,潜伏期为因变量,建立多重线性回归模型并进行多重共线性检验[10]。

假设有n 个自变量,那么本研究的模型为:

其中hθ(x)为潜伏期,xn为各血生化指标,θ0为常数,θn为各自变量系数。

将第m 个自变量作为因变量,对剩下的n-1 个自变量回归得到拟合优度R21-n/m,那么第m 个自变量的方差膨胀因子(variance inflation factor,VIF)为:

当VIFm的值越大时,说明第m 个自变量和其他变量的相关性越大。本研究定义回归模型的VIF 值为:

当VIF>10 时,即回归方程存在多重共线性。

1.2.4.2 LASSO 回归 为避免在变量过多时采用普通最小二乘估计带来的过拟合和多重共线性问题,本研究将进行LASSO 回归,识别出模型中不重要的变量,将其回归系数压缩为0,达到使模型简化及变得可估计的目的。

LASSO 的损失函数J(θ)为:

1.2.4.3 多重线性回归模型建立 将LASSO 回归筛选后的指标进行最终多重线性回归,得出大鼠预测模型。

1.2.4.4 多重线性回归模型检验 将验证预测模型的10 只大鼠,采取上述实验步骤得到相关实验数据,代入预测模型,得出潜伏期,与实际潜伏期进行误差分析。

1.3 统计学方法

采用SPSS 24.0 及MATLAB 2020 软件对所得数据进行统计学分析,计量资料符合正态分布采用均数±标准差()表示,组间比较采用t 检验,计量资料不符合正态分布采用中位数(四分位数)[M(P25,P75)]表示。计数资料采用例数表示。多重线性回归分析,以VIF>10 作为指标筛选先决条件。通过LASSO 回归对血生化指标进行筛选。将显著变量纳入多重线性回归并构建预测模型。以P <0.05 为差异有统计学意义。

2 结果

2.1 水迷宫学习记忆能力检测

模型组潜伏期(24.415±4.528)s 长于假手术组潜伏期(18.977±4.593)s,差异有统计学意义(t=3.265,P=0.003)。

2.2 血液生化指标检测

通过血生化检测,本研究得到了42 项血液生化指标,具体详见表1。

表1 两组大鼠血液生化指标数据结果[n=15,M(P25,P75)]

2.3 VD 大鼠血液生化特征性指标与潜伏期间数学模型的建立

2.3.1 预测模型初建立及多重共线性检测

将上述42 项指标数据进行回归,计算VIF,存在26 项VIF>10 的指标。见表2。

表2 共线性诊断

2.3.2 LASSO 回归

采用LASSO 回归对数据进行筛选,得到交叉验证的LASSO 拟合MSE(图1)及LASSO 拟合系数轨迹图(图2)。根据图1 最低点确定惩罚值为38.4406,即此时损失函数取得最小值,对应的即为最优lambda值。根据图2 可得到与最优lambda 值相交的变量即为模型最终所纳入的变量为总蛋白(total protein,TP)、总胆汁酸(total bile acid,TBA)、总胆红素(total bilirubin,TBil)、总胆固醇(total cholesterol,TC)、载脂蛋白A(apolipoprotein A,apo-A)、高密度脂蛋白胆固醇(high density liptein cholesterol,HDL-C)、甘油三酯(triglyceride,TG)、CO2、胆碱酯酶(cholines-terase,CHE)、免疫球蛋白M(immunoglobulin M,IgM)。

图1 LASSO 回归拟合MSE

图2 拟合系数轨迹图

2.3.3 多重线性回归模型建立

依据LASSO 回归筛选出的10 项血液生化指标,与能反映大鼠痴呆程度的潜伏期进行回归分析,构建VD 大鼠的多重线性回归预测模型。

其中各指标VIF 值均<10,模型相关系数R=0.852,拟合优度R2=0.725,回归模型统计量值F=5.016,显著性P=0.001。

2.3.4 多重线性回归预测模型结果评价

将上述根据随机数字表法选取的5 只模型组(1~5)和5 只假手术组(6~10)的大鼠进行预测模型分析,计算误差率,结果均<5%。见表3。

表3 多重线性回归预测模型判别及实际潜伏期结果

3 讨论

VD 是指由脑区低灌注的脑血管疾病所致的严重认知功能障碍综合征[12]。双侧颈总动脉结扎可致海马区供血不足,表现为学习记忆和旷场分析能力显著下降[13]。通过Morris 水迷宫检测大鼠学习记忆能力,目前采用最多的指标是潜伏期[14-16]。本研究中模型组潜伏期长于对照组,与王绪平等[17]研究一致。

目前VD 中医诊断不够全面,西医主要通过规避致病危险因素来预防VD 发生,尚没有明确关于VD的预防药物[18]。若建立数学预测模型,进行VD 早期诊断和干预,对其防治具有重要意义。本研究通过LASSO回归将不显著变量系数缩减为零,保留显著变量,减少多重共线性的影响,筛选VD 大鼠血液生化指标作为预测因子,发现TP、TBA、TBil、TC、apo-A、HDL-C、TG、CO2、CHE、IgM 均与VD 大鼠学习记忆能力密切相关,这与既往报道相符。刘晶靓[19]研究表明低频电刺激术治疗脑卒中患者,血清中与学习记忆能力呈正相关的TP 显著升高。华键等[20]研究表明HDL-C 水平的升高可防止脑血管疾病病情加重。刘恋等[21]研究表明血浆TC 水平下降使脑血管淀粉样蛋白积累,加剧认知损伤。张丽等[22]研究表明老年缺血性脑卒中患者血清TBil 明显低于参照组。此外,血清TG 的升高与老年心血管疾病病情加重密切相关[23-24]。侍洪斌[25]研究显示血清IgM 与TG 呈正相关,因此推测TG、IgM可作为诊断早期VD 的血清学指标。Zou 等[26]研究发现痴呆患者血浆中CHE 活性显著降低,其学习记忆能力下降。这些都提示上述指标对VD 的早期诊断有指导意义。本研究依据LASSO 回归筛选出的10 项血液生化指标与潜伏期进行回归分析,构建VD 大鼠预测模型。模型拟合优度较高,提示上述血液生化检测指标与学习记忆水平检测指标高度拟合,误差率<5%提示该模型具有良好的预测效能。

综上,本研究所建立的VD 预测模型,既可判断VD 动物模型复制成功与否,又因检测方便快捷,可用临床患者痴呆风险评分代替潜伏期,构建其与特征性血液生化指标之间的数学模型,有望为临床VD 患者早期预测及干预提供参考。本研究在正式开展前已进行预实验,对实验结果进行了预判,同时正式实验初期对大鼠进行了初筛,本研究模型预测出的潜伏期与实际潜伏期存在一致性。因此本研究在未来将开展更大的样本实验,专注于临床VD 患者血液生化指标的检测及其疾病进展的研究。

猜你喜欢

生化线性血液
渐近线性Klein-Gordon-Maxwell系统正解的存在性
从废纸篓里生化出的一节美术课
多彩血液大揭秘
二阶线性微分方程的解法
谁是半生化人
神奇血液
给血液做个大扫除
血液偏型
具有θ型C-Z核的多线性奇异积分的有界性