主成分分析用于百岁老人健康状况的综合评价
2019-07-01王琪如谭晓东
王琪如 谭晓东
(武汉大学健康学院,湖北 武汉 430071)
长寿是心理、生理、社会环境和自然环境等的综合作用结果〔1~3〕。在目前的长寿老人健康监测过程中,多从单因素指标出发进行评价,这样得出的结论不可避免的会产生一定的片面性〔4〕。这样的结果往往在解释上差强人意,其重要原因在于:①多个单一的生理指标会造成指标间的共线性问题;②利用普通人群的参考值作为参考,没有考虑到长寿老人的生理状况与普通人群的差异。因此,探讨针对长寿老人的综合性指标来反映其健康状况是目前老年学急需解决的问题之一。而主成分分析,可以通过降维将多个指标简化为少数彼此互不相关的(非共线性)的指标〔5〕,这些综合指标能反映尽量多的原始指标。本文利用主成分分析法,将健康的百岁老人监测指标进行了降维综合分析,以期找出一类能代表性地反映百岁老人的健康状况的指标。
1 对象与方法
1.1对象 从湖北省钟祥市疾控中心登记在册的93名百岁老人中,根据纳入和排除标准,收集到83名百岁老人的生化体检报告。纳入标准:①登记在册的百岁老人(年龄≥100岁);②能够参与体检并且报告结果没有缺失。排除标准:①同一人往年生化体检结果合为最新体检结果;②有缺失后的整合。
1.2指标的选取 综合文献回顾〔6〕将指标进行标准化,发现长寿老人在微循环、心功能、肝肾功能和免疫功能方面有较显著的长寿生理基础。具体表现在红细胞相关指标、血小板相关指标、尿素氮、总胆固醇、肌酐等。综合钟祥市现有百岁老人健康监测指标,本次研究选取以下标准化指标。总胆红素:0~20 μmol/L;淋巴细胞比率:20%~40%;直接胆红素:0~7 μmol/L;单核细胞比率:3%~10%;丙氨酸氨基转移酶:0~40 U/L;中性粒细胞数:(2.0~7.7)×109/L;门冬氨酸转移酶:0~40 U/L;淋巴细胞数:(0.8~4.0)×109/L;总蛋白:60~82 g/L;单核细胞数:(0.2~0.77)×109/L;白蛋白:35~55 g/L;红细胞:(3.5~5.5)×109/L;球蛋白:20~40 g/L;血红蛋白:110~160 g/L;A蛋白/球蛋白(A/G):1.0~2.5;血细胞比容:36%~50%;尿素氮:2.2~7.8 mmol/L;红细胞平均体积:86~100 fl;肌酐:45~115 μmol/L;平均血红蛋白量:26.00~31.00 pg;尿酸:142~416 μmol/L;平均血红蛋白浓度:280~370 g/L;二氧化碳结合力:24~32 mmol/L;红细胞分布宽度(RDW)-标准差(SD):37%~50%;总胆固醇:21~29 mmol/L;RDW变异系数(CV):11.90~14.50;三酰甘油:2.89~5.20 mmol/L;血小板:(100~300)×109/L;高密度脂蛋白胆固醇:0.0~2.3 mmol/L;血小板分布宽度:9~17 fl;低密度脂蛋白胆固醇:1.1~1.7 mmol/L;平均血小板体积:9~13 fl;同型半胱氨酸:0~15 μmol/L;大型血小板比率13%~43%;白细胞:(4~10)×109/L;葡萄糖:3.80~6.11 mmol/L;中性粒细胞比率:45%~77%。
1.3统计方法 采用SPSS19.0对百岁老人标准化后的指标进行主成分分析。对相关矩阵中特征根大于1及累计贡献率高于70%的主成分进行抽取。通过公式计算各主成分得分并用主成分得分与百岁老人的年龄进行F检验,用主成分得分与百岁老人的性别进行t检验。
2 结 果
2.1重要主成分的提取及主成分得分的计算 指标标准化后进行主成分分析,得到8个主成分。相关系数矩阵显示各变量之间相关性较好,提示适用主成分分析,见表1。前8个主成分累积贡献率大于70%,说明很好地代表了原始数据的大部分信息,见表2。根据林海明〔7〕的方法,用公式Yi=faci-λi计算出的主成分得分效果更好。得到Y1、Y2、Y3、Y4、Y5、Y6、Y7和Y8主成分的得分,分别代表主成分Z1~Z8的得分。
表1 相关矩阵(部分)
表2 解释的总方差初始特征值
2.2应用主成分得分比较不同年龄、性别百岁老人健康状况 每1个百岁老人都有对应的主成分得分。将8个主成分得分与百岁老人的年龄进行F检验。第4主成分得分的方差分析有显著性结果(F=3.134,P=0.002),说明不同年龄的百岁老人在第4主成分所代表的综合指标上是有差异的,第4主成分在总胆固醇和低密度脂蛋白胆固醇上的载荷较大(aij>0.6),且呈正相关,见表3。说明这些变量对第4主成分作用较大。将8个主成分得分与百岁老人的性别进行t检验(t=2.773,P=0.007),说明不同性别第6主成分得分上有差异。第6主成分在门冬氨酸转移酶和球蛋白上的载荷较大(aij>0.5),且呈正相关,说明这些变量对第6主成分得分的作用较大。随着年龄的增加,无论是男性还是女性,第4主成分得分都在均值上下波动。在第6主成分得分上,女性较男性的波动大,见图1、2。
表3 第4主成分和第6主成分的成分矩阵(aij)
图1 不同性别各年龄组第4主成分得分
图2 不同性别各年龄组第6主成分得分
3 讨 论
主成分分析的提取不是目的,而是进一步的分析。主成分的提取是为了进一步对百岁老人健康状况做综合评价。但从主成分的提取中,可以获得综合评价长寿老人健康状况的综合指标——主成分4和主成分6,分别代表了心脏和肝肾功能及免疫功能的情况。
第4主成分Z4得分在百岁老人的不同年龄段间有差别。其所代表的总胆固醇和低密度脂蛋白胆固醇在不同的百岁老人年龄段间存在差异。与殷召雪等〔8〕的研究发现百岁老人总胆固醇较高的结论相符。Z6则主要反映了门冬氨酸胰酶和球蛋白的情况,经过t检验可知,球蛋白在性别之间有差异,但是在年龄上没有差异,这与Middleton等〔9〕认为百岁老人常能避过主要与增龄相关的疾病,较好地保存免疫功能的结论一致。
通过主成分分析得知,在针对百岁老人健康的综合评价上,首先更应关注总胆固醇、低密度脂蛋白、门冬氨酸转移酶和球蛋白指标的变动,其次,即使同为百岁老人,但不同年龄组的百岁老人总胆固醇和低密度脂蛋白是存在差异的,说明在不同年龄组的百岁老人,其心脏功能及肾脏功能是存在差异的,但是这个差异并没有影响其长寿,具体的原因还需进一步探讨。同样的,在门冬氨酸转移酶和球蛋白指标上,长寿老人存在性别上的差异。说明在免疫功能方面,男女长寿老人存在差异,这种差异没有影响其长寿。至于这种差异对长寿老人的生存影响还需进一步研究。
综上,主成分分析能够正确且深入地反映百岁老人健康状况,克服了很多其他文献仅用单因素单指标分析带来的片面性。