APP下载

2300例类风湿关节炎患者红细胞计数及其相关参数的数据挖掘研究

2018-01-22孙艳秋刘健忻凌万磊方妍妍文建庭董文哲

风湿病与关节炎 2018年11期
关键词:关联规则相关性分析类风湿

孙艳秋 刘健 忻凌 万磊 方妍妍 文建庭 董文哲

【摘 要】目的:基于数据挖掘方法探究类风湿关节患者的红细胞计数(RBC)及其相关参数与炎症、免疫、代谢指标的相关性、关联性及危险因素。方法:整理类风湿关节炎住院患者的病例资料,研究其实验室指标,运用SPSS 22.0、SPSS Clementine 11.1 Aprior等统计学软件对指标进行相关性分析、关联性分析、二元Logistics回归分析。结果:①共纳入RA患者2300例,共有贫血患者1448例,其中轻度贫血1042例,中度贫血397例,重度贫血9例,极重度未发现。②相关性分析显示:RBC及其相关参数大多与白细胞计数(WBC)、补体C3、补体C4、三酰甘油(TG)、总胆固醇(TC)呈正相关(P < 0.05 或P < 0.01),与年龄、病程、红细胞沉降率(ESR)、超敏C-反应蛋白(hs-CRP)、免疫球蛋白A(IgA)、免疫球蛋白G(IgG)、类风湿因子(RF)等呈负相关(P < 0.05或P < 0.01)。③经关联性分析:RBC降低与WBC、IgM、C3、C4、TC、TG升高有明显关联性,血红蛋白(Hb)降低与WBC、IgM、C3、C4、TC、TG升高有明显关联性,红细胞压积(HCT)降低与WBC、C3、C4、TC、TG升高有明显关联性。④二元Logistic回归分析得出,C4、TG、TC升高是RBC下降的危险因素(OR > 1),WBC、C4、TG、TC升高是Hb下降的危险因素(OR > 1),WBC、TG、TC升高是HCT下降的危险因素(OR > 1)。结论:类风湿关节炎患者的RBC及其相关参数的下降,与炎症、免疫、代谢指标的升高具有相关性且部分指标呈有效的强关联性,WBC、C4、TC、TG升高可作为RBC及其相关参数值降低的危险因素,参与了类风湿关节炎的发病及活动,具体机制有待进一步研究。

【关键词】 关节炎,类风湿;贫血;红细胞计数及其相关参数;相关性分析;关联规则;数据挖掘

类风湿关节炎(rheumatoid arthritis,RA)是一种累及全身多系统的慢性自身免疫性疾病,关节形成滑膜炎和血管翳为主要病理表现,可侵蚀破坏关节软骨、骨质,造成关节畸形或功能丧失。RA常伴有关节外表现,如发热、贫血、皮下结节、血管炎等。其中,贫血是RA最常见的关节外表现之一[1]。研究表明,RA患者确诊后1年内,合并贫血的概率高达5%,贫血的发生率、严重程度影响着RA病情活动性及治疗;另外,贫血也作为重要评估因素判断RA病情预后[2]。本文通过整理RA患者的病历资料,探究红细胞计数(RBC)及其相关参数与炎症、免疫、代谢指标的相关性、关联性及危险因素,研究结果可指导临床重视对贫血的预防及治疗,并为判断RA预后提供参考。

1 资料与方法

1.1 一般资料 选取2012年6月至2018年1月在安徽中医药大学第一附属医院风湿科就诊的住院RA患者,共纳入2300例。主要选取以下指标:RBC及其相关参数,包括RBC、血红蛋白(Hb)、红细胞压积(HCT)、平均红细胞体积(MCV);炎症指标包括白细胞计数(WBC)、红细胞沉降率(ESR)、超敏C-反应蛋白(hs-CRP);免疫指标包括免疫球蛋白A(IgA)、免疫球蛋白G(IgG)、免疫球蛋白M(IgM)、补体C3、补体C4、类风湿因子(RF)、抗环瓜氨酸肽(CCP)抗体;代谢指标包括三酰甘油(TG)、总胆固醇(TC)。

1.2 诊断标准 RA诊断按照2009年美国风湿病学会(ACR)和欧洲抗风湿病联盟(EULAR)共同提出的分类标准[3]。贫血诊断标准:男性Hb < 120 g·L-1;女性Hb < 110 g·L-1。轻度贫血为90 g·L-1 < Hb≤120 g·L-1(男)、90 g·L-1 < Hb≤110 g·L-1(女);中度贫血为60 g·L-1 < Hb≤90 g·L-1;重度贫血为30 g·L-1≤Hb≤60 g·L-1;极重度贫血为Hb < 30 g·L-1。

1.3 数据挖掘 RBC及其相关参数(RBC、Hb、HCT、MCV)降低取值定为T,正常和升高设定为F。其他实验室指标:炎症指标(WBC、ESR、hs-CRP),免疫指标(IgA、IgG、IgM,C3、C4、RF),代谢指标(TG、TC)正常及降低取值为F,升高取值为T。包括补充缺失数据,剔除错误数据。关联规则分析:采用SPSS Clementine 11.1中的Aprior模块分析指标间的关联规则,设定最小支持度为40%,最小置信度为80%。

1.4 统计学方法 采用SPSS 22.0软件进行统计分析。指标间相关性采用Spearman分析和二元Logistic回归分析方法,计数资料采用χ2检验,计量资料以表示,非正态分布资料采用Wilcoxon秩和检验。以P < 0.05为差异有统计学意义。

2 结 果

2.1 患者一般情况 共纳入资料完整的RA患者2300例,其中男353例,女1947例,比例为1∶5.52。2300例RA患者中伴贫血1448例(62.96%);年龄15~88岁,平均(53.89±12.99)岁;平均住院时间(18.98±10.39)d;平均住院次数(1.85±1.91)次。RA伴贫血患者一般情况:轻度贫血1042例(71.97%),中度贫血397例(27.42%),重度贫血9例(0.62%),极重度未发现。见表1。

2.2 RA患者RBC及其相关参数情况 2300例

RA患者RBC及其相关参数与正常参考值比较,RBC降低、正常、升高分别有997例(43.35%)、1292例(56.17%)、11例(0.47%);Hb降低、正常、升高分別有1448例(62.96%)、812例(35.30%)、0例(0.00%);HCT降低、正常、升高分别有1329例(57.78%)、967例(42.04%)、4例(0.17%);MCV降低、正常、升高分别有289例(12.57%)、1961例(85.26%)、50例(2.17%)。

2.3 RBC及其相关参数与其他实验室指标相关性分析 RBC与WBC、C3、C4、TG、TC呈正相关(P < 0.01),与年龄、病程、ESR、hs-CRP、IgA、IgG、IgM、RF呈负相关(P < 0.05或P < 0.01),与抗CCP抗体无相关性(P > 0.05);Hb与WBC、C3、C4、TG、TC呈正相关(P < 0.05或P < 0.01),与病程、ESR、hs-CRP、IgA、IgG、IgM、RF呈负相关(P < 0.01),与年龄、抗CCP抗体无相关性(P > 0.05);HCT与WBC、C3、C4、TG、TC呈正相关(P < 0.01),与病程、ESR、hs-CRP、IgA、IgG、IgM、RF呈负相关(P < 0.01),与年龄、抗CCP抗体无相关性(P > 0.05);MCV与年龄、TG、TC呈正相关(P < 0.01),与病程、ESR、hs-CRP、IgA、IgG、IGM、C3呈负相关(P < 0.01),与WBC、C4、抗CCP抗体、RF无相关性(P > 0.05)。见表2。

2.4 RBC及其相关参数与其他实验室指标的关联规则分析 设定前项为RBC及其相关参数(RBC、Hb、HCT、MCV),后项为其他实验室指标(ESR、WBC、hs-CRP、IgA、IgM、IgG、C3、C4、抗CCP抗体、RF、TG、TC),设定最小支持度为40%,最小置信度为80%。经Aprior 模块分析,RBC降低与WBC、IgM、C3、C4、TC、TG升高呈强关联;Hb降低与WBC、IgM、C3、C4、TC、TG升高呈强关联;HCT降低与WBC、C3、C4、TC、TG升高有明显关联性;以上关联规则支持度均 > 40%,置信度均 > 80%,提升度均 > 1;MCV关联规则分析均小于最小支持度与置信度,未出现关联结果。见表3。

2.5 RBC及其相关参数与其他实验室指标的二元Logistics回归分析 其他实验室指标设为自变量X,包括WBC、ESR、hs-CRP、IgA、IgG、IgM,C3、C4、RF、TG、TC,参数值降低和正常设为0,升高设为1。RBC及其相关参数设为因变量Y,RBC、Hb、HCT、MCV参数值降低设为0,正常和升高设为1,所有因素同时引入二元Logistic回归模型。分析结果提示:RBC与C4、TG、TC呈正相关(P < 0.01),与ESR、hs-CRP呈负相关(P < 0.01),与其他指标不相关(P > 0.05);其中C4、TG、TC是RBC的危险因素(OR > 1);Hb與WBC、C4、TG、TC呈正相关(P < 0.05或P < 0.01),与ESR、hs-CRP、IgA、IgG呈负相关(P < 0.05或P < 0.01),与其他指标不相关(P > 0.05);其中WBC、C4、TG、TC是Hb的危险因素(OR > 1);HCT与WBC、TG、TC呈正相关(P < 0.01),与ESR、CRP、IgA、IgG呈负相关(P < 0.05或P < 0.01),与其他指标不相关(P > 0.05);其中WBC、TG、TC是HCT的危险因素(OR > 1);MCV与CRP、IgG、IgM呈负相关,与其他指标不相关(P > 0.05)。综上可知,RBC及其相关参数的危险指标集中于WBC、C4、TG、TC。见表4。

3 讨 论

RA是一种发病机制尚不明确的自身免疫性疾病,其机制可能与细胞免疫特别是调节性T细胞的数量或功能异常有关,调节性T细胞起源于胸腺,可表达CD4和CD25,能够发挥抑制性免疫调节作用,持续性表达IL-2Rα链(CD25),具有免疫抑制性和免疫无能性两大特征,其中最重要的一群细胞是CD4+CD25+调节性T细胞,研究中多用CD4+CD25+Treg表示,其既可减少因单依据高表达CD25而丢失的Treg细胞,又可除去CD25阳性的效应性T细胞。刘健等[4]认为,RA活动期伴贫血患者外周血中CD4+CD25+CD127loTreg表达水平低,并且与疾病活动度及贫血相关指标密切相关,提示该细胞参与了RA发病和疾病活动,可作为RA伴贫血的原因之一。贫血作为关节外最常见表现之一,是RA活动的常见表现,多为轻、中度贫血,贫血的常见类型有慢性病贫血(ACD)、缺铁性贫血(IDA),其中,ACD最为常见,占60%以上[5]。RA病情活动时,白细胞介素(IL)-6、IL-1、干扰素1(INF-1)、肿瘤坏死因子-α(TNF-α)等细胞因子均较病情稳定时明显增高,导致铁代谢异常、骨髓造血抑制。国内外对RA伴贫血患者行体外骨髓细胞培养的研究表明,细胞因子如IL-6、TNF-α、INF-γ在RA并发贫血的发病中通过抑制红系祖细胞增殖,抑制促红细胞生成素(EPO)的产生及干扰铁代谢等发挥作用[6]。本研究显示,2300例RA患者中,1448例(62.96%)伴有贫血,其中轻度贫血1042例(71.97%),中度贫血397例(24.42%),重度贫血9例(0.62%),未发现极重度贫血。孙晓云等[7]研究表明,在239例RA患者中,有123例(51.46%)伴有贫血,轻度贫血94例(39.33%),中度贫血29例(12.13%),无重度和极重度贫血发生;结合其他相关文献报道,本研究与国内外关于RA伴贫血发病率报道的30%~70%一致[8]。邓丽等[9]发现,合并贫血的RA患者Hb水平越低,超声下骨侵蚀越严重。MOLLER等[10]研究发现,贫血可预测RA患者的关节放射学损害,并且这一预测作用独立于疾病活动度,提示贫血可作为预测RA患者骨破坏的指标。

关联规则是数据库中2个或2个以上取值之间存在的规律,反映了数据集各元素之间的有趣联系[11],其中最小支持度和置信度由操作者设定,如果项集X的支持度大于设定的最小支持度,X则称为频繁项集;若生成的关联规则中所有支持度和置信度都大于最小设定值,则被称为强关联规则[12]。关联规则挖掘的目的就是找出强关联规则。而提升度反映了关联规则两数据集的相关性,提升度 > 1且越高表明正相关性越高,为有效的强关联规则;提升度 < 1且越低表明负相关性越高,为无效的强关联;提升度 = 1,表明两者相互独立,没有相关性。关联规则本文相关性分析示,RBC、Hb的降低均与WBC、IgM、C3、C4、TC、TG升高有明显关联性;HCT降低与WBC、C3、C4、TC、TG升高有明显关联性;以上支持度均 > 40%,置信度均 > 80%,提升度 > 1;MCV关联规则分析均小于最小支持度与置信度,未出现关联结果。表明免疫、炎症、代谢异常的升高与RA患者RBC及其相关参数的降低有强关联。

二元Logistic回归分析常用于数据挖掘、经济预测等领域,回归分析可探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。一般而言,有两大用途:①寻找危险因素,对于疾病的预防与治疗具有重要的指导意义;②预测某种疾病或情况出现的概率,可用于风险评估或建立风险评分。本文分析结果提示:RBC及其相关参数多与脂代谢异常升高呈正相关,与免疫、炎症指标的升高呈负相关。其中C4、TG、TC指标值升高是RBC降低的危险因素(OR > 1),WBC、C4、TG、TC指标值升高是Hb降低的危险因素(OR > 1),WBC、TG、TC指标值的升高是HCT降低的危险因素(OR > 1)。调查显示,RA患者的平均寿命较正常人群缩短,而心血管疾病为首要死亡原因,约为50%,故RA被认为是一个独立的预测心血管病的危险因素[13-14]。RA患者体内存在明显的血脂异常,表现为低TC、低高密度脂蛋白胆固醇和高TG[15],说明RA患者血脂的变化和心血管疾病患者血脂的改变是一致的[16-17]。总之,危险因素涉及炎症、免疫、代谢指标,可认为炎症、免疫、代谢指标的异常升高均不同程度地参与了贫血的发生与发展。

综上所述,RA患者炎症、免疫、代谢指标的异常升高与RBC及其相关参数的降低具有相關性,且部分呈有效的强关联性。炎症、免疫、代谢指标异常升高作为危险因素,参与贫血发展并提示疾病活动程度。本研究危险因素的发现具有积极意义,不仅作为RA合并贫血的监测因素用于指导临床重视对贫血的预防及治疗,而且对于判断疾病发展、转归也有重要参考意义。

4 参考文献

[1] 姚血明,马武开,黄颖,等.类风湿关节炎患者贫血情况及其对疾病影响的研究[J].风湿病与关节炎,2014,3(11):20-22.

[2] SINGH H,ARY S,TALAPATRA P,et al.Assessment of fatigue in rheumatoid arthritis by Functional Assessment of Chronic Illness Therapy-Fatigue score and its relation to disease activity and anemia[J].J Clin Rheumatol,2014,20(2):87-90.

[3] 李兴福.2010年美国风湿病学会联合欧洲抗风湿病联盟的类风湿关节炎分类标准解读[J].诊断学理论与实践,2010,9(4):307-310.

[4] 刘健,陈瑞莲,潘喻珍,等.新风胶囊对类风湿关节炎活动期伴贫血患者外周血CD4+CD25+CD127lo调节性T细胞的影响[J].山东中医药大学学报,2009,33(6):480-483.

[5] 马璐晔,刘荣清.205例类风湿关节炎患者贫血临床分析[J].宁夏医科大学学报,2011,33(4):368-370.

[6] 李芳,刘宗印,滕清良,等.细胞因子与类风湿关节炎并发贫血的相关性研究[J].中华血液学杂志,2002,23(2):40-41.

[7] 孙晓云,苏茵,蔡莉萨,等.类风湿关节炎伴发贫血的临床分析[J].中国实用内科杂志,2005,25(7):614-616.

[8] BEAR AN,DESSYPIRS EN,KRANTZ SB.The pathogenesis of anemia in rheumatoid arthritis:a clinical and laboratory analysis[J].Semin Arthritis Rheum,1990,19(4):209-223.

[9] 邓丽,李敬扬,文振华,等.类风湿关节炎患者血红蛋白水平与疾病活动度相关性分析[J].慢性病学杂志,2016,17(9):969-971.

[10] MOLLER B,SCHERER A,FORGER F,et al.Anaemia may add information to standardized disease activity assessment to predict radiographic damage in rheumatoid arthritis:a prospective cohort study[J].Ann Rheum Dis,2014,73(4):691-696.

[11] 沈姗姗,郑光,展俊平,等.基于数据挖掘探讨类风湿关节炎证-症-法-方药规律[J].风湿病与关节炎,2013,2(10):5-9.

[12] 王爱平,王占凤,陶嗣干,等.数据挖掘中常用关联规则挖掘算法[J].计算机技术与发展,2010,20(4):105-108.

[13] MEUNE C,TOUZE E,TRINQUART L,et al.Trends in cardiovascular mortality in patients with rheumatoid arthritis over 50 years:a systematic review and meta-analysis of cohort studies[J].Rheumatology Oxford,2009,48(10):1309-1313.

[14] 刘潇桐,张杰.类风湿关节炎心血管疾病研究进展[J].风湿病与关节炎,2015,4(3):52-54.

[15] KHOVIDHUNKIT W,MEMON RA,FEINGOLD KR,et al.Infection and inflamemation-induced proatherogenic changes of lipoproteins[J].J Infect Dis,2000,181(13):S462-472.

[16] DURSUNOGLU D,EVRENGUL H,POLAT B,et al.Lp(a)lipoprotein and lipids in patients with rheumatoid arthritis:serum levels and relationship to inflammation[J].Rheumatology Int,2005,25(4):241-245.

[17] 张晓刚,李振彬,刘彦卿,等.类风湿关节炎心血管风险及中药有效成分对其干预的研究进展[J].风湿病与关节炎,2018,7(5):73-76.

收稿日期:2018-07-18;修回日期:2018-08-19

猜你喜欢

关联规则相关性分析类风湿
类风湿因子阳性是得了类风湿关节炎吗
类风湿因子需要转阴吗
类风湿因子阳性就是类风湿关节炎吗
上市公司财务指标与股票价格的相关性实证分析
淘宝星店成长中的粉丝力量
中国城市化与经济发展水平关系研究
关联规则挖掘Apriori算法的一种改进
基于关联规则的计算机入侵检测方法