应用LIS大数据建立0~3岁儿童血清FT3、FT4、TSH间接参考区间
2019-06-04苏汉文
苏汉文,顾 剑,何 兵
(武汉大学人民医院:1.检验科;2.儿科,湖北武汉 430060)
甲状腺功能对儿童健康成长具有重要作用,而儿童甲状腺功能在其生长、发育过程中有一个动态变化过程,对儿童甲状腺功能实验结果的解释需特别注意下丘脑-垂体-甲状腺轴的成熟度,对参考区间的解释应考虑从胎儿到成年甲状腺的生理状态[1]。应用时应考虑特定年龄段的参考区间,而试剂盒说明书一般只提供大于18岁健康成人甲状腺功能的参考区间,因此,根据检测系统建立适合本实验室的儿童甲状腺功能指标的参考区间是很有必要的。美国临床和实验室标准化协会(CLSI)文件C28-A3C指出建立参考区间首选包含至少120例参考个体的非参数方法[2];然而,健康个体的筛选具有严格的纳入及排除标准,对0~3岁儿童而言,标准的建立需耗费更大量的人力及物力。医院实验室信息系统(LIS)存储有大量检测数据,国外文献报道了多种基于现有数据建立参考区间的方法,如EM算法[3]、分段拟合[4]、线性回归[5]等,但国内鲜有这方面的报道。本研究通过收集LIS存储数据,结合R语言编程,筛选、拟合数据,建立了0~3岁儿童甲状腺功能检测指标的间接参考区间,希望为医学实验室生物参考区间的建立提供可靠的参考。
1 资料与方法
1.1原始数据采集 收集本院LIS存储的2013年7月至2017年12月,年龄1 d~3岁儿童所有游离三碘甲状腺原氨酸(FT3)、游离甲状腺素(FT4)、促甲状腺激素(TSH)检测值29 169例。排除性别、年龄、首诊缺项者。分为A组(1 d~≤1个月)、B组(>1~≤12个月)、C组(>1~≤3岁)。
1.2仪器与试剂 采集受检者空腹静脉血2~3 mL,3 000 g离心(离心半径19 cm)10 min,分离血清2 h内检测。采用Siemens ADVIA Centaur XP全自动化学发光免疫分析仪及配套试剂、校准品进行检测,采用化学发光磁微粒子免疫检测法,质控品为BIO-RAD Lyphochek Immunoassay Plus Control。
1.3方法
1.3.1检测质量保证 (1)精密度验证:根据EP15-A2[6]选用2个浓度水平混合血清标本,每个水平每天检测1批,每批重复检测3次,连续检测5 d,计算批内和总的精密度。计算相应浓度水平的标准差与验证值,核实精密度与厂家申明是否一致,满足实验室分析质量目标的要求。(2)室间质量评价:参加全国临床检验中心室间质量评价计划,分析反馈图表,保证各项目的正确度。(3)分析测量线性范围验证:参考CLSI文件EP6-A2[7]选取新鲜患者血清,使用单独或混合的方式(至多4份)获取高值和低值样品浓度,使其接近厂家声明的线性范围的上限与下限。将高值(H)和低值(L)样品按比例配置混合,形成系列评价样品。在一个分析批内每份样品重复测定2次,计算各个样品的理论浓度。以预期值为X,实际测定值为Y,绘制线性图。
1.3.2存储数据统计分析
1.3.2.1数据筛选 收集LIS中2013年7月至2017年12月、年龄1 d~3岁所有FT3、FT4、TSH检测值作为原始数据,经3次筛选后最终数据用于统计分析。数据筛选原则:(1)同一患者的多个检测值,经excel函数COUNTIF 进行条件统计,在同一年龄分组内保留初次测定值。(2)排除儿童和(或)母亲确诊为甲状腺功能亢进、甲状腺功能减退及其他代谢性相关疾病患者的检测值。(3)排除项目分析测量线性范围之外的值,按Dixon离群值测试D/R比值法[8],当某个观测值的D/R≥1/3值时该值作为离群值被剔除。D值是极大或极小值与相邻值之间的绝对差值,而R值是指所有观测值的全距。采用统计学方法计算检测值的四分位数值P25(Q1)、P75(Q3),依据四分位数值计算四分位间距的IQR(Q3~Q1),通过绘制箱式图将大于Q3+3IQR和小于Q1-3IQR的数据视为离群值并予以剔除。
1.3.2.2计算间接参考区间 采用Excel数据分析编制频数分布表。R软件以频数分布表的累积频率为横坐标,频数分布表节点检测值为纵坐标,绘制累积频率图[2]。R编程对累积频率图任意2点间数据进行无限循环,直至识别出最佳线性部分。循环条件为同时满足:(1)最小残差平方和;(2)最大累积分布百分比。满足上述条件的A、B 2点间数据采用Origin软件拟合线性回归方程Y=bX+a,其中Y为检测值,X为累积频率,应用外插法求得间接参考区间,5%~95%参考区间为[(5b+a)~(95b+a)]。
2 结 果
2.12013年7月至2017年12月FT3、FT4、TSH精密度性能验证结果 2013年7月至2017年12月FT3、FT4、TSH检测系统精密度均满足实验室分析质量目标的要求,保证了分析测量的精密度。见表1。
2.22013年7月至2017年12月分析测量范围验证结果 2013年7月至2017年12月FT3、FT4、TSH检测系统在分析测量范围内保持稳定良好的线性。见表2。
2.3室间质量评价结果 2013年7月至2017年12月参加全国临床检验中心内分泌室间质量评价FT3、FT4、TSH 3个检验项目全部合格,保证了检测结果的正确度。
2.4存储数据筛选结果 FT3、FT4、TSH 3个检验项目的原始数据经筛选后最终数据为各16 562例,占56.78%(16 562/29 169)。A组受检者血清FT3、FT4、TSH频数分布图及累积频率分布图见图A1~6;B组、C组受检者血清FT3、FT4、TSH频数分布图及累积频率分布图见图B1~6。
表1 2013年7月至2017年12月FT3、FT4、TSH精密度性能验证结果
注:CV表示变异系数
注:A1~3分别表示FT3、FT4、TSH频数分布图;A4~6分别表示FT3、FT4、TSH累积频率分布图及拟合线性图
图1 A组受检者血清FT3、FT4、TSH频数分布图及累积频率分布图
续表2 2013年7月至2017年12月FT3、FT4、TSH分析测量范围验证结果
注:B1~3分别表示FT3、TFT4、TSH频数分布图、B4~6分别表示FT3、FT4、TSH累积频率分布图及拟合线性图
图2 B组、C组受检者血清FT3、FT4、TSH频数分布图及累积频率分布图
2.5利用存储数据建立的FT3、FT4、TSH 间接参考区间 利用LIS存储数据建立的0~3岁3个年龄段儿童FT3、FT4、TSH参考区间与文献报道基于健康个体建立的参考区间比较,差异均无统计学意义(P>0.05)。见表3。
3 讨 论
参考CLSI文件C28-A3建立参考区间是实验室建立健康人群参考区间的首选方法,但该法需募集大量表观健康个体[9],对0~3岁儿童而言,更是需要大量的人力和物力,另一方面“健康”的定义却无严格统一的标准,过于严格的个体筛选可导致参考区间过窄,难以满足疾病状态个体的诊断。
LIS可存储大量患者信息,数据经授权可用于研究。国外已有不少利用LIS存储的项目检测值建立参考区间的相关研究。1963年HOFFMAN[9]首次对医院混合数据进行了筛选,建立了血清葡萄糖的参考区间。2010年KATAYEV等[5]利用统计学的精确计算替代Hoffmann方法中观察判断线性部分的模糊理论,建立了血红蛋白、肌酐等5个项目的参考区间,证明了该方法的精确性及可重复性,引起了学界的广泛关注。2011年DORIZZI等[10]证明经该方法建立的促甲状腺激素间接参考区间不仅与直接参考区间一致,且优于试剂厂商提供的参考区间。
采用医院存储数据建立参考区间有2个关键步骤。其一是对原始数据的筛选。本研究对原始数据进行了3次筛选获得最终数据:(1)收集日期内只保留同一患者的初次检测值。(2)为保证用于计算参考区间的检测值中“相对健康个体”的比例大于50%,剔除甲状腺功能减退、甲状腺功能亢进儿童的检测值。“相对健康个体”指不患影响所建立参考区间项目测定结果对应疾病的个体,在建立参考区间的过程中“疾病个体”与“健康个体”的比例非常重要。(3)剔除离群值。本研究采用基于四分位距值的箱式图法,剔除了大于3倍四分位距值的数据,对大数据的统计处理较适宜。其二是识别累积频率分布的最佳线性部分。有研究采用分段回归确定线性部分[5]。本研究采用R语言编程,利用计算机进行穷举法在累积频率分布的任意两点间进行线性拟合,简单却缜密,可在短时间内实现循环计算,给出最佳线性分布位点。
本研究利用存储数据建立的0~3岁3组儿童FT3、FT4、TSH参考区间与基于健康个体建立的临床现有参考区间比较,差异无统计学意义(P>0.05),与李怀远等[11]和王洁等[12]建立的参考区间结果一致。
4 结 论
虽然间接法建立参考区间的思想被广泛引用,但实际将其用于建立参考区间的相关文献报道却较少,主要是因为LIS数据中包含有大量疾病个体检测值,与国际临床化学学会(IFCC)所定义参考值的概念不一致,但其优势是间接参考区间建立的人群与该参考区间的适用人群更匹配,且在建立的过程中可节省大量的人力、物力,对医学实验室建立自己的参考区间是一个不错的选择。