北京铁路局进藏列车乘务人员健康状态预警模型研究*
2010-03-11南京工业大学应用数学系210009陈建丽施庆生
南京工业大学应用数学系 (210009) 陈建丽 施庆生
青藏铁路格拉段于 2005年 10月全线贯通,2006年列车开行,列车乘务人员全部采用全程担当值乘方案。由于要持续的处于高原环境中,且要短时间内频繁往返平原和高原,身心疲劳不能得到有效的恢复,长期累积可能会引起列车乘务人员生理和心理的应激反应,这可能会破坏人体内环境的平衡,使人体处于一种异常状态〔1〕。因此,北京铁路局按照铁道部要求,于2006年 3月对进藏列车乘务人员进行体检选拔,习服培训后上岗值乘。为了加强进藏旅客列车乘务人员健康管理工作,掌握人员健康变化规律,进一步完善防治工作措施,又分别于 2007年 3月和 2007年 11月进行了两次岗间体检,在岗时间跨度都为 8个月。
本文利用北京铁路局进藏列车乘务人员的两次岗间体检资料,应用累积比数 logit模型,探讨影响列车乘务人员健康状态的重要生理监测敏感指标,并利用筛选出的重要生理检测敏感指标建立乘务人员身体健康状态的累积比数 logit预测模型。
资料与方法
1.样本、指标选择
本文的研究资料为北京铁路局进藏列车乘务人员的两次岗间体检数据资料,分别为 2007年 3月的岗间体检,400人;2007年 11月的岗间体检,296人,两次共计 696个样本。剔除缺失数据样本,最后保留两次岗间体检样本 510个。
北京铁路局两次体检项目包括个人生活史、既往病史调查,内科、外科、耳鼻喉科、眼科检查,血氧饱和度、胸部 X线、肺功能、腹部 B超、心电图、超声心动图检查,血、尿常规检查,血液肝功能、肾功能、血糖、血酯生化检查。
本文选取 38个体检指标来构造统计分析的自变量,每个自变量的取值xi结合相应体检指标检测值ui和铁路局岗前体检、岗间体检生理指标异常标准限值vi和改变标准限值wi进行赋值,异常(xi=2),改变(xi=1),正常(xi=0)。其中改变标准限值wi只有血压和血常规给出标准,其他指标采用如下方法给出:wi=vi×(1+5%)(对≤vi为异常的体检指标)或wi=vi×(1-5%)对≥vi为异常的体检指标)。
对ui≥vi为异常的体检指标,若ui≥vi,视为异常(xi=2);如果wi≤ui 对ui≤vi为异常的体检指标,若ui≤vi,视为异常(xi=2);如果vi 表 1 本文选取 38个初始体检指标 因变量即乘务人员的健康状态分三类:异常 (y=1),需采取相应措施;改变 (y=2),需引起注意;正常(y=3)。 因变量采取以下构造方法:将每个样本出现异常的生理指标个数相加,就得到该样本异常生理指标的个数 n。根据健康监测的标准从严格到宽松,我们分为三个等级〔2〕:等级 Ⅰ:n≤2时,y=3;n=3时,y=2;n≥4时,y=1。等级Ⅱ:n≤3时,y=3;n=4时,y=2;n≥5时,y=1。等级Ⅲ:n≤4时,y=3;n=5时,y=2;n≥6时 ,y=1。 2.累积比数 logit回归模型〔3〕 累积比数模型是一种有序回归模型,可用于处理按等级进行分类的有序因变量。在应用中可利用模型中的斜率系数解释实际问题,并能获得因变量与解释变量之间联系强度的OR值。 设因变量 y为 K个等级的有序变量,K个等级分别用 1,2,…,K表示。XT=(x1,x2,…,xp)为自变量。记等级为 j的概率为 P(y=j|X),则等级小于等于 j的累计概率为: P(y≤j|X)=P(y=1|X)+ …+P(y=j|X)有序分类结果的 logit回归定义为: 根据有序结果的 logit回归,可得每类的概率: 1.单因素累积比数 logit回归分析 首先,在所选择的 38个变量中,以防有重要变量遗漏,在 0.2的显著水平上对三种分类等级分别进行单因素累积比数 logit回归分析,寻找有统计学意义的影响进藏列车乘务人员身体健康状态的生理监测指标。三种监控等级对应的三个模型筛选出的有统计学意义的变量,见表 2。累积比数模型对这一条件并不敏感,即当条件不成立时,参数估计仍然较稳定〔5〕。所以我们对三种等级全部采用累积比数 logit模型。 由于同一类的体检指标之间有较强的相关性,或某些体检指标可能没有显著的预测作用,因此在选择模型的过程中要对体检指标进行筛选。以估计样本为基础,采用逐步后退法对初始体检指标进行筛选,变量筛选后比例发生比检验 P全部大于 0.05,三个模型采用累积比数模型都是合适的。三个模型的似然比χ2检验和拟合优度统计指标如表 4。 表 2 在 0.2的显著性水平下筛选出的有统计学意义的变量 表 4 模型拟合优度指标 2.多因素累积比数 logit回归分析 单因素分析虽然能逐步确定一些自变量与因变量之间的关系,但由于自变量间的相互作用影响,不能真正反映自变量与因变量之间的关系〔4〕。为了更好地了解身体健康状况与各个生理监测指标综合作用的内在联系,并排除混杂因素的影响,本文以单因素分析中具有统计学意义的生理监测指标为自变量,进行多因素累积比数 logit回归分析,采用后退法筛选重要影响因素。 采用多因素累积比数 logit模型首先应对成比例发生比假设条件 (p roportional odds assump tion)进行检验。三个模型的检验结果如表 3。 三个模型的似然比χ2检验都是显著的 (P<0.0001),这表明三个模型中所包含的自变量对因变量都有显著的解释能力。另外,三个模型的两个拟合优度统计指标 Pearsonχ2和 devianceχ2的检验 (P=1)都是不显著的,这说明三个模型都充分拟合了数据。三个模型参数估计结果见表 5~7。 表 5 模型Ⅰ的最大似然估计结果 表 3 比例发生比检验 由检验可知,筛选变量前模型Ⅱ和Ⅲ不能拒绝原假设,说明采用累积比数 logit模型是合适的。然而, 表 6 模型Ⅱ的最大似然估计结果 表 7 模型Ⅲ的最大似然估计结果 从三个累积比数 logit回归模型的参数估计结果可知,三个模型中包含共同变量 x4(血氧饱和度)、x5(肺活量 )、x7(体重下降 )、x11(HGB)、x14(AL T)、x16(TB IL)、x18(TP)、x19(白球比 )、x24(UA)、x25(TC)、x26(HDL)、x28(TG)、x34(升主动脉内径 )、x36(主肺动脉径)、x38(右心室流出道),说明这些指标是影响进藏列车乘务人员身体健康状况的重要生理检测敏感指标。且这些变量在三个模型当中的 OR值的平均值由大到小为:x4、x25、x16、x19、x36、x14、x34、x26、x28、x5、x7、x38、x24、x1、x11。这说明平均来看,在其他自变量相同的情况下,进藏列车乘务人员岗间体检中血样饱和度(x4)每增加一个等级,身体健康状态变差的可能性相对其他 14个生理检测指标来说是最大的。 3.进藏列车乘务人员健康状态预测 为了进一步检验模型的预测能力,我们将 510个样本代入模型对其所处的状态进行预测,三个模型的正确识别率情况,见表 8。 表 8 累积比数 logit模型的正确识别率 本文以北京铁路局进藏列车乘务人员的两次岗间体检数据为基础,建立进藏列车乘务人员健康状态预警的累积比数 logit模型,探讨影响列车乘务人员健康状态的重要生理监测敏感指标。 本文的实证研究发现,血氧饱和度、肺活量、体重下降、HGB、AL T、TB IL、TP、白球比、UA、TC、HDL、TG、升主动脉内径、主肺动脉径、右心室流出道是影响进藏列车乘务人员健康状态的重要生理监测敏感指?标,这集中体现了低氧对血液、心肺功能、代谢系统的影响。因此,在对进藏列车乘务人员健康管理工作过程中,这些指标可作为岗间体检中的重要参考指标。另外,在健康监测严格程度不同的规定下,三个累积比数 logit模型对乘务人员所处状态的正确识别率分别达到 79.6%,85.3%和 85.3%,显示该模型具有较好的预测能力。 1.施红生.高原铁路机车乘务人员生理选拔指标研究.中国安全科学学报,2006,16(6):18-24. 2.周晶晗,赵桂芹.我国产险公司财务恶化预警研究——基于 L ogistic模型.经济科学,2007(3):113-123. 3.王济川,郭志刚.L ogistic回归模型——方法与应用.北京:高等教育出版社,2001:237-349. 4.吴彬,田俊,罗仁夏.胃癌患者生存质量影响因素的累积比数模型分析.中国卫生统计,2007,24(1):36-38. 5.陈峰.医用多元统计分析方法.北京:中国统计出版社,2001,105-109.结果与分析
结 论