25~49岁女性全身骨量减少风险自评估工具的研制与检验
2020-10-26崔新雯张一民
崔新雯 张一民
1 国家体育总局体育科学研究所(北京100061)
2 北京体育大学(北京100084)
1 前言
骨质疏松症(osteoporosis,OP)是以骨量减少和微结构的退化为特征伴骨脆性增加和易发骨折的一种全身性骨骼疾病[1],其发病人数逐年增多,已成为世界范围且不断增长的公共健康卫生问题[2,3],而作为OP 发病前的一个危险阶段——骨量减少,发生人数更多,却常被忽视。临床及流行病学研究证实,骨质疏松症的预防胜于治疗[4]。风险评估工具作为预防骨质疏松症的一种筛查手段,与运用仪器直接检测骨密度相比,在操作方法和经济成本上占有更大优势,但目前大多数已建成的骨质疏松症风险评估工具[5-13]主要针对的是绝经后妇女,对绝经前的年轻人骨量减少的研究较少。本实验室之前首次建立了未绝经女性腰椎骨量减少风险自评估方法[14],使评价年轻人腰椎骨量减少更加简便与高效,同时也引起了对这一群体骨骼健康的关注。因此,作为腰椎骨量减少风险自评估方法的补充,本研究继续研制针对全身骨量减少的风险评估工具,以期综合全面评价全身骨量,筛查低骨量人群,为预防绝经后骨质疏松症和老年性骨质疏松症,及进一步丰富体质健康自评体系提供技术支撑。
2 对象与方法
2.1 研究对象
本研究对象来自于北京市的多个高校和企事业单位,根据纳入、排除标准选取研究对象共149名。纳入标准:年龄在25~49 岁的健康年轻女性,经研究者说明研究目的后,均自愿参与实验。排除标准:糖尿病、高血压、高脂血症、心脏病、肾和肾上腺疾病、慢性肠胃疾病、慢性肝病、妇科疾病、自身免疫性疾病(类风湿性关节炎)、甲状腺、甲状旁腺疾病、骨软化症、骨硬化症及各种肿瘤患者,正在服用影响骨代谢的药物(如双磷酸盐、糖皮质激素、利尿剂等)者,骨代谢病史者。在所有研究对象中随机抽取115 人作为建模组,建立25~49岁女性全身骨量减少风险评估工具,34人作为验证组,对评估工具的应用效果进行评价检验。研究对象基本情况见表1。两组的年龄、身高和体重经独立样本T检验后,所得P值均大于0.05,差异无统计学意义;两组中骨量正常的比率和骨量减少的发生率经卡方检验后,所得P值亦大于0.05,差异无统计学意义。此外,研究对象中未出现骨质疏松症。
表1 研究对象基本情况
2.2 研究方法
2.2.1 问卷调查法
采用经严格信度和效度检验的问卷[14]——女性骨骼健康状况调查问卷,对所有研究对象进行调查。问卷内容包括出生日期、测试日期、生活习惯(蔬菜、水果、奶制品、豆制品、蛋类等的摄入情况,咖啡、茶等的饮用情况,睡眠习惯等)、身体活动水平、自感症状(疼痛、手脚麻木、腿脚抽筋等情况)、疾病、用药史、遗传史、月经、生育情况、18岁以前以及18~30岁时的体育锻炼情况、钙的摄入情况等,均为与骨密度与骨健康密切相关的影响因素。调查问卷中,奶制品、豆制品、咖啡、茶等的食用频率,分每周5 次以上、每周3~4 次、每周1~2次、每周不足1次及以下四个水平。总身体活动水平,采用了国际身体活动问卷(International Physi⁃cal Activity Questionnaire,IPAQ)的长卷中文版进行评价,调查近一年的职业性、交通性、家务性和休闲性身体活动的活动时间、频率、方式等。评价标准参照国际身体活动数据处理与分析指南[15],并借鉴其他研究[16,17]的分级方法,将总身体活动水平分为高、中、低3 个水平(高水平:每周3天以上大强度身体活动能量消耗至少1500 METs/周,或每周7天中等强度、大强度身体活动累计能量消耗至少3000 METs/周;中等水平:每周3天以上至少20 分钟的大强度身体活动,或每周5 天以上至少30 分钟的中等强度身体活动,或每周5 天以上中等强度、大强度身体活动累计能量消耗至少600 M ETs/周;低水平:不满足高水平和中等水平的身体活动),4 个单项身体活动水平分为活跃和不活跃2个水平(①职业性身体活动水平活跃:每周300 分钟以上的中度到大强度的工作,如步行、搬举重物或其他相应的活动,若不是,则为“不活跃”;②交通性身体活动水平活跃:每周300分钟以上的步行、骑自行车或其他类似活动,若不是,则为“不活跃”;③家务劳动性身体活动水平活跃:每周300分钟以上较重的家务活动,如吸尘、挖掘、搬举或其他类似活动,若不是,则为“不活跃”;④休闲性体力活动水平活跃:每周中到大强度体力活动150分钟以上或每周大强度体力活动60 分钟以上,若不是,则为“不活跃”)。18岁以前以及18~30岁的体育锻炼,指在此年龄期间,有目的、有计划、有规律的从事各种体育活动,分是、否两个水平。
2.2.2 实验室测量法
使用美国诺兰德公司生产的双能X 线骨密度测试仪(Dual-Energy X-ray Absorptiometry,DXEA)XR—46(型号)对研究对象进行身体成分测试。仪器在每日测试前均进行精确度和准确度检测,测试瘦体重、脂肪和骨密度的变异系数分别小于1.5%、2.5% 和1.0%。测试中的所有操作均由同一位专业人员完成。根据世界卫生组织(WHO)1994年提出的诊断标准[18],将骨量低于正常成年人骨峰值1.0~2.5 个标准差判定为骨量减少。
2.2.3 数理统计法
应用统计软件SPSS16.0 版本进行统计分析。以DXEA 测骨密度所得的T 值作为判断骨量减少(-2.5<T<-1)的金标准,采用Pearson相关分析、单因素方差分析和二分类Logistic 回归分析方法,对经理论分析形成的调查问卷所涉及的影响因素进行筛选,得到评估模型。绘制受试者工作特征曲线(receiver operat⁃ing characteristic curve,ROC),根据ROC 曲线下面积(area under the curve,AUC)、灵敏度、特异度、约登指数、符合率确定临界值,使评估工具达到良好的筛检价值且简便易行。最后通过外部样本回代,采用Kappa一致性检验方法对评估与金标准筛检结果的一致性进行检验,以评价评估工具的应用效果。本统计方法均以P<0.05为水平具有显著性。
3 结果
3.1 全身骨密度影响因素的筛选和骨量减少风险评估模型的建立
3.1.1 正态性检验
采用K-S 检验方法对连续性变量进行正态性检验,P>0.05,结果见表2。由表2所示,各连续性变量在建模组和检验组中分布均属于正态分布。
表2 两组中不同自变量的正态检验P值
3.1.2 相关分析
将各影响因素中的连续型变量与全身骨密度值、全身骨密度T 值做Pearson 相关分析,得到身高、体重、瘦体重和脂肪与骨密度值和全身骨密度T值有相关关系(P<0.05)见表3。
表3 影响因素与全身骨密度的相关分析(r)
3.1.3 单因素方差分析
以全身骨密度值和全身骨密度T 值为因变量,对影响因素中的分类变量进行单因素方差分析,结果见表4,得到豆制品、休闲性身体活动、总身体活动水平、18 岁前的体育锻炼以及18~30 岁的体育锻炼对全身骨密度值和T值存在显著影响。
表4 骨密度影响因素的频率分布及单因素方差分析(F)
(续表4)
3.1.4 全身骨量减少风险评估模型的建立
以是否骨量减少(-2.5<T<-1)为因变量(是=1,否=0),以与全身骨密度T值有显著相关的豆制品[每周5次以上(参照水平)、每周3~4次、每周1~2次、每周不足1 次及以下]、休闲性身体活动(是=1,否=2)、总身体活动水平(低、中、高)(是=1,否=0)、18岁之前的体育锻炼(是=1,否=2)、18~30岁的体育锻炼(是=1,否=2)和体重为自变量,运用Forward LR(最大偏似然估计的似然比检验)的筛选方法进行二分类Logistic 回归分析,结果见表5,总身体活动水平、18~30 岁的体育锻炼和体重进入回归模型,得到公式(1)。最大似然比检验显示似然对数值=62.029,Cox-Snell 拟合优度值R2=0.235,Nagelkerke 拟合优度值R2=0.424,说明该回归模型拟合效果较好。Hosmer-Lemeshow 检验结果为:χ2=3.151,P=0.925,表明该模型通过了Hosmer-Lemeshow检验。Exp(B)为比数比OR,由此可知18~30 岁缺乏运动为影响骨密度的危险因素,而较高的总身体活动水平和较高的体重是骨密度的保护因素[19]。
表5 是否骨量减少的二分类Logistic回归分析
3.2 全身骨量减少风险评估模型的评价
骨量减少风险评估模型的评价主要通过考察模型筛检骨量减少(-2.5<T<-1)的筛查价值。以灵敏度为纵坐标,以l-特异度为横坐标,绘制ROC曲线,以AUC、灵敏度、特异度、约登指数和符合率为检验指标,检验模型筛检骨量减少(-2.5<T<-1)的筛检效果,以上检验指标的值越大,模型筛检效果越优,同时确定临界值。ROC曲线下面积可以作为某一种诊断方法准确性评价的指标,面积越大,该诊断方法用于筛查疾病的准确性就越高[20]。约登指数是灵敏度与特异度之和减去1,指数越大说明筛查实验的效果越好,真实性越强。
通过公式(1)绘制ROC 曲线,得到Logistic 回归模型筛检骨量减少(-2.5<T<-1)的AUC 为0.870[P=0.000,95%CI 为(0.788,0.953),标准误=0.042]。Logis⁃tic 回归模型不同临界值的筛检评价指标的比较见表6。可见,当临界值为-2.0713 时,各评价指标较为理想。此时得到Logistic 回归模型筛检骨量减少高危人群的灵敏度为87.5%,特异度为70.8%,符合率为73.2%。
表6 Logistic回归模型不同临界值的筛检评价指标比较
3.3 全身骨量减少风险评估工具的形成
由于Logistic 回归模型的预测变量回归系数均为无限小数,为方便风险评估工具的应用,需要对模型进行简化。以回归系数B值为依据,比较取整,去除常数项,得到公式(2)。
对各预测变量下不同水平进行赋值,18~30 岁的体育锻炼为“是”、“否”两个等级,分别赋值2和4;总身体活动水平有低、中、高三级,分别赋值0、1、2,体重(kg)为观测值,计算W 值。通过对公式(2)绘制ROC曲线,得到简化后模型的AUC为0.868[P=0.000,95%CI为(0.789,0.948),标准误为0.041]。模型简化前后的AUC对比见图1。
Logistic回归模型简化后不同临界值的筛检评价指标的比较见表7。可见,当临界值为-9(为了方便实际应用,将表格中的-9.0630四舍五入得到-9)时,各评价指标较为理想,筛检骨量减少高危人群的灵敏度为87.5%,特异度为74.0%,符合率为75.0%。
表7 Logistic简化后回归模型不同临界值的筛检评价指标比较
图1 模型简化前后的ROC曲线
风险评估模型简化前后的各筛检评价指标比较见表8,可以认为简化前后的模型筛检效果相当,进而,全身骨量减少风险评估工具正式形成,即W=18~30岁的体育锻炼-总身体活动水平-0.2×体重,其中,18~30岁的体育锻炼分“是、否”两个水平,分别取值2和4;总身体活动水平分“低、中、高”三个水平,分别取值0、1、2,体重为观测值,临界值为-9,W≤-9为全身骨量减少低风险,W>-9为全身骨量减少高风险。
表8 模型简化前后的筛检评价指标比较
3.4 全身骨量减少风险评估工具的应用效果
将所研制的骨量减少风险评估工具应用于34 人的回代样本,进行工具的应用效果评价。采用Kappa一致性检验,对用金标准所测结果和自评估工具筛检结果进行对比(见表9),所得Kappa 值为0.55(P=0.016),根据标准(Kappa 值≥0.75,一致性较好;0.75>Kappa 值≥0.4,一致性一般;Kappa 值<0.4,一致性较差),可见两种方法的一致性尚可。此外,筛检所得AUC 为0.944[P=0.021,95%CI:(0.817,1)],灵敏度为100%,特异度为75.0%,符合率为80.0%,即该工具将骨量减少者全部筛出归为高危人群,在筛检的低危人群中无骨量减少者。应用效果表明,骨量减少风险评估工具对年轻人群全身骨量减少有一定的筛查价值。
表9 工具筛检结果与金标准诊断结果对比(人数)
4 讨论
女性在年轻(绝经前)时期维持较高水平的骨密度对于降低绝经后骨质疏松症风险和继发的骨折风险意义重大。研究[21]估计,绝经前女性每年骨密度的丢失率在0.25%~1%。因此,本研究出于对年轻女性(绝经前)骨骼健康状况的关注,研制简易的25~49 岁女性骨量减少风险评估工具,用于筛查骨量减少的高危群体,以期预防骨质疏松症。
4.1 全身骨量减少风险评估模型的建立与评价
25~49 岁女性骨量减少风险评估工具,是基于筛选影响全身骨密度的敏感因素而建立的。经科学严谨的筛选,得到豆制品、休闲性身体活动水平、总身体活动水平、18 岁之前是否参与体育锻炼、18~30 岁的体育锻炼、体重和瘦体重与骨密度密切相关,由于瘦体重的测试一般需要借助仪器设备,不便作为自评估指标,而在身体成分各指标与全身骨密度、骨密度T 值的相关性分析中,体重的相关系数与瘦体重较为接近,因而以体重取代瘦体重纳入随后的回归分析。最终得到了全身骨量减少风险评估模型的预测变量——总身体活动水平、18~30 岁的体育锻炼和体重。这与本实验室之前的研究结果一致[22]。
适宜强度的运动增进骨骼健康,运动一方面提供了一定强度的负荷刺激,使骨骼结构发生适应性改变,另一方面促进了神经体液调节,改善骨骼的血液循环并促进其对营养物质的利用,最终促进骨量增长,使骨骼强度和刚度得以提高[23-25]。目前多数研究结果表明,运动对青少年及中老年人的骨密度有积极影响,但关于运动对绝经前女性骨密度影响的关注度不高,相关的随机对照实验较少。Kelley 等[21]在有限的随机对照实验的基础上就运动(至少1年)对绝经前女性骨密度的影响进行了meta分析,并基于效果量给出分析结果,即运动对绝经前女性骨密度有显著有益的保护效果。Seidelin 等[26]的研究也发现,12 周、每周2 次的间歇运动,不仅提高了绝经前和绝经后女性的有氧运动能力(包括最大摄氧量),还显著提升了骨密度,且当每周运动频率减为1次时,该生理适应仍得以保持。可见,长期规律运动是骨骼健康的极为有利的因素。骨峰值的形成时期一般在30 岁左右[27-29],而18~30 岁位于骨峰值形成之前和骨骼快速生长期——青春期之后,作为又一个骨量增长时期,该时期的运动对进一步加快骨量形成、促进骨峰值提高的意义不容忽视[30-32],此外,该时期的运动还对绝经性和老龄性骨量丢失、骨折风险起到了低成本、高效能的预防作用[33]。体重作为一种机械刺激同样有助于骨量的提高和维持。对于一些为追求时尚而刻意且过度减重的年轻女性,低体重会使她们有更高的低骨密度和低骨骼肌质量风险。因此,维持正常体重十分重要[34]。本研究发现,作为体重主要组成成分的瘦体重、脂肪与全身骨密度成正相关关系,这与李伟[35]和傅晓华[36]的研究结果一致。一项针对城市年轻人群骨密度的研究[37]显示,低骨骼肌质量与绝经前女性低骨密度密切相关。有研究[38]强调,体重和瘦体重是维持年轻女性骨量水平的决定因素。瘦体重过低不利于骨量的维持,而年轻时低骨量水平可能同样预示着日后的低骨骼肌质量,这也为骨骼肌减少症敲响了警钟[39]。
本研究综合ROC曲线下面积(AUC)、灵敏度、特异度、约登指数和符合率,对骨量减少风险评估模型的筛检预测能力进行评价。其中,AUC 用于对两个诊断试验的准确度进行综合比较,它不受诊断界值的影响,是目前公认的最佳评价指标。AUC 越大,新的诊断方法筛检准确性就越高。当AUC 在0.7~0.9 时,准确性良好,在0.9以上时,准确性较高。灵敏度即真阳性率,指新诊断方法将实际有骨量减少者进行正确分组的能力。特异度即真阴性率,是新诊断方法将实际无骨量减少者进行正确分组的能力[40]。符合率用来评价筛检的可靠性[41]。本研究建立风险评估模型的目的是较早地发现骨量减少的高危人群,做到提早预防,因而需对灵敏度有较高要求,但灵敏度和特异度是一种此消彼长的关系,只注重高灵敏度可能会导致特异度降低,而特异度太低会使假阳性预测率增加,这同样会降低筛检价值。本研究在综合考虑了上述各评价指标的基础上,最终确定风险评估模型的临界值为-9(简化后模型),使模型取得较为理想的筛检效果。由国内外的研究[5-13]可知,众多骨质疏松症风险筛查工具的灵敏度大都在80%以上,特异度在40%~70%,与之相比,本研究所建立的二分类Logistic 回归模型在简化前后筛检的灵敏度和特异度分别为87.5%和70.8%、87.5%和74.0%,AUC 分别为0.870、0.868,可以识别大多数有骨量减少的高风险人群,体现出良好的筛查价值。
4.2 全身骨量减少风险评估工具的应用效果
将所建立的全身骨量减少风险评估工具应用于外部样本共34人,取得了评估工具与金标准筛检结果相一致的验证结果。AUC高达0.944,筛检准确性高。同时,评估工具的筛检灵敏度达到100%,即将所有真阳性人群(骨量减少者)全部检出,且筛检的低危人群中无骨量减少者,特异度为75%,总体符合率达到80%,可见,本研究建立的全身骨量减少风险评估工具取得了良好的应用效果,这为绝经前女性骨健康状况的评估及骨质疏松症的早期预防提供了可能。此外,本研究所建的全身骨量减少风险评估工具操作简单,自评者根据自身18~30 岁时参加体育锻炼情况、过去1年内的总身体活动水平及当前体重就可以迅速得到相应的风险分值,与临界值比较后,可快速得出全身骨量减少的风险状况,方便了25~49岁女性的自评及对自我健康的管理。同时,本课题组已建立的腰椎骨量减少风险评估方法[14]可以与本评估工具联合使用,以达到对骨骼健康状况的全面评估,推进骨质疏松症的及早预防。
5 结论
本研究建立了25~49 岁女性全身骨量减少风险自评估工具:W=18~30 岁的体育锻炼(是=2;否=4)-总身体活动水平(低=0;中=1;高=2)-0.2×体重(kg)。其中,18~30 岁的体育锻炼分“是、否”两个水平,分别取值为2 和4;总身体活动分“低、中、高”三个水平,分别取值为0,1,2;体重(kg)为观测值。临界值为-9,W≤-9 为全身骨量减少低风险,W>-9 为全身骨量减少高风险。
经验证,该风险自评估工具筛检效果良好、操作简便,建议后续研究跨地区、大范围的选取研究对象,以建立更加广泛适用的自评估工具。