中华05RUS-CHN法骨龄评价可靠性的再检验
2014-10-18张绍岩金成吉何忠涛梁京红磊0何晓玲周君一
张绍岩,金成吉,沈 松,何忠涛,梁京红,李 雪,孙 宁,蔡 广,迟 娜,李 磊0,栾 彬,李 煜,何晓玲,周君一
骨龄在青少年运动员选材和竞赛中有重要的应用价值。因中国儿童青少年生长发育出现了显著加速的长期趋势,于2006年国家体育总局颁布、实施了新的骨龄评价标准[6]。为解决骨龄应用实践中的难点问题,新骨龄标准先后提出了不同的骨龄评价方法[3,5],但基本方法仍然是中华05RUS-CHN法[1,2]。骨龄评价是一种实用技术,因此和其他技术方法一样存在系统误差和随机误差。在国际上,对经典Greulich-Pyle图谱法和TW计分法的读片可靠性研究普遍指出,图谱法整片主观性过大,因而随机误差较大,而且得出的骨龄是非连续性数值(至少相隔3个月);TW计分法随机误差较小,可得出连续的骨龄数值(0.1岁)。因此,修订的骨龄标准采用了TW3计分法,在此基础上提出了适合于应用领域特点的中华05RUSCHN法。经过检验,中华05RUS-CHN法的读片可靠性与TW 法相似[4]。
近年来,骨龄的应用非常广泛,而且对于骨龄应用的认识也有了进一步的发展。中国足球协会(以下简称中国足协)针对以往使用骨龄与生活年龄差值鉴别青少年参赛资格的不足,提出了在全国青少年比赛中以骨龄分组的改革措施,并制定了严格的骨龄测试程序和应用中华05新骨龄标准,经过2年的实践取得了良好效果。为了推广和提高工作质量,2012年中国足协举办了“中国足协骨龄读片师”培训班。参加培训的人员大都具有长期从事骨龄评价的经验,并多次参加中华05RUS-CHN法技术培训。
在提出骨龄新标准时,曾检验了使用中华05RUSCHN法的可靠性[4],但骨龄评价培训与经验积累对评价结果的可靠性有重要影响。随新骨龄标准的实施和推广,中华05RUS-CHN法已在我国体育领域得到了广泛的应用,特别是在青少年体育竞赛中以骨龄分组将逐渐推广,骨龄评价的可靠性更为重要。所以,再次检验中华05 CHN-RUS法的读片可靠性,可以了解我国体育领域骨龄应用可靠性的现状,也有助于提高骨龄应用工作质量。
1 对象与方法
1.1 检验样本
以45名正常儿童青少年(骨龄2~18岁)的左手腕后前位X线片作为读片可靠性检验样本,所有X线片均无性别、年龄标识,以随机顺序排列。评价者仅依据中华05 RUS-CHN法阅读、记录每手腕部X线片桡尺骨远端、掌骨(I、III、V)、近节指骨(I、III、V)、中节指骨(III、V)、远节指骨(I、III、V)骨化中心的发育等级。
1.2 骨龄评价者
有13名评价人员参加可靠性检验研究,以1~13随机编号。评价人员分别为广东省、浙江省、山东省、湖北省、河北省、吉林省、上海市、重庆市、成都市、大连市足球协会推荐的科技人员或体育院(校)教师,不仅是各地骨龄评价的骨干,而且,部分人员也承担着其他运动项目全国青少年比赛的骨龄评价工作(表1)。在本研究中这些评价人员称为评价者。13名评价者骨龄评价经验不等,但大部分较有经验,从事骨龄评价的时间较长,并使用过不同的骨龄评价方法,每年都有一定的X线片阅读数量。近些年来都在使用中华05骨龄新标准,至少参加过2次中华05法骨龄培训。
1.3 重复读片检验过程
在“中国足协骨龄读片师培训班”结束时,13名评价者使用中华05RUS-CHN法,在3h内独自阅读45张手腕部X线片。记录每骨化中心的发育等级。培训班结束1个月后,按地址顺序将相同的45张X线片寄给评价者,在3h内独自重复阅读,记录每骨化中心的发育等级。
在相同条件下,中华05骨龄标准的读片员阅读相同的45张手腕部X线片,记录每骨化中心的发育等级。
表1 本研究13名评价者基本情况一览表Table 1 The Basic Data for 13Observers
1.4 统计分析
手腕骨发育等级评价结果的重复性:计算每名评价者本人重复读片中(以下简称评价者内)骨发育等级相同和不同的例数的百分数;计算每名评价者与中华-05骨龄标准制订读片员之间(以下简称评价者与标准间)骨发育等级相同和不同例数的百分数。采用多个相关样本非参数检验,检验评价者内和评价者间骨发育等级相同例数的百分数组间差异显著性,如差异显著,则以2-相关样本非参数检验(Wilcoxon符号秩检验,双尾)来检验两两评价者之间的差异显著性。
重复读片的系统误差和随机误差:以中华05法骨龄标准计算重复阅读中每X线片的骨龄。计算重复阅读每X线片的骨龄差值,作为评价者内和评价者与标准间骨龄评价的系统误差指标,以单样本t检验(0检验值,双尾)检验差值的显著性。以重复读片的骨龄差值,计算标准差和95%的置信区间,比较评价者内和评价者之间骨龄评价的随机误差。计算公式如下:±t0.05×,其中,d为重复读片的骨龄差值;n为X线片数量;t0.05为显著性为0.05水平时的t值。
2 结果
2.1 评价者使用中华05RUS-CHN法的骨发育等级重复性
表2显示,13名评价者重复读片(评价者内)骨发育等级相同例数的平均百分数为84.3%,等级不同的大部分相差1个等级,而且低1个等级和高1个等级的例数相接近(分别为6.7%和8.1%),相差2等级的例数在1%以下。但不同评价者本身的重复性存在显著性差异(P<0.00),重复阅读骨发育等级相同例数的百分数在70.5%~92.1%。根据2-相关样本非参数检验显著性(P<0.05)可将评价者分为三类:优秀者1、4、7、13号(90.5%~92.1%);良好者3、5、8、9、10、11、12号(79.2%~87.2%);一般者2、6号(70.5%~76.6%)。
评价者与标准间的重复性显著低于评价者内的重复性(表2)。在13名评价者与骨龄标准读片员之间,骨发育等级相同例数的平均百分数为78.1%,低1个等级或高1个等级的例数相似(分别为10.9%和9.7%),低2个等级或高2个等级的例数均在1%以下。同样,在不同评价者之间,评价者与标准间的重复性存在显著的不同(P<0.00),重复阅读骨发育等级相同例数的百分数在69.0%~83.3%。根据2-相关样本非参数检验显著性(P<0.05)可将评价者分为三类:优秀者3、4、7、11、12、13号(80.0%~83.3%);良好者1、2、5、8、9、10号(74.8%~78.6%);一般者6号(69%)。
表2 本研究13名评价者重复读片中骨发育等级相同与不同例数的百分数一览表Table 2 The Percentage of Agreement and Un-agreement in Rating Stages of Skeletal Development for 13Observers(%)
在重复性检验中,评价者内和评价者与标准间骨发育等级不同的平均百分数相似,表现出了评价偏差的随机性,但个别评价者可能存在有过高或过低的系统偏差,例如9号评价者内的偏低例数的百分数比偏高例数的百分数高8.7%,8号评价者与标准间的偏高例数的百分数比偏低例数的百分数高11.5%。
通过不同骨的骨发育等级相同例数的平均百分数,可以了解不同骨发育等级评价的相对难易程度。由表3可见,如按升序排列,评价者内骨发育等级相同例数相对最低的三个骨化中心为中节指骨V、桡骨远侧端、近节指骨I,而评价者与标准间则分别为中节指骨III、掌骨V、尺骨远侧端,但与其它的骨的差别并不显著。
2.2 评价者使用中华05RUS-CHN法的系统误差和随机误差
由表4可见,13名评价者本身重复读片,骨龄差值的平均数在-0.08~0.17岁之间,7、10号评价者两次读片的骨龄差值与“0”检验值之间存在显著性差异(P<0.05)。13名评价者与骨龄标准读片员之间,重复读片的骨龄差值平均数在-0.14~0.16岁之间,1、2、8、12号评价者的骨龄差值与“0”检验值之间有显著性差异。但是,对于骨龄龄评价来说,这些差值的绝对值均不大。因此,13名评价者的评价者内和评价者与标准间的系统误差均较小。
表3 本研究手腕部各骨发育等级相同和不同例数的百分数一览表Table 3 The Percentage of Agreement and Un-agreement in Rating Stages of Skeletal Development for Each Bone of Hand and Wrist(%)
13名评价者本身重复读片,骨龄差值95%的置信区间在±0.26~±0.49岁之间,而评价者与标准间的骨龄差值95%的置信区间在±0.35~±0.56岁之间。
在手腕骨发育的不同阶段,13名评价者的系统误差与随机误差不同。由表5可见,在骨龄15岁以上,13名评价者的评价者内和评价者与标准间的骨龄差值平均数与“0”检验值存在显著性差异(P<0.05),在骨龄大于或等于8岁并小于或等于15岁发育期间,13名评价者的评价者内和评价者与标准间骨龄差值95%置信区间(±0.38岁和±0.43岁)均小于骨龄8岁以下(±0.59岁和±0.54岁)和骨龄15岁以上(±0.43岁和±0.52岁)。
表4 本研究13名评价者重复读片的骨龄差值平均数与95%的置信区间一览表Table 4 The Means of Differences of Skeletal Age and 95%Confidence Intervals in the Rereading for 13Observers(岁)
表5 本研究13名评价者重读片的不同骨龄段骨龄差值平均数与95%的置信区间一览表Table 5 The Means of Differences of Skeletal Age and 95%Confidence Intervals in the Rereading for Different Regions of Skeletal Age
3 讨论
在许多运动项目的青少年国际竞赛中,普遍存在怀疑运动员年龄大于文证年龄的问题。在2010年第一届青少年奥林匹克运动会前夕,国际奥委会医学委员会[10]发表了关于高水平青少年运动员年龄确认问题的共识声明。共识声明指出,使用适当方法确认年龄不仅是公平竞赛的保证,而且也是保护青少年运动员健康和安全的需要。最近,国际足球联合会[11]使用磁共振方法,观察手腕部桡骨远侧骺与骨干是否融合,确认U-17岁组运动员的参赛资格,得出U-17岁组运动员的官方文证的年龄不都是正确的结论。但因缺乏不同种族人群和其他年龄组磁共振成像标准,这种方法距离实用尚有较长的路要走。
在国内,数十年来,运动竞赛组织机构频繁使用骨龄。虽然骨龄是最准确的生物年龄评价方法,但不能准确的确认生活年龄,所以采用了国际司法界推测未成年人年龄的方法[12],确认青少年运动员的参赛资格。但是这种方法所确定的是年龄范围,仍未能解决根本问题。为此,中国足协在全国青少年联赛中以骨龄分组,运动员参赛与生活年龄无关。为保证公平竞赛,骨龄评价的可靠性更加重要。因此,本研究以重复评价中手腕骨发育等级的重复性、骨龄评价的系统误差和随机误差研究了不同评价者应用中华05RUS-CHN法的可靠性。
在国际上有研究[7,8,11,13]报告了TW2-RUS方法的可靠性,TW2-RUS法的评价者内和评价者间的等级重复率分别为82.7%~91.4%和74.4%~80.5%,评价者内和评价者间的随机误差分别为±0.42~±0.50岁和±0.58~±0.76岁。在2006年修订中国儿童骨龄标准后,对中华05RUS-CHN法的可靠性的研究[6]报告,经过1次培训,有不同经验的11名评价者的评价者内骨发育等级重复率为63.4%~82.2%,骨龄差值的95%置信区间为±0.40~±0.76岁;评价者与标准间的RUS—CHN等级评价重复率为61.3%~77.3%,骨龄差值的95%置信区间为±0.42~±0.96岁;其中有经验者接近或达到了国际间骨龄评价的可靠性水平,但大部分无经验者经过一次培训,读片可靠性仍然较低。在本次研究中,13名评价者中的11名有至少5年的骨龄评价经历,至少参加过2次中华05骨龄培训班(初级班和高级版),评价者内骨发育等级相同的例数的百分数为70.5%~92.1%(平均84.3%),随机误差(骨龄差值95%的置信区间)在±0.26~±0.49岁之间;评价者与标准间骨发育等级相同的例数的百分数为69.0%~83.3%(平均78.1%),随机误差在±0.35~0.56岁之间,骨龄评价的可靠性普遍提高,特别是有9名评价者的随机误差达到了±0.5岁以下。由此说明,技术培训与经验在提高骨龄评价可靠性中的重要作用。
在TW3-RUS法骨龄中,桡骨和尺骨具有相对较大的权重(各占20%)。中华05RUS-CHN法以TW3法为基础,桡、尺骨同样有相对较大的作用。因此,虽然桡、尺骨远侧端骨化中心的解剖学结构较复杂,但发育等级的可重复性仍然与其他的骨相接近。
13名评价者不同骨龄段的骨龄评价随机误差不同,其可能的原因为,在体育领域骨龄评价对象的年龄大都在8岁以上,所以在培训中以及在应用实践中对8岁以下儿童的骨龄评价较少。而15岁以上时,手腕部掌指骨骺与骨干均已完成融合,评价骨龄只能依据桡、尺骨骺的融合过程,为了骨龄评价又将融合过程划分为4个阶段(等级),相互之间的区分存在一定的难度,导致随机误差较大。因此,桡、尺骨融合过程发育等级的评价将是今后骨龄培训与练习的重点,以进一步减小骨龄评价的随机误差。
计算重复读片后等级相同的例数的百分数,是许多可靠性研究分析可重复性所采用的主要方法。在骨龄评价中,可重复性与系统误差和随机误差有一定的关系,一般情况下,可重复性高,系统误差和随机误差则小,反之亦然。但这种关系并非一一对应,如果重复读片中,不同的骨发育等级出现系统偏高或偏低趋势,即使可重复性较高,也会引起骨龄评价结果较大的系统误差;另一方面,虽然可重复性较低,但等级偏高或偏低例数接近,则骨龄评价的随机误差可能并不大。例如6号评价者,评价者内和评价者与标准间等级相同的例数的百分数分别为70.5%和69.0%,是13名评价者中的重复性最低者,其高、低1个等级的例数相差不大,所以,评价者内和评价间的随机误差并不过大,分别为±0.42岁和±0.55岁。因此,仅使用等级相同的例数的百分数是不全面的,还应当结合系统误差和随机误差,综合评估骨龄评价的可靠性。
在青少年体育竞赛中应用骨龄,选择适用的骨龄评价标准和适当的骨龄评价可靠性固然重要,但要取得显著效果,获取被评价者真实的手腕X线片和真实的阅读结果也是很重要的环节,因此,建议青少年体育竞赛管理机构应制定严密的、双盲的骨龄评价程序,严格管理,与科技人员一起共同努力,使科技成果发挥其应有的作用。
[1]张绍岩,刘丽娟,刘刚,等.中国人手腕骨发育标准-中华05V.骨成熟度百分位数曲线的修订[J].中国运动医学杂志,2009,28(1):20-24.
[2]张绍岩,刘丽娟,吴真列,等.中国人手腕骨发育标准—中华05 I.TW32CRUS、TW32C腕骨和 RUS2CHN 方法[J].中国运动医学杂志,2006,25(5):509-516.
[3]张绍岩,刘丽娟,张继业,等.RUS-CHN图谱法用于推测青少年年龄[J].中国法医学杂志,2009,24(4):249-253.
[4]张绍岩,吴真列,沈勋章,等.中国人手腕骨发育标准-中华05II.RUS-CHN和TW3-C腕骨方法的读片可靠性[J].中国运动医学杂志,2006,25(6):641-646.
[5]张绍岩,张继业,刘丽娟,等.手腕部桡尺骨骺线骨龄方法[J].中国运动医学杂志,2010,29(6):666-668.
[6]中华人民共和国国家体育总局.中华人民共和国体育行业标准-中国青少年儿童手腕骨成熟度及评价方法(TY/T 3001-2006)[S].北京:中国标准出版社,2006:1-39.
[7]BEUNEN G,CAMERON N.The reproducibility of TW2skeletal age assessments by a self-taught assessor[J].Ann Hum Biol,1980,7(2):155-162.
[8]BULL R K,EDWARDS P D,KEMP P M,et al.Bone age assessment:a large scale comparison of the Greulich and Pyle,and Tanner and Whitehouse(TW2)methods[J].Arch Dis Child,1999,81:172-173.
[9]DVORAK J,GEORGE J,JUNGE A,et al.Application of MRI of the wrist for age determination in international U-17soccer competitions[J].Br J Sports Med,2007,41:497-500.
[10]ENGEBRETSEN L,STEFFEN K,BAHR R,et al.The international Olympic committee consensus statement on age determination in high-level young athletes[J].Br J Sports Med,2010,44:476-484.
[11]MEDICUS H,GRON A M,MOOREES C.F A.Reproducilibity of rating stages of osseous development[J].Am J Phys Anthropol,1976,35:359-372.
[12]SCHMELING A,REISINGER W,GESERICK G,et al.Age estimation of unaccompanied minors Part I.General consideration[J].Forensic Sci Int,2006,159S:S61-S64.
[13]WENZEL A,MELSEN B.Replicability of assessing radiographs by the Tanner and Whitehouse-2method[J].Hum Biol,1982,54(3):575-581.