APP下载

《年龄与发育进程问卷》中文版在高危儿童发育筛查中效度验证

2016-08-01刘仕祺

中国循证儿科杂志 2016年6期
关键词:界值效度敏感度

刘仕祺 武 元 边 旸 李 明

·论著·

《年龄与发育进程问卷》中文版在高危儿童发育筛查中效度验证

刘仕祺 武 元 边 旸 李 明

目的 在高危儿童中行中文版《年龄与发育进程问卷》(ASQ-C)的进一步验证。方法 以Gesell发育量表为效度标准,对儿童发育迟缓门诊就诊的2~60月龄的儿童同时实施Gesell发育量表和ASQ-C评测,分析ASQ-C及其不同领域在不同年龄组及不同筛查界值时的诊断参数。结果 符合本文纳入标准的高危儿130例进入本文分析,男94例,女36例,年龄(19.9±16.4)个月,早产26例。≥18和<18个月组分别为52例和78例。ASQ-C量表以2 s为筛查界值,其诊断一致率73%,敏感度72.5%(95%CI:63%~82%),特异度74.3%(95%CI:61%~88%),阳性预测值86.8%(95%CI:79%~94%),阴性预测值53.7%(95%CI:40%~67%)。ASQ-C以1 s为筛查界值,其诊断一致率75%,敏感度92.5%(95%CI:87%~98%),特异度32.4%(95%CI:17%~48%),阳性预测值77.5%(95%CI:70%~85%),阴性预测值63.2%(95%CI:41%~85%)。≥18个月组儿童中诊断一致率90%~92%、敏感度95.6%~100%;<18个月组儿童中诊断一致率64%~68%、敏感度59.6%~85.1%。ASQ-C在适应性能区、粗大运动能区、精细动作能区、语言能区和个人社会能区与Gesell发育量表相应领域的诊断一致率68%~80%,敏感度46.6%~85%,特异度64.3%~93.7%,语言能区的敏感度(63.3%~85%)高于精细运动能区(47%~68.2%)。结论 ASQ-C与北京Gesell发育量表对应领域的一致性好。ASQ-C作为发育筛查量表用于高危儿临床效度虽在可接受范围内,但达不到理想筛查量表的参数水平。对<18个月的高危儿童,以1 s为界值的敏感度显著提高,可降低漏诊。

年龄与发育进程问卷-第3版; Gesell量表; 效度; 高危儿

家长的日常观察对早期识别发育落后的儿童有重要意义,但轻微的发育落后或学习能力等问题可能要到学龄期才被发现,因此对于学龄前儿童进行系统的发育筛查非常必要[1,2]。《年龄与发育进程问卷》第3版(ASQ-3)结合了家长的日常观察记忆与现场观察或检查,不仅简单易行,其发育筛查的可靠性也较好,ASQ-3是美国1~66月龄儿童的发育筛查及发育监测中使用最广泛的量表[3],已被翻译为多种语言应用于不同语种的地区和国家。ASQ-3中文版(ASQ-C)由卞晓燕等翻译并先后建立了上海常模和全国常模,在国内也有了一定范围的普及应用。然而ASQ-C的临床效度研究尚不充分,在医院不同就诊人群中的验证十分必要。本文重复验证ASQ-C在医院就诊的高危儿童中的效度。

1 方法

1.1 研究设计 以诊断准确性研究作为设计方案。以Gesell发育量表为效度标准(金标准),在医院检查和随访的高危儿童中同时行Gesell发育量表及ASQ-C问卷筛查,以考察ASQ-C问卷筛查的水平。

1.3 效度标准量表和待测问卷

1.3.1 效度标准量表 ①Gesell发育量表[4,5]是专业人员评估量表,于ASQ-C同时或之后的2周内进行评估,包括5个领域,适应性行为领域:对物体和背景的精细感知觉及手眼协调能力;大运动行为领域:走、跑、跳等运动协调能力;精细动作行为领域:手指的抓握和操纵物体的能力;语言行为领域:语言的表达及对简单问题的理解能力;个人-社交行为领域:儿童对居住的社会文化环境的个人反应。 ②适用于0~6岁儿童。③包括13个年龄组,~4周、~16周、~28周、~40周、~52周、~18月、~24月、~36月、~42月、~48月、~54月、~60月、~72月年龄组。④评估场所为独立的房间,允许家长在场,鼓励评估儿童发挥出最佳水平;⑤赋分标准:在每个领域,分别找到能全部通过及全部不能通过的年龄组为“底”和“顶”,根据结果评价成熟年龄。以成熟年龄/实际年龄分别计算各领域的发育商(DQ)。

1.3.2 效度标准量表界值 Gesell量表[5]5个领域中任一领域发育落后的即定义为异常。以2 s为例,DQ≥76为发育正常,DQ<76为发育落后,其中<54为中重落后,~75为轻度落后。

1.3.3待测问卷 ①ASQ-C问卷[6-8]为家长自评量表,包括沟通、粗大动作、精细动作、解决问题和个人社会5个能区,每个能区包括6个问题,每个问题被认为代表了该年龄段的发育里程碑。②适用于1~66月龄儿童,20套问卷,0~24个月每2个月为1个年龄组(增加9月龄)、~36个月每3个月为1个年龄组、~60个月每6个月为1个年龄组,共21个月龄组,根据不同月龄选择相应问卷。③在候诊室根据父母/带养人结合记忆(选择或不选择帮助)当场完成。④每个项目3选1,“是”赋10分,“有时是”赋5分,“还不能”赋0分。⑤项目得分和为能区得分,能区得分和即为此量表的总分。

1.3.4 待测问卷界值[7,8]高于界值:表示发育正常,能区(或总分)得分﹥均值(x)-1个标准差(1 s);接近界值:表示发育在监测区或可疑发育迟缓风险(1个或多个能区得分接近界值),能区(或总分)得分x-2 s~x-1 s;低于界值:表示发育异常(发育迟缓风险),能区(或总分)得分≤x-2 s。本研究ASQ-C问卷界值分为x- s和x-2 s 两种,正常:能区(或总分)得分﹥x- s 或x-2 s,异常:能区(或总分)得分≤x-s或≤x-2 s。

1.4 分组考虑 18月龄被认为是易于识别发育落后的关键年龄[9-10],本研究分为≥18个月组和<18个月组。

1.5 诊断参数的定义 本文设定Gesell发育量表(2s)正常和和异常界值,分别计算ASQ-C总体、<18个月和≥18个月患儿一致率[(真阳性人数+真阴性人数)/总人数],敏感度[真阳性人数/(真阳人数+假阴人数)],特异度[真阴人数/(真阴人数+假阳人数)],阳性预测值[真阳人数/(真阳人数+假阳人数)],阴性预测值[真阴性人数/(真阴人数+假阴人数)]。

1.6 统计学方法 采用SPSS 19.0进行统计分析。在ASQ-C及其不同能区不同界值情况下计算诊断参数以评价其效度。

2 结果

2.1 一般情况 符合本文纳入标准的高危儿130例进入本文分析,男94例,女36例,年龄(19.9±16.4)个月,早产26例。≥18个月组52例,<18个月组78例。在ASQ-C 的21个月龄组中,本文纳入的高危儿占据了19个年龄组,缺如2和9月龄组,不同年龄组的例数最多19例,最少2例,平均每组6.2例,低于每组平均数的有11个年龄组。在Gesell发育量表13个年龄组中,本文纳入的高危儿占据了12个年龄组,缺如1月龄组,不同年龄组的例数最多28例,最少1例,平均每组10.8例,低于每组平均数的有6个年龄组。

2.2.1 Gesell发育量表测量结果 以2 s定义下,所有领域DQ≥76者37例(28.5%),至少1个领域DQ<76者93例(71.5%),DQ<54者38例,DQ ~75者55例。

2.2.2 ASQ-C测量结果 以常模人群1 s为界值,ASQ-C各能区结果均高于界值者13例(10.0%),至少1个能区低于界值者76例(58.5%),至少1个能区接近或低于界值者(筛查阳性率)117例(90%)。

2.3 ASQ-C的诊断参数 表1显示,ASQ-C在总体及分年龄组中,与Gesell发育量表诊断结果比较,ASQ-C以2 s和1 s为界值时的诊断一致率接近。≥18月组诊断一致率(0.9~0.92)高于<18月组(0.64~0.68)。ASQ-C总体中,2s的敏感度(72.5%)低于1 s的敏感度(92.5%),2 s的特异度(74.3%)高于1 s的特异度(32.4%)。

表1 总体及不同年龄组的诊断参数

注 A:《年龄与发育进程问卷》中文版(ASQ-C);G:Gesell发育量表;1 s为 1个标准差;2 s为2个标准差;一致率为(真阳性人数+真阴性人数)/总人数

2.4 ASQ-C不同能区诊断参数 表2显示,ASQ-C的5个能区一致率, 1 s和2 s分别为0.74~0.80和0.68~0.78。5个能区敏感度1 s为68.2%~85%,精细运动能区最低,语言能区最高;5个能区敏感度2 s为46.6%~63.3%,适应性能区最低,语言能区最高。5个能区特异度1 s为64.3%~82.4%,适应性能区最高,语言能区最低。5个能区特异度2 s为89.6%~93.7%。

表2 ASQ-C分领域不同年龄组诊断参数(%)

注 A:《年龄与发育进程问卷》中文版(ASQ-C);G: Gesell发育量表;1 s为 1个标准差;2 s为2个标准差;一致率为(真阳性人数+真阴性人数)/总人数

3 讨论

在国内Gesell发育量表在诊断发育落后中有较为广泛的应用,且被认为有较高的准确性,可作为发育落后的诊断标准,在发育量表开发和研究中有很多采用其作为效度标准,但评估时所需的时间、场地、工具及需要专业评估人员较其他筛查量表有更高的要求。

ASQ-3已翻译成多国文字版本,作为一种广泛使用的儿童早期发展筛查量表,其临床效度研究不多。国外ASQ-3的临床效度多以BayleyⅡ或Ⅲ为效度标准,敏感度(20%~100%)和特异度(65%~97%)[14-18]变异很大。但多数研究提示其敏感度70%~80%,特异度78%~92%。

作为官方授权的ASQ-3汉语版本,ASQ-C首先在上海建立常模,并对225名儿童比较了ASQ-C与贝利婴儿发育量表Ⅱ(BSIDⅡ)的评估结果[4]。BayleyⅡ诊断发育迟缓儿童20例,被ASQ-C识别出17例,ASQ-C的敏感度为85.0%,特异度为84.3%,阳性预测值31.5%,阴性预测值98.5%。结果优于一般国际研究结果。虽较低的阳性预测值提示其有较高的过度识别,但其较高的阴性预测值提示其识别不足少。卞晓燕等随后建立了全国性常模[5],通过与北京Gesell发育量表比较,在198例低出生体重儿人群中,ASQ-C识别发育迟缓的敏感度为87.5%、特异度为84.5%、识别不足1.1%,识别过度14.2%。全国常模的过度识别明显减少。

由于中国常模仅在低出生体重儿童中进行了检验,临床效度的验证还不充分。本研究以Gesell发育量表为效度标准,收集了我院儿童发育迟缓门诊就诊的儿童,进行临床效度研究,结果提示ASQ-C(2 s为筛查界值)的敏感度72.5%,特异度74.3%,阳性预测值86.8%,阴性预测值53.7%,与卞晓燕的结果相比,在发育迟缓门诊就诊的高危人群的检验中,敏感度、特异度明显降低(均<75%)。在54例ASQ-C筛查阴性的儿童中,有25例被Gesell发育量表诊断异常,而呈现出相当低的阴性预测值(53.7%),提示在高危人群中识别严重不足,可能与研究人群不同有关。本研究发育异常儿童比例较高,以Gesell发育量表为标准,至少1个领域异常的比例为71.5%,且ASQ-C总体筛查结果接近界值(1 s~2 s)35例(27%),任一领域筛查结果接近界值(1 s~2 s)81例

(62.3%)。有学者认为[7],在较多人群分布于界值附近时,单纯通过界值划分为2个独立的结果,可能由于一个很小的检验误差而出现跨越界值情况,而影响评估结果,造成诊断参数的差异。

理想的筛查方法应敏感性﹥90%,特异性﹥80%,在发育评估量表中常难以企及,一般敏感性与特异性70%~80%的发育量表即可接受[11.12.16]。本研究在发育障碍门诊的高危儿童中的ASQ-C筛查提示,其临床效度还不够理想,会造成过多的假阳性(误诊)和假阴性(漏诊)筛查结果,还不能符合临床需要。这与卞晓燕的研究结果不一致,而与国际研究的多数报告相近。

ASQ-C以1 s为界值时敏感度92.5%,漏诊(7例)明显减少,可将更多的发育迟缓的患儿筛查出来,识别可疑发育迟缓的能力强,与卞晓燕结果一致。但特异度低(32.4%),误诊过多。故在门诊选用1 s为界值时,需注意进一步监测行发育诊断量表的进一步评估,避免过度干预及治疗。

本研究以18个月为界分为2个年龄组进行效度检验,≥18月龄组ASQ-C的敏感度1 s和2 s 分别为100%和95.6%,特异度1 s和2 s 分别为33.3%和66.7%,<18月龄组敏感度1 s和2 s 分别为85.1%和59.6%,特异度1 s和2 s 分别为32.2%和80.6%。在不同界值下均提示≥18月龄组较<18月龄组敏感度更好。Steenis等[13]研究将受试者以18月为界分为2组,其研究结果提示≥18月龄组较<18月龄组的敏感度和特异度均高。Schonhaut等[21]的研究通过8月、18月和30月组的儿童的ASQ评估与BayleyⅢ结果比较发现,随着年龄的增大,ASQ问卷的敏感度提高。卞晓燕[5]的研究发现:24月以下敏感度75%~80%,24月以上敏感度85%~100%。本研究与上述研究结果一致。有学者认为这是由于随着年龄的增长,儿童达到发育里程碑的年龄的变异减小,发育落后更易被识别[22]。本研究在≥18月龄的儿童中,不同界值敏感度均大于95%,提示大年龄组儿童效度可能更为理想。但因本研究大年龄组儿童样本量较小,待更大样本人群中进行验证。

ASQ分领域筛查诊断参数分析鲜有报道,国际上曾在耳聋等特殊感觉障碍的儿童中进行过研究。本研究结果提示,ASQ-C以2 s为界值,在适应性能区、粗大运动能区、精细动作能区、语言能区和个人社会能区与Gesell发育量表相应领域诊断的一致率接近(0.68~0.78),提示ASQ-C问卷与Gesell发育量表各领域对应关系较好。各能区的敏感度为46.6%~63.3%,低于发育量表可接受的临床效度指标。各分能区敏感度低于总量表敏感度,这与Wiley and Meinzen- Derr[23]研究结果正好相反。而ASQ-C各能区以1 s为界值的敏感度,精细运动能区最低(68.2%),语言能区最高(85%),均接近或达到了可接受水平。同时,ASQ-C以1 s为界值的特异度在语言能区为64.3%、适应性能区为82.4%,虽低于2 s为界值的特异度89.6%~93.7%。综合起来看,分领域筛查界值以1s为好。

本文的不足与局限性,①本文纳入的病例没有完全包含ASQ-C和Gesell发育量表的年龄组,未纳入2个月以内婴儿,不同年龄组中例数也不均衡,部分年龄组内样本量较少。②ASQ-C是患儿养育人自评量表,养育人不同的文化水平可能会对其理解问卷内容有一定影响,Gesell发育量表是专业人员评价量表,不同人群对量表内容的理解差异可能影响一致性。③目前缺乏发育异常的评价的金标准,Gesell发育量表只作为效度标准,ASQ-C评估Gesell发育量表评估不能完全代表与真值间的距离。

在发育障碍门诊高危儿童中的研究提示,ASQ-C作为发育筛查量表,临床效度虽在可接受范围内,但达不到理想筛查量表的参数水平。对<18月龄的高危儿童中,以1 s为界值的敏感度显著提高,可降低漏诊,推荐在异常患儿比例较高的医院就诊人群中采用。

[1] 李明,武元. 运动发育迟缓的早期识别与诊断. 中国实用儿科杂志,2016, 31(10): 743-747

[2] American Academy of Pediatrics, Committee on Children With Disabilities. Developmental surveillance and screening of infants and young children. Pediatrics, 2001, 108(1): 192-196

[3] Radecki L, Sand-Loud N, O'Connor KG, et al. Trends in the use of standardized tools for developmental screening in early childhood: 2002-2009. Pediatrics, 2011, 128(1): 14-19

[4] 卞晓燕, 姚国英, 魏梅, 等. 年龄与发育进程问卷上海市儿童常模及心理测量学特性研究. 中华儿科杂志, 2010, 48(7): 492-496

[5] 魏梅, 卞晓燕, Squires Jane, 等. 年龄与发育进程问卷中国常模及心理测量学特性研究. 中华儿科杂志, 2015, 53(12): 913-918

[6] Suires J,Twombly E,Bricker D,等.年龄与发育进程问卷使用指南.卞晓燕,陈静仪,柴臻,等,译.上海:上海世纪出版社股份有限公司科学技术出版社,2013:1

[7] 张秀玲, 李寄平, 秦明镜, 等. Gesell发育量表3.5-6岁北京修订本的制定. 中国临床心理学杂志, 1994, 2(3): 148-150

[8] 0-6岁Gesell发育量表检查手册.林传家,李寄平,张秀玲,等,译.北京:北京市儿童保健所,1986:5

[9] Horwitz SM, Irwin JR, Briggs-Gowan MJ, et al. Language delay in a community cohort of young children. J Am Acad Child Adolesc Psychiatry, 2003, 42(8): 932-940

[10] Sustersic B, Paro-Panjan D. Assessment of general movements in relation to neurologic signs at age two years. Pediatr Neurol, 2008, 39(2): 108-112

[11] Glascoe FP. Screening for developmental and behavioral problems. Ment Retard Dev Disabil Res Rev, 2005, 11(3), 173-179

[12] Council on Children With Disabilities, Section on Developmental Behavioral Pediatrics, Bright Futures Steering Committee, et al. Identifying infants and young children with developmental disorders in the medical home: an algorithm for developmental surveillance and screening. Pediatrics, 2016, 118(1): 405-420

[13] Steenis LJ, Verhoeven M, Hessen DJ, et al. Parental and professional assessment of early child development: The ASQ-3 and the Bayley-III-NL. Early Hum Dev,2015, 91 (3): 217-225

[14] Squires J,Twombly E. ASQ-3 Users Guide. Baltimore,Maryland:Paul H. Brookes Publishing Co,2009:169,170,201-211

[15] Veldhuizen S, Clinton J, Rodriguez C, et al. Concurrent validity of the Ages and Stages Questionnaires and Bayley Developmental Scales in a general population sample. Acad Pediatr, 2015, 15 (2): 231-237

[16] Simard MN, Luu TM, Gosselin J. Concurrent validity of Ages and Stages Questionnaires in preterm infants. Pediatrics, 2012, 130 (1): e108-e114

[17] Woodward BJ, Papile LA, Lowe JR, et al. Use of the Ages and Stages Questionnaire and Bayley Scales of Infant Development-II in neurodevelopmental follow-up of extremely low birth weight infants. J Perinatol. 2011,31 (10): 641-646

[18] Gollenberg AL, Lynch CD, Jackson LW, et al. Concurrent validity of the parent-completed Ages and Stages Questionnaires, 2nd Ed. with the Bayley Scales of Infant Development II in a low-risk sample. Child Care Health Dev, 2010, 36(4): 485-490

[19] Horwitz S, Irwin JR, Briggs-Gowan MJ, et al. Language delay in a community cohort of young children. J Am Acad Child Adolesc Psychiatry, 2003, 42(8): 932-940

[20] Sustersic B, Paro-Panjan D. Assessment of general movements in relation to neurologic signs at age two years. Pediatr Neurol, 2008, 39(2): 108-112

[21] Schonhaut L, Armijo I, Schönstedt M, et al. Validity of the Ages and Stages Questionnaires in Term and Preterm Infants. Pediatrics, 2013, 131(5): e1468-e1474

[22] Losardo A,Notari SyversonA ,BrickerDD. Alternative approaches to assessing young children. Paul H. Brookes Publishing Company, 2001

[23] Wiley S, Meinzen-Derr J. Use of the ages and stages questionnaire in young children who are deaf/hard of hearing as a screening for additional disabilities. Early Hum Dev, 2013, 89(5), 295-300

[24] Smith C, Wallen M, Walker K, et al. Validity of the fine motor area of the 12-month ages and stages questionnaire in infants following major surgery. Phys Occup Ther Pediatr, 2012, 32(3), 260-271

(本文编辑:张崇凡,孙晋枫)

ThevalidityoftheChineseversionofASQinhighriskchildren

LIUShi-qi,WUYuan,BIANYang,LIMing

(DepartmentofPediatrics,PekingUniversityFirstHospital,Beijing100034,China)

Corresponding Author:LI Ming, E-mail: drliming@163.com

ObjectiveASQ-C is a newly introduced and standardized questionnaire for children's development in China. The validity of ASQ-C was not fully tested .In this study, the Gesell developmental scale was used as a diagnostic scale to test the validity of the ASQ-C in high risk children. MethodsThe 130 samples were selected in the outpatient of children development, who were evaluated by both ASQ-C and Gesell development scale. Cutoff points for all ASQ-3 age-versions were calculated in two ways and the samples were divided into 2 groups according to the age. The sensitivity, specificity, positive and negative predictive values were calculated. The subscales of ASQ-C were analyzed according to the corresponding scales of Gesell development scale. ResultsIn generally, the coincidence rate was 0.73, sensitivity and specificity were 72.5% (95%CI:63% to 82%)and 74.3%(95%CI:61% to 88%),the PPV and NPV were 86.8%(95%CI:79% to 94%)and 53.7%(95%CI:40% to 67%).Using 1 s as the cutoff, the sensitivity and specificity were 92.5% and 32.4%, the PPV and NPV were 77.5%(95%CI:70% to 85%)and 63.2%(95%CI:41% to 85%).Sensitivity and specificity values were higher for the older age-cohort than for the younger age-cohort. The sensitivity and specificity of the subscale were 46.6% to 85% and 64.3% to 93.7%.ConclusionThe ASQ-C was a developmental screening scale, its validity was within acceptable range, but failed to reach the ideal screening scale level. For less than 18 months of high-risk children, using 1s as the cutoff may significantly improve the sensitivity and reduce missed diagnosis.

Ages and Stages Questionnaire-C; Gesell development scale; Validity; High risk children

北京大学第一医院儿科 北京,100034

李明,E-mail: drliming@163.com

10.3969/j.issn.1673-5501.2016.06.007

2016-11-29

2016-12-16)

猜你喜欢

界值效度敏感度
假体周围感染联合诊断方法的初步探讨*
效度验证模式系统整合与效度研究发展策略
《广东地区儿童中医体质辨识量表》的信度和效度研究
一种基于属性的两级敏感度计算模型
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
绝经后MHT期间出血内膜监测及诊刮界值研究
初中数学中绝对值性质的应用
部分国家和地区司机血液酒精浓度界值及相关处罚规定
下尿路感染患者菌群分布及对磷霉素氨丁三醇散敏感度分析
复杂图形测验对区分阿尔茨海默病与非痴呆的诊断效度