BSID-Ⅲ筛查测试在上海地区使用信度的初步研究

2018-01-31林森然曹志娟古桂雄

中国妇幼健康研究 2017年12期

林森然，杨青，曹志娟，古桂雄，花静

(1.苏州大学附属儿童医院，江苏苏州 215000；2.同济大学附属第一妇婴保健院妇幼保健部，上海 201204；3.上海市松江区妇幼保健所，上海 201600)

发育行为障碍是一种常见的慢性儿科疾病，通常涉及三个方面的发育，即运动发育、认知发育和社会行为发育，运动发育又包含精细运动和大运动。当其中一个方面存在发育障碍时，往往会伴随其他方面也发生缺陷，其发展程度由轻至重不等[1]。美国流行病学研究显示，有12%～16%的儿童存在至少一种发育行为障碍[2]。在我国西北和西南地区0～3岁儿童中也有39.7%存在不同程度的发育行为落后[3]。虽然发育行为问题具有如此高的发病率，但由于其早期症状较为轻微，不易被察觉，往往在常规保健中被忽视，患儿至学龄期才表现出注意力不集中、动作“笨拙”等，严重影响学业和日常生活能力，甚至继发抑郁、焦虑等心理疾患，更有高达58%的患儿症状可持续到成年期[4-5]。因此十分有必要在婴幼儿期即进行早期的常规筛查，美国儿科学会建议所有儿童都应当进行常规的发育筛查[2]。贝利婴幼儿筛查测试量表第三版(Bayley Scale of Infant Development-3rd Edition-Screening Test，BSID-Ⅲ Screening Test)是在BSID-Ⅲ诊断测试(The Bayley Scales of Infant and Toddler Development，Third Edition)的基础上简化修订，可以独立应用于婴幼儿行为发育的快速筛查，是具有完整的信度和效度的检验资料[6]。本研究团队前期引进该量表并进行汉化修订，初步评价其在上海市0～24月龄婴幼儿中使用的信度，为进一步在全国开展BSID-Ⅲ筛查测试的研究奠定了基础。

1对象和方法

1.1对象

随机抽取2017年1至4月在上海市某区妇幼保健院及所辖社区卫生服务中心(共16家医院)常规体检的婴幼儿，均为该区的本地户籍和(或)外地户籍常住人口，遵照知情同意和自愿参加原则，开展横断面研究，共收集样本2 784例，月龄范围为16天至24月龄15天。排除标准为：①母亲严重妊娠合并症；②先天畸形；③体检当天存在严重的外伤或感染；④严重的运动发育障碍(如脑瘫)和视力、听力障碍性疾病；⑤严重智力低下或与发育相关的遗传性疾病。

1.2工具

BSID-Ⅲ筛查测试是由BSID-Ⅲ诊断测试简化修订而成的筛查性量表，可以独立应用于婴幼儿行为发育的快速筛查，适用年龄范围为0～42月龄，包含5个能区的测试：认知能力、语言理解、语言表达、精细运动以及大运动，5个分量表共计136个题目。每个能区所通过的题目直接相加即为该能区的最后得分，并划分9个年龄段，对应9组不同的筛查界值，结果评判分为存在落后风险(At Risk)、边缘(Emerging)和无明显异常(Competent)三个等级。本研究团队前期已与美国Pearson出版商签订合同并购买BSID-Ⅲ Screening Test原版测试手册及工具，并对指导手册进行翻译汉化，邀请多位专家反复核对，再由专业人员将其回译成英语，确认中文版指导语的准确并忠实于原文。由上海市第一妇婴保健院按照中文指导语对参与研究的每位测试者进行统一培训，培训合格后发放测试工具、指导手册及有关研究资料和方案。

1.3统计学方法

采用Excel建立数据库，录入调查内容，采用SPSS 16.0软件进行一般统计描述及相关分析等。采用Cronbach α系数分析BSID-Ⅲ筛查测试的内部一致性，Pearson相关系数用来分析各分量表之间的关联。上述值>0.75时，表示有很好的可靠性。采用组内相关系数(intra-class correlation coefficient，ICC)对测试者间信度进行分析，ICC>0.6时表示可靠性很好。

2结果

2.1研究对象一般情况

本次研究共纳入2 784名婴幼儿，年龄范围为16天至24月龄15天，根据指导手册中筛查界值所对应的年龄标注，同时结合6月龄以内婴幼儿发育变化迅速的特点，将研究对象按照6月龄以内每45天为一个年龄组，6～12月龄每3个月为一个年龄组，12月龄以上每6个月为一个年龄组进行分组，共8个年龄段。男童1 490人，占被调查人数53.5%，女童1 294人，占被调查人数的46.5%。早产儿(<37孕周)113人，占总被调查人数的4.1%；足月儿(37～42孕周)2 659人，占总被调查人数的95.5%；过期产儿(>42孕周)12人，占比0.4%，见表1。

表1研究对象一般情况[n=2 784，n(%)]

Table 1 Basic data of study subjects[n=2 784，n(%)]

项目男女合计月龄分布 16天～2月龄0天291(10．5)272(9．8)563(20．2) 2月龄1天～3月龄15天150(5．4)118(4．2)268(9．6) 3月龄16天～5月龄0天234(8．4)222(8．0)456(16．4) 5月龄1天～6月龄15天180(6．5)157(5．6)337(12．1) 6月龄16天～9月龄15天189(6．8)163(5．9)352(12．6) 9月龄16天～12月龄15天223(8．0)183(6．6)406(14．6) 12月龄16天～18月龄15天152(5．5)112(4．0)264(9．5) 18月龄16天～24月龄15天71(2．6)67(2．4)138(5．0)母亲分娩年龄 <35岁1332(89．5)1185(91．6)2517(90．5) ≥35岁157(10．5)109(8．4)265(9．5)出生体重 <2500g36(2．4)34(2．7)70(2．5) 2500～4000g1344(90．2)1202(92．9)2546(91．5) >4000g110(7．4)58(4．5)168(6．0)分娩孕周 <37w72(4．8)41(3．2)113(4．1) 37～42w1412(94．8)1247(96．4)2659(95．5) >42w6(0．4)6(0．5)12(0．4) 总计1490(53．5)1294(46．5)2784(100．0)

2.2 BSID-Ⅲ筛查测试的信度

2.2.1内在信度

本文选用内部一致性信度与折半信度来评BSID-Ⅲ筛查测试的内在信度。该量表总体Cronbach α系数为0.981，各个分量表的Cronbach α系数介于0.972～0.982之间，见表2，可见量表层面的内部一致性较好。Pearson相关分析结果显示，各分量表得分之间的相关性较高(>0.9)，见表3，也提示内部一致性信度良好。此外，Guttman分半系数分析结果表明，五个能区分量表层面的分半信度系数为0.963。以上分析结果均表明BSID-Ⅲ筛查测试具有可靠的内部信度。

表2各分量表的内部一致性信度分析(n=2 784)

Table 2 Analysis of internal consistency of each

subscale(n=2 784)

表3各分量表之间的相关性分析(n=2 784)

Table 3 Analysis of correlation of each subscale (n=2 784)

维度认知能力语言理解语言表达精细运动大运动认知能力1．0000．9410．9100．9630．952语言理解1．0000．9230．9440．928语言表达1．0000．9130．888精细运动1．0000．957大运动1．000

2.2.2外在信度

本文选取测试者间信度来评价BSID-Ⅲ筛查测试的外在信度。共选取30名婴幼儿由两名测试员同时打分，并进行组内相关系数的分析，见表4。认知能力、语言理解、精细运动和大运动四个能区的ICC系数均在0.8以上(均P<0.01)，语言表达能区ICC系数为0.560(均P<0.05)，可见量表整体的测试者间信度较好，但语言表达能区仅有中等水平的一致性。

表4各分量表的测试者间信度(n=30)

Table 4 Inter-rater reliability of each subscale (n=30)

维度ICC95%CI认知能力0．889a0767～0．947语言理解0．890a0．769～0．948语言表达0．560b0．075～0．790精细运动0．889a0．766～0．947大运动0．824a0．629～0．916

注：aP<0.01，bP<0.05。

3讨论

3.1 BSID-Ⅲ筛查测试具有良好的内在信度

信度也称稳定系数，指的是测量结果的可靠性或一致性，代表量表的稳定程度，是评价量化工具应用性的关键。一般分为内在信度与外在信度。本研究的内在信度选择Cronbach α系数与Guttman分半系数作为评价标准，一般认为Cronbach α系数越接近1，内在信度越理想，0.70～0.80之间尚可接受。本研究显示，BSID-Ⅲ筛查测试的量表总体与各个分量表的Cronbach α系数均大于0.9，5个分量表层面的Guttman分半系数为0.963，各分量表之间的Pearson相关系数>0.9，与国外已有的研究结论保持一致，如在中东地区的研究显示其一致性系数在0.76～0.81之间，Pearson相关系数>0.9[6]。本研究所得的各分量表一致性系数均在0.9以上，可见BSID-Ⅲ筛查测试量表中文版较波斯语版具有更加理想的内在信度。

3.2 BSID-Ⅲ筛查测试具有良好的外在信度

本研究的外在信度分析选择了测试者间信度，两名测试员同时对同一名被测对象进行打分，比较二者之间的一致性，当二者ICC>0.6时即表明量表具有良好的测试者间信度。本研究结果显示认知能力、语言理解、精细运动和大运动4个能区的ICC系数分别为0.889、0.890、0.889、0.824，可见以上分量表具有非常好的测试者间一致性(均P<0.01)。语言表达能区的一致性相对较低，但尚可接受(ICC=0.560，P<0.05)，而国外研究中，不论是BSID-Ⅲ筛查测试还是BSID-Ⅲ诊断测试，其5个分量表均有非常好的测试者间一致性[6-7]。国内BSID-Ⅲ诊断测试的相关研究也表明其外在信度良好[8]。因此应在后续的研究中扩大重测的样本量及年龄段，进行进一步研究。

3.3 BSID-Ⅲ筛查测试在我国引进的可行性

贝利婴幼儿发育量表是由美国心理学家Nancy Bayley，综合了Gesell等量表的优点，经过对数千名婴幼儿测验所研制出来的一套评定婴幼儿行为发育的工具，于1969年首次出版，1993年发表第二版(BSID-Ⅱ)，2005年发表第三版(BSID-Ⅲ)。该量表一直随着时代变化进行更新和修订，已被翻译成多国语言，成为国际通用的婴幼儿发展量表之一。在国内BSID-Ⅱ和BSID-Ⅲ均有学者使用，且这两个版本在国内外都被证明具有良好的应用性[7-10]。最新版的BSID-Ⅲ由于其更加细化和全面的评估体系，目前国际上得到了更广泛的研究[11]。BSID-Ⅲ筛查测试则是选取BSID-Ⅲ中区别度较高的题目重新编制，能够对婴幼儿从出生到42个月认知、运动、语言能力进行全面快速的筛查。目前国际上在英语国家和非英语国家均已有研究表明BSID-Ⅲ筛查测试的适用性良好[6，12]，但尚未得到广泛大量的应用。与目前国内常用的婴幼儿发育筛查工具(DDST，ASQ，小儿神经心理量表等)比较，BSID-Ⅲ筛查测试是具有分值评价体系的客观测试工具，且作为国际通用的量化工具便于开展不同国家间的儿童间比较。此外，该工具无需花费大量时间即可快速筛查被测儿童的认知-运动发育水平，使得医生能在短时间内判断哪些儿童需要进一步的检查和干预，从而减少不必要的医疗资源浪费，在我国出生人口众多，儿科资源紧缺的形势下，引进至国内具有较好的应用前景。

综上所述，BSID-Ⅲ筛查测试在国内研究地区具有较好的使用信度，在国内具有较好的应用前景。但本调查仅局限于上海市，样本从代表性上而言有一定的局限。其次鉴于中国等亚洲地区儿童与欧美儿童的体质发育、养育环境和文化背景等存在一定差异，测试题目与筛查界值可能还需要适当的修订，并仍需进一步扩大样本量在全国范围内开展进一步的研究和制定筛查界值。

[1]金星明.发育行为临床诊断特点[J].中国实用儿科杂志,2012,27(3):183-185.

[2]Wiley S, Meinzen-Derr J.Use of the ages and stages questionnaire in young children who are deaf/hard of hearing as a screening for additional disabilities[J].Early Hum Dev,2013,89(5):295-300.

[3]Wei Q W, Zhang J X, Scherpbier R W,etal.High prevalence of developmental delay among children under three years of age in poverty-stricken areas of China[J].Public Health,2015,129(12):1610-1617.

[4]Raz-Silbiger S, Lifshitz N, Katz N,etal.Relationship between motor skills, participation in leisure activities and quality of life of children with Developmental Coordination Disorder: temporal aspects[J].Res Dev Disabil,2015,38:171-180.

[5]Tal Saban M, Ornoy A, Parush S.Executive function and attention in young adults with and without developmental coordination disorder:a comparative study[J].Res Dev Disabil,2014,35(11):2644-2650.

[6]Soleimani F, Azari N, Vameghi R,etal.Is the Bayley scales of infant and toddler developmental screening test, valid and reliable for Persian speaking children?[J].Iran J Pediatr,2016,26(5):e5540.

[7]Deroma L, Bin M, Tognin V,etal.Interrater reliability of the Bayley III test in the Italian Northern-Adriatic Cohort II[J].Epidemiol Prev,2013,37(4-5):297-302.

[8]Yu Y T, Hsieh W S, Hsu C H,etal.A psychometric study of the Bayley Scales of Infant and Toddler Development-3rd Edition for term and preterm Taiwanese infants[J].Res Dev Disabil,2013,34(11):3875-3883.

[9]杨进,刘小红.贝利婴幼儿发展量表北京农村地区常模的制订[J].中国妇幼健康研究,2016,27(9):1031-1034.

[10]崔继华,姜艳蕊,刘芸,等.婴幼儿运动发育的预测因素研究[J].中国妇幼健康研究,2014,25(1):1-4.

[11]Steenis L J, Verhoeven M, Hessen D J,etal.First steps in developing the Dutch version of the Bayley III: Is the original Bayley III and its item sequence also adequate for Dutch children?[J].Eur J Dev Psychol,2014,11(4):494-511.

[12]Jackson B J, Needelman H, Roberts H,etal.Bayley Scales of Infant Development Screening Test-Gross Motor Subtest: efficacy in determining need for services[J].Pediatr Phys Ther,2012,24(1):58-62.