言语可懂度分级问卷中文版的研发及其信度效度研究*
2021-09-30王丽燕申敏梁巍刀维洁周丽君朱美华
王丽燕 申敏 梁巍 刀维洁 周丽君 朱美华
随着新生儿听力筛查的普及和助听技术的发展,越来越多的听障儿童得到早期干预,对听障儿童的语言能力康复效果进行评估成为临床工作者和家长关注的问题,因此,开发使用方便、结果可靠的评估工具成为研究热点。言语可懂度分级问卷(speech intelligibility of rating,SIR)1998年由英国诺丁汉小儿人工耳蜗项目小组开发[1],该问卷将儿童的言语可懂度从低到高分为五个等级,由熟悉听障儿童的家长或康复人员根据儿童的日常表现评级,可以方便快捷地考察听障儿童的言语可懂度。Allen等[2]对原英文版SIR问卷的评分者一致性信度进行了验证,认为该问卷一致性信度良好。SIR自开发以来,在国际上包括中国得到了广泛应用,虽然国内应用SIR问卷已有多年,但存在多个翻译版本混用的情况。目前国内SIR问卷至少存在3个中文版[3~5],不同的版本在文字翻译上存在一定差异, 国内不同的研究使用的版本各不相同;此外,这3个版本中仅有一个版本[5]进行了信度检验,且只检验了评分者信度,对其他信度指标以及效度没有涉及。故本研究拟对SIR问卷进行中文版标准化研究,同时全面考察该中文版问卷的信度和效度等有效性指标,为今后规范使用提供依据。
1 资料与方法
1.1翻译和修订中文版SIR 采用回译法(back translation)[6]对原英文版SIR问卷进行中文版翻译和修订。请一位精通中文和英文的双语者将英文原版SIR问卷翻译成中文,再由另一位双语者把翻译好的中文回译成英文;接着将回译的英文问卷与原英文问卷进行比对,找出其中不准确、被曲解的部分并进行修正;在此基础上,研究者又请3位听力语言康复领域熟悉问卷评估且中、英文水平均较高的专家对译文进行审定、提出完善意见,然后根据专家意见进一步修改,初步确定中文版SIR问卷。
1.2研究对象 本研究包括预实验和正式实验两个阶段。预实验和正式实验的研究对象纳入标准均为:0~6岁听力正常儿童,发育正常,主要语言环境为汉语普通话。
1.3预实验 预实验的目的是考察经修订初步确定的中文版SIR问卷的可用性,即文字表述是否需进一步修改、问卷大体上是否合理。选取191例0~6岁健听儿童进行预实验,每一岁为一组,共分为6组,每组例数分布见表1。请191例儿童的家长填写初步确定的中文版SIR问卷,就问卷表述是否清晰、准确、易懂等进行反馈,对反馈意见进行梳理,对预实验问卷得分进行统计分析,进一步完善直至确定问卷。
表1 191例0~6岁儿童各年龄组例数及SIR得分(分,
预实验统计处理:计算每个年龄段问卷得分的平均值以及年龄和问卷得分之间的相关系数,考察问卷得分随年龄变化的趋势,初步检验问卷的合理性。
1.4正式实验 应用确定的中文版SIR正式问卷进行正式实验,以检验问卷的信度和效度。
1.4.1信度检验 选取103例0~6岁健听儿童进行信度研究,其中,0~、1~、2~、3~、4~、5~6岁组分别为22、25、18、9、16、13例。请与其共同生活并熟悉这103例儿童听觉言语表现的两位家长分别填写确定的SIR中文版问卷;间隔2周后,请每例儿童的一位家长再次填写该问卷,提醒家长如实按照儿童当下的语言能力状况填写。
中文版SIR问卷的填写方法:由经过培训的专业人员对家长进行访谈,先向家长介绍该问卷评估的目的及评分方法,请家长自行判断小儿的语言能力最接近于五个级别中的哪一级(先不着急评分),然后询问家长是否理解所选级别的涵义,请家长举例;如果发现家长无法清楚解释或举例,则向其解释该级别或相邻级别的涵义,帮助其准确评分,最终家长选择的级别即为SIR问卷的得分。
1.4.2效度检验 选取60例0~2岁健听儿童(0~、1~2岁组分别为22例和38例)和60例3~6岁健听儿童(3~、4~、5~6岁组分别为20、20、20例)进行效度研究。对60例0~2岁儿童进行SIR评估和小龄儿童听觉发展(LittlEARS)评估[7];60例3~6岁儿童进行SIR评估和格雷费斯儿童发育量表(Griffiths)评估[8]中的听力语言分测验。
LittlEARS评估是一套包含35道日常行为问题(如“孩子理解简单的问题吗?”“孩子会在您的要求下重复某些特定的词语吗?”)的问卷,可以对0~2岁儿童早期的接受性语言、表达性语言能力进行评估,该问卷目前在国内外广泛使用。熟悉儿童的家长根据指导语自行填写问卷,对每一题进行“是”或“否”作答,遇到不理解的问题由经过培训的专业人员进行解释。最终家长回答“是”的题目总数即为LittlEARS问卷的得分。
Griffiths评估也是一套国内外广泛使用的工具,用于评估0~8岁儿童的心理发育水平,包含运动、个人与社会、听力语言、手眼协调、视觉表现、推理6个分测验,其中听力语言分测验是专门测查儿童理解和应用语言的能力。由经过培训的专业人员对儿童进行施测,计算儿童通过项目的总得分,最终得到发育年龄即为评估得分。
1.4.3正式实验统计处理 信度检验:计算103例0~6岁健听儿童间隔2周分别进行两次SIR评估得分的相关系数,得到问卷的重测信度;计算熟悉这103例儿童的两位家长分别完成SIR评估得分的相关系数,得到问卷的评分者信度。
效度检验:分别计算60例0~2岁儿童SIR评分和LittlEARS得分、60例3~6岁儿童SIR评分和Griffiths评估中的听力语言分测验得分的相关系数,得到问卷的效标效度。
2 结果
2.1预实验结果 191例0~6岁健听儿童各年龄组SIR得分见表1,可见随着年龄的增长,SIR得分逐渐增加;月龄与SIR得分的Pearson相关系数r=0.836,为极显著相关(P<0.01);表明SIR问卷符合要求,可以用于正式实验。本研究确定的SIR中文版问卷见表2。
表2 SIR中文版正式问卷
2.2正式实验结果
2.2.1重测信度 采用正式问卷对103例0~6岁健听儿童间隔2周分别进行两次SIR评估,第一,二次SIR评分分别为3.12±1.72和3.16±1.70分,两次评估得分的Spearman相关系数r=0.983,为极显著相关(P<0.01),表明重测信度良好。
2.2.2评分者信度 103例儿童每例儿童的两位家长分别完成SIR评估,两位家长的SIR得分分别为3.12±1.72和3.09±1.71分;两位家长评估得分的Spearman相关系数r=0.997,达到极显著相关(P<0.01),表明评分者信度良好。
2.2.3效标效度 采用正式问卷对60例0~2岁儿童进行SIR评估和小龄儿童听觉发展(LittlEARS)评估,得分分别为1.85±1.13和23.25±9.30分,SIR和LittlEARS评估得分Spearman相关系数r=0.698,极显著相关(P<0.01)。
采用正式问卷对60例3~6岁儿童进行SIR评估和Griffiths评估中的听力语言分测验,得分分别为4.80±0.40和56.67±11.18分,SIR和Griffiths评估中的听力语言分测验得分的Spearman相关系数r=0.428,为极显著相关(P<0.01)。
上述结果表明,无论对0~2岁儿童还是3~6岁儿童,SIR效标效度均良好。
3 讨论
随着国内听障儿童早期干预的日益推广,如何评估儿童的听觉语言康复效果成为热点。近年来国内很多临床工作者和研究人员从国外引进一些问卷类评估工具,很大程度上弥补了国内评估工具的不足,对于促进康复工作和研究起到很好的作用。但是,由于语言、文化等差异,由国外引进的外文版问卷不宜自行翻译成中文后直接使用,规范的做法是采用标准化程序进行研译,然后对研译的中文版本进行信度和效度检验,检验合格后再应用于临床和科研[6]。
本研究采用的回译法(back translation)就是一种跨文化研究领域测量工具翻译的标准化程序,包括翻译、回译、校对、审核多个程序,旨在保证译文忠实于原意且符合目标语言的文化特点。越来越多研究者在引进外文评估工具时采用此程序[5,9,10]。为了进一步确保采用回译法得到的中文翻译SIR问卷可用,本研究还开展了预实验,考察随着年龄的增长,SIR问卷得分呈现何种规律;预实验结果显示,随着年龄的增长,SIR得分逐渐增加,月龄与得分的相关性为极显著相关(P<0.01)。这进一步表明本研究研译的中文版SIR问卷合理、可用,也为下一步正式实验进一步检验问卷的信度和效度奠定了基础。而且预实验收集了家长对该问卷文本的意见,几乎所有家长都认为问卷文字表述清楚,不存在歧义。
在心理测量领域,信度有多种类型,不同的信度考察的侧重点不同。评分者信度反映的是不同评分者之间的一致性,重测信度反映的是测试的稳定性[11]。本研究对这两个信度指标都进行了考察,以全面检验本研究研译的中文版SIR问卷的可靠性与稳定性。在考虑信度检验的样本量时,对预实验的数据(表1)细致分析后发现,3岁以下儿童随着年龄的增长,SIR得分增长较快,而3岁以上儿童随着年龄的增长,SIR得分增长较慢,这一规律符合儿童语言发展的规律,因此,本研究进行信度检验时3岁以下组样本量较大,3岁以上组样本量较小;同时因为总样本量(n=103)较大,可以较好地避免由于SIR问卷项目少易受随机误差的影响。根据重测信度的测量要求,两次评估间隔时间不宜太长也不宜太短,一般2~3周为宜[11];且鉴于儿童语言发展速度较快,故本研究两次评估的间隔时间定为2周。为了避免记忆效应,评估时一方面提醒家长按照填写问卷时孩子当下的情况如实填写,另一方面让家长举出具体事例,以印证家长不是凭记忆作答。本文结果表明,本研究研译的SIR中文版问卷评分者信度和重测信度这两个信度指标均良好,表明该问卷有较好的可靠性和稳定性。
效度和信度是相关的,理论上效度系数总是低于信度系数,要想有较高的效度,先决条件是有较高的信度;但有较高的信度,却不一定有较高的效度,因为效度的高低还取决于其他无关变异所占的比例[12]。因此,对于一个严谨的测量工具,除检验其信度外,还有必要检验其效度。本研究在考察中文版SIR问卷的效度时,主要考察效标效度,它是使用最多的评价效度的方法[12]。效标效度反映的是测验的有效性,即测试是否真能测出想要的特质,该指标常用测试分数与效标分数之间的相关性来表示[11]。由于国内适用于0~6岁、可作为SIR的效标没有合适的工具,因此本研究针对0~2岁儿童选择小龄儿童听觉发展(LittlEARS)作为效标,针对3~6岁儿童,选择Griffiths评估中的听力语言分测验作为效标;虽然Griffiths评估也适用于0~2岁儿童,但因为该评估需要对儿童进行一对一测试,而0~2岁儿童配合度较低,因此本研究仅对3~6岁儿童进行了该评估。LittlEARS和Griffiths评估都是国内外公认且经过有效性验证的评估工具,目前在国内广泛使用[13,14]。本研究结果显示,中文版SIR评分与两者的相关系数r分别为0.698和0.428,虽然一般情况下0.4cr<0.7相关性仅为中度,但本研究统计检验显示相关性有显著意义(P<0.01),表明本研究研发的SIR中文有效问卷效度良好。r系数值较低考虑与LittlEARS、Griffiths评估中的听力语言分测验有部分项目关注的是听觉有关,今后可进一步探讨,发掘更适合的评估工具作为效标是选择之一。
从国外引进的听觉或言语能力评估问卷,国内也逐渐开始重视标准化建立和有效性考察,如王大华等[15]对听觉能力分级(categories of auditory performance, CAP)进行了研译并检验了评分者信度,王宇等[5]对SIR进行了研译和评分者信度检验,Wang等[16]对LittlEARS问卷进行了标准化研究;这些工作对于规范国外引进评估问卷的使用、增强研究结果的可比性很有意义。本研究也是在这方面所做的尝试,后续课题组将利用本研究确定的中文版SIR问卷,建立汉语普通话儿童参考标准,为听障儿童言语可懂度评估提供对比依据,以帮助更好地评估听障儿童的语言康复效果。