APP下载

汉语发展性阅读障碍小学生词边界划分的发展研究*

2022-01-22梁菲菲

心理与行为研究 2021年6期
关键词:离线连词边界

梁菲菲 向 颖 武 浩 韩 洋

(1 教育部 人文社会科学重点 研究基地天津师范 大学心理与行为研 究院,天津 300387) (2 天津 师范大学心理学部,天津 300387) (3 学生心 理发展与学习天津 市高校社会科学实 验室,天津 300387)

1 引言

发展性阅读障碍(developmental dyslexia,DD)作为常见的学习障碍之一,发生率为5%~8%;患者无明显脑损伤,精神障碍或智力缺损,但词汇量和阅读水平显著低于同龄人(白学军,张明哲,孟红霞,谭珂,王雯,2018;郭志英,谭珂,宋星,彭国慧,白学军,2018;Meng,Cheng-Lai,Zeng,Stein,& Zhou,2011;Shu,McBride-Chang,Wu,& Liu,2006;Zhang,Xie,Xu,& Meng,2018)。汉语文本阅读中无词间空格,词汇识别的首要环节是词切分,即把词从句子中切分开来(李兴珊,刘萍萍,马国杰,2011)。因此,词切分技能是反映汉语读者阅读效率的重要因素之一。词切分技能形成的基础是字词识别,而DD 儿童最典型的表现是在字词识别中存在缺陷(Shu,et al.,2006;Shu,Meng,Chen,Luan,& Cao,2005)。那么,汉语阅读环境中发展性阅读障碍的成因是否与读者的词切分技能有关?本研究采用传统的离线词切分任务(off-line word segmentation task),对上述问题进行考察。

白学军等人(2019)通过操纵阅读中视觉词切分线索的存在(插入词间空格),采用眼动追踪技术,考察了DD 儿童在阅读伴随词汇习得中的在线词切分是否存在缺陷。将新词(假词)放在八个强限制性语境中,将其描述成日常生活所熟悉的一个语义类别的新成员(如将“挑尔”描述成一种不存在的水果)。一半被试在词间空格条件下阅读,一半被试在正常无空格条件下阅读。结果发现,不论是DD 儿童,还是生理年龄匹配(与DD 儿童年龄相仿的正常发展儿童)或阅读能力匹配儿童(与DD 儿童的阅读能力相当,生理年龄低于DD 儿童的正常发展儿童),在词间空格文本阅读中,阅读伴随习得词汇的效率均显著高于传统无空格文本阅读。具体表现为,DD 儿童在词间空格文本中对新词的注视时间(包括首次注视时间、凝视时间和总注视时间)显著短于无空格文本条件。此外,DD 儿童的词间空格效应在词汇加工时程上出现较早,在效应量上也显著高于两组正常发展儿童。这表明DD 儿童在阅读中伴随习得词汇时更加依赖词间空格这类视觉词切分信息。基于词间空格最大的作用是帮助读者在视觉上判断新词的构成,起到视觉词切分线索的作用(Blythe et al.,2012;Liang et al.,2017;Liang et al.,2015),本研究推断,在阅读实时加工过程中(on-line process),DD 儿童的词切分技能表现出一定程度的缺陷,这可能是他们词汇习得效率较低的原因之一。

词切分技能除了可以从内隐的实时阅读过程反映之外,还可以通过外显的词边界划分任务表现来推断。外显词边界划分技能常用离线词切分任务来测量,要求读者用分割线(一般为“/”)将阅读材料的词单元标记出来,通过与标准词切分,如《信息处理用现代汉语分词规范》(中华人民共和国国家标准GB/T 13715-92)比对,来计算个体对标准词划分的认同率(以下简称为“词切分认同率”)。词切分认同率越低,表明读者的心理词单元和标准词单元差异越大;词切分认同率接近100%,表明读者心理词切分和标准词切分规则的一致性非常高。

付彧、何立媛、吴蕊涵和闫国利(2015)采用离线词边界切分任务,从发展的视角考察了汉语读者外显词边界划分的表现。被试包括小学三年级、五年级、初中二年级和高中二年级4 个年龄段的儿童和青少年。结果发现,词切分认同率随读者年级的升高而降低,表现出典型的发展趋势。这种现象可以解释为:在长期大量的语言接触和阅读经验基础之上,读者在心理词典中会形成一些词与词的意义组合—语块(例如把“小红花”作为一个意义单元来加工),这些语块可以进行整体储存和加工;随着读者年龄的增长和阅读经验的增加,语块大小和语块数量逐步发展,表现为读者对标准词切分的认同率随年龄的增长而逐步降低。那么,DD 儿童的阅读水平和阅读经验有限,他们相对较低的词切分技能是否会表现在外显词切分认同率上?这是本研究关注的问题。

近期,He 等人(2021)通过严格的实验操纵,以正常大学生为被试,发现在离线词切分任务中,倾向于将词划分为更大加工单元的读者,在在线阅读中并未表现出加工优势;而将词划分为较小加工单元的读者,在线阅读中也并未表现出加工代价。因此,He 等人提出了新的观点:在线词切分和离线词切分并不是一个统一的加工过程,二者可能反映了不同的阅读认知加工机制。当前关于在线词切分的研究更多地反映了汉语阅读中读者对视觉词切分线索的依赖程度,而视觉词切分线索的插入是以标准词为单位进行的,也就是说,在线词切分任务反映了读者以标准词单元进行阅读时的加工效率(Bai,Yan,Liversedge,Zang,& Rayner,2008;Liang et al.,2017;Liang et al.,2015)。而离线词切分任务从根本上反映的是个体阅读中常用的心理词加工单元,有可能是词,也有可能是比标准词单元更大的“语块”,具有较大的个体差异性。这也意味着在线词切分和离线词切分可能代表了不同的认知加工过程。

本研究从小学二、三、四年级选择DD 及其CA 儿童作为研究对象,采用离线词切分任务,考察DD 儿童的外显词切分是否存在缺陷。如果在线词切分和离线词切分反映的是相同的认知加工过程,那么,基于白学军等人(2019)的研究结果,DD 儿童的在线词切分具有一定程度的缺陷,本研究预期DD 儿童在离线词切分任务中将表现出缺陷,即DD 和CA 儿童的词切分认同率具有显著差异,且随着读者年级的升高,这种差异将逐步扩大。相反,如果按照He 等人(2021)的观点,即在线词切分和离线词切分反映了不同的认知加工过程,离线词切分任务反映了基本的词意识,本研究预期DD 儿童在心理词单元的认知上可能不会表现出缺陷,因为要是读者在最基本的词单元认知上存在缺陷,就意味着他们在阅读中无法进行词切分,也就无法理解文本所传达的语义信息,整个阅读过程将无法完成。

2 研究方法

2.1 被试

采用国内汉语发展性阅读障碍常用的筛查工具(刘文理,刘翔平,张婧乔,2006;Meng et al.,2011;Shu et al.,2006):(1)识字量测试,采用小学生汉字识字量测验(王孝玲,陶保平,1996),(2)智力测试,采用联合瑞文推理测验(李丹,胡克定,陈国鹏,金瑜,李眉,1988),在山东省潍坊市两所小学二、三、四年级715 名学生中进行筛查,在各年级中同时选择DD 儿童和CA 儿童作为被试。

被试分组标准如下:(1)DD 组,选择智力处于中等或良好水平,即联合瑞文推理成绩(CRT)在常模团体的前75%,识字量成绩低于同年级平均成绩1.5 个标准差以上的儿童作为DD 组被试;(2)CA 组,选择识字量位于平均值上下0.5 个标准差以内,且与DD 组被试同年龄且智力水平相当的儿童作为CA 组被试。被试信息如表1所示。经检验,各年级DD 组与CA 组被试在年龄和CRT 得分上均无显著差异,|t|s<1.63,ps>0.05,表明两组被试在年龄和智力方面是匹配的。

表1 DD 组与CA 组被试信息

2.2 实验材料

(1)请两所小学各年级语文教研组教师选取适合二至四年级学生阅读的课外读物共60 篇,并结合北京大学汉语语言学研究中心语料库,从中共选取句子310 个。(2)请4 名小学二年级语文教师对句子难度进行评定,同时标出超出二年级阅读水平的字和难以理解的句子。共筛除不符合要求的句子64 个。(3)将剩余246 个句子分为A、B 两组,每组123 句,邀请不参与正式实验的二年级学生进行阅读,并标出不认识的字与词。A 组包括32 名儿童,B 组包括30 名儿童。筛除标记比例大于10%的句子。(4)最终选取200 个句子作为正式实验材料。以《现代汉语词典(第5 版)》、《信息处理用现代汉语分词规范》(中华人民共和国国家标准GB/T 13715-92)和NLPIR汉语分词系统(刘源等,1994)为标准进行词切分,并进行词性标注。实验句子共包括汉字3479 个,标点符号217 个,词汇2844 个(除去重复词,共有1022 个词)。词性分类统计如表2 所示。为避免被试疲劳,将200 个实验语句分为A 版和B 版,各100 句。各年级一半被试完成A 版词切分,另一半被试完成B 版词切分。

表2 实验材料中各词性数量

2.3 实验设计

采用2(被试:DD、CA)×3(年级:二、三、四)的被试间实验设计。因变量为词切分认同率。

2.4 实验程序

以班级为单位集体施测。要求被试自定步幅完成纸质版句子阅读,任务是将句子切分为词。指导语为:“请阅读下面的句子,用“/”把句子分成一个一个的词。请看例题。例1,我/爱/爸爸/和/妈妈。”实验共持续30 分钟。

2.5 数据整理

避免外界线索可能给被试的词切分提供帮助,删除句子的首、尾词,以及与标点符号相邻的词(Liu,Li,Lin,& Li,2013)。词切分认同率计算方法为:个体正确切分的词边界数量/目标材料标准词边界数量。例如,一个句子按国家标准CCLWSSIP信息处理用现代汉语分词规范(contemporary Chinese language word segmentation specification for information processing,CCLWSSIP)的分词规则,词边界数为10 个,被试实际切分的词边界数为7 个,则词切分认同率为70%。词切分认同率数值越高,表示实际词切分与标准切分的一致程度越高。

3 结果

3.1 DD 组与CA 组的总体词切分认同率分析

基于词N 的后边界同时也是词N+1 的前边界,前边界和后边界的词切分认同率在数值上相等,本研究将基于词的后边界进行分析统计。各年级DD 组与CA 组的词切分认同率如图1 所示。两因素方差分析结果显示:年级主效应显著,F(2,112)=3.73,p<0.05,=0.06。由于年级发展不是本研究的考察重点,故不作进一步多重比较分析;组别主效应不显著,F(1,112)=0.90,p>0.05;年级与组别的交互作用不显著,F(2,112)=0.21,p>0.05。结果表明,DD 组和CA 组儿童在总体词切分认同率上无显著差异。

图1 各年级DD 和CA 组儿童的词切分认同率

前期研究发现,词切分认同率受词性所调节(付彧等,2015;Liu et al.,2013),接下来将对各词性的词切分认同率进行进一步分析。

3.2 DD 组与CA 组对实词的切分认同率分析

实词包括形容词、名词、数词、量词、代词和动词,其前、后边界的认同率见图2 和图3。两因素方差分析发现,组别的主效应,以及组别和年级的交互作用在六种实词的前、后边界切分率分析中均不显著,Fs <3.2 1,ps>0.05。结果表明,在实词切分中DD 组和CA 组儿童的表现相当,并未表现出离线词切分缺陷。

图2 各年级DD 与CA 组儿童对名词、动词和形容词的切分认同率

图3 各年级DD 与CA 组儿童对数词、量词和代词的切分认同率

3.3 DD 组与CA 组对虚词的切分认同率分析

虚词包括连词、副词、介词和助词,其前、后边界认同率的平均数和标准误见图4。连词的分析结果显示,组别主效应在前、后边界分析中均显著,Fs>4.32,ps<0.05,s>0.06,组别与年级的交互作用均不显著,Fs<0.43,ps>0.05。DD 组对连词前、后边界的切分认同率显著低于CA 组,表明DD 儿童对连词的切分与标准连词切分差异较大。

图4 各年级DD 与CA 组儿童对虚词的切分认同率

在副词、助词和介词分析中,组别以及组别和年级的交互作用均不显著,Fs<3.91,ps>0.05。上述结果表明,除连词外,DD 组和CA 组儿童在其他虚词切分的认同率上,表现相当,并未表现出线下词切分缺陷。

4 讨论

本研究采用离线词切分任务,以词切分认同率作为指标,考察了DD 儿童在阅读中的离线词切分能力是否具有缺陷。词切分认同率反映的是个体主观词边界切分标准与客观词切分标准间的一致程度。每当阅读材料中存在客观标准的边界,而阅读者未进行切分时,词切分认同率就会下降。本研究发现,无论在总体词切分认同率,还是在大多数词性(除连词外)的词切分认同率上,DD 组和CA 组均无显著差异。结果支持第二种假设,虽然汉语DD 儿童在线阅读过程中会由于视觉词切分线索的插入而提高阅读效率,表现出对视觉词切分线索的依赖性,但是他们在阅读中对词边界的划分能力并无缺陷。此外,各个年级间也未出现DD 组与CA 组的切分差异,这表明,与正常儿童类似,DD 儿童在二年级时也形成了相对完整的词切分规则。虽然早期形成的词切分规则会随着读者年级的升高而发展,DD 儿童始终和正常发展儿童保持统一发展水平。该研究发现对当前汉语阅读词切分机制以及汉语发展性阅读障碍的认识有重要启示,具体如下。

第一,本研究结果为“在线词切分和离线词切分不是一个统一的认知加工过程”的观点(He et al.,2021)提供了新的实验证据。在拼音文字阅读中,词间空格使得词在视觉水平上凸显,这不仅促进了词汇识别,还引导了眼跳定位(Rayner,1998,2009)。由此,词被认为是拼音文字阅读中的基本加工单元。在无空格语言阅读中(如汉语),关于阅读的基本加工单元至今还在争论。早期观点认为词是汉语阅读的基本加工单位,词具有一定的“心理现实性”(沈德立等,2010;Bai et al.,2008;Li,Rayner,& Cave,2009)。近期也有研究者提出“语块”可能是汉语阅读的基本加工单位(Zang,Fu,Bai,Yan,& Liversedge,2021)。上述两种观点均是从在线阅读加工的研究视角得出的结论。而He 等人发现,读者“心理词”单元的大小与阅读加工效率并无因果关系,这在一定程度上表明词边界划分和词切分加工不是一个统一的过程。本研究的发现进一步支持了该观点。虽然白学军等人(2019)发现,DD 儿童在阅读中习得词汇时具有词切分缺陷,但是DD 儿童对词边界的划分并未表现出缺陷。该研究发现提示研究者在汉语阅读词切分机制研究中,有必要对上述两个概念进行区分。此外,本研究外显地告知DD 儿童要对词单元进行切分,而白学军等人在研究中要求DD 儿童在自然状态下阅读,并未外显提示读者在阅读中需要完成词切分过程。上述实验任务的不同,可能反映了虽然DD 儿童基本的词意识没有缺陷,但是他们可能不会主动利用相对完好的词意识在阅读中进行词切分。

第二,本研究结果有助于加深对汉语发展性阅读障碍词切分加工特点的认识。如前所述,外显的词切分认同率实质上反映的是汉语读者的词意识程度。已有研究发现,随着读者阅读水平的提高,他们的词意识越来越模糊,更加倾向于将相邻多个词汇结合起来形成更大的意义加工单元(付彧等,2015)。本研究结果进一步证实,虽然DD 儿童在字词加工中存在多方面缺陷,如语素理解缺陷、语音加工缺陷和正字法加工缺陷等(隋雪,姜娜,钱丽,2010;周路平,李海燕,2011),但是他们的词意识与正常儿童不存在差距,甚至对连词切分的认同率还显著低于正常发展儿童,再次证明DD 儿童在基本的词意识上没有缺陷。回顾本研究的实验任务,即通过指导语明确地告知了被试要对阅读的句子按照词单元进行划分,这对DD 儿童的教育具有一定的启示:在阅读中,教育者可以外显提示DD 儿童对词单元进行划分,让他们将更多的认知资源集中到词单元的切分,这样就可在正确词切分的前提下进行阅读理解,在一定程度上避免DD 儿童由于先天的字词加工缺陷影响阅读效率。

最后,需要说明的是,由于本研究中的连词数量较少,仅有44 个,且“和”占多数,此外连词左侧和右侧词的词性也相对单一(多为名词),因此,在一定程度上本研究关于连词的切分结果不具有代表性。后续研究有必要进一步考虑实验材料的代表性,深入揭示DD 儿童对连词的切分特点。

5 结论

在本研究条件下,得出如下结论:小学二至四年级DD 儿童与CA 儿童的线下词切分认同率无显著差异,表明DD 儿童的词边界划分能力不具有缺陷。

猜你喜欢

离线连词边界
基于卷积神经网络的离线笔迹鉴别系统
守住你的边界
新版Windows 10补丁离线安装更简单
有边界和无边界
OF MALLS AND MUSEUMS
表格大团圆,连词学得全
人蚁边界防护网
好进难出 应对迅雷“口袋战”
离线发文件 不是会员也能用