汉语阅读中的眼跳目标选择：词汇信息与视觉复杂性的作用 *

2019-08-26刘璟尧于慧婧姜心荷梁菲菲王永胜白学军

心理与行为研究 2019年4期

李馨刘璟尧于慧婧姜心荷梁菲菲王永胜白学军

(1 教育部人文社会科学重点研究基地天津师范大学心理与行为研究院，天津 300387) (2 天津师范大学心理学部，天津300387) (3 国民心理健康评估与促进协同创新中心，天津 300387) (4 天津师范大学教育学部，天津 300387)

1 问题提出

阅读过程中的眼动控制研究主要包括眼睛何时移动（when）和眼睛移向何处（where）两个方面。读者何时开始移动眼睛以及眼睛移向何处是由两个独立系统分别决定的（Clifton et al., 2016；Joseph, Liversedge, Blythe, White, & Rayner, 2009； Li,Liu, & Rayner, 2011； Zang, Liang, Bai, Yan, &Liversedge, 2013）。本研究主要探讨眼睛移向何处这一问题。

以往拼音文字阅读的眼动研究证实，读者下一个眼跳落点位置主要受词的低水平视觉特性影响，如词长和标记词边界的信息（如词间空格）（Joseph et al., 2009；李玉刚, 黄忍, 滑慧敏, 李兴珊,2017； Perea & Acha, 2009）。同时，眼睛落点位置（landing position）的变异性和眼睛起跳位置也会影响眼跳落点的最终位置，研究阅读过程中读者的注视位置可以更好地回答眼睛移向何处这一问题（Zang et al., 2013）。而与之直接相关的两个研究证据是偏向注视位置（preferred viewing location,PVL）和最佳注视位置（optimal viewing position,OVP）（Rayner, 2009；臧传丽, 孟红霞, 白学军, 闫国利, 2013）。

为了更好地解释读者阅读过程中的注视位置，研究者基于大量研究证据，采用计算机模拟，提出两种类型的阅读模型。一种为眼球运动模型（oculomotor models），该模型主张，低水平视觉因素（如词长）和当前眼跳落点的位置影响读者眼睛移向何处（where）（臧传丽等, 2013），代表性模型为战略-战术模型（strategy - tactics theory, O'Regan & Jacobs, 1992）。战略-战术模型认为，读者在阅读中采用词间眼跳策略（strategy）和词内眼跳技术（tactic）。采用词间眼跳策略是为了能准确地注视每个词的最佳注视位置（OVP）。如果首次眼跳落点能落在最佳注视位置（OVP）上，则对该词只有一次注视。但有时由于误差，如果越过或未达到预期的注视目标，最终使首次注视落在非OVP 上，读者会采用词内眼跳技术，即对该词进行再注视。

另一种为认知加工模型（cognitive models），该模型也认同低水平视觉因素对眼动控制的影响，但认为认知加工因素的影响要远远大于低水平视觉因素的影响。E-Z 读者模型和SWIFT 模型是其代表模型（Clifton et al., 2016； Richter, Engbert,& Kliegl, 2006）。前者认为只有完全识别当前注视词N 后，才能加工词N+1；后者则认为，读者同时可以平行加工几个单词。

与拼音文字不同，汉语属于表意文字，其书写的基本单元是汉字。基于两种语言存在书写特征差异，所以不能直接利用基于拼音文字阅读研究得出的眼动模型解释汉语阅读。以往研究发现，汉语阅读的注视位置受词频、预测性等因素的影响（Li, Bicknell, Liu, Wei, & Rayner, 2014； Liu,Reichle, & Li, 2015, 2016）。在汉语阅读中，视觉复杂性主要反映在笔画数的多少，而汉字的视觉复杂性会影响眼跳目标选择（王永胜等, 2018）。

研究者通过操纵双字词中首字和尾字的视觉复杂性，考察汉字的视觉复杂性对注视位置的影响。例如，孟红霞，白学军，闫国利和姚海娟（2014）操纵双字词中首字和尾字的笔画数，划分为四个水平，即首多尾多、首多尾少、首少尾多、首少尾少，考察汉字的笔画数对汉语阅读中的注视位置效应的影响。结果发现，如果首字的笔画数较多，那么读者的首个眼跳落点往往落在首字上；首字和尾字的笔画数都会对再注视概率产生影响。随后，Ma 和Li（2015）运用同样的实验方法，探讨首字和尾字在双字词词汇加工中的不同作用，结果发现，首字和尾字的笔画数均会对凝视时间产生影响，但相比之下，首字的复杂性在眼跳目标选择上更为重要。此外，读者所注视词的加工难度也会影响眼跳目标选择。研究发现，词的加工难度越小，眼跳长度越长；词的加工难度越大，眼跳长度越短（臧传丽等, 2013； Wei,Li, & Pollatsek, 2013）。基于此，本研究主要探讨汉字的笔画数对阅读中的眼跳目标选择的影响，这种影响是仅仅由视觉复杂性引起，还是由视觉复杂性导致的加工复杂性引起？

以往关于汉字视觉复杂性的研究均采用汉字为实验材料，考察视觉复杂性对汉语阅读中注视位置的影响，但是汉字的词汇信息对眼动控制的影响比较大。因此，为了排除汉字词汇信息的影响，本研究引入Landolt 范式。该范式的优势在于，排除句子的全部词汇信息（包括词频、音位结构等），仅保留词汇结构，如字母数或词汇数（Liu, Reichle, & Huang, 2015）。

Hillen 等（2013）在实验中设置正常句子、真词词列、假词词列和基线四种条件，运用“Landolt rings”（见图1）为实验基线，让被试模拟自然阅读，实验任务为从一系列的O 形字母中找出随机出现且带有缺口的形似C 形字母的“Landolt”，并报告其个数。结果发现，阅读中负责加工字形、语义和句法的脑区是有差异的。Williams 和Pollatsek（2007）采用“Landolt C”考察视觉搜索任务的潜在认知过程。结果发现，认知加工过程影响搜索任务中的眼睛运动。随后还发现，使用“Landolt C”的研究结果支持序列加工模型（Williams, Pollatsek, & Reichle, 2014）。

Liu，Reichle 等（2015）使用Landolt 范式，探讨词汇切分和词汇识别是如何影响读者眼动。为了与汉字结构更接近，研究者使用“Landolt square”代替“Landolt rings”（见图2）。研究发现，首次注视点与有多次注视的首个加工注视位置更靠近词首，单一注视点的位置更靠近词的中心。因此，Landolt 范式对于汉语阅读同样适用。

为了排除汉语词汇信息的影响，本研究选用基于韩语字母编写的符号为实验材料，保证笔画数与汉字笔画数一一对应，主要表现为横（一）和竖（丨），见图3。

基于以往研究结果，本研究的研究假设如下：对于汉语阅读中的眼跳目标选择而言，（1）如果有词汇信息和无词汇信息对其的影响无显著差异，说明汉字的笔画数对眼跳目标选择的影响是由视觉复杂性引起；（2）如果有词汇信息和无词汇信息对其的影响有显著差异，说明汉字的笔画数对眼跳目标选择的影响是由视觉复杂性导致的认知加工复杂性引起。

2 研究方法

2.1 被试

49 名非韩语或非汉语言文学专业的在校生（24 名男生, 25 名女生），年龄为18-25 岁。视力或矫正视力正常，实验前均不知道实验目的。

2.2 实验设计

采用单因素被试内实验设计，自变量为是否有词汇信息，分为有词汇信息和无词汇信息两个水平。

2.3 实验材料

实验材料包括有词汇信息材料和无词汇信息材料。

有词汇信息材料为编制的72 个汉语句子。请不参与实验的15 名大学生采用李克特七点量表进行句子通顺性评定（1 为非常不通顺, 7 为非常通顺），排除句子的通顺性对实验结果的影响。经统计检验，M = 6.71，SD = 0.41。

无词汇信息材料选取步骤如下。

首先，选取105 个韩语符号，其中63 个是带有部件“圆”（O）（见图4a）。把不带有部件“圆”的42 个改编后的符号（见图4b）分成三组，每组从3 画到16 画依次排列。每个字的笔画由简单的横（一）和竖（丨）构成，并确保每个字的部件无汉语词汇意义。请不参加正式实验的10 名大学生对每组符号是否按照视觉复杂程度的高低进行排列，确保42 个改编后的符号的视觉复杂性差异。

其次，按照所筛选的符号材料的笔画数替代有词汇信息的72 个汉语句子对应的汉字，组成72 个符号句子，即无词汇信息材料。所有带有部件“圆”（O）的韩语符号，用“方框”（□）代替“圆”（见图5）。

要求被试完成有词汇信息和无词汇信息阅读任务，每种任务包含72 个实验句和36 个填充句。在有词汇信息任务中，被试完成句子阅读后，需要回答随机呈现的阅读理解问题（共40 个），并进行“是”或“否”按键判断。在无词汇信息任务中，为了模拟自然阅读，要求被试“阅读”由改编后的符号组成的无词汇信息句子，并报告目标符号的数量，即带有“方框”（□）的符号数量。为了避免无词汇信息任务中的视觉搜索对实验结果的影响，实验句不包含目标符号，仅填充句包含1-3 个目标符号。除了首字和尾字的位置外，目标符号在填充句其它位置出现的概率相同。实验材料示例见表1。

2.4 实验仪器

EyeLink 1000 眼动仪记录被试的眼动轨迹。采样率为1000 Hz，刷新率为120 Hz，分辨率为1024 ×768 像素。眼睛与屏幕间距离为85 cm，实验刺激为30 号黑体，大小为39 × 39 像素，视角约为1.02°。

2.5 实验程序

实验采用个别施测。（1）被试坐在距离眼动仪前85 cm 的椅子上，下巴放在下巴托上，尽可能保持头部不动。（2）为保证眼动记录的精确性，水平三点校准，平均误差小于0.2°。校准完成后，向被试呈现实验指导语。（3）当被试熟悉程序后，开始正式实验。实验材料随机呈现，整个实验持续30-40 分钟。

2.6 眼动指标

表 1 实验材料示例

3 研究结果

根据如下标准删除数据：（1）删除注视时间小于80 ms 或长于800 ms 的注视点；（2）被试回答问题的正确率低于80%的句子；（3）注视点少于或等于3 个的句子；（4）3 个标准差之外的数据（梁菲菲等, 2017；王永胜等, 2018）。删除数据占总数据的8.36%。

在有词汇信息句子和无词汇信息句子的数据分析中，目标词为所有的双字词，每个汉字的笔画数作为协变量参与分析。分析跳读率和注视位置时，句中前后三个目标词的数据不参与分析。

运用基于R 语言（R Development Core Team,2014）环境下的线性混合模型（Linear Mixed Model, LMM）和lme4 数据处理包（Bates, Maechler,& Bolker, 2012）分析数据。其中，线性模型是以是否有词汇信息、笔画数以及两者之间的交互作用作为固定因素，用LMM 进行分析。

3.1 平均向前眼跳幅度

被试阅读有词汇信息句子和无词汇信息句子的平均向前眼跳幅度及其固定效应估计值见表2 和表3。

表 2 目标词的平均向前眼跳幅度（标准差）

表 3 是否有词汇信息在平均向前眼跳幅度上的固定效应估计值

被试阅读有词汇信息句子的平均向前眼跳幅度显著大于无词汇信息句子的平均向前眼跳幅度（b = -0.40, SE = 0.04, t = -10.26, p＜ 0.001）。

3.2 跳读率

被试阅读有词汇信息句子和无词汇信息句子的跳读率及其固定效应估计值见表4 和表5。

被试阅读有词汇信息句子的跳读率（M = 0.19,SE = 0.39）显著高于无词汇信息句子的跳读率（M =0.18, SE = 0.38；b = -0.39, SE = 0.19, Z = -1.99, p ＜0.05），笔画数的主效应显著（b = -0.37, SE =0.08, Z = -4.62, p ＜ 0.001），交互作用显著（b =0.89, SE = 0.15, Z = 6.12, p ＜ 0.001）。简单效应分析结果发现，在有词汇信息句子中，对多笔画汉字的跳读率更高（b=-0.0 6, SE=0.01, t=-6.1 1,p＜0.001)。

表 4 目标词的跳读率平均数（标准差）

表 5 是否有词汇信息在跳读率上的固定效应估计值

3.3 平均首次注视位置及首次注视位置分布

分析被试阅读有词汇信息句子和无词汇信息句子的注视位置，被试阅读两种任务句子的平均首次注视位置及其固定效应估计值，见表6 和表7。

2018年9月3日，2018广州国际汽车零部件及售后市场展览会(AAG)在广州保利世贸博览馆隆重启幕。本次展会是华南地区规模最大的，集商贸、交流、投资于一体的专业性汽车后市场展览会，展会规模超过10万平方米，1 300多家企业参展，开展当天有近2万全球专业观众和买家莅临现场，预计3天的展期专业观众和买家数量将达到5万人次。

表 6 目标词的平均注视位置（标准差）

表 7 是否有词汇信息在平均注视位置上的固定效应估计值

结果发现，在平均首次注视位置上，是、否有词汇信息存在显著差异。被试阅读有词汇信息句子的平均首次注视位置（M = 0.89, SE = 0.55）显著大于无词汇信息句子的平均首次注视位置（M =0.74, SE = 0.51； b = -0.23, SE = 0.04, t = -6.20, p ＜0.001），这说明，相较于无词汇信息句子，阅读有词汇信息句子时，平均首次注视位置更靠近双字词的中心位置。此外，笔画数的主效应显著（b =-0.06, SE = 0.03, t = -2.05, p ＜ 0.05），交互作用不显著（b = -0.04, SE = 0.06, t = -0.67, p ＞ 0.05）。

对落在四个区域内首次注视的百分比进行分析，不同条件下的首次注视位置分布见图6。将区域作为自变量，对是、否有词汇信息句子在每个区域中的注视百分比进行2（是否有词汇信息）×4（区域：1，2，3，4）重复测量方差分析。结果发现，区域的主效应显著，F（3, 267）= 222.06，p ＜0.001, η= 0.38。进一步分析发现，落在区域1 和区域2 的首次注视的百分比显著大于区域3 和区域4 中的百分比，ps＜0.001。这表明，被试对目标词的首个注视点大多落在词的中间偏左位置。

3.4 单次注视中的平均首次注视位置及首次注视位置分布

已有研究发现，汉语阅读中的单次注视和多次注视中的首次注视位置分布存在差异，具体为：在单次注视中，首次注视位置分布呈现二次曲线分布趋势；而在多次注视中，首次注视位置分布呈现线性趋势（白学军等, 2011； Yan, Kliegl,Richter, Nuthmann, & Shu, 2010）。因此，对不同条件下单次注视中的平均首次注视位置及其固定效应估计值进行统计分析，见表6 和表7。

结果发现，在单次注视中，阅读有词汇信息句子的平均注视位置（M = 0.96, SE = 0.54）显著大于无词汇信息句子的平均注视位置（M = 0.88, SE =0.52； b = -0.11, SE = 0.03, t = -3.33, p ＜ 0.01）。这说明，在单次注视中，相较于无词汇信息句子，阅读有词汇信息句子的平均注视位置更靠近双字词的中心。此外，笔画数的主效应不显著（b =-0.01, SE = 0.03, t = -0.27, p ＞ 0.05），交互作用显著（b = -0.16, SE = 0.07, t = -2.42, p ＜ 0.05）。简单效应分析结果发现，与有词汇信息句子相比，无词汇信息句子中的笔画数效应更大（前者平均数差异为0.01，后者平均数差异为0.03）。

对落在四个区域内单次注视中的首次注视的百分比进行分析，不同条件下的首次注视位置分布见图7。被试的注视点落在区域1、区域2、区域3 和区域4 的百分比分别为26%、30%、26%和17%。该分布为典型的二次曲线趋势，与以往拼音文字阅读和汉语阅读研究中关于单次注视位置分布趋势基本一致（McDonald & Shillcock, 2004；白学军等, 2011）。

将区域作为自变量，对是、否有词汇信息句子在每个区域中的注视百分比进行2（是否有词汇信息）× 4（区域：1，2，3，4）重复测量方差分析。结果发现，区域的主效应显著，F（3, 267）=184.44, p ＜ 0.001, η= 0.25。进一步分析发现，落在区域2 中的首次注视的百分比明显大于区域1、区域3 和区域4 中的百分比，ps ＜ 0.001。这说明在单次注视中对目标词的首个注视点更靠近词的中间位置。

3.5 多次注视中的平均首次注视位置及首次注视位置分布

多次注视中的首次注视在所有首次注视中（包含单次注视和多次注视）所占的百分比约为31.8%，其中，被试阅读有词汇信息的句子时出现再注视的比率约为18.1%，阅读无词汇信息的句子出现再注视的比率约为45.2%。由此可知，被试在阅读无词汇信息的句子时再注视的比率更高。被试阅读两种条件句子时的多次注视中的平均首次注视位置及其固定效应估计值见表6 和表7。

结果发现，在多次注视中，无论是有词汇信息句子还是无词汇信息句子，被试阅读时的平均首次注视位置没有显著差异（b = 0.01, SE = 0.07, t =0.10, p ＞ 0.05），笔画数的主效应不显著（b =0.001, SE = 0.06, t = 0.01, p ＞ 0.05）。

对落在四个区域内的首次注视的百分比进行分析，不同条件下的首次注视位置分布见图8。无论是阅读有词汇信息的句子还是无词汇信息的句子，多次注视中的首次注视位置分布趋势一致。

将区域作为自变量，对是、否有词汇信息句子在每个区域中的注视百分比进行2（是否有词汇信息）× 4（区域：1，2，3，4）重复测量方差分析。结果发现，区域的主效应显著，F（3, 267）=34.47，p ＜ 0.001，η= 0.11。进一步分析发现，落在区域1 中的首次注视的百分比（55%）明显大于区域2（26%）、区域3（12%）和区域4（7%）的百分比（ps ＜ 0.001）。这说明在多次注视中，被试对目标词的首个注视点往往落在词首。

4 讨论

4.1 是否有词汇信息对眼跳目标选择的影响

本研究采用Landolt 范式，以是否有词汇信息为自变量，笔画数为协变量，考察其对汉语阅读中眼跳目标选择的影响。结果发现，与阅读无词汇信息的句子相比，被试阅读有词汇信息的句子的跳读率更高，平均向前眼跳幅度更长。这可能是因为阅读有词汇信息的句子时，词汇信息（如词频、音位结构等）有助于被试在眼跳前的注视中获取较多信息，进而对眼跳目标的选择产生影响。这一结果与前人研究结果一致（Liu, Reichle, &Li, 2015； Williams & Pollatsek, 2007）。Liu、Reichle 和Huang（2015）运用Landolt 范式，从词汇识别和词汇切分的角度探讨阅读过程中的眼跳目标选择。研究表明，词汇的加工难度和词长影响向前眼跳幅度。词长越长，向前眼跳长度越长；词汇的加工难度越大，向前眼跳长度越短。

本研究还发现，在首次注视中，被试阅读有词汇信息句子的平均注视位置显著大于无词汇信息句子的平均注视位置。在单次注视中，与无词汇信息句子相比，被试阅读有词汇信息句子的平均注视位置更靠近词的中间位置；在多次注视中，被试无论阅读有词汇信息句子还是无词汇信息句子，平均首次注视位置没有显著差异。这说明在首次注视和单次注视上，读者阅读时的平均注视位置分布均受词汇信息的影响，但首次注视与单次注视中的平均注视位置具体受哪些词汇信息的影响有待进一步探讨。

以往研究发现，注视时间和眼跳目标选择受汉字的视觉复杂性（具体表现为笔画数）影响（Ma & Li, 2015；白学军, 李馨, 闫国利, 2015；李馨,2018；李玉刚等, 2017；孟红霞等, 2014）。将笔画数作为协变量分析发现，在跳读率和首次注视中的平均注视位置的分析中，笔画数的主效应显著；在单次注视中的平均注视位置和跳读率的分析中，笔画数与自变量（即是否有词汇信息）产生显著的交互作用。这说明笔画数对阅读中的跳读率、首次注视和单次注视中的平均注视位置产生影响。

以往研究中研究者用图形（如圆、方框）作为Landolt 范式的实验材料（Hillen et al., 2013； Liu,Reichle, & Huang, 2015； Williams et al., 2014）。本研究采用基于韩语结构编写的符号且其“笔画数”与相应的汉字笔画数一一对应，在很大程度上更贴合汉字结构特征。

4.2 汉语阅读中是否存在偏向注视位置

已有研究表明，拼音文字阅读中存在PVL 和OVP，证实拼音文字阅读的眼跳目标选择是以词为基础（Joseph et al., 2009； Radach & Kennedy,2004）。本研究发现，无论是阅读有词汇信息句子还是无词汇信息句子，被试在双字词上的平均首次注视位置分布呈现出从左往右递减趋势。

当仅有一个注视点时，平均注视位置倾向于接近词的中间位置；当有多个注视点时，平均首次注视位置倾向于落在词首，且其注视位置分布的变化趋势呈负向的线性变化。这与前人研究结果一致（白学军等, 2011； Liu, Reichle, & Li, 2015；孟红霞等, 2014； Yan et al., 2010）。

对于读者在阅读过程中选择的眼跳策略，“战略-战术”模型认为读者在阅读时会采取词间眼跳策略（O'Regan & Jacobs, 1992）。这种策略有助于读者能准确地注视每个词的OVP，但眼跳过程中产生的误差会使读者错过本应注视的目标。此时，读者如果使用词内眼跳技术（即对该词进行再注视），则能确保在单次注视时，每个词都将会在OVP 上被注视；在多次注视时，每个词都将会从不同的位置上被注视。本研究结果支持“战略-战术”模型。