APP下载

数字化时代文本阅读眼动控制模型研究

2020-11-29

科技传播 2020年9期
关键词:眼动词汇加工

21 世纪以来,面对飞速发展的技术手段和多元化的欣赏品味,信息和知识载体的样式及其传播方式都发生了显著变化,人们借助手机、电脑、电子阅读器等终端工具在各种新兴数字出版平台浏览信息和获取知识,这已成为数字化时代的一种阅读常态。无论是“读书”还是“读屏”,看似简单的阅读行为实则是一个非常复杂的认知加工过程;在阅读过程中,视觉信息的获取通过眼睛运动来实现,眼动不仅是一种外在的行为表现,同时也受多种认知因素的影响,是反映阅读过程非常重要的指示器。眼动技术能够对阅读过程进行实时记录,提供了一种比命名法和词汇判断法等认知加工方法更自然、更有效且干扰更小的研究手段,因此,眼动记录技术近些年来被越来越多的国内外研究者应用到阅读研究中。

1 阅读中的眼动现象

关于阅读的眼动研究迄今已有百余年历史,事实上,早在19 世纪末,法国学者Lamare、Jaral以及Huey 就开始以眼动为指标探讨认知过程[1]。1975 年,美国著名学者Rayner 在研究中将读者的眼动轨迹进行记录,以此来探讨语言的认知加工过程[2]。在此之后,研究者们对眼动研究的范式和手段做了大量的补充和更新,在阅读认知研究领域取得了丰硕的研究成果。国内的阅读眼动研究相对来说起步较晚,但随着眼动记录技术的不断进步、眼动数据分析技术的快速发展以及心理语言学相关研究的不断深入,近20 多年来,眼动技术开始被大量地应用到文本阅读研究中。大量研究表明,在文本阅读的过程中,读者总是试图通过不断移动眼睛在文本上的位置,以此来获取必要的信息,进而辨识字词,理解文本意义。眼动记录技术可以实时追踪阅读过程中读者的眼动轨迹,获得阅读加工过程的精确眼动数据,提供诸如读者注视了哪里、注视了多久等大量信息,从而揭示读者对文本内容加工的难易程度以及读者对于文本的理解程度,在此基础上进一步研究文本阅读中的认知加工现象。

从眼球的生理构造来看,读者在阅读文本时取决于3 个区域:即视网膜中视觉最敏锐的中央凹区域(the fovea centralis)、视觉敏锐度较低的副中央凹区域(the parafovea belt)、以及视觉敏锐度更差的外周视觉区(the perifovea outer region)。由于眼睛的注视范围有限,读者在阅读时不得不通过移动眼球让阅读内容进入中央凹视觉区,以完成正常的阅读和理解。就主观感受而言,人们往往感觉眼睛的注视点在阅读过程中是在文本材料上平滑移动的。而事实并非如此,在阅读过程中,眼睛会在注视点之间产生一系列快速而短暂的跳跃式运动。眼跳(saccade)所需时间的长短与眼跳的距离呈正相关,眼跳行为受中枢神经系统控制,其距离存在很大的变异性。在两次眼跳之间,眼睛会保持大约250ms 左右的短暂停留,这种相对静止的状态被称为注视(fixation)。因为眼跳过程中视觉是被抑制的,阅读中信息的获得主要是在注视期间完成,但注视的时间同样也存在很大的变异性。在阅读过程中,多数眼跳的方向都是从已知区域朝向未知区域,但有些时候,眼跳会朝向相反的方向,对已阅读过的信息重新进行加工,这种与眼球移动相反方向的眼跳称为回视(regression)。回视大多数是针对紧邻的前一个词,但当理解不充分时,长距离的回视会指向较早出现的词语上。简单来说,眼睛在阅读的过程中并不是连续地向前移动,读者借助两次眼跳之间的短暂注视获取信息,而文本的不同语种、读者个体能力的差异以及文本的加工难度等方面都会成为影响注视点位置、注视持续时间、眼跳距离及眼跳方向的重要因素。

在正常的阅读中,眼睛的移动使文本进入到中央凹视觉区中进行有效的加工,但词之间的注视时间和眼跳幅度却存在很大的波动。在阅读的眼动研究中,尽管眼动的分析指标非常复杂,但总的来看,阅读眼动控制主要被用来解释眼动中的两个基础问题:其一是决定读者何时开始移动眼睛的因素有哪些(when),即阅读中与眼动有关的时间维度指标;其二是决定读者的眼睛移向何处的因素有哪些(where),即阅读中与眼动有关的空间维度指标。这两个问题构成了阅读眼动控制研究的基本内容。注视时间主要受阅读加工过程的控制,而眼跳则主要取决于眼动限制和文本视觉特征。

在阅读认知领域的研究中,为了试图解释阅读中眼动过程与读者心理活动过程的对应关系,研究者们运用计算机模拟技术在大量数据的基础上整合已有的实验证据,通过研究阅读中眼动控制机制,为解释眼动与认知加工的关系提供了理论框架。在各种眼动控制认知加工模型中,E-Z 读者(E-Z reader)模型和SWIFT(Saccade-generation with inhibition by foveal targets)模型是被广泛接受的最有影响的两种计算模型。这些模型并非一成不变的,为了更加充分解释阅读过程中的词汇识别、认知加工、注意资源分配和眼动控制,每个模型都会随着研究的不断深入去逐渐修改和完善理论框架和计算公式。

2 文本阅读中词切分的依据

阅读是从文字材料中获取信息的一种认知活动,这一过程从辨识字词开始,到理解篇章意义截止,而词汇识别无疑是这中间最为关键的一环。进行词汇识别之前,读者首先要识别文本中的语言符号,并将其组合成词、词组、短语和句子等不同层次的语言单位,在明确各语言单位之间关系的基础上理解文本所要表达的意义。词切分(word segmentation)的过程也就是语言符号组织的过程,对文本中词切分的研究有助于理解阅读的本质与规律,也对阅读眼动控制模型的构建有重要意义。

对于大多数的拼音文字(如英语、德语等)而言,其书写形式都有一个显著的特点,即词与词之间有空格作为界限。例如,当看到“Das ist eine gute Idee”这句话时,即便文本中有个别不认识的词,读者凭借经验也会很容易判断这句话由5 个单词组成。因此,词间空格在拼音文本的阅读中为读者提供了一种清晰自然的物理线索,在很大程度上促进了词汇识别,具有标记词边界的作用,提高了词汇加工的速度。与此同时,词间空格也有助于眼跳目标的选择和确定[3]。

与拼音文字不同,中文作为一种表意文字以“字”为基本的书写单位,除了用极少的标点符号来标注停顿外,所有方块汉字有着相同的间隔,没有明确的视觉标记来表示语义的停顿和划分。拼音文字有不同的词长,德语中“Sonne”和“Erscheinung”因字母长度不同而明显具有不同的形状;而在汉语中,无论是笔画数差异巨大的“一”和“赢”,还是构成部件上差异巨大的“火”和“燚”,它们在文本的空间分布上是一致的,即所占的词长是相同的。换言之,中文的词间空间长度与词内空间长度是相同的。

根据词的定义可知,词是汉语中最小的意义单位。但对于大多数以汉语为母语的学习者而言,“词”的概念往往是朦胧的,甚至在语言学界对词的界定都存在不小的争议。在语言学学者所做的一项研究中,母语汉语被试者对“词”的认同率只有70%左右[4]。同样,由于缺少明显的边界信息,经常导致待切分文本中的文字存在多个切分结果,此类歧义的存在加大了中文分词的难度。例如,在“网球拍卖光了”这句话中,由于缺乏词长线索,可以将其切分为“网球/拍卖/光了”,也可将其切分为“网球拍/卖/光了”。在两种情况下,句子所表达的意义完全不同。在对这种句子进行认知加工时,读者明显需要花费更多的时间。

就语法知识而言,汉语词汇没有明显的形态变化,单复数、时态,词性等在英语文本中显而易见的形态变化在汉语中缺失,对此类词的语法知识的识别高度依赖于语境。尽管如此,所有这些词切分上的特征并未影响日常的汉语阅读,可见汉语中有着与拼音文字中词间空格起相同作用的特殊的词切分依据[5]。汉语这些独有的特点使研究者开始重新思考阅读眼动控制模型的适用性,即之前的眼动控制模型大多是建立在相关的拼音文字研究数据之上,那么,对于中文这种特殊的文本材料,眼动控制的模型是否仍然适用?

3 阅读眼动控制模型

正如前文所言,研究者们为了解读文本阅读中词切分与眼动行为之间的关系,迄今为止已经建立了多种模型。这些模型深入探讨了阅读中的语言因素和眼动生理控制因素之间的相互作用,为解释人类阅读过程中的基本问题提供了理论框架。

早期的眼动控制模型分为眼球运动模型(the oculomotor model)和认知加工模型(the processing model)两类。眼球运动模型考察阅读中眼动现象的主要焦点在于视觉和物理属性的角度,其支持者要么是将低水平的视觉线索视作决定眼动行为的关键因素,要么认为眼跳系统的自身特点是影响眼动的关键因素,而高水平的认知词汇加工只能起到调节作用。与此相对,认知加工模型的支持者则认为是认知加工驱动着阅读中的眼动行为。此外,认知加工模型将词看作文字识别过程与眼动控制过程的基本线索,词汇加工不仅能够决定或影响眼跳何时发动,还能影响眼跳落点。综上可知,眼球运动和认知加工两种模型的争论点在于:认知词汇加工过程是否是导致眼动的原因?以及认知词汇加工过程在多大程度上影响眼睛运动?随着研究的不断深入,在探讨阅读过程中眼动机制的问题上,越来越多的证据支持认知加工模型的合理性[6]。

在拼音文字的文本阅读研究中,根据对视觉注意分配观点的不同,目前基于认知加工理论的眼动控制模型可分为两类:即支持视觉注意序列分配的E-Z 读者模型和支持视觉注意平行分配的SWIFT 模型。两者都试图以词作为文本阅读中的基本加工单元来解释眼动行为的特点,不同的是,E-Z 读者模型主张序列加工(serial lexical processing)。该模型支持者认为,在早期的视觉加工阶段,视网膜开始获取视觉特征,随后读者在注意资源的参与下对加工词视觉信息进行编码,并在此基础上进行随后的词汇加工。在认知加工过程中,促使注意移动到词上的信号和促使眼睛移动到词上的信号并非同一个。在此基础上,词汇编码的过程被分为两个不同的激活阶段:第一阶段(L1)释放信号给眼动系统,将眼睛转移到下一个词,第二阶段(L2)释放信号给注意系统,将注意转移到下一个词。但这两个阶段并不是完全独立的,而是在时间上有所重合。简言之,读者是按照序列的方式对阅读知觉广度内的词依次进行加工,注意资源会在当前词加工完成之后序列性地转换到下一个加工词上。

SWIFT 模型则主张平行加工(parallel lexical processing),该模型主要采用词汇激活(Lexical Activity)的概念描述词汇加工的实时状态。研究者认为,在阅读知觉广度内的所有词汇加工呈空间分布,词汇所组成的激活性质的集合的值随着时间的推移实时地发生改变。阅读知觉广度内每个词被分配的注意并不均等,换言之,注意资源的分配是一个动态变化的过程,词的加工水平和加工速度与注意资源的分配成正比。也就是说,读者对阅读知觉广度内所有的词并非机械地按照既定序列依次加工,而是分布式地进行平行加工,注意可同时分布在所有被加工词上。词汇加工难度是影响词汇激活状态的参数,所有词汇当前相对的激活状态影响当前注视点的持续时间和下一眼跳的落点位置。SWIFT 模型虽然与E-Z 读者模型基于不同的概念假设,但也采用了一些相似的概念,例如词汇加工的阶段性,以及词频和预测性效应对词汇加工难度的影响。

4 结语

当前主流的眼动控制模型都是基于拼音文字阅读研究的基础上产生的,而与之对应的中文阅读眼动控制模型还处在发展阶段。尽管拼音文字的眼动控制模型是建立在词的基础之上的,中文阅读的相关研究也证实了词加工的整体性,但上述模型能否用来解读中文阅读中的眼动行为和文字识别加工过程还有待大量研究数据的支持。事实上,由于中文存在不同于拼音文字的诸多特性,以及汉字成词的复杂性和多样性,在未来研究中都有必要在考虑以词为基本加工单元的同时,也将单个汉字的加工考虑在内,在此基础上构建适合于中文阅读的眼动认知加工控制模型,从而进一步解释阅读的本质和规律。

猜你喜欢

眼动词汇加工
认识“超加工食品”
后期加工
基于眼动的驾驶员危险认知
基于ssVEP与眼动追踪的混合型并行脑机接口研究
本刊可直接用缩写的常用词汇
一些常用词汇可直接用缩写
本刊可直接用缩写的常用词汇
菱的简易加工几法
国外翻译过程实证研究中的眼动跟踪方法述评
看,塑料制品是这么加工来的