APP下载

花园幽径现象理解折返性的数据结构分析

2015-04-25杜家利于屏方

中文信息学报 2015年1期
关键词:幽径歧义数据结构

杜家利, 于屏方

(1. 广东外语外贸大学 词典中心,广东 广州 510420;2. 南京大学 外国语学院,江苏 南京 210093;3. 广东外语外贸大学 中国语言文化学院,广东 广州 510420;4. 中国社会科学院 语言研究所,北京 100732)



花园幽径现象理解折返性的数据结构分析

杜家利1,2, 于屏方3,4

(1. 广东外语外贸大学 词典中心,广东 广州 510420;2. 南京大学 外国语学院,江苏 南京 210093;3. 广东外语外贸大学 中国语言文化学院,广东 广州 510420;4. 中国社会科学院 语言研究所,北京 100732)

该文讨论了花园幽径现象(GPP)的数据结构。GPP数据结构呈现理解折返的认知树形结构,不同于语法前状态的词集合结构、句子理解的语法线性结构和语义匹配多对多的歧义图状结构。GPP结构的显著性特征如下:(1)GPP理解初期,数据结构呈线性特征;(2)GPP理解中期, 语义触发点迫使原解码模式被推翻,数据结构表现为词集合结构;(3)GPP理解末期, 行进式错位导致回溯形成,解码结构最终呈现树形结构;(4)GPP动态解码融合了除歧义图状结构之外的两种结构特征,语义触发语的激活产生额外认知负担。GPP树形结构与歧义图状结构的不同从数据结构角度证实了两种语法现象的迥异,从而为计算语言学解读GPP提供了理论支撑。

花园幽径现象;数据结构;认知;折返性;语义触发

1 引言

花园幽径现象(Garden Path Phenomenon,GPP)是初始结构被迫调整引发语义折返的特殊认知现象,其得名于解码过程中的迷途知返,就好像在花园中走入了一条不能通达的幽径,径尽路绝,绝而后返。其先期理解貌通而实不畅。在语义触发点出现后,解码者被迫返回到原来节点重新进行结构重组以实现解码。此现象曾引发学者从语法[1-4]、语义[5-7]、语用[8-9]、心理[10-13]、信息处理[14-16]、认知[17-21]等其他角度[22-25]进行研究。GPP先扬后抑的理解折返特性蕴涵结构性回溯,可借助数据结构知识进行解构。

数据结构是指系统中数据元素间不同关系的集合,包括离散关系的集合结构、具有对应关系的线性结构、多对多并行的图状结构、一对多单向解读的树形结构。这4种数据结构恰好和语法前状态词集合的解读、句法关系的线性解读、语义匹配多对多的歧义解读、GPP回溯性结构解读具有对应关系。本文借助数据结构的不同形式来讨论语言结构的多样性。为便于直观有效地比较各种数据结构解码特点,例句解读采用美国斯坦福大学自然语言处理中心的Stanford Parser作为解析器(http://nlp.stanford.edu/software)。

2 非花园幽径现象的数据结构分析

非GPP的数据结构包括词集合结构(图1)、语法线性结构和歧义图状结构。前一类因不符合句法关系而属于词汇范畴,后两类则属于句法和语义范畴。

2.1 集合结构分析

语法前状态的词集合结构是指元素之间除了同属于一个集合外,别无其他关系。

图1 词集合结构

下面例句所形成的关系都是词集合结构关系,“*”表示此例句不被语法接受。我们利用Stanford Parser在线解析,并将具体代码和解析结构表示如下:

The/DT; new/JJ; singers/NNS; song/NN;old/JJ; women/NNS; boat/NN; building/NN; window/NN; sun/NN。

例1 *The new singers the song.

(ROOT

(NP

(NP (DT The) (JJ new) (NNS singers))

(NP (DT the) (NN song))))

例 2 *The old women the boat.

(ROOT

(NP

(NP (DT The) (JJ old) (NNS women))

(NP (DT the) (NN boat))))

例 3 *The building window the sun.

(ROOT

(NP

(NP (DT The) (NN building) (NN window))

(NP (DT the) (NN sun))))

如上所示,解码均未成功,例句最终形成的都是NP结构形式。此类离合结构因不符合语法,处于无关联的分散状态,不能形成正确有效的句法生成式。例1 [The new singers]NP+[the song]NP,例2 [The old women]NP+[the boat]NP,例3[The building window]NP+[the sun]NP各认知元素相对独立,难以形成完整语义链条。此集合结构是语法前状态的词汇累积,不属于句法范畴。

2.2 线性结构分析

与词集合状态不同,语法线性结构符合语言规范。句子理解过程中各认知结构元素形成一对一、如同线性排列的关系。

在句法分析时,线性结构中的成分具有排列的唯一性,同一元素在句法上不可能同时具有多种句法功能。如图2所示,认知解码顺序是1-2-3-4-5。集合结构中的例句经过调整可形成语法线性结构。

图2 语法线性结构

The/DT; new/JJ; singers/NNS; sing/VBP; the/DT; songs/NNS; old/JJ; women/NNS; sail/VBP; a/DT; boat/NN; building/NN; window/NN; reflects/VBZ; sun/NN。

例 4 The new singers sing the songs.

(ROOT

(S

(NP (DT The) (JJ new) (NNS singers))

(VP (VBP sing)

(NP (DT the) (NNS songs)))))

例 5 The old women sail a boat.

(ROOT

(S

(NP (DT The) (JJ old) (NNS women))

(VP (VBP sail)

(NP (DT a) (NN boat)))))

例 6 The building window reflects the sun.

(ROOT

(S

(NP (DT The) (NN building) (NN window))

(VP (VBZ reflects)

(NP (DT the) (NN sun)))))

如上所示,例4—6所形成的解析结果均为表示句子终结的S, 这表明系统认定这些句子符合语法条件且能够成功解读为完整句。例4中的[The new singers] NP+[[sing]VBP+[the songs]NP]VP,例5中的[The old women]NP+[[sail]VBP+[a boat]NP]VP, 例6中的[The building window] NP+[[reflects]VBZ+[the sun]NP]VP分别充当各自的SVO句法功能,先后排列的认知元素具有唯一的句法功能,各部分语法结构和位置顺序具有清晰性和唯一性,线性理解特征明显。

我们可依据以上信息构建一个扩充转移网络(Augmented Transition Network,ATN)来解码例4。“PUSH”表示下推至相关子网络;“POP”表示上托回上一级网络;“SETR”表示把相关信息送入寄存器;“I”表示解码复杂度为一级且为初始级。“A-1”表示编号为1的弧(Arc)。

表1 线性结构的解码算法

按照表1和图3(见下页),例4解码共需要16步,涉及10个相关的解码弧,具体算法如下:

图3 线性结构的扩充转移网络

1. Arc-1, 系统S主网络试图解析NP,根据知识库信息将下推至NP子网络;

2. Arc-4,NP子网络启动,解析Det成功,将结果送入寄存器;

3. Arc-7,解析Adj成功,将结果送入寄存器;

4. Arc-5,解析N成功,将结果送入寄存器;

5. Arc-6,解析NP成功,将结果上托回S主网络;

6. Arc-1,S主网络将NP结果整合后送入寄存器;

7. Arc-2,S主网络尝试解析VP并根据知识库信息将VP下推至VP子网络;

8. Arc-8,VP子网络启动,解析V成功,将结果送入寄存器;

9. Arc-9,VP子网络试图解析NP,但在第二层的VP子网络无法直接解析,遂下推至第三层的NP子网络进行解析;

10. Arc-4,第三层NP子网络启动,解析Det成功,将结果送入寄存器;

11. Arc-5,解析N成功,将结果送入寄存器;

12. Arc-6,第三层NP子网络NP解析成功,上托回第二层VP子网络;

13. Arc-9,NP解析结果送入寄存器;

14. Arc-10,VP子网络成功解析,上托回S主网络;

15. Arc-2,S主网络将VP解析结果送入寄存器;

16. Arc-3,S主网络完成解析,将S存入寄存器;系统解码成功。

以上算法显示,该句解码共需要3个网络: S主网络、NP子网络和VP子网络。其中NP子网络分别在S主网络和VP子网络中两次被调用,这使得该句解码复杂度达到III级。

2.3 图状结构分析

与语法线性结构中各元素一一对应关系不同,歧义图状结构中的各元素可以是多多相对的关系,无论选择哪种语义对应关系均能实现认知解读,也就是说认知结构中的认知元素在语义匹配多对多的歧义图状结构中具有多对多的语义对应关系。结构如图4所示。

图4 歧义图状结构

图中的认知元素具有多重释义,无论节点扩展方向指向哪里均可实现认知解码,只是意义表达不同而已。请见例7。

例7 Failing student looked hard.

具有两种语法功能: 动名词Gerund (Grd) 和形容词Adj。前者在语法中居于原型地位,与搭配具有较高概率。的形容词用法类似,英语LDOCE词典中解释为:

也各自具有实义动词(intransitive)和系动词(linking verb),以及形容词(adj)和副词(adv)两种语法意义。这样,例7元素多维语义的自由搭配会产生图状数据结构。

在Stanford Parser中,概率高低是取词依据,所以在所有图状结构中,概率最高的词义将得到凸现。

(ROOT

(S

(NP (NN Failing) (NN student))

(VP (VBD looked)

(ADJP (JJ hard)))))

如上所示,Stanford Parser默认为动名词(即Grd),为系动词,为形容词,这种选择是由系统概率所决定的。这种解码与其他三种较低概率的语义选项构成语义图状结构。CFG(Context Free Grammar)语法如下(共15行):

G={Vn,Vt,S,P}

Vn={S,NP,VP,Adj,Grd,V,N,Adv}

Vt={failing, student, looked, hard}

S=S

P:

表2 多维语义选项的歧义图状结构

本句的理解具有多重性,主要体现在failing和hard的意义多维性上。Failing可以作为形容词(Adj)也可以作为动名词(Grd)两种状态存在,hard也可以具有形容词(Adj)和副词(Adv)两种状态。所以,两个不确定的语法点相互排列组合就形成4种意义完全不同的解释。这4个句子S1/S2/S3/S4的状态可以通过下列语法进行分析。

如上面语法所示,形容词和名词可以形成名词词组,Failing (adj) student 符合该语法规则因此可以生成正确的NP生成式。在与具有歧义的hard进行匹配时,hard的形容词状态和副词状态的双重语法特性形成了能构筑两个不同意义的解码程序。S1的解码程序是f-h-b-i-f-d-a。S2的解码程序是f-h-b-i-j-e-a。两程序的不同来源于对hard词性选择的不同。两种选择都符合解码条件,只是生成的句义不同: “落榜生看来是难的”(S1);“落榜生似乎很努力”(S2)。

同样,Failing (Grd) student中,动名词Grd和名词N可以形成名词词组NP。这样作为动名词用法的failing与具有形容词和副词双重语法功能的hard便形成两个新的句义,其各自的解码途径也迥异。S3的解码程序为g-h-c-i-f-d-a, 意为“让学生落榜看来是难的”。S4的解码程序为g-h-c-i-j-e-a, 意为“让学生落榜这件事似乎干得很努力”。

由上面分析可知,在上述的CFG语法中,failing具有(f)和(g)的双重语法功能,因此NP生成可参照(b)和(c)的规则,具有歧义性。hard具有(f)和(j)的双重语法功能,VP生成也具有歧义: 既可以参照(d)也可以参照(e)的规则。这种双歧义的搭配就形成了四种不同句义解读。

词汇语法功能的多样性和生成规则的非唯一性决定了语法生成式的多样性,导致歧义语义产生。歧义特性在数据结构上对应的是多对多的图状结构(图5)。

图5 “Failing student looked hard”的数据结构

为了更直观地分析歧义产生的图状结构,可构建一个ATN来实例分析语义多维性。

该网络由主网络S、子网络NP和VP组成,共涉及11个转移弧。歧义出现在弧4/弧5,弧8/弧10。由此产生的解码算法列表如下:

表3 图状结构的解码算法

图6 图状结构扩充转移网络

算法共由11步组成,在不考虑概率的情形下生成2×2的矩阵,对应4种不同语义解释。两个歧义点分别出现在第2步对Adj和Grd、以及第8步对Adj和Adv的选择上。具体算法如下:

1. Arc-1, 主网络首先对NP解码,根据知识库信息将下推至NP子网络;

2. Arc-4/ Arc-5, NP子网络启动,CFG语法中的Adj和Grd选择均能通过语法规则,第一次歧义点出现;子网络任意选择其中之一作为解码结果送入寄存器;

3. Arc-6,将解码为N后送入寄存器;

4. Arc-7, NP解码成功,上托回主网络;

5. Arc-1,主网络将返回的NP解码信息送入寄存器;

6. Arc-2,主网络开始解码VP并下推至VP子网络;

7. Arc-9,VP子网络启动,V得到解码,寄存器保存结果;

8. Arc-8/ Arc-10, 第二个歧义点出现,子网络不论选择Arc-8或者Arc-10均能通过CFG语法规则,遂产生两个不同的语义取向;

9. Arc-11, VP解码成功并上托回S主网络;

10. Arc-2, 主网络将VP解码结果送入寄存器;

11. Arc-3, 寄存器中第一个和第二个歧义点排列组合产生2×2的语义矩阵,可成功生成四种解码结果;系统解码成功。

以上分析可知,语法线性结构和歧义图状结构的非GPP结构都具有非折返的单向性特点,系统不需要回溯,符合语法的选择都可以解码成功,不存在被迫中止的休克现象。

GPP结构与前面3种结构既有相同之处也有不同之处,这些异同分别出现在解码的不同阶段,最终形成的数据结构表现为树形结构。

3 花园幽径现象的数据结构分析

GPP理解折返性的树形结构是指结构中的元素存在一对多的数据关系,当其中的一种关系作为认知原型进行缺省解读时,就好像由根向节点进行扩展,失败后的解码模式被迫顺原路返回到根,再顺着下一个节点进行解读,直到结构中的元素得到正确匹配。其结构如图7所示。

图7 理解折返的树形结构

在图7中,设定根元素具有一对三的认知关系,而且正确解读的认知项是最右侧下方的10号,那么解码顺序是: 1-2-3-3-2-1-4-5-6-6-5-4-1-7-8-9-10。由此可见GPP认知解码具有折返性: “3-2-1”和“6-5-4-1”的出现表明在解码完成前经历了两次回溯性折返。这种对前期理解否定之否定的折返性过程具有程序上的可验证性。从数据结构角度分析,解码初期(即1-2-3和1-4-5-6)具有线性结构特征,系统解码按照知识库中原型信息(即概率较高信息)顺序解读;解码中期(即3-2-1和6-5-4-1)具有集合结构特征。系统在语义触发点(即3和6)出现后,原来的解码模式被打破,顺序解读的结果在寄存器中不再是按照语法规则排序的线性结构而是呈现游离的集合状态;解码后期,系统参照回溯信息重新调整解码策略,放弃原型的高概率解码模式,启用低概率信息,解码成功的数据结构与前期解码结构共同组成树形数据结构。下面以实例解读GP句(Garden Path Sentence)的数据结构分析。

例8 The new record the song.

3.1 GPP解码初期的线性结构分析

在Stanford Parser中,解析器是按照概率高低进行解码的,高概率的原型信息首先被系统解读。具体信息如下:

The/DT; new/JJ; record/NN; song/NN;

(ROOT

(NP

(NP (DT The) (JJ new) (NN record))

(NP (DT the) (NN song))))

解码初期,系统默认record为名词,对NP和NP的各自解读形成的数据结构就是线性结构。由于生成结构NP+NP不符合语法规则,已形成的线性结构被系统打破,呈现为游离的集合结构。

3.2 GPP解码中期的集合结构分析

解码中期,线性结构NP+NP模式被打破,句子元素得到释放。系统根据知识库知识重新解码。这些游离出来的句子元素之间不再是按照语法规则组成的有序排列,而变成了无序、动态的集合结构。这种结构随着低概率VP的组配成功宣告终结。

无序集合结构向再次有序的线性结构(后线性结构)的过渡,使系统产生回溯。

3.3 GPP解码末期的树形结构分析

解码末期,完成了由名词向动词释义的转变,数据结构也形成了“线性结构——集合结构——后线性结构”的树形结构轨迹图。

G={Vn,Vt,S,P}

Vn={S,NP,VP,Det,Adj,V,N}

Vt={the new record song}

S=S

P:

Processing Procedure(Bottom-Up)

1: The new record the song

SUCCESS

解码可按照树形图结构进行解释,其正确的认知顺序为: 1-2(f)-3(g)-4(h)-5(d)-6(f)-7(h)-8(c)-8(c)-7(h)-6(f)-5(d)-4(h)-3(g)-9(g)-10(b)-11(i)-12(f)-13(h)-14(c)-15(e)-16(a)。这样,在规则3(g)-9(g)中,因为涉及record名词和动词同形的选择而成为认知折返的根,由其扩展出的树形节点包括名词解释的节点3(g)-4(h)-5(d)-6(f)-7(h)-8(c)和动词解释节点9(g)-10(b)-11(i)-12(f)-13(h)-14(c)-15(e)-16(a)。两者在形成过程中的数据结构都是线性结构,如图8所示。

图8 “The new record the song”的数据结构

8(c)不能形成正确的句法生成式,作为线性结构的终端,该点成为认知顿悟的语义触发点。由8(c)

向3(g)的逐步回溯,即8(c)-7(h)-6(f)-5(d)-4(h)-3(g)就打破原来生成的线性结构,并游离出句子元素,这个过程产生了GPP的理解折返性。

游离元素基于概率的构成角色使其具有名词原型义,而其功能角色又使其具有动词实践义,激活区的取向决定认知解码的导向。缺乏低概率统计信息的Stanford Parser无法解读例8,所以在解析结果中产生的是NP+NP模式而不是成功解读的S模式,这也是基于统计的解析器在获取较高概率信息的同时所付出的代价: 系统无法解读低概率规则形成的句法生成式。我们可根据CFG语法规则构建一个ATN,更好地理解GPP折返时树形结构生成全貌,如图9所示。

图9 树形结构的扩充转移网络

例8树形结构ATN包括S主网络、NP子网络和VP子网络,涉及11个弧。以理解折返性回溯(backtracking)为主要特征的解码算法表如表4所示。

表4 树形结构的解码算法

续表

ATN解码算法共包括回溯在内的22步。第1—7步,形成的是基于高概率解码的线性结构。回溯出现时,原结构被打破,游离的句子元素构成集合结构。第8—22步,基于低概率解码的后线性结构形成。综合来说,例8中理解折返的动态数据结构是蕴涵“线性结构——集合结构——后线性结构”的树形结构轨迹图。

4 讨论

从语法理论角度分析,歧义句和花园幽径句都涉及结构中部分成分的局部歧义。前者允许多种结构胜出而不折返;后者往往是低频次选结构颠覆高频优选结构后在某个解读不通的触发点上折返后胜出,具有排他性。

从线性结构、图状结构和树形结构的解码算法可以看出: (1)从复杂度角度看,歧义句解码复杂度是II级,普通句和花园幽径句的复杂度是III级,这说明歧义句具有多重理解的可能,不论哪种解码方式均可获得成功,所以,单纯从句法角度来说解码较为简单;(2)从解码算法角度看,歧义句、普通句和花园幽径句涉及算法步骤分别是11、16和22,后两者虽具有相同的复杂度,但后者解码涉及的算法步骤较前者多,这说明花园幽径句因蕴涵理解折返特性,解码最困难。

5 结语

花园幽径现象是具有语义触发机制的认知现象,理解初期产生行进式错位并适时折返,形成解码模式的否定之否定。花园幽径现象的认知数据结构,不同于语法前状态的词集合结构、句子理解的语法线性结构和语义匹配多对多的歧义图状结构,是具有理解折返的认知树形结构。其动态过程蕴涵“线性结构——集合结构——后线性结构”。通过对GPP程序分析和歧义多对多认知匹配的对比,本文以基于ATN的实例验证了GPP的非歧义性在于其回溯性结构的存在。

致谢 感谢英国伯明翰大学Wolfgang Teubert教授和教育部语言文字应用所博士生导师冯志伟教授的指正。

[1] Bever T G. The cognitive basis for linguistic structures[A]//Hayes, J. R. (ed.), Cognition and the Development of Language. New York: John Wiley and Sons, 1970: 279-352.

[2] Pritchett B L. Garden path phenomena and the grammatical basis of language processing[J]. Language, 1988,64: 539-576.

[3] Häussler J, Bader M. The assembly and disassembly of determiner phrases: Minimality is needed, but not sufficient[J]. Lingua, 2009, 119(10): 1560-1580.

[4] Malsburg T, Vasishth S. What is the scanpath signature of syntactic reanalysis?[J].Journal of Memory and Language, 2011, 65(2): 109-127.

[5] Jin Y H. Semantic analysis of Chinese garden-path sentences[C]//Proceedings of the Fifth SIGHAN Workshop on Chinese Language Processing, 2006,7: 33-39.

[6] Christianson K, Hollingworth A, Halliwell J, et al. Thematic roles assigned along the garden path linger[J]. Cognitive Psychology, 2001,42: 368-407.

[7] Wilson M P, Garnsey S M. Making simple sentences hard: Verb bias effects in simple direct object sentences[J]. Journal of Memory and Language, 2009, 60(3): 368-392.

[8] Foss D J, Jenkins C M. Some effects of context on the comprehension of ambiguous sentences[J]. Journal of Verbal Learning and Verbal Behavior, 1973,12: 577.

[9] Bailey K G D, Ferreira F. Disfluencies affect the parsing of garden-path sentences[J]. Journal of Memory and Language, 2003,49: 183-200.

[10] Bader M, Haussler J. Resolving number ambiguities during language comprehension[J]. Journal of Memory and Language, 2009,61(3): 352-373.

[11] Patson N D, et al. Lingering misinterpretations in garden-path sentences: Evidence from a paraphrasing task[J]. Journal of Experimental Psychology: Learning, Memory, and Cognition, 2009, 35(1), 280-285.

[12] 杜家利,于屏方. 花园幽径现象顿悟性的认知解读[J]. 外语与外语教学,2011,6: 26-29.

[13] Choi Y, Trueswell J C. Children’s (in)ability to recover from garden paths in a verb-final language: Evidence for developing control in sentence processing[J]. Journal of Experimental Child Psychology, 2010, 106(1):41-61.

[14] 冯志伟. 花园幽径句的自动分析算法[J]. 当代语言学, 2003,4: 339-349.

[15] Yu P F, Du J L. Automatic analysis of textual garden path phenomenon: A computational perspective[J]. Journal of Communication and Computer, 2008, 5 (10): 58-65.

[16] 杜家利, 于屏方. 花园路径现象认知解读的程序化特性分析[J]. 计算机工程与应用, 2011,47 (21): 5-9.

[17] Malaia E, Wilbur R B, Weber-Fox C. ERP evidence for telicity effects on syntactic processing in garden-path sentences[J]. Brain and Language, 2009, 108(3):145-158.

[18] McMurray B, Tanenhaus M K, Aslin R N. Within-category VOT affects recovery from "lexical" garden-paths: Evidence against phoneme-level inhibition[J]. Journal of Memory and Language, 2009, 60(1): 65-91.

[19] O’Rourke P L, Petten C V. Morphological agreement at a distance: Dissociation between early and late components of the event-related brain potential[J]. Brain Research, 2011, 1392(5): 62-79.

[20] Staub A. Eye movements and processing difficulty in object relative clauses[J]. Cognition, 2010, 116(1): 71-86.

[21] Christensen K R. Syntactic reconstruction and reanalysis, semantic dead ends, and prefrontal cortex[J]. Brain and Cognition, 2010, 73(1): 41-50.

[22] 于屏方, 杜家利. 良构子串表在自然语言处理中的程序化应用: 以花园幽径句为例[J]. 中文信息学报, 2012, 26(5): 107-113.

[23] 宋艳雪, 张绍武, 林鸿飞. 基于语境歧义词的句子情感倾向性分析[J]. 中文信息学报, 2012, 26(3): 38-43.

[24] 张仰森, 黄改娟, 苏文杰. 基于隐最大熵原理的汉语词义消歧方法[J]. 中文信息学报, 2012, 26(3): 72-78.

[25] 张禄彭,易绵竹,周云. 中文歧义研究25年——以《中文信息学报》论文为例[J]. 中文信息学报,2012, 26(4): 73-84.

Towards Data Structure Analysis of Half-Returned Feature of Understanding Garden Path Phenomenon

DU Jiali1,2, YU Pingfang3,4

(1. Lexicographical Research Center, Guangdong University of Foreign Studies, Guangzhou, Guangdong 510420, China;2. School of Foreign Studies, Nanjing University, Nanjing, Jiangsu 210093, China;3. Faculty of Chinese Language and Culture, Guangdong University of Foreign Studies, Guangzhou, Guangdong 510420, China;4. Institute of Linguistics, Chinese Academy of Social Sciences, Beijing 100732, China)

This paper discusses data structure of garden path phenomenon (GPP). The data structure of GPP belongs to cognitive tree-liked structure rather than the other structures, e.g. word set structure in pre-grammar condition, linear grammatical structure in syntactic understanding, and ambiguous map-liked structure in semantic-matched multiple cognition. The distinctive structure features of GPP include. (1) In the early understanding, the data structure of GPP shows a linear feature; (2) in the medium-term understanding, semantic trigger point brings the breakdown of the original model, and the data structure of GPP is a word set structure; (3) in the late understanding, processing breakdown results in backtracking and GPP creates a tree-liked data structure at the end; (4)the dynamic understanding of GPP is the integration of two structures except map-liked one, and the activation of semantic trigger point brings additional cognitive load. The difference between tree-liked data structure of GPP and map-liked data structure of ambiguity reflects the dissimilarity between these two syntactic phenomena from the perspective of data structure, which provides the theoretical support for computational linguistics to interpret GPP.

garden path phenomenon; data structure; cognition; half-returned feature; semantic trigger

杜家利(1971—),副教授,主要研究领域为计算词典学,计算语言学,句法学和术语学。E⁃mail:dujiali68@126.com于屏方(1971—),教授,主要研究领域为词典学和汉外语言对比。E⁃mail:yupingfang68@126.com

1003-0077(2015)01-0028-10

2013-01-25 定稿日期: 2013-03-18

国家社科后期资助项目(12FYY019; 12FYY021);广东外语外贸大学人才引进项目(399-X3413012)

TP391

A

猜你喜欢

幽径歧义数据结构
数据结构线上线下混合教学模式探讨
网师园的岛屿、深山与幽径
前行
现代汉语歧义类型的再讨论
为什么会有“数据结构”?
eUCP条款歧义剖析
登翠微峰
语文教学及生活情境中的歧义现象
昔日,今天
高职高专数据结构教学改革探讨