基于图式的文本蕴涵识别初探
2015-04-21倪盛俭姬东鸿
倪盛俭,姬东鸿
(1. 安庆师范学院 外国语学院,安徽 安庆 246000; 2. 武汉大学 计算机学院,湖北 武汉 430070)
基于图式的文本蕴涵识别初探
倪盛俭1,姬东鸿2
(1. 安庆师范学院 外国语学院,安徽 安庆 246000; 2. 武汉大学 计算机学院,湖北 武汉 430070)
文本蕴涵识别是大部分自然语言信息处理应用的核心。该文尝试探讨文本蕴涵识别中涉及的(意象)图式理据。通过对选自语料例子的分析,显示各类图式是如何成为文本蕴涵识别的理据的。图式包括物性结构、理想认知模型、框架、脚本等。这些图式都是表示语义信息的结构。从广义上讲它们都可以纳入语义特征的范畴,都可能成为蕴涵关系成立的理据。基于图式的文本蕴涵识别研究结合有关图式库的构建,有望为突破文本蕴涵识别瓶颈作出重要贡献。
文本蕴涵识别;图式;物性结构;理想认知模型;框架;脚本
1 前言
文本推理过程的关键是文本蕴涵(textual entailment, TE)的识别。现有文本蕴涵识别(recognition of textual entailment, RTE)成果,几乎都来自自然语言处理(NLP)领域,且研究对象基本上都是英语。有学者指出RTE是大部分NLP应用研究的核心[1],但现有RTE系统针对PASCAL的RTE竞赛所提供的TE测试集,获得的召回率、正确率一般都只有60%~70%左右,综合评价(F-score)在0.6到0.7之间。面对大量真实文本, RTE效果应该比这些数值体现的效果差些。RTE效果还不令人满意且遇到了瓶颈,其重要原因是对蕴涵成立的语言理据挖掘严重不足。现有RTE研究一般只能处理简单的词语(语义)关系、表层句法关系或语义特征(semantic features,SF),对TE成立的其他条件如意象图式(简称图式)理据等并不是很明确。
本文尝试从广义和认知的角度理解SF,把图式纳入SF范畴。本文所说图式包括QS、ICM、框架、脚本。QS是生成词库理论(the Generative Lexicon, GL)的重要内容。GL在广泛的认知语境中对意义进行分解分析,其QS具有普通认知图式的特征,是用来分解、表示词语意义的工具;认知语义学中,ICM、框架、脚本*可以把脚本理解为事件的序列,但脚本仍然可以表示词语信息,因为单个词语可以触发脚本,这个脚本都可以成为理解该词语的语境。也是用来表示词语信息的,因而,这些图式都可以纳入SF范畴。冯志伟先生指出: 语义表征,既需要配价的描述,也需要认知图式的描述[2]。所以,SF不仅包括传统成分分析法所获得的语义信息,还可包括各种图式内容。
本文主要探讨图式作为SF是如何成为RTE理据的。本文安排如下: 先简单介绍各类图式,然后说明它们怎样成为RTE的理据,最后是总结,进一步明确本研究的意义。
2 图式
所有图式都具有特定结构和内容,有理想性、整体性、不易变动性,同时具有开放性、选择性、关联性、普遍性等特点[3]。图式相对稳定,但从长时间看,其内容和结构会发生变化,以适应变动的社会和文化。图式在不变性和开放性方面(这两方面不是本文的重点)与文化类似。
2.1 QS
新结构主义语义学理论中,Pustejovsky所创立的GL是最精密、最富有成效的后生成主义形式分解语义学,它提供了当代语义学中最详尽的形式化分解方法模式。GL聚焦于语境中语义确定和调节机制,注重一词多义现象和创造性语言用法的描述,试图通过超越“义项枚举词库(方法)”(SEL)赶超Katz语义学。GL将词库作为基础来描述语言动态、创造性的用法,它超越Katz词汇语义学的地方主要包括: 明显与语义逻辑表示产生联系,对表示进行分层,内容更丰富细致;表示模式面向计算语言学,提出可操作的语义生成机制[4-5]。
QS是结构化的、用来表示词条(义项-词形对)所指的实体特别是人工物与有关内容间的关系[4],包括四部分内容。
• 构成角色: 实体与其组成成分或构成部分等之间的关系,如材料、重量、成分和构成元素等。
• 形式角色: 将实体从一个更大的领域中区分出来,包括方向、大小、形状、维度、颜色、位置等。
• 目的角色: 表示实体的目的或功能。
• 施成角色: 即导致实体产生或出现的因素,如创造者、天然物或人造物(作为工具导致实体的产生)、因果链(因果关系)。
QS所表示的关系,是对传统语义关系的补充,也是对传统所表示词语语义的补充*当然这种补充也不是圆满的,如语义-文本理论(Meaning-Text Theory)的词汇函数(Lexical function)所表示的各类词语关系就基本上不能为QS所表示。词汇函数和QS适用表示的词语关系范围不同。。QS是GL最成功的内容之一,已经被许多语言理论框架吸收[4,6]。QS是GL语义生成性的来源之一。QS的构成角色和形式角色实现为言语后,在语句中与表示被描述实体词语间的关系为非论元性语义依存关系,而其功用角色和施成角色在语句中与被描述实体能指之间的关系是论元性的语义依存关系。QS是桥接词汇、句法和常识的有效手段之一,这种特性使得它可以对蕴涵识别作出贡献。
2.2 ICM
认知语义学中比较系统、权威的理论是ICM理论和框架理论。ICM在Lakoff的著作中首次得到全面、系统描述,该书核心思想是: ICM是组织知识的手段,范畴结构和原型效应是这种组织的副产品。Lakoff对ICM的描述较为复杂,这里仅引用王寅(2005)对ICM的有关论述以便理解[7]。
王寅认为,认知模型就是人们在认识事体、理解世界过程中所形成的一种相对定型的心智结构,是组织和表征知识的模式,由概念及其间相对固定的联系构成[8]。王寅对ICM的概念总结如下:
所谓ICM,就是指在特定的文化背景中说话人对某领域中的经验和知识所作出的抽象的、较为完整的、理想化的理解,这是建立在许多认知模型之上的一种复杂的、整合的完形结构,是一种具有格式塔性质的复杂认知模型。ICM是由很多认知模型组成的,具有体验性(在人类与外界互动的基础上形成)、完形性(不仅仅是由各构成部分组合而成,而且也是一个整体结构)、内在性(是心智中认识事体的方式)[9]。
本研究中,ICM用于表达抽象词语的概念结构,为抽象词语的理解提供语境,进而为RTE服务。
2.3 框架
框架和脚本概念源自人工智能领域研究[10]。框架被Fillmore引入语言学而得到充分发展[11],框架语义学在认知语义学中独树一帜,它基于真实语料研究语言,以其为理论基础构建的框架网(FrameNet)[12]在NLP等领域得到了广泛应用。
Fillmore把“框架”定位为涵盖多种其他图式的概念,本文继承传统人工智能研究关于框架和脚本的认识,认为多个框架构成脚本,脚本是框架的序列。
框架语义学与ICM理论的不同之处在于: 前者切入点是社会语境中事件结构的描述和理解,重点在世界知识,后者切入点是概念结构描述,重点在于心智及其操作过程。框架语义学把格语法中针对语言的“格框架”映射到对世界知识的处理,对情景进行描述。每一个格框架刻画一个抽象、具有图式化特征的小“情景”或“语境”。格框架映射到现实世界,体现为各种事件框架。框架中的实体(词语、范畴或概念等)是激发理解语境的索引,对框架的全面理解,需要许多为一个言语社团所共享、默认的知识。
框架内容和框架间的关系都可能成为RTE的理据。FrameNet1.5提供了八种框架关系,其中的视角关系可以理解如下[12]:
同一事件或框架,因视角不同,使用不同的词语、实现为不同的句法[13]。认知语言学中,视角是语义识解(construal)的一个重要方面。如商业事件框架中,如果聚焦于买方,则买方成为前景,被突显而成为射体,买方成为主语,用动词buy,spend,pay做句子核心;如果聚焦于卖方,则卖方成为主语,句子核心是sell或charge;如果商品成为主语,则cost成为句子核心。
框架语义学和FrameNet除了用于解释一词多义、歧义区分等外,还可帮助RTE。
2.4 脚本
关于脚本,没有统一的定义,以下仅举两个定义来帮助理解。
Schank和Abelson给出的脚本定义如下:
脚本是特定语境中事件的合适序列结构,它由一些槽(slots)和关于什么样的内容可以填充这些槽的要求构成。脚本是一个互相连接的整体,一个槽的内容会影响另外一个槽内可以出现什么内容。脚本处理程式化日常情景,它们通常不易变化,不提供处理新情景的手段[10]。
脚本不易变化,不意味着其绝对不能变动。Schank和Abelson在其下文中指出了脚本的可变化性,即脚本偏离。脚本偏离和以脚本为骨架实现的语句(文本)都可以提供新信,体现语言使用的动态性,这不是本文重点,不详述。本文要利用的是脚本静态、不易变的特点。
后来Abelson进一步将脚本定义并解释如下。
总之,脚本是假设的认知结构,激发的脚本能够组织基于事件情景的理解。弱式意义上,脚本是一系列关于事件集出现的潜在性(可能性)的推理,它可能与其他不处理事件的图式在结构上有相似性。强式意义上,脚本同时涉及事件的发生和对事件顺序的预期。最强式意义上,脚本中事件完全按照仪式化程序排列(如日本茶道),这时对脚本的预测绝对可靠,不过这类脚本相对少见[14]。
根据上述脚本定义和其他学者的论述,脚本具有以下为TE的获得提供线索和方便的特点: 1)脚本的内容和结构相对稳定;2)默认状态下,脚本中有关要素和内容是一个整体,不可分割;3)强式脚本中,前后事件之间可具有因果关系,前面事件的实现,是后续事件发生的必要条件。
3 RTE中的图式理据
蕴涵通常研究句子或命题之间的关系,而TE则研究文本(片段)间的关系。文本可以是单句、复句或者句群、语段、篇章。如果一个文本(片段)(被蕴涵文本,称为假设,记为H)的真实性来自另一个文本(片段)(蕴涵文本,记为T)的真实性,那么,这两个文本(片段)间存在TE关系。如:
(1) 妈妈: 宝宝,别躺地上,刚下过雨呢。(T)
(1a) 妈妈告诉宝宝不要躺地上,因为地上是湿的。(H)
容易判定,文本(1)蕴涵文本(1a),因为如无特殊说明(典型或理想状态下),“下雨”的默认结果是“地湿”,“下雨”是原因。
语言理解涉及的推理,需要获取因果关系、语义蕴涵和会话含义等。因果关系有多因多果、多因一果、一因一果、一因多果等情况。从因推出果,可以称为结果蕴涵,从果推测因,则是预设。因而,广义上的TE包括文本预设、文本结果蕴涵、文本语义蕴涵、文本会话含义。预设又可分为语义预设和语用预设,会话含义分为规约会话含义和非规约会话含义。由于语用预设具有主观性、隐蔽性、可取消性等特征[15],而非规约会话含义又涉及很广的语境,包括社会文化历史价值观念、心理认知状态等,具有很强的动态性和不确定性,本文暂不研究语用预设和非规约会话含义。
笔者将由词语间直接的语义关系(如WordNet所表示的词语关系)和句法转换导致的TE归入文本语义蕴涵。这类蕴涵的研究现在已经很多,这里不再论述。这样本文研究对象就只有文本语义预设、文本规约会话含义和文本结果蕴涵。预设(H)在时间上先于语句(T)的言语行为或其描述的事件、命题,会话含义则具有伴随性、共时性,结果蕴涵则在时间上具有滞后性。
3.1 RTE的QS理据
QS主要对文本语义预设、文本规约会话含义有贡献。先看语义预设的例子:
(2) 邦邦,别把自行车脚架拆下来。(T)
(2a) (这辆)自行车有脚架。(H)
自行车QS的“构成角色”包括材料、重量和部件等。根据生活经验,“脚架”是自行车重要部件,应该成为自行车所激发QS的内容之一,即从自行车的QS可知,“自行车”和“脚架”之间有整体-部分的语义依存关系,借助该QS可知“自行车脚架”包含H,也即T蕴涵H。
事实上,一旦图式被触发,关于其所有内容的存在性和事实性描述都可以成为语义预设,体现图式的整体性。语义预设是语言理解的语境之一,对其利用需要根据具体情况加以选择(图式的选择性)。
如果在“自行车”的QS中包括“骑”这样的“功能”,就可以为机器识别以下T和H之间蕴涵关系做出贡献:
(3) 去超市有点远,借我的自行车去吧。(T)
(3a) 说话人建议听话人骑自行车去超市。(H)
这是一个由T获得规约会话含义H的例子。T蕴涵H主要源于: 1)“吧”有劝诱义,具有“建议”等言语效果(当然,这点不是QS的贡献);2)“自行车”自然地触发其功能“骑”。这实际上是语义预设内容之一。事实上,规约会话含义的产生,通常以语义预设为基础。
3.2 RTE的ICM理据
ICM主要对文本语义预设、文本规约会话含义有作用。此处以“母亲”的ICM为例来说明。Lakoff认为“母亲”的ICM至少应当包括以下子模型:
生殖模型——生孩子
遗传模型——提供基因
养育模型——养育孩子
婚姻模型——父亲的妻子
宗谱模型——孩子最亲近的女性长辈[7]
因ICM作为图式具有整体性,理想状态下,“A是B的妈妈”至少包含以下这些语义预设:
H1: A生了B。
H2: B身上有A的基因。(或“B继承了A的基因”)
H3: A养育了B。(或“A对B有养育之恩”)
类似地,ICM可以触发文本规约会话含义。试看:
(4) 地球是人类的母亲,人类生活在地球的怀抱中。(T)
(4a) 地球养育着人类。(H1)
(4b) 地球为人类提供了生活所需的条件。(H2)
(4c) 地球为人类提供了舒适的生存环境。(H3)
(4)中“母亲”是隐喻用法。隐喻基于图式,是从源域(如母亲)到目标域(如地球)基于相似性的映射。隐喻理论认为“映射是系统性的,隐喻图式具有能产性和创造性。一旦隐喻映射发生了,源域的用法可以系统地被目标域所接收,一些新的隐喻用法可能被创造,目标域可能被赋予新的解读[16]”。
逐个把“母亲”各个子模型与“地球”可以触发的联想(不同维度的意义,可以规约化为子模型,但本文没有提供)匹配,发现“母亲”的“养育”模型在意义上与地球所具有的能力(作用)具有许多相似之处: 母亲为子女提供衣食住行和无微不至的照顾,地球也无私地为人类提供各类生活资源和良好的生存环境。基于相似性,“母亲”和“地球”之间借助“母亲”的“养育”子模型确立了隐喻映射,映射确定后,“养育”子模型所有内容及其结构都可能成为“地球”ICM的内容、结构,进而赋予“地球”新的解读,其结果包括: H1、H2和H3等都可以成为T的规范会话含义。这体现了隐喻的能产性和创造性。可见,隐喻映射可以发生于不同ICM的子模型之间,这是局部的映射,隐喻映射具有选择性。上述推理过程中,只突显“母亲”ICM的“养育”这个子模型,体现了认知的转喻性。可见,本例又是“转喻、隐喻是基于图式的,认知模式主要是意象图式形式,而不是命题形式”这个论断的一个例示。
3.3 RTE的框架理据
国外有学者专门谈论了框架语言学对RTE的影响[17]。并出现了利用框架[18]及其关系[19]做NLP的RTE识别研究,取得不错的效果。但语言学方面的研究还有待深入。
框架和框架关系都可以触发蕴涵,它们主要对语义预设和规约会话含义的识别有贡献。框架触发蕴涵的过程与ICM类似,这里不再举例说明。以下仅从几个框架关系看蕴涵的获取。
FrameNet 1.5提供了继承、利用、分框架和视角等框架关系。框架间继承关系与词语间继承关系性质类似,词语继承关系触发语义蕴涵,框架继承关系因其间接性所触发的蕴涵被纳入规约会话含义。根据利用的定义[12],它能触发语义预设,如:
(5) 由于速度太快,在转弯时撞墙起火,车上两名歹徒当场毙命。
(5a) 车以很快的速度行驶。
“速度”是“速度”框架的触发语之一,该框架预设主体的“运动框架”。针对主体“车”而言,用于描述其运动的动词包括“行驶”,因而(5)语义预设(5a)。
分框架关系中,如果分框架之间具有严格的时间先后或因果关系,则也可产生语义预设。如犯罪框架包括逮捕、传讯、审判和宣判四个分框架,后面的分框架预设前面所有分框架。
同一事件因视角不同而有不同语句实现,这些语句相互蕴涵。如“雇佣”框架包括从雇主角度看的“聘用”框架和从求职人员角度的“找工作”框架。试看:
(6) 他于是就退学了,以示抗议,但至今没有找到工作。(T)
(6a) 至今没有人聘用他。(H)
(6)的“(他)至今没有找到工作”借助求职者“找工作”框架触发“雇佣”框架,(6a)则借助雇主“聘用”框架触发“雇佣”框架,在具体框架元素相同或没有冲突的情况下,这两个角度的框架互相依赖、互相蕴涵,而且(6a)与(6)都没有蕴涵阻塞语*蕴涵中阻塞语的研究是个有一定复杂性的问题,现有研究不少,这里不详述。。根据这些条件可以判断,(6)蕴涵(6a)。从(6)得到(6a)借助于间接的框架关系,因而(6a)是(6)的文本规约会话含义。
3.4 RTE的脚本理据
国外已经有人尝试在RTE中加入脚本内容[20]。脚本是由框架构成的,因而两者区分不是界限分明的。但脚本因自身特点,在作为RTE理据时有别于框架。脚本可以为文本语义预设、规约会话含义和结果蕴涵的识别做出贡献。以下借助“饭店”脚本举例说明。
根据Schank & Abelson[10],从顾客的视角,饭店脚本的草图包括以下内容:
脚本: 饭店
角色: 顾客,服务员,厨师,出纳员(cashier)
理由: 取得并享受食物,充饥。
场景1: 进入(饭店)
顾客进入饭店,寻找空位,就坐。
场景2: 点菜
接受菜单,看菜单,决定吃什么,点菜。
场景3: 吃
收到食物,吃食物。
场景4: 从饭店出来
要求结账,拿到账单,给女服务员小费,走到出纳处,把钱给出纳,从饭店出来。
这个脚本在英语文化中是典型的。汉语文化中的饭店脚本也大致如此,但通常顾客不会给服务员小费。这个脚本属于强脚本,前后场景和事件按照时间顺序构成具有因果关系的序列,前面重要的事件,构成后续必要事件发生的必要条件。
借助“饭店”脚本,可以识别以下(7)和(7a)之间的语义预设蕴涵关系:
(7) A: 要不,一起去吃饭吧。B: 我刚从小观园回来呢。
(7a) B已经吃过饭。
类似(7)这样的话,估计在武汉大学经常发生,通常说话人和听话人都明白“小观园”是一个吃饭地方(饭店或酒店)。“小观园”容易触发“饭店”脚本,脚本与其他图式一样,都具有理想性,如无特别说明,既然已经“从小观园回来”(蕴涵“从饭店出来”),意味着脚本中时间上先于“从饭店出来”的其他事件都已发生过,因而(7)语义预设(7a)。
根据“饭店”脚本,也可触发文本规约会话含义,试看:
(8) 多带点钱来,我要吃饭。(T)
(8a) 说话人要去饭店吃饭。(H)
“钱”是饭店脚本的必要元素,“吃饭”+“(带)钱”就能激活饭店脚本,(8)中带钱的目的是去饭店吃饭,因而T蕴涵H。事实上,在吃饭这个大背景下,饭店脚本中任何特有的事件(如点菜、结账)(不同于在家吃饭的事件)或实体(如女服务员、账单),都可以激发饭店脚本。
由于强脚本的各个事件之间往往具有因果关系,因而可以为文本结果蕴涵识别服务。从因果角度看,上面(7)中B说的内容是(7a)的“果”,(7a)则是(7)中B说的内容的因。尽管从逻辑角度看(7)和(7a)未必具有因果关系,但语言学上可以说得通,试看:
(9) 你为什么从饭店出来呢?
(9a) 因为我已经吃过饭了。
(9b) 因为我已经付过钱了。
(9)和(9a)、(9b)作为问和答是自然的,可见借助脚本,可以识别某些文本结果蕴涵。
4 结语
认知语义学认为认知模式主要是(意象)图式形式(而不是命题形式),语言中无处不在的隐喻、换喻的运作是基于图式之上的。本研究显示,不仅隐喻、转喻推理基于图式,语言(词语)很多字面用法也涉及图式。要使NLP的RTE获得更好效果,需全面深入研究,明确图式在RTE中的作用,并建立相应资源。这样有望同时为语言字面用法和隐喻、转喻性用法理解提供更为有效的手段,提高RTE效果。
目前,基于框架语义学的框架网已经构建,而且在多个领域得到了应用。脚本库虽未建立,也已经有人利用脚本做RTE,但效果还不理想。参考冯志伟先生的观点,物性结构、理想认知模型、脚本与框架一样,都有形式化的特点,应该可以构建机器可读的相关资源[21]。面向NLP的QS库、脚本库、ICM库的构建,必可提高RTE的效果。但是,这些图式资源库的构建,将是一项难度不亚于文本蕴含的艰巨的任务,因此这成为了应用图式方法的一个瓶颈,是未来基于图式RTE需要解决的主要问题。
[1] Pazienza Pennacchiotti, M Zanzotto. A linguistic inspection of textual entailment. Advances in Artificial Intelligence[C]//Proceedings in Lecture Notes in Artificial Intelligence, 2005, (3673): 315-326.
[2] 冯志伟. 计算语言学的历史回顾与现状分析[J]. 外国语,2011(1): 9-17.
[3] Ungerer F, Schmid H J. An Introduction to Cognitive Linguistics[M]. Beijing: Foreign Language Teaching and Research Press, 2001: F27.
[4] Pustejovsky J. The Generative Lexicon[J]. Massachusetts: Massachusetts Institute of Technology, 1996: 60-140.
[5] 宋作艳. 生成词库理论的最新发展[J]. 语言学论丛,2001,43(6): 202-221.
[6] Pustejovsky J. Type Theory and Lexical Decomposition[J]. Journal of Cognitive Science, 2006,(6): 39-76.
[7] Lakoff G. Women, Fire, and Dangerous Things: What Categories Reveal about the Mind[M]. Chicago and London: The University of Chicago Press, 1987: 68-71, 74, 106, 133-134, 154, 159-376, 487.
[8] 王寅. 语义理论与语言教学[M]. 上海: 上海外语教育出版社,2001: 192.
[9] 王寅. 认知语言学探索[M]. 重庆: 重庆出版社, 2005: 140.
[10] Schank R C, Abelson R P. Scripts, Plans, and Knowledge[M].Yale University, New Haven, Connecticut, 1975:152.
[11] Fillmore Charles J. Frame Semantics in Linguistics[C]//Proceedings of In the Morning Calm. Seoul: Hanshin Publishing Co., 1982: 111-137.
[12] FrameNet [OL],http://www.icsi.berkeley.edu/~framenet/, accessed 10/20/2011.
[13] Langacker R W. Cognitive Grammar: A Basic Introduction[M]. New York: Oxford University Press, 2008: 73-76.
[14] Abelson R P. Psychological status of the script concept[J]. American Psychologisl, 1981, 36: 715-729.
[15] 计道宏. 预设的语用功能研究[J]. 东北师大学报(哲学社会科学版),2011,(5): 101-103.
[16] Lakoff G, Johnson M. Metaphors we live by[M]. London: The university of Chicago press, 2003: 246, 253.
[17] Burchardt A, et al. Assessing the impact of frame semantics on textual entailment[J]. Nat. Lang. Engineering, 2009, 15(4): 527-550.
[18] Ion A, Prodromos M. A Survey of Paraphrasing and Textual Entailment Methods[J]. Journal of Artificial Intelligence Research, 2010, 38: 135-187.
[19] 张鹏,等. 基于FrameNet框架关系的文本蕴含识别[J]. 中文信息学报,2012,26(2): 46-50.
[20] Murray W R. Conceptual Metaphor and Scripts in Recognizing Textual Entailment. Natural Language Processing and Cognitive Science[C]//Proceedings, 2008:127-136.
[21] 冯志伟. 自然语言处理中的一些宏观问题之我见[J]. 中国外语,2009,(5): 36-41.
[22] 束定芳. 认知语义学的基本原理 、研究目标与方法[J]. 山东外语教学,2005,(5): 3-11.
A Tentative Study on Schemata Based Textual Entailment Recognition
NI Shengjian1, JI Donghong2
(1. School of Foreign Languages, Anqing Teachers’ College, Anqing, Anhui 246000, China; 2. School of Computer, Wuhan University, Wuhan, Hubei 430070, China)
Recognition of Textual Entailment (RTE) is of substantial significance to most natural language processing. This paper explores the schematic explanations to TE, revealing how (image) schemata can justify the TE results by case studies. Schemata include qualia structure, idealized cognitive model, and frame, script, etc., all of which are structures that can be used for representing word meaning. In a broad sense, all these kinds of schemata belong to the category of semantic feature and thus have the potential to become evidences for TE. Exploration into RTE based on schemata and the construction of corresponding corpora of schemata may contribute to solving the bottleneck issues in RTE.
RTE; schema; qualia structure (QS); idealized cognitive model (ICM); frame; script
倪盛俭(1969—),博士,主要研究领域为词汇语义学。E⁃mail:723853360@qq.com姬东鸿(1966—),教授,博士生导师,主要研究领域为自然语言处理,词汇语义学。E⁃mail:Donghong_ji2000@yahoo.com.cn
1003-0077(2015)03-0082-06
2013-04-08 定稿日期: 2013-07-26
安徽省2014年质量工程教学研究重点项目(2014JYXM236);国家自然科学基金(61173062,61202193)。
TP391
A