关于优选论句法学在多层次英语语法错误检测中的可行性探索综述
2019-04-26胡玉秀
胡玉秀
【摘要】虽然语法检错研究和应用已经取得了一定的成果,但是目前的检错系统缺乏通用性,查错能力也并不理想。文章通过语言学理论优选论词汇功能语法(OT-LFG)对中国英语学习者的英语冠词习得过程进行分析解释,利用OT-LFG理论框架中的评估器过滤机制为语法检错和修改提供理论支持及实践基础。
【关键词】优选论;词汇功能语法;语法检错
一、引言
优选论最初诞生于音系学领域,由音系学家A.Prince和认知科学家P.Smolensky于20世纪90年代初提出,并通过在应用中发现问题和解决问题不断发展和完善,已经拓展到几乎所有的语言学领域,但优选论在计算机句法学方面的介绍和研究成果还很少。因此,利用优选论词汇功能语法理论来研究其在英语语法错误检测及修改上的应用不仅可以推动和拓展优选论的发展及应用,帮助我们更深入地了解人类语言机制(language faculty,即人类是如何获得语言知识系统的),而且将成为自然语言处理研究的理论支持和实践基础,为自然语言处理研究和发展做出贡献。
二、语法检错及优选论的理论可行性
(一)语法检错
目前语法检测已成为普通大众应用最为普遍的自然语言处理技术之一,然而相关的研究却相对贫乏。国内相关的研究也不多见。Clement, Gerdes & Marlet(2011)分析这其中主要有两个原因: 实际应用和语言学研究主导方向。首先,语法检错系统通常局限于某种语言,因此应用的通用性非常差;其次,一个更加深层次的原因是语言学作为一门语言科学,主要致力于自身学科的发展,少数的跨学科语言学如社会语言学、心理语言学以及外语教学也只是间接地对语法错误检测有些研究。
另外,目前的自动检测系统如微软公司的Word系统只能进行单词的拼写检查,以及相邻单词之间简单关系的分析和检查,而对于那些需要深入分析才能识别的错误无能为力。即使是目前开发的专门用于辅助写作的系统如Whitesmoke, Grammarly, Ginger,也只能进行主要语法错误的简单查错和修改,对于那些需要考虑语义上下文关系的语法错误则不能全部识别。
(二)优选论
优选论的根本思想是,各语言间的不同根本原因是普遍性制约条件不同等级排列的结果。这些制约条件普遍存在于所有语言中,并且是可违反的(Kuhn, 2003: ix)。图1清楚地展示了优选论下语言的共性(Language Universality)和类型变化的特性(Language Variability)(Lam, 2004)。
在图1中,制约条件A,B,C,D,E普遍存在于所有语言中,而这五个制约条件的不同排列产生了X语言和Y语言。因此,学习一种语言实际上是学习制约条件在目标语言中的排列。
(三)优选论句语法
优选论句法学,即优选论词汇功能语法(OT-LFG),是优选论(OT)和词汇功能语法(LFG)的结合体。LFG强调语法功能比如主语、谓语、宾语等和词汇在语法中的核心地位,并且提出语言当中各个结构如句法、语意、功能是平行存在并且相互对应的。这种对应关系通过成分结构(constituent structure,简称c-structure)和功能结构(functional structure,简称f-structure)之间的映射(mapping)来实现。LFG主要由词库、句法和语义解释三部分组成。表示语义的谓词论元结构首先在词库里通过词汇编码而分配到一个语法功能。这种语义与语法功能之间的联系在词库里是可以通过词汇规则进行转换的。当一个词条最后取得正确的语法功能编码以后,它就可以和其他表示语法意义的词条一起构成词汇进入到句法部分。在OT-LFG中,LFG发挥着生成器的作用,也就是所有输出项都是以LFG的成分结构和功能结构配对的形式出现的(见图2)。
在OT-LFG中,输入项为由功能结构解析的所要表达的意思(a meaning parsed in f-structure),输出项为成分结构和功能结构的成对出现。FDR与*FunctN为两个制约条件。研究证明(Kaplan & Bresnan, 1995),在LFG中由成分结构到功能结构的运算在数学上是有定解的(decidable),而且所有的运算都只需要“合一”(unification)这种简单的预算方式。合一运算是数理逻辑中“并”运算的一种适于自然语言处理的特殊形式。由于采用合一运算作为基本的运算方式,词汇功能语法就可以十分方便地应用到自然语言处理中去。
优选论在计算音系学上的研究不但证实了优选论的基本假定和方法是可以形式化并应用到计算机语言学应用中的,而且证实了优选论是计算上易于操作的(computationally tractable)(Eisner, 1997; Karttunen, 1998; Heiberg, 1999)。因此,需要有針对性研究,使其可以在计算句法学上得到应用。可见,优选论词汇功能语法是一个既具有理论价值又有实际价值的研究方向。相信通过深入细致的研究工作,可以使其应用到语法错误检测上,为实现准确地自动英语语法检测与修改系统做出积极贡献。
三、可行性路线探讨
陈述了目前语法错误检测的问题以及应用优选论的理论可行性,这部分将以英语冠词错误为例探讨优选论在语法检错中的应用路线。之所以选择英语冠词为例,不仅因为它的错误率高,而且因为它的多层次分析需求作为自然语言检错对象最有代表性,也因为研究证明优选论对于语言中涉及多个界面的问题(interface problems)具有最有效的解释力。
鉴于优选论句法学的理论特点,本文建议采用优选论词汇功能语法的理论框架对英语名词短语中冠词的使用进行优选论解释和概括,在此基础上分析中国英语学习者的英语冠词使用错误,并通过优选论的评估器过滤功能检验其在自然语言处理语法检错中的应用性。首先,通过自由写作、中译英练习以及英语冠词使用填空题收集数据,并对数据整理描述分析。具体可行性路线如下。
(一)應用优选论词汇功能语法对英语名词短语中冠词的使用进行优选论描述性概括
在优选论分析中,问题的描述性概括非常重要,它是承接数据与分析的必要中间步骤。可以在名词短语语义环境(Noun phrase semantic context)的帮助下进行优选论描述性概括。
(二)基于名词短语所指(noun phrase reference)语意分析设计中译英练习
Huebner(1983)提出了名词短语所指语义环境,在英语冠词研究中广为应用。他将名词短语所指的语义通过两个二元的特征分为四类(见图3),一个特征是专一所指(±Specific Referent(±SR)),另一个特征是假定听者知道所指(±Assumed Known to the Hearer(±HK)).
(三)将Master(1994)设计的冠词诊断测试(Article diagnostic test)按名词短语所指语义环境分类
此冠词诊断测试是专门针对母语为非英语的学习者使用英语冠词的情况研究而设计的,它包括所有的英语冠词使用,分为两部分:第一部分是由独立的语义不相关句子构成的;第二部分是一段叙述短文。测试中共有58个填空。结合Huebner(1983)的语义环境分类可将这58个语义分类,并用来收集英语冠词使用数据。
(四)应用优选论制约条件以及OT-LFG评估器对冠词使用错误进行分析解释
如上所述,优选论的根本思想是语言间的不同是由于制约条件在不同语言中的排列不同所造成的,因而学习一门语言就是学习制约条件不同排列的过程。在这个过程中,存在于学习者语法体系中的制约条件的“错误”排列导致应用错误,在接触显性语言形式后学习者发现错误并激发制约条件的重新排列直至达到目标语言中的排列顺序。接下来需具体研究是怎样的排列顺序导致了冠词使用的错误,进而达到错误过滤的目的。
(五)运用错误驱动下的制约条件降级演算模拟习得过程,以建立英语冠词习得显性语言形式小型数据库
优选论认为外语的习得过程即制约条件的降级过程。Tesar & Smolensky(1998)提出通过制约条件的降级演算系统学习者可以建立起来所学语言的制约条件等级体系。那么通过错误驱动下的制约条件降级演算模拟英语冠词习得过程即可获得包含英语冠词使用错误的例子。纠正所得错误并与原有错误并列,从而建立小型的数据库以促进英语冠词习得过程。
四、结语
优选论是自然语言处理研究中较新的语言学理论框架,基于普遍语法,可学性理论按照语言习得规律、过程提出的规则,其强大的通用性、解释力将在句法研究中得到进一步检验和应用。在国内同类研究中此理论框架在自然语言处理研究中甚少见到,因此此类研究对于自然语言处理研究领域和计算语言学领域将具有重要的启发作用,也将对句法理论语言学的发展做出重大的贡献,具有较高的实际意义和学术价值。当然,本文仅对一类语法现象进行了可行性探讨,对于哪些制约条件及什么样的制约条件排列可以通过评估器解释英语冠词使用错误,学习者是怎样通过制约条件的重新排列习得英语冠词的,优选论词汇功能语法在语法检错上的应用是否可行等问题还有待各领域专家学者的进一步考察。
【参考文献】
[1]Clement, L., Gerdes, K.& Marlet, R.2011.A Grammar Correction Algorithm: Deep Parsing and Minimal Corrections for a Grammar Checker.LNAI 5591, pp.47-63.Springer–Verlag Berlin Heidelberg.
[2]Eisner, Jason.1997.Efficient Generation in Primitive Optimality Theory.In Proceedings of the ACL, Madrid, Spain.
[3]Heiberg, Andrea Janine.1999.Features in Optimality Theory.PhD Thesis, Universityof Arizona.
[4]Huebner, T.1983.A Longitudinal Analysis of the Acquisition of English.Ann Arbor, MI: Karoma.
[5]Kaplan, Ronald.& Bresnan, Joan.1995.Lexical Functional Grammar: A Formal System for Grammatical Representation.In Dalrymple, M., Kaplan, R.M., Maxwell, [18] J., & Zaenen, A.(Eds.) 1995.Formal Issues in Lexical-Functional Grammar.Palo Alto: CSLI, Stanford University.
[6]Karttunen, Lauri.1998.The Proper Treatment of Optimality in Computational Phonology.Rutgers Optimality Archive, ROA-258.
[7]Kuhn, Jonas.2003.Optimality-Theoretic Syntax: A Declarative Approach.Stanford: CSLI Publications, Centre for the Study of Language and Information.
[8]Lam, Olivia.2004.Aspects of the Cantonese Verb Phrase: Order and Rank.Unpublished MPhil Dissertation.The University of Hong Kong.
[9]Master, P. 1994. The effect of systematic instruction on learning the English article system.In T.Odlin (Ed.), Perspectives on Pedagogical Grammar,pp.229-252.New York: Cambridge University Press.