APP下载

基于句式结构的汉语图解析句法设计

2014-07-07彭炜明宋继华王宁

计算机工程与应用 2014年6期
关键词:图解句法句式

彭炜明,宋继华,王宁

1.计算语言学教育部重点实验室(北京大学),北京大学计算语言学研究所,北京 100871

2.北京师范大学信息科学与技术学院,北京 100875

3.北京师范大学文学院,北京 100875

基于句式结构的汉语图解析句法设计

彭炜明1,宋继华2,王宁3

1.计算语言学教育部重点实验室(北京大学),北京大学计算语言学研究所,北京 100871

2.北京师范大学信息科学与技术学院,北京 100875

3.北京师范大学文学院,北京 100875

梳理了汉语语法学界对“句式”这一术语的认识分歧;从中文信息处理角度分析了当前本领域句法分析和树库构建缺乏句式结构的现状;对黎氏语法形式化研究作了一个最新的综述,指出其在句式结构方面的优势和仍存在的不足;以黎氏语法图解法为原型改造设计出一种新型的汉语图解析句法,具体包括图形化的句法结构表示和结构化的XML存储格式。

句式结构;图解析句;析句方法;句本位语法

1 引言

众所周知,汉语语法的研究成果通常有两大领域应用可作为检验理论的具体实践,一是对外汉语教学,一是中文信息处理。前者面向没有汉语语感的外国人,而后者面向完全没有人类语言经验的计算机。它们本质上都是在解决汉语的语言习得问题,都需要关于汉语语法系统的理论指导。从逻辑上讲,二者应该能够实现多方面的相互参证、相互促进。但多年来这方面的学科交叉研究却并不多见。特别是随着对外汉语语法教学从“以结构为纲”到“以功能和交际为纲”的思路转变,在这两个学科间寻找到有效结合点变得越发困难。注意到,若要实现与交际功能的结合,句型句式在语法教学中占据不可替代的重要地位。在特定情境中进行语法教学,不宜以词类系统或短语结构知识体系为纲展开语法点教学,而必须结合如连动句、兼语句、双宾语句、“连……都……”、“是……的”等常用句型句式进行。

然而,目前中文信息处理领域主流的句法树库和自动句法分析研究都是建立在结构主义语法理论的基础上,以短语为着眼点,强调结构层次,句法关系以二元结构关系为主[1]。因此,句式结构在中文信息处理中一直处于一种模糊的边沿地位,造成了语法教学、研究与中文信息处理应用之间的信息鸿沟。

2 句式结构

2.1 术语说明

“句式”这一术语广泛运用于汉语语法学界,与此相关还有“句型”、“句类”等一系列术语。不同的学者对这些术语有着不同的理解和界定。最具代表性的主要为以下几家:

(1)吕叔湘把“句式”看作句子的结构类型,“句式”和“句型”不作区分,都指“句子的结构格局”[2]。但句子的结构分类可以从句法结构上分,也可以从语义结构上分。以主、谓、宾、补等句法成分作为结构要素的可以参照吕叔湘《现代汉语八百词·现代汉语语法要点》中的动词谓语句式表[3],以施事、受事、结果、工具、处所等语义标记作为结构要素的则以李临定《现代汉语句型》为代表[4]。

(2)张斌认为“句式”是句子的特征类别,主张区分“句型”、“句类”和“句式”。他主编的《现代汉语描写语法》中是这样界定的:“句型指的是句子的结构类型,如单句与复句、主谓句与非主谓句,等等。”“句类指的是句子的语气类别,如陈述、疑问、祈使、感叹。”“句式是句子的特征类别,如‘把’字句、‘被’字句、存现句,等等[5]。”

(3)范晓的“句式”最具综合性,他以“句型”、“句模”和“句类”分别指称句法、语义和语用三个平面内的句子类别,而把“句式”定义为“由一定语法形式显示的表示一定语法意义的句子的结构格式”,是一种包含句法结构、语义结构和语用功能的三维综合体[6-10]。

关于句子分类的术语细化当然有助于人们对此问题的深入认识,但不管是特征类别还是语义、语用类别,都需要采用一定的句法结构格局作为形式载体。因此,本文权且接受⑴中“句式”的术语定位,即“句子的结构格式或结构类型”,而将“把”字句等具有显著特征的句子类别作为若干特殊句式(特定的下位句式)。这么做既有避免多立名目的考虑,同时也是基于中文信息处理的现实需求:语义理解必需首先以形式为纲实现句子的结构化,并且结构设计讲究系统性,要求能够分析和处理所有的合法句子。

2.2 句式的结构和层次

句式研究与汉语语法学的发展有着密切的联系,从最早的《马氏文通》到黎锦熙《新著国语文法》,再到后来的吕叔湘《中国文法概略》、王力《中国现代语法》等等,早期成体系的语法著作本质上都是在探讨汉语的句子结构格局。可以说,研究时间长,积累成果丰富,但却鲜见句式研究成果系统地应用到中文信息处理中,用于指导汉语的句法分析。

究其原因,中文信息处理中句子结构的形式化处理在很大程度上模糊了汉语的句式结构,以至于很难从句法树结构中获取句式结构。句法树结构与句式结构最直观的差别是,前者以一种层级的树状结构为表现形式,而后者通常采用词类、成分或特征词等的线性序列。当然,这并不是说描述句式的序列配置中各部之间没有层次关系,事实上,句式本身就蕴含了一种整体格局下的固定层次结构。

以“S+已经+V+了+O”句式(其中S表示主语,O表示宾语,V表示动词)为例,在现代汉语语法体系下自然能得出其结构层次是:“(S((已经(V了))O))”。这种以动词为中心,先后组合的层级顺序由句式整体格局决定。“小林已经离开了书店。”一句,只要说明“小林”、“离开”、“书店”充当句式中的S、V和O,那么就无需再对其进行具体的层次结构分析,因为它已经由语法体系整个地赋予了所属句式。如果在句法结构的形式化设计中将这种属于句式格局的固定层次结构保存下来,就可形成若干模式化的“句式结构”。

但是反观目前主流短语结构树的设计,却没有留意句式结构的信息维护。如图1所示,(a)为上述例句的短语结构树,直接依存的若干中心词由于追求二分结构而分布在相隔较远的树层级中;(b)树句子作了一定附加扩展,新成分的加入立即打破原有各成分之间的相对层次关系。

图1 短语结构树示例(“!”表示中心词所在)

上例中只是在原有句式上增加了状语、定语,若再考虑语序变换、成分复杂化等操作,则句子结构更加不固定,从树结构中获取特定句式结构信息将变得异常困难。根本原因在于树结构设计时放弃了“句子成分”的结点形式,代之以“直接成分+句法关系”的标注模式,进而过度地追求二分层次分析。这样,句子结构扩展和复杂化产生的层次与句式的固定层次杂糅在一起,从而模糊了句式结构的固有层次性。

相比短语结构树,后来兴起的依存结构树采用中心词直接依存的结构形式,一定程度上避免了短语层次切分琐碎和中心词依存关系不突出的弊端,因而在从句法结构走向句义分析方面显示出更强的适应性。然而,依存结构只要求满足单核心、弱连通、无环、无交叉弧等几条依存公理的纯形式约束,也没有建立明确的句式结构信息。依存弧上所标注的各种依存关系仍然是短语结构层面的二元句法、语义关系,同样缺乏关于句式结构的宏观视角。

朱德熙在讨论“NP+Vf着+N”句式(例如“台上坐着主席团”)时,指出该句式中的“施事、受事”等是“低层次”语义,“表示存在方式”是“高层次”语义[11],而后者只有到句式结构层面才能显现。从中文信息处理走向深层句义理解的角度出发,有必要探索基于句式结构的句法表现形式和存储格式。这种新型的结构格式应该既能适应句子结构扩展变换的复杂层次结构,同时又能维护特定句式的固定层次结构。

早期汉语语法体系中有一种以直观展现“句子结构格局”著称的图解析句法,即黎锦熙《新著国语文法》中自创的“图解法”。黎氏语法中图解是面向教学而设计的一种手绘图形,当时还未实现计算机的形式化。彭炜明[12]、何静[13]等已经开始尝试基于黎氏图解法进行汉语句法结构的形式化研究。本文下面将对这方面的研究作一综述,并针对其中不足提出一个新的图解析句法设计方案。

2.3 黎氏语法形式化研究综述

黎氏语法体系主张“以句法控制词类”的“句本位”语法分析思想。句法上采用“句子成分分析法”(或称“中心词分析法”)析句,通过主语、述语、宾语、补足语、形附、副附六大句子成分来建构汉语的句子结构格局。词法上“依句辨品”,承认词类与句子成分之间存在一定的对应关系。具体操作采用图解法作为析句工具,其大致法式为:通过一条长横线来上下分隔句子主干和枝叶,主干部分用双竖线分隔主语和述语,述语动词若带宾语则以单竖线引出,带补足语则以斜线引出。长横线下方画附加成分,用左斜线或左折线表示形附,右斜线或右折线表示副附,斜线、折线用以区分充当相同成分的词类。单句图解公式和示例如图2所示。

何静、彭炜明等[13]在黎氏图解法基础上设计出与图解样式相对应的XML结构存储规范(简称“图解结构”,XML树层级与图解样式之间维持一种编码、解码的关系),通过实现一个可视化的图解标注工具标注构建了规模为11万句(21万字)的现代汉语句法图解树库和4 286句(3.4万字)的古代汉语句法图解树库。以这些标注语料为基础开展汉语核心句式的归纳和古今汉语的句式结构系统比较研究,取得了初步的研究成果。

图2 黎氏语法图解公式和图解示例

根据前期研究,采用图解结构存储句法信息有一个明显的优点:对特定句式的句子,其句子成分和中心词“具有相对稳定的结构层次和位置顺序”,符合本文所述模式化“句式结构”的特点。因此,可以方便地利用XPath等XML结构查询工具从图解树库中提取特定句式的句子,非常有利于开展基于句式结构的句法、语义统计分析和相关理论研究。

完全采用黎氏图解法进行句法分析也存在一些局限[14]:

(1)首先是黎氏语法的六大成分术语陈旧,与目前汉语语法学界和语法教学界通行的术语体系存在较大差异,需要进行相关术语的清理。

(2)黎氏语法中对所谓“变式句”的成分分析太过从语义出发而不顾形式约束,因而有的分析与人们语感相差较大。比如将“董存瑞,我一辈子都忘不了他。”一句分析为“董存瑞”作“宾语”,“宾踞句首”,“他”则为宾位回指代词;而现在一般都分析为“董存瑞”作全句主语的主谓谓语句。因此,对句式的语序变换分析也需要相应的规范。

(3)黎氏图解法最大的问题还在于,仅依靠六大成分建构的句法格局并不足于区分所有的句式。比如双宾语句,由于黎氏图解公式中主干上只能有一个宾位,因而间接宾语通常分析为副位(补语);又如,连动句、紧缩句等复杂谓语句式,黎氏语法都用副附(前状后补)来分析。这些都是早期语法体系欠周密的一些地方,需要重新规范和设计。

3 句式系统的图解设计

本文的图解设计以黎氏图解法为原型,主要包括两方面内容:一是图解的图形样式(以下简称“图解样式”);二是相应的XML结构规范(以下简称“图解结构”)。参照前人研究成果,需遵循以下设计原则:

(1)编码解码原则:图解样式与图解结构之间可以进行信息无损的双向转换。即图解样式可以编码保存为一定层次结构的XML树;反之,也可将XML树重新解码成原始图解样式。另外,根据图解样式或图解结构均可恢复句子原文信息(词语序列)。

(2)固定句式结构原则:特定句式中成分、词类或特征词序列具有相对固定的结构层次和位置顺序。句式扩展变换不影响这种结构的稳定性,保证程序能从中获取句式结构信息。

为了以下行文方便,首先列出图解结构中所使用的XML元素(Element)和属性(Attribute)标记集,分别如表1~表3所示。

表1 词类标记集

表2 句法标记集

为了能与最广泛的教学语法体系兼容,本文主要参考20世纪50年代提出的“暂拟汉语教学语法系统”,共设8类句子成分:以主语、谓语、宾语作为句式的主干成分,以定语、状语、补语为句式的附加成分,以呼语和插入语为不影响句式的独立成分。下面采用“主干句式→扩展变换句式”的演绎法思路逐次说明汉语句式系统的图解设计。

表3 属性标记集

3.1 主干句式

主干句式是指不考虑附加成分、语序变换和成分复杂化等因素的常规句子结构格式,即只考虑主语、谓语核心(简称谓核:因为“谓语”在结构设计中通常用来表示包括状语、补语和宾语在内的整个谓语部分,为了避免歧义,本文对主干结构上不包含附加成分的“谓语”均以“谓核”来指称。)和宾语三种成分。根据“依句辨品”的句本位思想,主、宾语的图解位置为“指称位”,通常由名词或代词充当,谓核为“陈述位”,通常由动词或形容词充当。考虑到各自使用频率,本设计中默认指称位词性为名词,陈述位词性为动词。如果代词充当指称位,或者形容词充当陈述位,则在相应图解位置上方挑勾作为标记。

一般的句子结构通常都会有主语和谓语两部分,这样的句子为“主谓句”,与之相对的便是“非主谓句”。主谓句又可根据谓核的个数分为“单核谓语句”和“多核谓语句”。前者包括六类主干句式,本文大致沿用黎氏语法的主干图解样式,即将各主干成分依次配置于长横线上方,以双竖线分隔主谓,以单竖线引出宾语,体词谓语和主谓谓语则以支架顶起以示“陈述化”。所不同者有二:(1)取消引出“补足语”的斜线,将系动词的后接成分一律归入“判断宾语”;(2)主干线上一个动词谓核(简称动核)可带两个宾语。如图3所示。

单核谓语句的图解结构设计以双宾语句和主谓谓语句为例说明,如图4所示。

图3 单核谓语句图解样式

图4 单核谓语句图解结构示例

每个句子(按截句标点切得的文本片段,截句标点包括句号、问号和叹号)以ju元素为根结点,属性@ctg表示句子类型(单句、复句或非句),属性@cnt表示句子原文内容。ju元素之下包含若干小句元素xj,xj之下设主语sbj和谓语prd元素。主、谓以下层次遵循“中心词分析法”思想,即成分的中心词作为其直接儿子元素,若中心词元素前后有附加成分或支配成分(即动核的宾语),则它们与中心词元素互为兄弟。这样,特定句式的主干成分及其中心词在以ju为根的XML层级中就处于一个确定的位置,句式的线性配置描述可转化成固定模式的XML路径表达式(XPath)。考虑到主、谓、宾三种成分确定主干格局并以谓语为核心,在xj元素和prd元素上分别设置属性@ptt记录“主干结构”信息(参见表3)。单核谓语句中,xj的@ptt属性就是在prd的@ptt前加上一个“S”。

单核主谓句中其他的四类主干句式(单动谓语句、动宾谓语句、形容词谓语句、名词谓语句)的图解结构可仿双宾语句结构类推。主谓谓语句结构稍复杂一些,因其谓核不是单词而是小句,故prd元素内再嵌套一小句元素xj。结合标记集表不难理解图4的图解结构。

多核谓语句指由两个或两个以上谓词结构结合起来共同充当谓语,此时图解主干线上将配置多个陈述位,根据它们的结合关系又分为三类:联合谓语句、连动谓语句和兼语谓语句。如图5所示,联合谓语句在两个谓词结构中间画一条表示联合关系的虚线;连动谓语句和兼语谓语句则分别以单斜线和双斜线分隔。

图5 多核谓语句图解样式

多核谓语句的图解结构特点是:(1)xj元素下有两个或以上的prd元素(此时每个prd表示一个谓词结构而非整个谓语);(2)第二个及以后的prd除了设@ptt外,另需增加属性@ext来标示它与前一prd之间的结合关系:联合UP(Union Predicate)、连动CP(Consecutive Predicate)或兼语TL(TeLescopic form),然后取首个@ext值加上“S”作为整个xj的@ptt。如图6所示。

图6 多核谓语句图解结构示例

非主谓句分两类:独词句和无主句。既然无主谓之分,图解样式就取消分隔的双竖线。独词句通常由一个单独的体词性成分或叹词充当,无主句仍由谓语结构充当,因此共需区分三种情况。图解样式和图解结构设计如图7所示。

3.2 扩展变换句式

实际语言交际中使用的句子千差万别,对应的句式也复杂多样,但语法分析系统不需要把每一种句式都像主干句式一样作为结构基元存储起来。因为有了主干句式,任何复杂句式都可以按照一定的规则在主干句式的基础上扩展变换得到。句式的扩展变换可以分为三类:附加扩展、语序变换和成分复杂化。

图7 非主谓句图解样式和图解格式

3.2.1 附加扩展

如前所述,附加成分包括定语、状语和补语三类。其中,定语是对体词性成分的修饰和限定,状语和补语是对谓词性成分的修饰、限定和补足。充当定语的主要是形容词、名词、动词结构;充当状语的主要是副词、名词(或带介词)和动词结构。这两类附加成分都位于中心词之前,且扩展个数一般不受太大限制,扩展方式为:指称位前可加三类定语,陈述位前可加三类状语,如图8所示。三类定语都可带结构助词“的”,副词、动词状语可带结构助词“地”。由于基本沿袭黎氏语法的图解设计,故此将几种类型罗列于此,不作逐一说明。

图8 扩展句式图解样式

补语的图解设计有所调整,考虑到补语在现代汉语表义结构中的作用重于前两种修饰语,特别是结果、情态两类补语的语势几乎与宾语相仿,因而本设计中将由谓词充当的补语图解于长横线上方、谓核之后,用符号“~”引出,而数量补语和时地补语(主要为介名结构)则图解于长横线下方。如图9所示。

三类附加成分若直接粘附于主干横线上,则它们同处在以谓核为中心的句式结构的固定层级辖域之内。仍以“小林当时已经悄然离开这书店。”为例,多个状语adv和宾语obj在图解结构中与动核v同为兄弟,如图10所示。

图9 补语扩展句式图解样式

图10 “多状-动-宾”句式图解示例

从形式上看,这种结构设计似乎没有表达图1(b)中句法结构的层次性,但这恰恰体现了句式结构本身的层次观念。因为句子是词语序列与层级句法结构的统一体,句法结构显然要受表层线性结构的制约。在单动核的句式结构中,动词为中心,结构层次的造成因素只能是向前和向后两个方向的组合次序。汉语是一种修饰语在前的语言,因此在不考虑向后组合(宾、补等)的情况下,多状与动核只可能取一种组合层次,比如上例为:

(当时(已经(悄然离开)))

而动核向前结合状语与向后结合宾语的次序通常并不影响句式的语义理解,也就是说,“状-动-宾”的组合层次并非句式结构的强制层次。比如上例即可按以下四种层次理解:

((当时(已经(悄然离开)))书店)

(当时((已经(悄然离开))书店))

(当时(已经((悄然离开)书店)))

(当时(已经(悄然(离开书店))))

图1(b)的短语结构事实上是在这四种分析中人为规定了一种“正确”结构,因而在NLP短语结构分析中,相当一部分的模型计算都耗费在对语义理解影响不大的结构消歧上了。从这个意义上说,句式结构比主流NLP句法分析标准中的层次结构更具现实意义。

3.2.2 语序变换

在主干句式上进行语序变换即产生黎氏语法所谓“变式句”。黎氏语法的变式系统相当复杂,有些分析过于附会语义关系而不顾形式约束。本设计规范只保留两类变式:主谓倒装和宾语前置(排除“把”字句和“宾踞句首”句)。另外,图解样式不采用横线上抬或下屈的形式,而是改为在两种成分的分隔线上加一个“S”号。图解结构中则在主语sbj或宾语obj元素上设属性@inv=1作为标识。如图11所示。

图11 变式句图解样式

3.2.3 成分复杂化

成分的复杂化是多方面的,但都可从指称位和陈述位两个方面考虑。凡一个成分的中心词为体词,即可按指称位句法规则复杂化;凡一个成分的中心词为谓词,即可按陈述位句法规则复杂化。主要句法规则已述于前文“主干句式”和“附加扩展”两节,比如名词→定中结构、动词→动宾结构等,下面补述前文未涉及规则,如表4所示。

3.3 复句和紧缩句

以上为汉语单句句式的全部图解设计。若一个截句号内有两个小句(两部分之间有句间语气停顿,或者两部分主谓俱全),则全句按复句分析。目前采用自上而下、逐个小句分析的方式图解,如图12所示。

表4 成分复杂化示例

图12 复句图解样式和图解结构

图13 紧缩句式图解样式和图解结构

图14 基于句式结构的汉语新图解公式

条件、假设和让步等偏正复句经常紧缩为一个单句形式,具体图解样式和图解结构如图13所示,即将偏正关系中主句一方作为顶层xj,然后在其内部主、谓一级插入作为从句的xj结构。

4 结论

从黎氏语法出发总结出一个如图14所示的汉语图解析句公式,按照此公式设计了基于句式结构的形式化图解析句法,并实现了一个基于Web的可视化语法图解标注工具,启动了对外汉语教材文本语料的语法图解标注工程。截至目前,完成树库标注规模为71.7万字(4.8万句)。

聘请的标注人员主要为高校的在校本科生和研究生,标注结果由专业人员统一审校。标注人员中有汉语语法相关专业的,也有非语法相关专业的,但是经过不长一段时间(一到两天)的学习和试标,都能达到一个比较高的效率和正确率。人均正确标注的效率达到:4 450字(207句)/每天(7 h)。这是出乎意料的,因为树库属于深加工语料库,向来难以兼顾正确性、一致性和标注效率。总结其中经验,最重要一条就是标注体系引入了“句式结构”的思想,并且通过对黎氏语法图解法的改进和完善,系统地总结和归纳了汉语的主干句式和扩展变换句式。句式结构之所以能起到如此大的促进作用,原因在于:首先,句式本身就代表了一种结构格局,其内部成分的固定层次结构不再需标注人员操刀,而改由程序编码生成,这就把他们从层次切分或依存弧设置等琐碎乏味的操作中解放出来。其次,“先主干后枝叶”的操作模式贴近人理解句子时“自顶向下,逐步求精”的认知心理。最后,图解析句法在操作上采纳了“依句辨品”的词类观,按照“主、宾-名、代”、“谓核-动、形”的缺省对应关系编码,将谓词的“指称化”和体词的“陈述化”过程统一转化为“句法实现”[15],节省了大量的词性标注时间。

[1]彭炜明,宋继华,王宁,等.汉语传统语法及其在中文信息处理中的应用展望[J].中文信息学报,2012(4):50-60.

[2]吕叔湘.汉语语法分析问题[M].北京:商务印书馆,1979.

[3]吕叔湘.现代汉语八百词(增订本)·现代汉语语法要点[M].北京:商务印书馆,1980.

[4]李临定.现代汉语句型[M].增订本.北京:商务印书馆,2011.

[5]张斌.现代汉语描写语法[M].北京:商务印书馆,2010.

[6]范晓.关于句式问题——庆祝《语文研究》创刊30周年[J].语文研究,2010(4).

[7]范晓.略论句干及其句式[J].山西大学学报:哲学社会科学版,2012(3).

[8]范晓.论句式意义[J].汉语学报,2010(3).

[9]范晓.关于句式义的成因[J].汉语学习,2010(4).

[10]范晓.句式的应用价值初探[J].汉语学习,2011(5).

[11]朱德熙.变换分析中的平行性原则[J].中国语文,1986(2).

[12]彭炜明,何静,宋继华.句本位语法图解析句系统的设计与实现[C]//第四届数字典藏与数字人文国际研讨会,台湾,中国,2012.

[13]何静,彭炜明,宋继华.现代汉语黎氏语法图解标注体系[C]//第十四届汉语词汇语义学国际研讨会(CLSW2013),郑州,2013.

[14]彭炜明.句本位语法数字化平台的建设和应用研究[D].北京:北京师范大学,2012.

[15]彭炜明,宋继华,俞士汶.中文信息处理的词法问题——以句本位语法图解树库构建为背景[C]//第十四届汉语词汇语义学国际研讨会(CLSW2013),郑州,2013.

PENG Weiming1,SONG Jihua2,WANG Ning3

1.Key Lab of Computational Linguistics,Ministry of Education,Institute of Computational Linguistics,Peking University, Beijing 100871,China
2.College of Information Science and Technology,Beijing Normal University,Beijing 100875,China
3.School of Chinese Language and Literature,Beijing Normal University,Beijing 100875,China

This paper reviews the understanding divergence of the term“sentence pattern”of Chinese grammar scholars; from the perspective of Chinese information processing,it analyses the lack of sentence pattern structure in current syntactic parsing and treebank construction in this field;and gives a recent review of formalization research of Li Jinxi’s grammar system,indicating its strengths and still shortcomings on sentence pattern structure;it uses Li Jinxi’s diagrammatic parsing method as a prototype design of a new type of diagrammatic parsing method of Chinese syntactic structure,specifically including a diagrammatic representation of the syntactic structure and structured XML storage format.

sentence pattern structure;diagrammatic parsing;parsing method;sentence-based grammar

A

TP391

10.3778/j.issn.1002-8331.1309-0436

PENG Weiming,SONG Jihua,WANG Ning.Design of diagrammatic parsing method of Chinese based on sentence pattern structure.Computer Engineering and Applications,2014,50(6):11-18.

国家社科重大项目(No.12&ZD227);中国博士后科学基金面上资助项目(No.2013M530455)。

彭炜明(1985—),男,博士,讲师,主要研究方向为中文信息处理、词汇语义学;宋继华(1963—),男,教授,主要研究方向为语言信息处理、计算机教育应用;王宁(1936—),女,教授,主要研究方向为汉语言文字学、文字训诂学、汉字信息处理。

2013-09-27

2013-11-13

1002-8331(2014)06-0011-08

CNKI网络优先出版:2013-11-15,http://www.cnki.net/kcms/detail/11.2127.TP.20131115.1124.012.html

猜你喜欢

图解句法句式
句法与句意(外一篇)
述谓结构与英语句法配置
句法二题
诗词联句句法梳理
例析wh-ever句式中的常见考点
图解十八届六中全会
图解天下
特殊句式
关心健康状况的问答