APP下载

语义角色标注研究综述

2011-04-12李业刚孙福振李鉴柏吕新宇

关键词:谓词组块句法

李业刚,孙福振,李鉴柏,吕新宇

(1.山东理工大学计算机科学与技术学院,山东淄博255091;2.北京理工大学计算机学院,北京100081)

语义角色标注就是对于给定句子中的每个谓词(动词、名词等)分析出其在句中的相应语义成分,并作相应的语义标记,如施事、受事、工具或附加语等.具体而言,即标注句子中的一些成分为给定谓词的语义角色,这些成分作为此谓词框架的一部分被赋予一定的语义含义.语义角色标注综合了自然语言处理领域的基础技术,如分词、词性标注、句法分析等,因此研究语义角色标注也为研究机器学习方法和那些底层的技术提供了研究平台.作为自然语言处理的基础技术,语义角色标注在很多应用中也发挥了很大的作用.目前语义角色标注已在问答系统[1]、信息抽取、信息检索[4],自动文摘[5]、文本蕴涵、机器翻译[8]等领域成功应用.本文拟从语义角色标注的语料库的资源、预处理、标注单元、标注过程及目前研究存在的问题及发展方向等进行了论述.

1 语料资源

进行自动语义角色标注,需要规模大、质量高的语料资源的支持.目前,英语较为知名的语义角色标注资源为FrameNet[9]、PropBank[10]和Nom-Bank[11].

U.C.Berkeley开发的FrameNet以框架语义为标注的理论基础对英国国家语料库进行标注.它试图描述每个谓词(动词、部分名词以及形容词)的语义框架,并试图描述这些框架之间的关系.Prop-Bank是宾夕法尼亚大学在Penn TreeBank句法分析语料库的基础上标注的语义角色标注语料库.PropBank只对动词(不包括系动词)进行标注,相应的被称作谓语动词.而且只包含20多个语义角色.其中核心的语义角色为Arg0~5六种,Arg0通常表示动作的施事,Arg1通常表示动作的影响等,Arg2~5根据谓语动词不同会有不同的语义含义.与FrameNet相比,PropBank基于Penn TreeBank手工标注的句法分析结果进行标注,因此标注的结果几乎不受句法分析错误的影响,准确率较高.它几乎对Penn TreeBank中的每个动词及其语义角色进行了标注,因此覆盖范围更广,可学习性更强.纽约大学的研究人员开发的NomBank是为了弥补PropBank仅以动词作为谓词,存在标注过于粗略的缺点.NomBank标注了Penn TreeBank中的名词性的谓词及其语义角色.另外NomBank容许角色出现相互覆盖的情况,这也是与PropBank不同的.

中文语义角色标注的研究主要使用三种资源:Chinese Proposition Bank(CPB),Chinese Nombank[12],Chinese FrameNet[13].Chinese PropBank(CPB)同英文PropBank基本类似,是Upenn基于Penn Chinese Treebank(CTB)标注的汉语浅层语义标注资源,在Penn Chinese Treebank句法分析树的对应句法成分中加入了语义信息.Chinese Nombank把传统的英文Proposition Bank和Nombank的标注框架,扩展到对中文名词性谓词的标注.山西大学构建的Chinese FrameNet是基于框架语义理论的,是一种FrameNet风格的中文词典.它描述了词汇单元以及参与者框架元素之间的关系,也包含了框架元素的详细句法信息.

2 预处理

预处理主要是对原始句子进行词汇、句法分析和谓词识别等.谓词识别是识别出句子中的动词性谓语,并为它们分配词义.在传统的基于短语结构句法分析的语义角色标注(SRL)系统中通常不执行这步,默认谓词已识别正确.CoNLL2008要求进行谓词标注,谓词识别分为两步:谓词标注和词义识别.谓词标注的任务是标注出句子中的谓词;词义识别在前者所识别的谓词基础上进行词义的分配.这两步都可以看成是分类问题,前者是一个二元分类问题,词义识别则是多元分类问题,因此在实现时可采用各种分类器进行分类.在特征向量的选取上,采用了同语义角色标注类似的特征.因此预处理的关键就变成了分类器的选择和特征向量的选取的问题.

3 标注单元

根据对句子的不同标注情况,语义角色标注系统自动标注的基本单元可以是句法成分、组块、短语、词等.词标注单元主要用于基于依存句法分析语义角色标注系统,短语主要用于基于Chunk的语义角色标注系统,句法成分主要用于基于短语结构句法分析的语义角色标注系统.目前,从整体效果上看,以句法成分为标注单元的语义角色标注要优于以词和短语为标注单元的方法.

文献[14] 以句法成分为基本标注单元的,这种策略在短语结构句法分析比较成熟的语言(如英文等)上表现得较好.然而,在其它语言上,很难自动的获得这种深层句法分析的结果,而且现有的句法分析系统,在通用领域表现欠佳.为此有人试图将语义角色标注建立在浅层句法分析的基础之上,其中文献[15] 中文语义角色标注F1值为74%.毕竟浅层句法分析的鲁棒性要好于深层句法分析.词是比短语更细的语言单位,有些语义角色标注系统也使用词作为标注的基本单位,然而效果并不如基于短语的和基于句法成分的理想[16].以上的方法都是建立在短语结构句法分析方法基础之上的,Hacioglu使用依存句法分析结果进行语义角色标注[17],也取得了可以与基于短语结构句法分析的相比较的结果.我们可以直接使用依存句法分析器获得依存句法分析的结果,也可以转化短语结构句法分析的结果为依存句法分析结果.与基于短语结构句法分析的方法相比,基于依存句法分析不但可以利用短语之间的依存特征,而且只需要学习和预测与谓词有依存关系的短语为某种语义角色即可,因此也加快了标注的速度.

3.1 基于短语结构句法分析的语义角色标注

基于短语结构的句法分析是句法分析中最为成熟的技术,性能和结果各方面都比较可靠、稳定.这种策略在句法分析比较成熟的语言(如英文等)上表现得较好.然而句法分析效果并不完美,所以不可能每一个角色都能够在句法分析树中找到与之匹配的句法成分.据统计在PropBank中,基于手工标注的句法分析树中有4.3%的语义角色找不到句法成分与之相匹配.对于由Charniak Parser产生的自动句法分析树约有10.0%的语义角色与句法成分不相匹配.而由Collins Parser产生的自动句法分析树,这一数值更高,约为12%.在其它语言上,很难自动的获得这种句法分析的结果,而且现有的句法分析系统,在通用领域表现欠佳.为此有研究者试图将浅层语义分析建立在浅层句法分析的基础上.

现在绝大多数的语义角色标注系统采用基于短语结构的句法分析,按照对句法分析的不同依赖程度可分成三类:基于最佳单棵句法树的SRL方法、基于最佳n棵句法树的SRL方法和基于联合学习的句法分析和SRL方法.在这些方法中,基于最佳单棵句法树的SRL方法是被研究最多的,占主导地位.目前文献报告的在单个自动句法树上的有刘挺等[18],F1值为77.13%,李军辉[19]等在CoNLL2005 Shared Task开发集和WSJ测试集上分别获得了77.54%和78.75%的F1值,.而在手工句法分析上最好的成绩是Pradhan等[20]报告的,F1值为89.4%.从上述数据可看出,基于手工句法分析的结果相比于自动句法分析的结果,相差了约12.3%,它们的性能差别主要取决于提供的句法分析的性能.

3.2 基于组块的句法分析

基于语义组块分析的语义角色标注中,标注的流程不再是传统的句法分析-语义角色识别-语义角色分类,而是一种简化的语义组块识别-语义组块分类流程.这一方法将语义角色标注从一个节点的分类问题转化为序列标注问题,由于避开了句法分析这个阶段,使得语义角色标注摆脱了对句法分析的依赖,从而突破了语法分析器的时间和性能限制.可以取得较高的准确率,并且大大节省了分析的时间.丁伟伟[21]与Carreras[22]等,Punyakanok[23]等比较发现,在中文语义角色标注中基于语义组块的方法上产生了与基于句法分析的方法可比较的结果.而英文则不然,主要因为,从分析准确率来看,中文的句法分析器相较于英文逊色许多,错误的分析对语义角色标注的负面影响是很大的,这使得使用基于句法分析的方法进行语义角色标注效果不好.其次,不同于基于语法组块的方法,语义组块使组块分析直接面向语义角色标注.语义组块识别直接依赖于特定动词,有利于充分提取与语义角色标注相关的特征,这使得基于语义组块方法避免了传统的基于语法组块方法中由于句法组块分析和语义角色标注脱节(例如组块边界和语义角色边界不一致)带来的弊端,提高了标注的准确率.

3.3 基于依存句法分析的语义角色标注

依存句法分析表达的句法结构是单词与单词之间的依赖关系图.从理论上分析,依存句法中的句法-语义接口更简单、更直观,并提供了更透明的谓词-论元关系表达.因此在基于短语结构句法分析的语义角色标注系统遭遇到发展瓶颈,如局部模型的机器学习方法很难有更大进展,数据的稀疏问题严重,更有效的特征难以抽取等,导致性能无法进一步提高.因此研究者开始探讨在另一种句法分析上进行语义角色标注——基于依存关系的语义角色标注.

基于依存分析的SRL研究相对较少,Hacioglu等[24]首次采用基于依存分析的方法来实现语义角色标注,所使用的依存树是由句法树转化而来,采用SVM分类器实现了角色的分类,提出了12个特征(依存关系,位置,中心词,依赖词等),并且表明谓词相关信息的重组对性能影响很大.最终在基于手工依存分析语料库Depbank和CoNLL2004shared task语料库上的F1值分别为84.6和79.8.这表明虽然使用的信息比基于句法分析SRL少,但取得的结果相似.Pradhan等[25]使用基于规则的依存分析结果进行SRL实验,取得的结果比使用最新的基于统计短语结构句法分析的性能要差很多,在WSJSection23上的F值从78.4下降到了47.2.类似的,Swanson和Gordon[26]报告:从基于规则的依存分析中抽取的句法树特征不如从短语结构句法分析上抽取的相同特征表现稳定.而最新的基于依存关系的SRL研究出现在CoNLL2008评测中,代表作是Johansson等的工作.在Johansson等一文中,详细比较了基于短语结构句法分析和基于依存结构句法分析的SRL在FrameNet语料库上的性能,结果表明使用现代基于统计的依存句法分析,两者的性能几乎是相当的.文章还指出早期基于依存关系SRL的性能较差的原因是依存句法分析的准确率较低.他们的实验还表明,依存关系表示中的语法功能信息影响了语义角色分类器的训练;而使用依存关系训练得到的角色分类器对因跨领域而引起的词汇问题更具复原力.在Johansson等的另一篇文章[28]中详细分析比较了两种SRL系统在Prop-Bank语料上的性能.这篇文章的贡献在于分别使用基于部分短语的(segment-based)和基于依存关系(dependency-based)的衡量标准来公平的比较代表当前最好性能的两类SRL系统的性能.他们实现的基于依存句法的SRL系统在上述两项衡量标准下F值分别为77.97(WSJ+Brown)和84.29(CoNLL-2008测试集).实验结果表明,基于依存分析的SRL系统更偏向于查找角色头而不是角色的文字片断.这样的特性究竟是优点还是缺点取决于具体的应用,如对于使用模板填充类的系统可能需要完整的角色;而对于使用语义角色标注表示的文本分类则可能仅需要角色的头.同基于短语结构句法分析的语义角色标注类似,基于依存关系的语义角色标注步骤一般可分为三步:谓词识别、角色识别和角色分类.当然还可以包括后处理,这里的后处理主要是进行全局推导.

4 标注过程

进行语义角色标注首先需要进行句法分析,并在句法分析的基础上进行谓词识别.所谓谓词识别就是识别出句子中的谓语动词或名词,并为该谓词标注词义.目前大部分的语义角色标注系统并不进行谓词识别,这是因为大部分系统默认使用了语料库中人工标注的谓词及其词义.但谓词识别也是语义角色标注中的重要一步,它的性能直接影响到系统性能.除去对原始句子进行词汇、句法分析和谓词识别等预处理外,目前大部分语义角色标注系统的标注过程采用四个步骤完成:剪枝、识别、分类和后处理.国内外很多学者对每个过程的研究也非常丰富,对于识别、分类阶段的特征挑选方面也进行了细致的研究.当然,并非所有的系统都包括以上4个步骤,特别是前两个步骤,其主要目的是提高处理效率,但随之带来的是召回率的下降,即损失了一些本应是语义角色的标注单元.因此,在某些系统中,去除了剪枝步骤.还有些系统合并了识别和分类步骤[29],直接对语义角色进行分类,也就是将非语义角色的标注单元也看成是一类.

4.1 剪枝算法

以句法成分为标注单元的语义角色标注,首先需要一种简单的剪枝预处理方法来过滤句法分析树中一些不可能成为语义角色的句法成分,保留尽量少的候选句法成分,以提高准确性.刘挺等[18]采用识别分类一步到位的方法对与谓词相关的全部句法成分进行训练和预测,只裁掉了句法类型为词性的句法成分.但使得AM-MOD和AM-NEG等角色对句法树上的句法成分匹配率很低,还要进行后处理.使用最广泛的剪枝算法是由Xue等[12]提出的.其基本思想是选取当前谓词结点和其祖先的兄弟结点作为候选角色,输入到角色识别阶段,其中如果当前结点是PP,则同时收集其直接孩子结点.

王红玲等[30]提出了基于中心词的剪枝算法,在预处理阶段,针对句法分析树中句法成分与语义角色不一一匹配的问题,在Xue[12]剪枝算法的基础上改进,提出了基于中心词的剪枝算法.该算法除选取当前谓词结点和其祖先的兄弟结点作为候选角色外,也选取这些兄弟结点的孩子结点,如孩子结点与其父亲结点具有相同中心词时,舍去孩子结点和其兄弟结点.该算法提高了系统的召回率(1.1%).

4.2 语义角色的识别和分类

标注方法语义角色的识别和分类步骤尤为重要,它们可以作为分类问题处理.也就是说,人们可以逐一判断一个标注单元是否是某一动词的语义角色,更进一步的,可以预测其属于何种具体的语义角色.最初人们使用基于规则的方法来解决分类问题,但是,此方法需要专家构筑大规模的知识库,这不但需要有专业技能的专家,也需要付出大量劳动.同时,随着知识库的增加,矛盾和冲突的规则也随之产生.为了克服知识库方法的缺点,人们后来使用机器学习的方法来解决此问题.该方法的优点是不需要有专业技能的专家书写知识库,只需要有一定专业知识的人对任意一种语言现象做出适当的分类即可.然后以此为训练数据,再使用各种学习方法构造性能卓越的分类器.该方法通常称为有指导学习(Supervised Learning)方法.虽然它能够较好的解决一些已有大量正确标注语料库的自然语言处理问题,但是通常,我们获得这种语料库的代价也是昂贵的.为此,人们试图使用未标注的语料库直接进行学习,这种方法被称作无指导学习(Unsupervised Learning)[31].或者只借助少量标注语料,利用大量未标注语料的半指导学习(Semi-supervised Learning)[32].然而无论是无指导学习,还是半指导学习,其理论都不甚完备,效果也不如有指导学习方法,但是泛化要好得多.

4.3 后处理

对于一个句法成分嵌套在另一个成分中的情况,如不采取处理系统有可能对这两个成分都进行了标注.但是,根据语义角色标注的规范,这是不允许的.因此,最简单的做法是在嵌套关系发生时,只保留一个角色.由于最大熵分类器能够很容易地预测每一个输出的概率,因此,处理嵌套时只把嵌套关系中概率最高的成分标注出来.

嵌套关系的处理也可以放在论元识别之后、分类之前进行.这是因为二元训练中样例大致平衡,准确率也比较高,同时对分类阶段引入的错误也可以降低.Toutanova等[33]采用了这种方法,而且还采用动态规划的方法,自底向上地从句法树的叶子结点开始到根计算当前句法成分为根形成的不嵌套的子树与当前句法成分分别为空角色和非空角色的概率和,从而取得不嵌套的论元序列.

王红玲等[34]提出了基于角色共现概率的去除重复论元算法,具体思想为:经过分类后,可取得最可能承担当前句法成分角色的两个角色的概率,即具有最高概率的两个角色,然后通过计算角色的共现概率,来决定最终的角色.在后处理阶段,针对语义角色标注中不允许两个嵌套的句法成分同时承担动词的角色的问题,提出了基于角色共现概率的去除嵌套关系的算法,其基本思想是根据角色共现概率的大小决定保留的角色.针对谓语动词不会同时存在两个或两个以上的相同的核心角色的问题,提出了基于角色共现概率的去除重复论元的算法,具体思想为:经过分类后,取得最可能承担当前句法成分角色的两个角色的概率,即具有最高概率的两个角色,然后通过计算角色的共现概率,来决定最终的角色.实验结果表明,角色分类的准确率普遍提高,而对召回率的影响很小.这个现象充分说明了后处理对角色分类是有效的.

5 结论和展望

语义角色标注的性能严重依赖于句法分析的性能,而这个问题在中文的语义角色标注中尤其突出;由于很难提出更有效的特征,基于短语结构的语义角色标注系统发展遭遇瓶颈,性能很难进一步提高;跨领域分析性能较差等各个方面.

由于句法分析的错误,语义分析的性能等原因,独立的语义角色标注系统很难获得满意的分析结果,因此试图融合多种语义角色标注的结果可以作为一种尝试.但要面对各种融合方法都或多或少的提高了系统的整体性能,当然也造成了系统构造复杂,分析效率不高等问题.

语义角色标注的性能离实用化还有一定的距离,需要继续深入研究.归纳起来,有以下几个方面有待进一步研究:

1)领域适应性问题.为了使语义角色标注达到实用的目的,必须解决领域适应性问题,也就是说解决测试语料和训练语料属于不同的领域,性能下降较多的问题.研究结果表明,Brown语料上的评测结果均较之WSJ语料结果低10%左右.真正解决这个问题还有很远的路要走.

2)句法分析和语义分析的联合学习.以往的研究均表明,不管是短语结构句法还是依存结构句法,语义角色标注系统的性能都受制于句法分析的性能,这一点在中文上表现尤为突出.实验结果表明:在英文中,使用手工标注和自动标注句法分析的SRL系统性能相差10%,而在中文上,这个值达到了30%.而进行联合学习是解决这个问题的一个有效途经.

3)基于依存句法分析的中文语义角色标注的进一步研究.这个研究方向刚刚起步,主要原因是没有合适的标注语料库,也没有合理的评测标准.已有研究表明,依存句法分析相比与短语结构的句法分析,含有更多的语义信息.因此该研究方向值得进一步深入研究.

[1] Shen D,Lapata M.Using semantic roles to improve question answering[C] //Annie Zaenen,Antal van den Bosch.Proceedings of the 2007Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning.Edmonton:Association for Computational Linguistics,2007:12-21.

[2] Mihai S,Sanda H,John W.Using predicate-argument structures for information extraction[C] //Erhard W Hinrichs,Dan Roth.Proceedings of the Annual Meeting on Association for Computational Lingustics.Sapporo:Association for Computational Linguistics,2003:8-15.

[3] 于江德,樊孝忠,庞文博.事件信息抽取中语义角色标注研究[J] .计算机科学.2008,35(3):155–157

[4] Bilotti M W,Ogilvie P,Callan J,et al.Structured retrieval for question answering[C] //Kraaij W,de Vries AP,Clarke CLA,eds.Proceedings of the 30th Annual Int'l ACM SIGIR Conf.on Research and Development in Information Retrieval.New York:ACM,2007,351-358.

[5] 秦兵,刘挺,李生.多文档自动文摘综述[J] .中文信息学报,2005,19(6):14-20.

[6] Braz R,Girju R,Punyakanok V,Roth D,et al.An inference model for semantic entailment in natural language[C] //Cristiano Castelfranchi.National Conference on Artificial Intelligence.Virginia:AAAI,2005:1 678-1 679.

[7] 吴晓锋,宗成庆.基于语义角色标注的新闻领域复述句识别方法.中文信息学报[J] .2010,24(5):3-8

[8] Jinho D C,Matha P.Transition-based semantic role labeling using predicate argument clustering[C] //Matsumoto,Yuji Mihalcea,Rada.Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics:Human Language Technologies.Portland:Association for Computational Linguistics,2011:37-45.

[9] Baker C F,Fillmore C J,Lowe J B.The berkeley frameNetproject[C] //Salimer M.Proceedings of the 36th Annual Meeting of the Association for Computational Linguistics and 17th International Conference on Computational Linguistics.Montreal:Association for Computational Linguistics.1998:86-90.

[10] Palmer M,Gildea D,Kingsbury P.The proposition bank:an annotated corpus of semantic roles[J] .Computational Linguistics.2005,31(1):71-106.

[11] Meyers A,Reeves R,Macleod C.The nombank project:an interim report[C] //Susan Dumais,Daniel Marcu,Salim Roukos Proceedings of HLT-NAACL 2004Workshop:Frontiers in Corpus Annotation.Boston:Association for Computational Linguistics,2004:24-31.

[12] Xue N.Annotating the predicate-argument structure of chinese nominalizations[C] //M Gild.Proceedings of the LREC 2006.Genoa:Association for Computational Linguistics,2006:1382 1387.

[13] You L P,Liu K Y.Building chinese framenet database[C] //Mrques K.Conference on Natural Language Processing and Knowledge Engineering(IEEE NLP-KE).NewYork:IEEE,2005:301-306.

[14] Punyakanok V,Roth D,Yih W T.The necessity of syntactic parsing for semantic role labeling[C] //R.Dale.Proceedings of IJCAI-2005.Berlin:Association for Computational Linguistics,2005:1 117-1 123.

[15] 王鑫,孙薇薇,穗志方.基于浅层句法分析的中文语义角色标注研究.中文信息学报[J] .2011,25(1):116–122

[16] Kwong O Y,Tsou B K.Semantic role tagging for chinese at the lexical level[C] //Robert Dale.Second International Joint Conference on Natural Language Processing.Jeju Island:Association for Computational Linguistics,2005:804-814.

[17] Hacioglu K.Semantic role labeling using dependency trees[C] //COLING'04Proceedings of the 20th international conference on Computational Linguistics.Geneva:Association for Computational Linguistics,2004:1 273-1 281.

[18] 刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J] .软件学报,2007,18(3):565-573.

[19] 李军辉,王红玲,周国栋,等.语义角色标注中句法特征的研究.中文信息学报[J] .2009,23(6):11-18

[20] Pradhan S,Hacioglu K,Krugler V,et al.Support vector learning for semantic argument classification[J] .Machine Learning Journal.2005,60(1):11-39.

[21] 丁伟伟,常宝宝.基于语义组块分析的汉语语义角色标注.中文信息学报[J] .2009,23(5):53-61,74

[22] Carreras X,Mrques L.Introduction to the conll2005shared task:semantic role labeling[C] //Daniel Gildea,CONLL'05 Proceedings of the Ninth Conference on Computational Natural Language Learning.Stroudsburg:Association for Computational Linguistics,2005:152-164.

[23] Duan H,Bai X,Chang B,et al.Chinese word segmentation at Peking University[C] //Qing Ma,Fei Xia.Proceedings of the Second SIGHAN Workshop on Chinese Language Processing.Sapporo:Association for Computational Linguistics,2003:152-155.

[24] Hacioglu K.Semantic role labeling using dependency trees[C] //Joakim Nivre,COLING'04Proceedings of the 20th international conference on Computational Linguistics.Geneva:Association for Computational Linguistics,2004:1273-1276.

[25] Pradhan S,Ward W,Hacioglu K,et al.Semantic role labeling using different syntactic views[C] //Kevin Knight,Hwee Tou Ng,Kemal Oflazer.Proceedings of the 43rd Annual Meeting of the Association for Computational Linguistics,Ann Arbor:Association for Computational Linguistics,2005:581-588.

[26] Swanson R,Gordon A S.A comparison of alternative parser tree paths for labeling semantic roles[C] //Nicoletta Calzolari,Claire Cardie,Pierre Isabelle.Proceedings of the 21st International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics.Sydney:Association for Computational Linguistics,2006:811-818.

[27] Johansson R,Nugues P.The effect of syntactic representation on semantic role labeling[C] //Donia Scott,Hans Uszkoreit,Proceedings of 22nd International Conference on Computational Linguistics.Stroudsburg:Association for Computational Linguistics 2008:393-400.

[28] Johansson R,Nugues P.Dependency-based semantic role labeling of PropBank[C] //Mirella Lapata,Hwee Tou Ng,Proceedings of the 2008Conference on Empirical Methods in Natural Language Processing,Honolulu:Association for Computational Linguistics.2008:69-78.

[29] Liu T,Che W,Li S,et al.Semantic role labeling system using maximum entropy classifier[C] //Daniel Gildea.CONLL'05 Proceedings of the Ninth Conference on Computational Natural Language Learning.Stroudsburg:Association for Computational Linguistics,2005:189-192.

[30] Wang H L,Zhou G D,Zhu Q M.Dependency tree-based SRL with proper pruning and extensive feature engineering[C] //Iryna Gurevych,Delphine Bernhard.Proceedings of the 22nd International Conference on Computational Linguistics(Coling 2008),Manchester:Coling 2008Organizing Committee,2008.23-24.

[31] Swier R S,Stevenson S.Unsupervised semantic role labelling[C] //D Lin,D Wu.Proceedings of the 2004Conference on Empirical Methods in Natural Language Processing.Barcelona:Association for Computational Linguistics,2004:95-102

[32] 陈耀东,王挺,陈火旺.半监督学习和主动学习相结合的浅层语义分析.中文信息学报[J] .2008,22(2):70-75

[33] Zhang M,Che W X,AW A T,et al.A grammar-driven convolution tree kernel for semantic role classification[C] //Annie Zaenen,Antal van den Bosch.Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics.Prague:Association for Computational Linguistics,2007:200-207.

[34] Wang H L.Research on feature-based semantic role labeling for English and Chinese[D] .Suzhou:Soochow University,2008.

猜你喜欢

谓词组块句法
句法与句意(外一篇)
述谓结构与英语句法配置
横浪作用下大型上部组块双船浮托安装动力响应特性试验研究
被遮蔽的逻辑谓词
——论胡好对逻辑谓词的误读
党项语谓词前缀的分裂式
句法二题
诗词联句句法梳理
陆丰7-2油田导管架平台上部组块低位浮托安装关键技术
也谈“语言是存在的家”——从语言的主词与谓词看存在的殊相与共相
英语词汇组块学习路径研究——组块法