文本情感倾向分析

2011-06-28黄萱菁吴苑斌

中文信息学报 2011年6期

黄萱菁，张奇，吴苑斌

(复旦大学计算机科学技术学院，上海 201203)

1 引言

随着互联网的发展和以用户为中心的Web2.0业务的不断扩展，人们可以随时随地通过论坛、博客、微博等各种方式分享心情、想法和观点。这些信息中包含了大量用户对于事件、产品、人物等对象的评论信息，同时也影响到了舆论热点的形成和人们的消费习惯。评论信息不论对于政府、企业还是个人都十分重要。对互联网用户的调查发现，用户普遍会在购买产品之前通过网络对产品进行调查，同时大部分用户也认为产品评论对其购买意愿产生了影响。此外，公众对于舆情热点的观点和倾向也经常影响政府机构的决策行为。因此，如何自动地从海量的非结构化评论中挖掘出高层次的语义信息并加以表示，就成为了人们的迫切需求。文本情感倾向分析(Sentiment Analysis/Opinion Mining)的研究正是在这一背景下应运而生。

自然语言处理的研究已有悠久的历史，但是绝大部分的工作都集中于对事实性文本的挖掘和处理。而文本情感倾向分析则关注对说话人的态度(或称观点、情感)的分析，也就是对文本中主观性信息的挖掘和处理。文本情感倾向分析涉及到语言学、认知理论、机器学习、数据挖掘、信息检索等多个领域，包含很多待解决的具有挑战性的问题，已成为自然语言处理的一个热门方向。以ACL为例，2006年ACL会后举办了倾向性分析的专题研讨会[1]，从2007年开始ACL将倾向性分析列为大会主题之一，此后SIGIR，SIGKDD，WWW，EMNLP，COLING，IJCNLP等会议中也都有大量的倾向性分析相关论文。

文本情感倾向分析可以粗略地分为两个大类：倾向性分类和倾向性信息抽取。倾向性分类将文本情感倾向性分析转化为文本分类问题，即利用有监督、无监督以及半监督的方法，对给定的篇章、段落、句子、短语或者单词是否具有倾向性，以及倾向性的极性进行分类。倾向性信息抽取则是更精细的分析方法，这类方法通常是将具有倾向性的文本转化为框架、槽等情感倾向性表示形式。在情感倾向性分析中需要使用命名实体识别、关系抽取、句法分析等自然语言处理底层技术。

随着文本情感倾向分析研究的不断深入，对于具有倾向性的特殊句式的研究也逐渐展开，例如：对于带有倾向性的比较句式的研究等[2]。除此之外，也有学者开始涉及具有倾向性的句子间关系分析等篇章级研究[3]。在倾向性分析应用，以及倾向性分析与其它任务相结合的研究也在逐渐展开，例如：倾向性文本摘要[4]、倾向性信息检索[5]、舆情分析等[6]。由于文本情感倾向性分析处理的语料大多来源于用户生成内容(user-generated content，UGC)，其中包含一定数量的垃圾，因此倾向性垃圾数据的查找与检测也成为近年来一个研究热点[7]。

本文中，我们将首先对文本情感倾向分析这一问题的不同任务进行定义，并对在不同任务下的倾向性表示这一基础问题进行阐述；之后我们分别对倾向性分类和倾向性信息抽取两大类方法分别进行归纳和介绍；接下来对常见的倾向性分析基准语料库和国内外主流评测会议以及情感倾向分析的主要应用领域进行介绍；最后，对情感倾向分析技术进行了总结，并对发展趋势进行展望。

2 问题定义与倾向性表示

在引言中我们提到，文本情感倾向分析是对文本中主观性信息的挖掘和处理。在本章中，我们将利用如下一段关于数码相机的评论来对情感倾向分析这一问题进行进一步阐述，并讨论不同粒度的倾向性表示。

例子：尼康D7000的外观和D90如出一辙，无论是体积还是按键布局都很合理。D7000相比D90有着非常大的升级，该机背部和顶盖采用了坚固的镁合金材质。虽然相机手柄和前脸并不是金属板，但是却几乎被橡胶蒙皮覆盖，非常的上档次。但是，D7000售价让很多N粉大为失望，价格太高。

关于这段文本中的情感倾向性我们希望得到哪些信息？首先，我们可以看到这段文字中有很多句子都具有倾向性，其中前三句是正面评价，而最后一句是负面评价。更深入一些，我们可以看到第一句话对尼康D7000这个产品的“体积”和“按键布局”，使用了“合理”这个词进行评价。第二句话对“背部”和“顶盖”所使用的材料进行说明，同时隐含地表达了正面评价。第三句话包含一个转折关系，它对相机的“手柄”和“前脸”给出了褒义的评论。最后一句话对D7000的“价格”这一属性给出了负面评价。同时所有这些评论都是由说话人给出的。在此基础上，我们还可以从这段话中看到，第一句话中对D90的两个属性“体积”和“按键布局”也给出了隐含的正面评价。第二句话中对D7000和D90进行了比较，句子中的第二个从句作为原因说明了第一个分句。此外第一句与第二句话之间存在并列关系，第三句话与第四句话间是转折关系。针对这些需求，我们可以更正式地定义情感倾向分析任务。

任务1：倾向性分类，是指对给定一段文本(文本可以仅包含一个单词，也可以是一整篇文章)，对其是否包含倾向性及其倾向性极性进行分类。通常的分类状态包含{贬义，中性，褒义}。

倾向性分类问题包含词语、短语、句子、段落、篇章等各个级别，其表示形式通常比较简单，与一般的分类问题相同。近期的一些研究在分类的基础上，加入了强度信息，或者将分类状态变成若干级别(将强度包含在不同状态中)[8]。

任务2：倾向性信息抽取，是指根据预先给定的倾向性单元定义(参见下文)，对于输入的一段文本(通常为句子或者篇章级别)，从中抽取出其所评论的评价对象、评价词和评价者等组成倾向性评价单元的要素，并识别要素或者评价单元间的关系。

2004年在文献[4]中提出了基于特征(Feature-based)的倾向性单元的概念，2007年在文献[9]中将关系抽取引入到倾向性信息抽取中，并将倾向性单元的定义进一步丰富。倾向性单元一般表示为五元组，包括：评价者、评价对象、评价词、强度、极性，如评价对象是产品，还可进一步细分为产品和特征两个子元素。

例如：尼康D7000的键位设置合理，操控符合用户习惯。

从这句话中，我们可以抽取出表1所示的两个五元组表示的倾向性单元。

表1 倾向性信息抽取五元组表示结果

由于五元组方式表示的倾向性单元，不能很好地表示比较、条件、原因等复杂的倾向性。为了解决这些问题，2008年Ganapathibhotla等[2]提出了篇章级别的评价解释，2011年复旦大学吴苑斌等提出了更复杂的基于图的倾向性表示方法[10]。如图1所示[10]，图中的顶点由评价者、评价对象、评价词、原因、条件等实体组成，边表示了顶点间的关系，顶点类型和边的类型可以根据不同的应用进行更改和扩展。

图1 基于图的倾向性表示

3 倾向性分类

倾向性分类和基于主题的文本分类在任务上有着“第一眼”的相似性——两者都需要把待分类文档对应到不同的文档类别中。倾向性分类将文本划归成褒义、贬义、中立；或者主观(包含倾向性)、客观(不包含倾向性)等类别。而基于主题的文本分类则将文本归类到不同主题的类别集合。

Pang等人[11]比较了不同类型的分类器在倾向性分类问题上的性能，使用了与传统文本分类相似的特征(Unigram,Bigram等)，同时也最早在电影评论语料中提出电影情节和电影评论之间的耦合对倾向性分类的影响。Yu等人利用朴素贝叶斯分类器，将词语作为特征,对句子的倾向性进行了分类研究[12]。另外在模型、特征以及特征选择等方面也有一些针对倾向性分类问题的研究[13-15]。除了针对篇章和句子的倾向性分类之外，对词语的极性、强度和上下文模式的分析也受到很多关注。对中文词语而言，北京大学的王治敏等人[16]基于《人民日报》基本标注语料库的真实文本实例进行统计归纳，得到词语的情感倾向。物理学中的Spin模型也被用来估计单个词语的倾向性极性[17]。

然而“主题”和 “倾向性”作为文档两个不同维度，在实际分类任务中会给分类器的设计带来区别。经典的文本分类方法通过分析文档中词汇，得到待分类文档与已分类文档的相似程度，根据相似程度的大小赋予相应的类标签。从分类器使用的特征上看，词特征在其中扮演了重要的角色。它利用了一个假设：相同主题的文档往往含有相同的词语。而在倾向性分类中，这个假设能够成立的范围明显缩小，即仅仅依靠特定词来断定文档倾向性的方法不再可靠。主要体现在以下几个方面。

1. 领域依赖性。在不同的领域中,含有完全不同词的文本可能有相同的倾向性，而同一个词在不同的领域中可能代表不同的倾向性。

2. 上下文依赖性。一个词出现在同一文章的不同上下文可能具有不同的倾向性。(例如：在一篇汽车评论文档中，“高”在“安全系数高”和“油耗高”两个不同的上下文中所表示的倾向性不同。)

这两点可以统一为倾向性与主题的耦合。无论是整体(即领域)，还是局部(即上下文)，情感倾向性的确定都和主题紧密相连。因此倾向性分类的核心问题在于处理倾向性和主题的关系，包括如何划定上下文，如何定位可能的倾向性，如何利用先验的倾向性推断未知的倾向性等。

针对倾向性分类的领域依赖性强的问题，迁移学习(Transfer Learning)从机器学习的角度提供了一种解决框架。它能够通过领域之间的联系，将一个领域中得到的模型迁移另一个不同的领域。在文献[18]中首先研究了structural correspondence learning (SCL)在跨领域倾向性分类上的应用。中国科学院计算技术研究所的吴琼等提出了基于图(Graph based)的迁移方法[19]；谭松波等人则采用了基于朴素贝叶斯分类器的迁移学习方法[20]。

针对上下文依赖问题，文献[21]中使用了和传统词义消歧类似的方法，并指出由于较传统词义消歧，倾向性的消歧粒度较粗，应用在实际系统中能够起到不错的效果。其主要关注的问题是：当一个词带有不同的情感倾向含义时，如何确定其在给定语境下的含义和倾向性。

此外，还有研究工作为了更进一步地除去噪声，试图打破倾向性和主题的耦合。Mei等人使用multi-Gaussian mixture model来对文档建模，将文档的分布视为Topic model和 Sentiment model的混合[22]。中国科学院自动化的赵军等提出了在条件随机场中引入了层次化标签，同时考虑主观性，倾向性(褒贬)，倾向性强度，使得每个部分的特征能相互增强的方法[23]。北京大学的万小军通过利用中英文双语知识，来提高中文倾向性分类的性能[24]。苏州大学的李寿山等则提出了利用欠采样和随机子空间生成方法，来解决情感倾向分类中的不平衡和半监督学习问题[25]。

4 倾向性信息抽取

倾向性信息抽取任务是在句子或篇章级别抽取和情感倾向相关的要素。相比于倾向性分类，倾向性信息抽取是一个更细粒度的任务，从句法和语义角度对文档进一步分析。

针对五元组形式的倾向性单元表示，倾向性信息抽取的一种方法是将其转化为命名实体识别和关系抽取任务。同样地，与传统的命名实体识别和关系抽取任务不同，倾向性信息抽取也需要考虑主题与倾向性的耦合问题。早期的工作通过人工制定模版来识别倾向性要素及其之间的关系[4]。这样简单的处理能够得到不错的准确率，但在召回率上的表现却不尽人意。因此如何自动有效地抽取倾向性要素及其之间的关系是目前研究的重点。

在倾向性要素方面，针对评价对象的抽取，近年来也有了更细致的工作。针对在线评论中的评论对象往往带有复杂的层次嵌套结构这一问题(例如，油耗为发动机的一个属性，则发动机与油耗间就具有一种层次关系)。能否分析复杂的评价对象，关系到是否能将情感准确的定位。一种方法是利用预定义的本体树和层次化学习来分析这样的复杂情况[26]。而为了克服人工直接构建本体树带来的困难，可以利用领域特征，自动地构建评论语料中评论对象的层次化结构，从而免去了人工构建本体库的困难[27]。哈尔滨工业大学赵妍妍等提出了利用句法结构相似度以及启发式的方法来查找可能的评价对象的方法[28]。还有一些研究工作使用互增强的算法框架，利用评价词和评价对象之间的关系，迭代的挖掘倾向性要素[29]。

在评价词抽取方面，早期的工作[2，9]大都采用字典查找的方法，即构建或利用已有的包含词语倾向性的词典，通过在文本中查找这些词语来确定评价词。由于该方法受到倾向性词典规模的限制，而构建大规模倾向性词典需要花费大量的人工，因此也出现了一些自动的倾向性词典构造和基于统计机器学习的评价词抽取算法。Riloff等人提出了利用Bootstrapping方法来学习评价词抽取模板的方法[30]。北京大学徐戈等提出了根据少量种子词利用基于图的词语倾向性排序算法，用来构建倾向性词典[31]。而Breck等人则将评价词的抽取问题转化为序列标注问题，并利用条件随机场方法对该问题进行建模[32]。

在关系抽取方面，从句法角度，可以使用上下文无关的统计特征，自动抽取能够匹配评价词和评价对象关系的语法模板[9]。也可以借鉴树核方法，将倾向性要素在句法分析树上的关系作为分类依据，通过定义相应的树核函数，刻画这些关系在句法树上的相似程度[33]。从语义角度，可以使用语义角色标注(Semantic Role Labeling)的方法，以 FrameNet中所定义的语义角色作为发现形象性信息的线索[34]。例如，“事件——主题——参与者——表述者”模型中的“参与者”角色可以对应到评价对象。由于语法、语义分析器本身会引入一些错误，所以另外一种方法是不使用现有的语法、语义分析器，直接由标注语料得到倾向性要素的标注器。文献[10]中定义了类似于语义角色标注的倾向性要素表示方式，利用结构化机器学习方法得到倾向性要素间的关系。

除此之外，由于在线评论的语言往往是丰富的，除了以上的五元组表示方式外，有一些特殊的句式也提供了许多有意义的信息。例如，用户往往会比较不同的评论对象，来表达自己对不同对象的观点，例如，在第二章中我们给出的例子“D7000相比D90有着非常大的升级”。这样的信息对于倾向性信息的抽取也是相当重要的，它能提供倾向性之间的关系。文献[35]研究了带有比较的评论句子。同时，用户也会对自己的观点施加各种限制条件，例如，“低档位时发动机噪声很大”，将“低档位”作为倾向性成立的限制条件抽取出，能够保证更为准确的抽取结果。文献[36]中首先讨论了如何找出带有条件的评论句子。

5 语料库与评测

与自然语言处理、信息检索和数据挖掘领域的其它任务类似，基准语料库和公共评测对于推动文本倾向性分析技术的发展有着至关重要的作用。本章中我们将分别介绍一些较有影响力的基准语料库和公共评测。

5.1 语料库

经过多年的努力，目前研究者们已经针对文本情感倾向分析的不同任务、不同领域、不同语种构建了多个基准语料库。下面我们按照不同任务、颗粒度和语种分别进行介绍。

针对倾向性分类任务，2002年Pang和Lee公开了包含700篇正面和700篇负面电影评论的语料库Movie Review Data*http://www.cs.cornell.edu/people/pabo/movie-review-data/，之后这个语料库规模扩展到1 000篇正面和1 000篇负面影评的规模。2004年他们还提供了共计10 000个句子，并包含倾向性信息的标注语料，该语料库广泛应用于句子和篇章级倾向性分析中。中国科学院计算技术研究所吴琼等在2010年文章中，介绍了他们所创建的包含 17 122 篇正面和负面评论文章，涵盖影视、教育和书籍等在内的9个主题的语料库[37]。在词语倾向性分析研究中，经常用到Stone 等人在1966年给出的General Inquirer Lexicon[38]，它包含3 672个单词，其中1 598个被分类为褒义，2 074个被标记为贬义。在中文词语倾向性方面，上海交通大学姚天昉等在2007年构建了包含强度信息的汉语情感词词典，包含3 120个褒义情感词和3 485个贬义情感词[39]，为中文词语级倾向性分类的研究提供了帮助。

针对倾向性信息抽取任务，Hu和Liu在2004年提供了包含4个类别共5种产品的语料库，该语料库对每个句子标记了评价对象、倾向性极性及其强度信息*http://www.cs.uic.edu/～liub/FBS/sentiment-analysis.html。MPQA(Multi-Perspective Question Answering)*http://www.cs.pitt.edu/mpqa/databaserelease/最初是由Wiebe等人在2002年构建的带有深度标注的倾向性分析语料库，目前的2.0版本中包含692篇文档，其中每句都标记了评价对象、评价表达式、极性和强度等在内的信息。在2008年，中国科学院自动化研究所和复旦大学一起构建了由478篇评论构成的包含汽车、数码相机、笔记本、手机四个领域的语料库，标注了其中的评价对象以及作者对该评价对象的倾向性所构成的倾向性单元[40]。

5.2 评测

除了各种类型的基准语料库之外，近年来国内外也开展了一系列的倾向性相关评测活动，对推动这个领域的发展起到了很好的作用。

美国国家标准局NIST的文本检索会议(TREC)，从2006年起连续组织了5年Blog Track任务*http://ir.dcs.gla.ac.uk/wiki/TREC-BLOG.，要求从博客中检索出与输入的查询相关且表达了倾向性的内容。它将篇章级的倾向性分类引入到检索任务中，受到了广泛的关注。国内先后有中国科学院计算技术研究所、清华大学、武汉大学、中国科学院自动化研究所、大连理工大学、北京邮电大学、复旦大学等在内的多家单位参加了该项评测，在多个评测指标上都取得了不错的成绩。

NTCIR项目自2007年起开始进行倾向性分析的评测，图2为他们在NTCIR-6上给出的观点分析的路线图*http://research.nii.ac.jp/ntcir/ntcir-ws6/opinion/index-en.html.。他们从多种语言、多信息源、多种颗粒度等方面对倾向性分类和倾向性信息抽取这两大类问题进行评测。中国科学院软件研究所、北京大学、中国科学院自动化研究所、东北大学、北京邮电大学、哈尔滨工业大学等单位参加了该项评测，并在多个评测指标上名列前茅。

图2 NTCIR 文本情感倾向分析评测路线图

2008年起，由中国中文信息学会信息检索专委会主办，开始推出了中文倾向性分析系列评测。提出了包括词语贬褒极性判别和篇章级主客观分析等在内的6个任务[40]。第一、二届中文倾向性分析评测共吸引了来包括日本、香港在内的近20家国内外一线科研单位的30多个科研团队参加。COAE2008/ 2009评测任务汇总见表2。今年将举办的第三届中文倾向性分析评测(COAE2011)，设置4个评测任务，首次将上下文语境信息对倾向性判别的影响加入到倾向性评测中。COAE评测对于中文情感倾向分析的研究起到了很好的推动作用，为中文的情感倾向分析提供了平台和基准语料集，近30篇国内外倾向性分析工作中使用或参考了该评测。

表2 COAE2008/2009 评测任务汇总表

6 应用

倾向性分类和倾向性信息抽取任务，为其他诸多与倾向性相关的应用提供了基本技术支持，包括情感信息检索，情感倾向摘要等。同时这些应用也反过来推动了倾向性分类和信息抽取技术的发展。

情感信息检索与传统的信息检索相比，不仅要求能够得到和查询相关的文档，同时要求所得的文档要包含和查询相关的倾向性。情感信息检索面对的困难之处在于： 1) 文档往往来源于博客，微博等非正式文本，它们的随意性使得检索系统本身性能受到影响；2) 如何定位和表示查询词中的倾向性。由于用户查询也会带有倾向性，则除去传统检索中的查询分析外，还需要考虑查询的情感倾向。清华大学张敏等提出了如何在传统检索模型对文档的评分过程中加入对倾向性的评分，并考察了不同的文档排序方案[41]。复旦大学黄萱菁等[5]提出了一个针对情感信息检索的检索模型，并证明了依赖于倾向性分析的查询扩展能提高整体检索性能。

情感倾向摘要任务希望从网络文本中摘出用户对某个主题的情感倾向。网络文本一方面有大量重复，无意义的评论，另一方面也提供了许多用户提供的信息，包括对产品的打分，排序，甚至有半结构化的信息(产品网站要求用户对产品的不同部分做不同评论，或者要求在评论时分优缺点分开评论)。如何去除噪声，同时利用这些特点对文本进行摘要，是情感倾向摘要与传统摘要不同的地方。清华大学庄丽等提出了基于多种知识的电影评论发掘和摘要方法，融合了WordNet、统计分析结果和电影知识等[42]。Titov等使用了类似Topic model方法，对文档中的词按不同的评论对象聚类，从而得到针对某一产品的评论摘要[43]。

随着评论信息受到越来越多的重视，利用评论信息发布虚假评论、重复评论发布等情况也越来越多，因此如何从海量信息中查找与检测垃圾评论也成为近年来一个研究热点。2007年Jindal等首次提出这个问题，并利用拷贝检测和分类器来检测评论中的垃圾信息[7]。清华大学李方涛等提出了一种结合评价者和产品信息的评论文章评价框架，并通过在15 507篇文章的上实验验证了算法的有效性[44]。除了对评论文章进行分析外，还有利用评分行为对评论作者是否是垃圾发布者进行分类的方法[45]。

7 结论与展望

本文对文本情感倾向性分析的两类任务进行了定义，并归纳了倾向性的不同表示。除此之外，还分别对倾向性分类和倾向性信息抽取两大类任务的研究方法进行了分析和总结，也介绍了常见的倾向性分析基准语料库和国内外主流评测会议，并对情感倾向性分析的主要应用领域进行了简单概述。总结情感倾向分析的研究现状，应该说情感倾向分析的研究已经取得了很多有影响力的成果，至于未来的发展趋势，我们认为情感倾向分析研究在如下几个方面值得考虑。

1) 语料来源的变化。2006年开始的TREC Blog Track 所处理的是博客内容，NTCIR在2008年之后也开始转向博客语料的处理。论坛、博客等用户生成内容可以反映大众的真实情感和态度。随着微博的发展，探索微博数据的特点，以及如何分析利用微博数据的倾向性是值得考虑的问题。

2) 倾向性语义表示问题。使用传统的槽方式对倾向性进行表示面临瓶颈，复杂的倾向性信息不能正确地进行表述，对于之后的倾向性分析应用也会造成一定影响。如何构造更好的倾向性语义表示应该是今后的重点研究方向之一。

3) 上下文语境对倾向性分析的影响。相同的词语、句子处于不同的语境下面会有不同的倾向性极性，这一问题已经引起国内外研究者的关注。在COAE 2011的评测中也特别提出了将其融入到相关任务中。

4) 语义理解。倾向性分析本质上也属于自然语言处理的范畴，需要对文本内容进行深入理解。目前的研究因为是起步阶段，有很多问题值得探讨，也产生了很多研究成果，但是目前绝大多数算法都基于统计方法，逐渐遇到了自然语言处理中的语义理解瓶颈，如何引入更多的语言知识和认知知识也是值得考虑的方向。

目前已有一些倾向性分析的商业软件与产品，例如，中科天玑倾向性分析系统Sentifier*http://www.golaxy.cn/、北大方正HNC评价分析系统*http://www.hncit.com/、上海语天倾向性分析系统*http://www.laiseek.com/、拓尔思互联网舆情监控系统*http://www.trs.com.cn等。随着文本倾向性分析技术的不断发展和研究的深入，一方面可以提高现有的倾向性分析系统的精度，另一方面在倾向性语义表示、篇章级倾向分析等方面的进步，可以为商业系统提供更多深入的信息加以利用。

[1] ACL 2006 Workshop on Sentiment and Subjectivity in Text[DB/OL], http://www.aclweb.org/anthology-new/W/W06/#0300, 2006.

[2] M. Ganapathibhotla， B. Liu. Mining Opinions in Comparative Sentences[C]//Proceedings of the 22nd International Conference on Computational Linguistics (Coling-2008), Manchester, 18-22 August, 2008.

[3] S. Somasundaran, J. Wiebe， Josef Ruppenhofer (2008) Discourse Level Opinion Interpretation[C]//Coling, Manchester, 18-22 August, 2008.

[4] M. Hu, B. Liu. Mining and summarizing customer reviews[C]//KDD ’04 Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining. 2004.

[5] Xuanjing Huang, W. Bruce Croft. A unified relevance model for opinion retrieval[C]//The 18th ACM International Conference on Information and Knowledge Management (CIKM ),2009.

[6] 李成伟,彭勤科,徐涛. 基于信息推理的网络新闻在线评论情绪分类[J].中文信息学报,2009,23(5):75-79.

[7] N. Jindal, B.Liu. Review spam detection[C]//WWW ’07 Proceedings of the 16th international conference on World Wide Web, 2007.

[8] Theresa Ann Wilson. Fine-grained Subjectivity and Sentiment Analysis: Recognizing the Intensity, Polarity, and Attitudes of Private States[D]. Ph.D Dissertation, University of Pittsburgh, 2008.

[9] N. Kobayashi, K. Inui, Y. Matsumoto. Extracting Aspect-Evaluation and Aspect-of Relations in Opinion Mining[C]//Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning (EMNLP-CoNLL), 2007.

[10] Y. Wu, Q. Zhang, X. Huang, et al. Structural Opinion Mining for Graph-based Sentiment Representation[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing(EMNLP), 2011.

[11] Bo Pang, Lillian Lee. Shivakumar Vaithyanathan Thumbs up? Sentiment Classification using Machine Learning Techniques[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP), 2002.

[12] Yu H, Hatzivassiloglou V. Towards Answering Opinion Questions: Separating Facts from Opinions and Identifying the Polarity of Opinion Sentences[C]//Proceedings of EMNLP-2003.

[13] Evgeniy Gabrilovich, Shaul Markovitch . Text Categorization with Many Redundant Features: Using Aggressive Feature Selection to Make SVMs Competitive with C4.5[C]//ICML 2004.

[14] Vincent Ng, Sajib Dasgupta, S. M. Niaz Arifin. Examining the role of linguistic knowledge sources in the automatic identification and classification of reviews[C]//Proceedings of the COLING/ACL Poster Sessions, 2006.

[15] Maite Taboada, Julian Brooke, Milan Tofiloski et al. Lexicon-based methods for sentiment analysis[J]. Computational Linguistics 2011, 37(2):267-307.

[16] 王治敏，朱学锋，俞士汶.基于现代汉语语法信息词典的词语情感评价研究[C]//Recent advancement in Chinese Lexical Semantics, Proceeding of 5th Chinese Lexical Semantics Workshop (CLSW-5), 2004, Singapore .

[17] Hiroya Takamura, Takashi Inui, Manabu Okumura Extracting semantic orientations of words using spin model[C]//Proceedings of ACL 2005.

[18] John Blitzer, Mark Dredze, Fernando Pereira, et al. Boom-boxes and Blenders: Domain Adaptation for Sentiment Classification[C]//Proceedings of the Association for Computational Linguistics (ACL) 2007.

[19] Qiong Wu, Songbo Tan, Xueqi Cheng. Graph Ranking for Sentiment Transfer[C]//Proceedings of the Association for Computational Linguistics (ACL) 2010.

[20] Songbo Tan, Xueqi Cheng, Yuefen Wang, et al. Adapting Naive Bayes to Domain Adaptation for Sentiment Analysis[C]//Proceedings of 31th European Conference on Information Retrieval (ECIR) 2009: 337-349.

[21] Cem Akkaya, Janyce Wiebe. Rada Mihalcea Subjectivity Word Sense Disambiguation[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP). 2009.

[22] Mei, Q., Ling, X., Wondra, M. et al. Topic Sentiment Mixture Modeling Facets and Opinions in Weblogs[C]//Proceedings of the 16th International World Wide Web Conference (WWW), 2007.

[23] ZHAO Jun, LIU Kang, WANG Gen. Adding Redundant Features for CRFs-based Sentence Sentiment Classification[C]//Proceedings of The Conference on Empirical Methods in Natural Language Processing (EMNLP),2008.

[24] Xiaojun Wan. Co-Training for Cross-Lingual Sentiment Classification[C]//Proceedings of the Association for Computational Linguistics (ACL),2009.

[25] Shoushan Li, Zhongqing Wang, Guodong Zhou et al. Semi-supervised Learning for Imbalanced Sentiment Classification[C]//Proceedings of IJCAI-2011.

[26] Wei Wei. Jon Atle Gulla Sentiment Learning on Product Reviews via Sentiment Ontology Tree[C]//Proceedings of the Association for Computational Linguistics (ACL), 2010.

[27] Jianxing Yu, Zheng-Jun Zha, Meng Wang, et al. Tat-Seng Chua, Domain-Assisted Product Aspect Hierarchy Generation: Towards Hierarchical Organization of Unstructured Consumer Reviews[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP),2011.

[28] Yanyan Zhao, Bing Qin, Shen Hu, et al. Generalizing Syntactic Structures for Product Attribute Candidate Extraction[C]//Proceedings of the North American Chapter of the Association of Computational Linguistics (NAACL 2010 ), 2010.

[29] Guang Qiu, Bing Liu, Jiajun Bu, et al. Expanding Domain Sentiment Lexicon through Double Propagation[C]//Proceedings of the 21st International Joint Conference on Artificial Intelligence (IJCAI), 2009.

[30] Riloff E, Wiebe J. Learning Extraction Patterns for Subjective Expressions[C]//Proceedings of EMNLP-2003.

[31] Ge Xu, Xinfan Meng, Houfeng Wang. Build Chinese Emotion Lexicons Using A Graph-based Algorithm and Multiple Resources[C]//Proceedings of the 23rd International Conference on Computational Linguistics (Coling 2010), 2010.

[32] Eric Breck, Yejin Choi, Claire Cardie. Identifying expressions of opinion in context[C]//Proceedings of the Twentieth International Joint Conference on Artificial Intelligence(IJCAI 2007), 2007.

[33] Yuanbin Wu, Qi Zhang, Xuangjing Huang. Lide Wu Phrase Dependency Parsing for Opinion Mining[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP). 2009.

[34] Kim, S.M., Hovy, E. Extracting Opinions Opinion Holders and Topics Expressed in Online News Media Text[C]//Proceedings of the Workshop on Sentiment and Subjectivity in Text,2006.

[35] Murthy Ganapathibhotla, Bing Liu. Mining Opinions in Comparative Sentences[C]//Proceedings of the 22nd International Conference on Computational Linguistics (Coling) 2008.

[36] Ramanathan Narayanan, Bing Liu, Alok Choudhary. Sentiment Analysis of Conditional Sentences[C]//Proceedings of Conference on Empirical Methods in Natural Language Processing (EMNLP) 2009.

[37] 吴琼，谭松波，程学旗.中文情感倾向性分析的相关研究进展[J].信息技术快报，2010,8(4): 16-38.

[38] P. J. Stone, D. C. Dunphy, M. S. Smith, et al. 1966. The General Inquirer: A Computer Approach to Content Analysis[M]. MIT Press, Cambridge, US.

[39] 姚天昉, 娄德成.汉语情感词语义倾向判别的研究[C]//第七届中文信息处理国际会议，2007.

[40] 赵军，许洪波，黄萱菁，等.中文倾向性分析评测技术报告[C]//第一届中文倾向性分析评测(COAE 2008)， 2008.

[41] Min Zhang, Xingyao Ye. A generative model to unify topic relevance and lexicon-based sentiment for opinion retrieval[C]//The 31st Annual International ACM SIGIR Conference (SIGIR2008).

[42] Li Zhuang, Feng Jing, Xiaoyan Zhu. Movie Review and Summarization[C]//Conference on Information and Knowledge Management(CIKM 2006), 2006.

[43] Ivan Titov. Ryan McDonald A Joint Model of Text and Aspect Ratings for Sentiment Summarization[C]//Proceedings of the Association for Computational Linguistics (ACL) 2008.

[44] Fangtao Li, Nathan Liu, Hongwei Jin, et al. Incorporating Reviewer and Product Information for Review Rating Prediction[C]//Proceedings of the 23rd International Joint Conference on Artificial Intelligence (IJCAI), 2011.

[45] Ee-Peng Lim, Viet-An Nguyen, Nitin Jindal, et al. Detecting product review spammers using rating behaviors[C]//Proceedings of the 19th ACM international conference on Information and knowledge management(CIKM 2010),2010.