APP下载

基于共词分析的国内文本情感分析研究

2019-06-03陈红琳魏瑞斌张玮

现代情报 2019年6期
关键词:共词分析深度学习神经网络

陈红琳 魏瑞斌 张玮

摘 要:[目的/意义]对国内文本情感分析的研究成果进行梳理与计量分析,有助于从不同角度了解主题研究状况、发文情况,对后续的研究具有一定的参考价值。[方法/过程]本文对发文期刊、作者团队进行统计分析,并利用共词分析法,研究关键词之间的联系,探讨近十年来在文本情感分析的研究热点及现状。[结果/结论]结果表明,我国近两年对文本情感分析的研究主要有基于情感词典的机器学习和神经网络的深度学习两种方法,文章最后指出了两种方法的研究现状及未来研究方向。

关键词:文本情感分析;共词分析;情感词典;深度学习;神经网络

DOI:10.3969/j.issn.1008-0821.2019.06.010

〔中图分类号〕TP391.1 〔文献标识码〕A 〔文章编号〕1008-0821(2019)06-0091-11

Abstract:[Purpose/Importance]The research results of text sentient analysis were sorted out and quantitatively analyzed,which was helpful to understand the status of subject research and publishing,and it had certain reference value for subsequent research.[methods/Procedures]This paper made a statistical analysis of the published journals and author teams,and uses co-word method to study the relationship between keywords,and discussed the research hot spots and current situation of text sentient analysis in the past decade.[Results/Conclusion]The results showed that the research on text sentiment analysis in China in the past two years mainly included two methods:machine learning based on emotion dictionary and deep learning based on neural network.At last,the paper pointed out the future research direction of the two methods.

Key words:text sentiment analysis;co-word analysis;emotional dictionary;deep learning;neural network

目前,互联网的应用无论是广度还是深度,都呈井喷式飞速发展,伴随而来的是,网络中的数据以每天数亿计的速度快速增长。通过挖掘这些海量数据,我们能从中得到很多有价值的信息。近年来,越来越多的学者开始关注网络文本挖掘,其中文本情感分析成为最热门的研究问题之一,涉及政治、军事、经济、娱乐、生产生活等各个领域,通过分析其中蕴含的用户情感,了解用户喜好,将其作为决策依据。

为了系统全面地了解评论内容、跟踪舆情,越来越多的组织及个人利用计算机技术,对网络中的用户文本信息进行分析,文本情感分析由此产生。文本情感倾向分析又称意见挖掘,是针对观点持有人对某产品、事件或人物等的评论,进行倾向性的研究。马晓玲等[1]提出了文本情感分析的研究框架,并从基础理论研究和应用研究两个角度对代表性成果进行了分析。拥措等[2]分析国内外短文本情感分析的研究方法、研究热点和研究趋势。

1 数据来源与研究方法

1.1 数据来源

本文以CNKI(知网)为数据来源,于2018年8月5日,以“文本情感分析”为主题词,对CNKI全文数据库进行搜索,共得到1 038篇文献,排除学位论文,并对所有文献进一步处理,删除无作者、无单位、无年代、无关键字、无学科主题、重复的文献,最终得到334篇文献。

1.2 研究方法

提取適当词频的关键词能准确描述文献的研究内容,能代表该领域的研究主题[3],将文献的主题词两两统计出它们在同一篇文献中出现的次数,对这些词进行聚类分析,统计研究相关主题,从而找出领域研究热点,并分析未来研究趋势。

本文采用Excel、Python、SPSS作为研究工具,通过Excel对数据进行基础分析,统计文献分布情况;利用Python进行词频统计,并构造共词矩阵;SPSS对共词矩阵进行聚类分析,统计当今研究热点。

2 研究基本情况

2.1 时间分布

按发表时间对文献数量进行统计,结果如图1所示,从图1可以看出,国内在文本情感分析的研究开始于2006年,最早的一篇文献是叶强等[4]在《信息系统学报》上发表的“面向互联网评论情感分析的中文主观性自动判别方法》”,他们在论文中提出了一种中文主观性自动判别方法。图1显示“文本情感分析领域”每年的发文量基本呈现为一个线性增长。2014年之后,每年的发文量基本保持在50篇左右。从论文累积发表的数量看,该领域的论文数量呈现为指数函数,其增长的速度较快。这反映出该领域的研究得到了越来越多研究者的关注。

2.2 期刊分布

从统计结果来看,334篇论文分布于173种期刊。根据布拉德福定律,按照发文数递减的顺序对期刊进行排序,把该领域的载文期刊分为3个区域(核心区、相关区和离散区),每个分区的论文数量大体相当(107篇、105篇和122篇)。其中,核心区每本期刊为发文6篇以上,相关区每本期刊发文为2篇到5篇,离散区域每本期刊发文数为1篇。3个区域的期刊数量比为14∶37∶122,大致满足1∶n∶n2的关系。根据比利时情报学家埃格郝的布拉德福核心区数量计算法,将核心区期刊数量用下列公式来计算[5]:

2.3 作者发文

从统计结果看,334篇论文共涉及作者814人,人均发表论文2.43篇。发文2篇以上的有27人。大多数作者(不限第一作者)发文数为1篇(共726人),72人发文数为2篇,发文数为3篇和4篇的均为8人。作者发文数量的这种分布反映出该领域的研究队伍较大,但是其中持续产出数量较多的研究者较少。结合图2看,目前该领域的研究人员还较为分散,基本是“單兵作战”,周咏梅、李勇敢、樊娜、郑啸等合作规模较大。

对文章按照作者分类汇总,发现各个研究团队研究的侧重点略有不同。周咏梅、阳爱民团队主要研究基于语料库的文本情感分析,包括情感词典的构建方法[27-28]、语料情感类别自动标注方法[25-26];李勇敢等研究了一个用于中文文本情感分类的评测系统[29-31]:包括构建多级词库、制定成词规则、开展串频统计等的新词识别方法、基于依存模式的观点句识别算法等,并将其应用于微博情感分类,实验证明该方法的识别效率较高。樊娜团队主要采用机器学习的方法进行文本情感分析,包含两种研究方法:第一种是按照文本结构的特点,依据语句相近的原则,将文本分隔成若干语义段,再采用条件随机场模型进行主观内容提取和观点识别,从而确定文本倾向[32];第二种采用K-邻近算法将整个文本的情感分成局部情感和全局情感,建立条件随机场模型,确定文本中的局部情感,再采用K-邻近算法计算文本的全局情感[19]。郑啸团队对情感分析的机器学习方法作了深入地研究,有传统的机器学习方法[20]和基于神经网络的深度学习算法[21-22],神经网络学习算法是近两年来流行的一种文本情感分析方法,在复杂模型的海量数据训练方面有极大的优势。

2.4 高频关键词分布

关键词作为期刊论文的一部分,通常反映论文的研究主题或研究方法等内容。通过研究某一领域的关键词,可以把握该领域的研究方向和研究热点[33]。从334篇论文中共提取674个关键词。本文对部分关键词进行了合并等处理,如“微博”和“中文微博”、“支持向量机”和“SVM”等,由于本文检索主题词为“文本情感分析”,故从关键词中剔除“情感分析”和“文本情感分析”,得到词频不低于4的关键词,词频分布具体情况如表3所示。从表3可以看出,“情感词典”词频居首,达50次,词频为1的关键词530个,占比约79%。通过对文献关键词词频进行分析,发现诸如“情感分类”、“支持向量机”、“机器学习”、“卷积神经网络”等表示情感分析研究方法的关键词出现次数较多,这在一定程度上反映出该领域对文本情感分析的实现方法和技术关注较多。

2.5 关键词共词矩阵分析

对关键词按词频进行降序排序,能从一定程度上反映学科主题的研究方向,但是单纯的词频排序不能反映高频词之间的内在联系,不能全面地揭示学科的结构、研究热点及研究动态。表4为40个高频关键词(部分)共现矩阵,反映关键词共同出现在一篇文献中的次数。在共词矩阵中,两个关键词共同出现的次数越多,说明关键词联系越紧密,越能体现主题的研究内容。因此,有必要根据高频关键词构建共现矩阵。如表所示,矩阵的对角线为关键词的词频,上三角或下三角表示两个关键词共同出现的次数。

在图3树状图中阈值约为21的位置划分类团,可以得到4个热点的研究领域,从上往下看,第一个类团包括“卷积神经网络”、“深度学习”、“词向量”和“自然语言处理”等关键词,主要是关于文本情感分析深度学习方法;第二个类团包括“情感信息抽取”、“语料库”、“情感极性”和“情感强度”等关键词,主要基于情感词典的情感分析;第三个类团包括“主题模型”、“文本挖掘”、“LDA”和“神经网络”等关键词,围绕文本情感分析的相关模型和算法研究。第四个类团包括“网络舆情”、“数据挖掘”和“短文本”、“机器学习”、“语义规则”和“情感计算”等关键词,该类团主要是基于传统机器学习的文本情感分析方法。具体分类如表7所示。

2.6 多维尺度分析

多维尺度分析是把样本数据反映在二维空间距离,联系紧密的两点会靠得很近[34]。在SPSS中导入相异矩阵进行多维刻度分析,得到图4所示的多维尺度分析图。

从图4可以看出,二维坐标图中整体布局呈边缘分布,大致可以分成4簇。第一象限包含“情感词典”、“情感词”和“机器学习”等关键词,

对应聚类分析中的第四类,主要涉及情感词典的构建及应用传统机器学习算法进行情感分类;第二簇集中在第二象限处,对应聚类分析第一类,体现深度学习算法在情感分类领域的应用;第三象限对应聚类分析的第三类,构建神经网络分析模型进行情感分析;第四象限关键词对应聚类分析的第二类,依据语料库确定感情词的情感极性和情感强度,以此来确定文本情感。

3 结果分析

文本情感分析技术有两类:基于外部知识库(情感词典)的技术和基于机器学习的技术。本文通过对文献关键词进行高频词分析和聚类分析,对“文本情感分析”领域的研究内容有了整体的认识,将该领域的研究分为4类,其中第一类、第三类基于深度学习的机器学习方法,第二类是基于词典的情感分析,第四类为传统机器学习的情感分析。通过对文献进行分析发现,2016年前文本分析方法主要采用情感词典和传统机器学习的方法,2016年后深度学习技术的相关文献呈逐年递增的趋势。

3.1 基于情感词典的情感分析技术

情感词典是文本情感分析的基础,构造文本情感词典,标注词的极性与强度,从而判断文本情感。词典构建是文本情感分析的关键,研究人员在词典构建与改进方面作了大量的工作,在现有词典基础上不断改进,充分考虑文本特性和用户表达习惯。文本情感词典有人工构建和自动构建两种方式,比较典型的英文人工构建词典有WordNet、SentiWordNet、General Inquirer、Option Lexicon;中文人工构建的开放性的词典库有知网(HowNet)提供的情感分析词语集、大连理工的情感词汇本体库、台湾大学构建的情感词典NTUSD[31]。人工构建的方式由于效率低,且不适合跨领域研究,因而目前多采用自动构建的方式,在一定程度上增强了领域的适用性。

基于情感词典的文本情感分析的研究成果较多,在短文本情感分析方面效率较高。周咏梅等[18]在HowNet和SentiWordNet的基础上,将词语分解成多个义元后计算其情感倾向强度,并使用词典校正方法对词语的情感倾向值进行修正,并应用到微博文本情感分析。对于特定领域的情感分析,为提高分析精度,需要构建特定领域的情感词典。王勇等[23]围绕中文微博中的情感分类,构建了四个情感词典:基础情感词典、表情符号词典、否定词词典和双重否定词词典,在此基础上,融合汉语言特征及微博情感表达特征,提出了一种基于极性词典的分类方法,该方法准确率达82.2%。王文远等[24]提出一种构建表情符号情感词典的方法,通过对大量微博中与表情共现的文本的情感分析,从而来确定表情的情感倾向,以此构建的面向情感分析的表情情感词典,该方法对分析文本情感的准确性方面有所提高。以上的研究主要是从不同维度来改进情感词典,同时定义词的情感极性,这种方法最大的问题是情感区分度不够,对不同数据集适应性欠佳。阳林[36]针对情感词的情感确定性,提出了一种新的权值计算方法,即情感确定性越大,其权值也越大,词的情感倾向更明确,从而字典内的情感区分度明显,这种方法在情感判断中的准确性上有很大提高。阳爱民等[37]介绍了一种情感词典的构建方法,选用若干情感种子词,利用搜索引擎返回的词的共现数,通过改进的PMI(Pointwise Mutual Information)算法计算情感词的情感权值,该方法应用于不同的语料环境下,构建的情感词典,可有效用于情感特征选择和直接情感分类。

3.2 基于机器学习的文本情感分析

从上面的聚类结果分析可以看出,机器学习的情感分析方法分为两大类,一类是传统的机器学习方法,该方法以情感词典为依托,采用机器学习的算法进行情感分类,从而确定文本情感极性,该方法研究成果众多。另外一类是基于神经网络的机器学习方法,相关的研究成果也呈逐年递增的趋势。

3.2.1 传统的机器学习方法

传统的机器学习方法分为无监督的机器学习方法和有监督的机器学习方法。

无监督机器学习最常见的方法是计算整篇文档的正向关联度和负向关联度,用两者的差值判断整篇文档的情感极性。这种方法过分依赖于情感词的选择及语料测评的领域范围,正确率较低。李勇敢等[21]在2013年采用中文依存句法分析的方法,并对依存分析的结果进行剪枝和归并,再利用一些规则进行情感词的抽取和极性判断,在一定程度上克服了分词系统简单的分词而造成情感极性判断差错。随后在依存句法分析的基础上,提出了一种基于规则和统计的新词识别方法[22],在情感词和评价对象的依存模式的基础上给出基于词语特征的观点句识别算法,实现中文微博情感倾向性自动分类,并给出观点句识别的算法。

有监督的机器学习方法首先根据情感词典进行文本特征标注,然后采用机器学习方法对已标注的训练数據训练出一个较好的模型,再利用模型预测文本的情感极性。所采用的机器学习算法主要有朴素贝叶斯(Naive Bayes,NB)方法、基于最大熵(Maximum Entropy,ME)方法、基于支持向量机(SVM)方法等。从关键词词频可以看出,支持向量机词频为27,朴素贝叶斯为6,可见,SVM方法是学者们首选的机器学习算法,相关的研究成果较多[36-38]。由于文本包含词、词性、情感词、否定词和程度副词等特征,通过词的不同特征组合来进行情感分析效果更好,将SVM和CRF多特征组合用于微博情感分析,正确率较高[39-41]。

3.2.2 基于深度学习的情感分类技术

深度学习通过对数据进行多层级的建模来获得关于数据特征的层次结构以及数据的分布式表示。随着深度学习技术在计算机视觉和语音识别领域的成功应用,越来越多的深度学习技术被应用于自然语言的处理,循环神经网络和卷积神经网络是深度学习中影响力较大的神经网络算法。研究人员模拟人类的神经元对文本进行情感理解,从而得出文本情感极性及情感强度等特征。

在循环神经网络方面,Mikolov T等[42]在2010年使用循环神经网络处理上下文语言信息。F Morin等[43]提出了LSTM(Long Short-Term Memory长短时记忆)型循环神经网络,很好地解决了梯度膨胀和遗失问题。Socher R等[44]采用构建在句法分析树上的循环神经网络对电影评论文本进行情感极性判别。梁军等[45]将LSTM型神经网络从链式结构扩展到基于树形结构的递归神经网络(Recursive Neural Network,RNN)上,用于捕获文本更深层次的语义语法信息,并根据前后语句的关联性引入情感极性转移模型,实践证明,该模型性能较好。李天辰等[46]针对网络文本主题分散的特点,先对文本主题进行聚类,然后在每个子类上应用循环神经网络,对正负情感样本分别建立主题模型,最后基于所属主题和所属情感的概率极性联合判断,这种先通过主题聚类再进行分析的方法使得文本情感分类的准确性得到显著提高。郝志峰等[47]利用双向RNN构建基于序列标注的细粒度意见分析模型,通过融合文本的词向量、词性和依存关系等语言学特征,学习文本的修饰和语义信息,并设计一个时间序列标注模型,同时抽取属性并判断文本的情感极性。胡荣磊等[48]将LSTM和前馈注意力模型相结合,并在Tensorflow深度学习框架下实现了方案,根据准确率、召回率和F1测度等指标与现有方案的对比,该方案有明显的优势。

Kim Y[49]在2014年将卷积神经网络从图像领域引入到自然语言处理领域,通过文本向量化处理文本情感分析,取得了较好的效果,国内不少学者在神经网络分析方面也取得了一定进展。陈钊等[50]提出了一种结合卷积神经网络和情感计算资源的中文文本情感分析方法,先根据词典资源的抽象表达式来分析词语的属性特征,并将词语的情感极性和词性特征应用到文本特征表示,再利用卷积神经网络提取与文本表达式相关的序列特征作为文本特征向量进行情感分析,该方法比主流卷积神经网络有更好的性能。杜昌顺等[51]针对传统的卷积神经模型没有考虑句子的结构信息,采用分段池化策略将句子结构考虑进来,分段提取句子不同结构的主要特征,并且引入Dropout算法以避免模型的过拟合和提升泛化能力。还有不少学者将注意力机制应用到卷积神经网络[52-54],实践证明,两者的结合在文本情感分析上效果显著。针对单通道卷积神经网络视觉单一、不能充分学习到文本特征信息的问题,李平等[55]提出双通道卷积神经网络算法,一个通道为字向量,另一个为词向量,利用细粒度的字向量辅助词向量捕捉深层次的语义信息;陈珂等[56]提出一种基于多通道卷积神经网络的中文微博情感分析模型,该模型通过将不同特征信息结合形成不同的网络输入通道,从而可以从多方面的特征表示来学习输入句子的情感信息。

以上研究主要是对文本的情感分析,有时图片与文字融合能更充分地揭示用户情感,同时不同背景的用户均能容易地理解图文的内容和情感。蔡国永等[57]提出了一种基于卷积神经网络的图文融合媒体的情感分析方法,融合图像特征与3个不同级别(词语、短语、句子级)的文本特征构建卷积网络神经模型,以分析比较不同层次的语义特征对情感预测的影响。邓佩等[58]提出了一种基于转移变量的图文融合微博情感分析方法,该方法能更准确地预测微博情感倾向。

可见,深度学习分析文本情感中神经网络模型占据重要地位,在模型的构造和应用的研究中已初见成效,未来还需要在情感分析的准确性方面对算法进行改进与优化。

4 结束语

伴随着互联网中数据量的剧增,文本情感分析对于客户体验、市场研究、数字分析和媒体测评等变得越来越重要。本文采用共词分析方法,对文献高频关键词进行统计分析,从不同层面分析“文本情感分析”,得出结论如下:

1)系统聚类分析和多维尺度分析显示,文本情感分析过程中形成了情感词典、机器学习、深度学习三大类群体,且无论是传统的机器学习方法还是深度学习方法都与情感词典情感分析方法存在一定的联系,说明无论采用什么情感分析技术,都离不开现有的语料库,都以情感词典为依托采用机器学习的方法进行情感分析。所以未来情感词典的完善、特别是领域词典,依然是一个需要不断深入与细化的研究课题。

2)由于机器学习方法效率很大程度上依赖于所提取的文本特征,比如词袋模型特征、n-gram模型特征都面临数据稀疏及维数灾难等问题,因而近两年在“文本情感分析”机器学习方法呈现向深度学习方法转移的趋势。其中神经网络是最常用的深度学习方法。神经网络模型可以对纯文本、图文融合文本进行情感分析,分类准确率较高。下一步的研究重点应放在增强模型的鲁棒性方面,以适应不同长度和语言的文本。

参考文献

[1]马晓玲,金碧漪,范并思.中文文本情感倾向分析研究[J].情报资料工作,2013,(1):52-56.

[2]拥措,史晓东,尼玛扎西.短文本情感分析的研究现状——从社交媒体到资源稀缺语言[J].计算机科学,2018,45(S1):46-49,68.

[3]刘岩.基于共词分析的国内智慧图书馆研究探析[J].图书馆学研究,2018,(18):9-14.

[4]叶强,张紫琼,罗振雄.面向互联网评论情感分析的中文主观性自动判别方法研究[J].信息系统學报,2007,(1):79-91.

[5]夏德元,宁传林.“一带一路”新闻传播问题研究现状及热点分析[J].新闻与传播研究,2018,(1):32-36.

[6]杜嘉忠,徐健,刘颖.网络商品评论的特征-情感词本体构建与情感分析方法研究[J].现代图书情报技术,2014,(5):74-82.

[7]徐勇,张慧,陈亮.一种基于情感分析的UGC模糊综合评价方法——以淘宝商品文本评论UGC为例[J].情报理论与实践,2016,39(6):64-69.

[8]王仁武,宋家怡,陈川宝.基于Word2vec的情感分析在品牌认知中的应用研究[J].图书情报工作,2017,61(22):6-12.

[9]陈国兰.基于情感词典与语义规则的微博情感分析[J].情报探索,2016,(2):1-6.

[10]周瑛,刘越,蔡俊.基于注意力机制的微博情感分析[J].情报理论与实践,2018,41(3):89-94.

[11]刘雯,高峰,洪凌子.基于情感分析的灾害网络舆情研究——以雅安地震为例[J].图书情报工作,2013,57(20):104-110.

[12]王波.基于跨领域知识的基金评论情感分析[J].情报杂志,2011,30(2):44-47.

[13]王波,郭晓军.基于情感分析的网络财经媒体通货膨胀预期研究[J].图书情报工作,2011,55(16):140-143,90.

[14]王洪伟,张对,郑丽娟,等.网络股评对股市走势的影响:基于文本情感分析的方法[J].情报学报,2015,34(11):1190-1202.

[15]李旭,于卫红.基于情感分析和关系网络的影视产品评论数据文本挖掘研究[J].情报探索,2018,(4):1-5.

[16]郑飏飏,徐健,肖卓.情感分析及可视化方法在网络视频弹幕数据分析中的应用[J].现代图书情报技术,2015,(11):82-90.

[17]阳爱民,周咏梅,周剑峰.中文微博语料情感类别自动标注方法[J].计算机应用,2014,34(8):2188-2191.

[18]周咏梅,王伟,阳爱民,等.一种基于特征簇的微博短文本情感分类方法[J].小型微型计算机系统,2016,37(12):2713-2716.

[19]樊娜,安毅生,李慧贤.基于K-近邻算法的文本情感分析方法研究[J].计算机工程与设计,2012,33(3):1160-1164.

[20]秦锋,王恒,郑啸,等.基于上下文语境的微博情感分析[J].计算机工程,2017,43(3):241-246,252.

[21]郑啸,王义真,袁志祥,等.基于卷积记忆神经网络的微博短文本情感分析[J].电子测量与仪器学报,2018,32(3):195-200.

[22]谢铁,郑啸,张雷,等.基于并行化递归神经网络的中文短文本情感分类[J].计算机应用与软件,2017,34(3):205-211,232.

[23]王勇,吕学强,姬连春,等.基于极性词典的中文微博客情感分类[J].计算机应用与软件,2014,31(1):34-37,126.

[24]王文远,王大玲,冯时,等.一种面向情感分析的微博表情情感词典构建及应用[J].计算机与数字工程,2012,40(11):6-9.

[25]高琰,陈白帆,晁旭耀,等.基于对比散度-受限玻尔兹曼机深度学习的产品评论情感分析[J].计算机应用,2016,36(4):1045-1049.

[26]刘续乐,何炎祥.基于多特征的微博情感分析研究[J].计算机工程,2017,43(12):160-164,172.

[27]周咏梅,阳爱民,林江豪.中文微博情感词典构建方法[J].山东大学学报:工学版,2014,44(3):36-40.

[28]周咏梅,杨佳能,阳爱民.面向文本情感分析的中文情感词典构建方法[J].山东大学学报:工学版,2013,43(6):27-33.

[29]李勇敢,周学广,孙艳,等.结合依存关联分析和规则统计分析的情感词库构建方法[J].武汉大学学报:理学版,2013,59(5):491-498.

[30]李勇敢,周学广,孙艳,等.基于依存分析和无监督主题情感模型的中文微博情感分析研究与实现[J].软件学报,2017,28(7):1-19.

[31]李勇敢,周学广,孙艳,等.中文微博情感分析研究与实现[J].软件学报,2017,28(12):3183-3205.

[32]樊娜,安毅生.基于语义分割的文本观点倾向分析方法研究[J].计算机工程与应用,2012,48(5):12-14,18.

[33]汪曼.国内社会网络分析应用现状研究[J].情报工程,2016,(5):75-85.

[34]陆慧雯.基于共词分析的我国近十年行业与战略情报研究[J].情报科学,2016,(5):169-173.

[35]王科.情感词典自動构建方法综述[J].自动化学报,2016,46(4):495-510.

[36]阳林.情感词权值研究及在情感极性分析中的应用[J].计算机应用,2015,35(S2):125-127.

[37]阳爱民,林江豪,周咏梅.中文文本情感词典构建方法[J].计算机科学与探索,2013,7(11):1033-1039.

[38]杨经,林世平.基于SVM的文本词句情感分析[J].计算机应用与软件,2011,28(9):225-228.

[39]唐晓波,严承希.基于旋进原则和支持向量机的文本情感分析研究[J].情报理论与实践,2013,36(1):98-103,93.

[40]李婷婷,姬东鸿.基于SVM和CRF多特征组合的微博情感分析[J].计算机应用研究,2015,32(4):978-981.

[41]黄发良,冯时,王大玲,等.基于多特征融合的微博主题情感挖掘[J].计算机学报,2017,40(4):872-888.

[42]Mikolov T,Karafiát M,Burget L.Recurrent Neural Network Based Language Model[C]//Proceedings of the 11th Annual Conference of the International Speech Comunication Association,2010:1045-1048.

[43]F Morin,Y Bengio.Hierarchical Probabilistic Neural Network Language Model[C]//The 8st International Conference on Artificial Intelligence and Statistics(AISTATS),2005.

[44]Socher R,Perelygin A,Wu J Y,et al.Recursive Deep Models for Semantic Compositionality Over a Senti-ment Treebank[C]//Proceedings of the EMNLP,2013:1631-1642.

[45]梁军,柴玉梅,原慧斌,等.基于极性转移和LSTM递归网络的情感分析[J].中文信息学报,2015,29(5):152-159.

[46]李天辰,殷建平.基于主题聚类的情感极性判别方法[J].计算机科学与探索,2016,10(7):989-994.

[47]郝志峰,黄浩,蔡瑞初,等.基于多特征融合与双向RNN的细粒度意见分析模型[J].计算机工程,2018,44(7):199-204,211.

[48]胡荣磊,芮璐,齐筱,等. 基于循环神经网络和注意力模型的文本情感分析[J/OL].2019,36(11).http://www.arocmag.com/article/02-2019-11-025.html,2018-08-10.

[49]Kim Y.Convolutional Neural Networks for Sentence Classification[C]//Proceedings of the EMNLP,2014:1746-1751.

[50]陈钊,徐睿峰,桂林,等.结合卷积神经网络和词语情感序列特征的中文情感分析[J].中文信息学报,2015,29(6):172-178.

[51]杜昌顺,黄磊.分段卷积神经网络在文本情感分析中的应用[J].计算机工程与科学,2017,39(1):173-179.

[52]梁斌,刘全,徐进,等.基于多注意力卷积神经网络的特定目标情感分析[J].计算机研究与发展,2017,54(8):1724-1735.

[53]冯兴杰,张志伟,史金钏.基于卷积神经网络和注意力模型的文本情感分析[J].计算机应用研究,2018,35(5):1434-1436.

[54]王文凯,王黎明,柴玉梅.基于卷积神经网络和Tree-LSTM的微博情感分析[J/OL].2019,36(5).http://www.arocmag.com/article/02-2019-05-007.html,2018-03-09.

[55]李平,戴月明,吴定会.双通道卷积神经网络在文本情感分析中的应用[J].计算机应用,2018,38(6):1542-1546.

[56]陈珂,梁斌,柯文德,等.基于多通道卷积神经网络的中文微博情感分析[J].计算机研究与发展,2018,55(5):945-957.

[57]蔡国永,夏彬彬.基于卷积神经网络的图文融合媒体情感预测[J].计算机应用,2016,36(2):428-431,477.

[58]邓佩,谭长庚.基于转移变量的图文融合微博情感分析[J].计算机应用研究,2018,35(7):2038-2041.

(责任编辑:孙国雷)

猜你喜欢

共词分析深度学习神经网络
神经网络抑制无线通信干扰探究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定