网络舆情分析系统中的支撑技术研究

2015-12-14王君泽方醒杜洪涛

现代情报 2015年8期

王君泽++方醒++杜洪涛

〔摘要〕网络舆情分析领域已经吸引了研究人员的关注并产生了诸多成果。本文对于近年来网络舆情分析领域的相关研究进行梳理，同时对现有网络舆情分析系统的架构进行剖析，对其中的数据采集、数据预处理、数据分析以及舆情展示等部分的支撑技术进行分析，并对网络舆情分析系统的发展方向进行探讨。

〔关键词〕网络舆情；舆情分析；系统框架

DOI：10.3969/j.issn.1008-0821.2015.08.011

〔中图分类号〕G2062；TP391〔文献标识码〕A〔文章编号〕1008-0821（2015）08-0051-06

随着网络媒体的日益发达和网民数量的不断增加，互联网已经成为民意表达的重要空间。为了有效利用互联网，将其作为政府治国理政、了解社情民意的新平台，需要及时发现、分析、管理网络舆情。而网络舆情分析技术正是解决该问题的关键之一。本文对于近年来的网络舆情分析领域的相关研究进行梳理，同时对现有网络舆情分析系统的架构（图1）进行剖析，分析其中的支撑技术，并对网络舆情分析系统的发展方向进行探讨。

1数据采集与数据预处理

11数据采集

数据采集是网络舆情分析的基础。该部分的主要功能

是借助Web爬虫，从互联网上获取网页数据。传统的通用型Web爬虫、分布式爬虫和主题爬虫等是网络舆情数据采集的主要技术力量。分布式爬虫和主题爬虫技术的应用是网络信息膨胀的结果。目前网络信息膨胀，具体表现为信息源激增、信息发布量快速增长、信息内容种类多样化等。膨胀的网络信息对网络数据的采集提出更高的要求。分布式爬虫可以对数据采集任务进行高效的任务分割，并且可以通过系统规模的动态扩展，保证网页信息的实时获取。主题爬虫[3]能够选择性地采集主题相关页面，以降低带宽的消耗以及计算和存储的资源。主题爬虫的难点在于如何对主题建模、如何判定页面与主题的相关性以及如何在一个爬虫系统中容纳不同的主题爬虫等[4]。

12数据预处理

数据预处理是指从网页文本中抽取对网络舆情分析有价值的信息，其中主要使用到的技术包括Web数据抽取、网页相似性识别等。

Web数据抽取（Web Data Extraction）通过识别网页文本的html结构抽取出新闻或网帖的标题、正文、发布时间、回复信息等不同的部分。当前在Web数据抽取领域广泛采用的技术是网页包装（Wrapping）[5]，其中抽取方法[6]和Wrapper的自动或半自动化生成工具是网页包装研究的重点对象。抽取方法主要包括直接解析[7]、HTML结构分析[8-9]和数据建模[10-11]等。此外，新的Web数据抽取数据策略也不断涌现，如微软亚洲研究院的Cai等人提出VIPS算法，利用网页的视觉特征来抽取信息[12]。需要指出的是，Web数据抽取方法的可操作性和实用性受到不同网站排版方式的差异程度和变动频次等因素的影响。

相似网页识别也是数据预处理阶段的重要技术。相似网页识别最初应用在网页消重领域[13-16]，即对内容重复的网页进行识别、处理和合并。在搜索引擎等应用中，网页消重可以节省网页数据库的存储空间和在网页数据库上进行操作的时间的过程。而在网络舆情分析系统中，该技术主要用于判断某条新闻或网帖被转载的次数，同时建立信息的转载轨迹，进而识别热点信息，实现对信息的溯源。

舆情数据分析

数据分析是网络舆情分析系统的核心部分。数据分析的目的是通过跟踪特定时期内集中反应特定社会热点问题的网络舆情信息，掌握舆情产生、变化和衰落的趋势或规律，深度分析网络舆情随时间的发展趋势情况，进而实现对舆情环境的监测与预警[17]。高质量的数据分析组件需广泛借鉴自然语言处理领域以及数据挖掘方面的成果，包括情感分析、话题检测与追踪、多文本摘要、热点识别等，以完成舆情的语义识别和知识发现。如网络舆情的总体概括的描述性信息可以借助情感分析技术在网络舆情信息文本挖掘的优势中得到，而网络舆情热点、焦点信息的自动发现则有赖于网络信息的主题检测和追踪技术。总的来看，学界对网络舆情数据分析组件的研究主要集中在以下几个方面：

21语义分析及数据挖掘

舆情分析的效果在很大程度上依赖于对原始网页的文本的语义理解能力，其中又涉及中文分词、词性标注、指代消解、新词识别、人名消歧等技术。在中文分词领域，经过多年的发展，尤其是2003年首届国际中文分词评测[18]开展以来，已经取得诸多成果。中国科学院计算技术研究所在多年研究工作积累的基础上，研制出汉语词法分析系统ICTCLAS（Institute of Computing Technology，Chinese Lexical Analysis System），主要功能包括中文分词、词性标注等[19]。为提升语义分析的效果，命名实体识别[20]、指代消解[21]、人名消歧[22]等诸多技术往往被综合使用。

22情感分析及观点识别

情感分析是数据挖掘和计算机语言学的分支，能够对各种新闻资源、社会媒体评论和其他用户生成内容进行提取、分析、处理、归纳和推理[23]。针对网络文本进行情感分析，有助于舆情分析人员明确网络传播者的意图和倾向。文本情感分析研究早期的工作主要集中在词语级别的语义倾向计算和文档级别的文本情感分类方面。如Kim通过分析大量美国大选时的网络新闻评论，来推断大部分选民是支持共和党还是民主党[24]；Lin等人构造“巴以战争”评论分析系统来区分某一评论是支持巴方还是支持以方[25]。该领域的快速发展是2006年以来美国标准与技术研究院组织的多次国际性观点检索（Opinion Retrieval）评测比赛推动的结果[26-27]。近年来该领域的研究者开始将精力放到获得更细粒度结果的研究方向上如细粒度的观点挖掘、情感分类器的领域移植和情感摘要等[28-29]。部分研究人员尝试对用户的观点进行分解或摘要[30-31]，并提出Opinosis等基于图的观点摘要技术[32]和OPINIONCLOUD等观点摘要和可视化技术[33]。全局序列模型（Global Sequence Model）、条件随机场（Conditional Random Fields）等技术也被用于识别用户情感[34-36]。endprint

情感分析技术功能的实现和优化依赖于情感词语料库的完备性。情感词是指带有情感倾向性的词语。Turney提出从大规模语料中，利用一个词与具有强烈正面倾向的种子词集合中词语的互信息，减去这个词与具有强烈负面倾向的种子词集合中词语的互信息，计算这个词语的情感倾向性[37]。通过类似上述的词语情感倾向性识别策略，可以构建情感词语料库。目前文本情感语料库的建设方面，已有的语料库包括Pang语料库[38]、Whissell语料库[39]、Berardinelli电影评论语料库[40]等。而有关中文情感词汇方面的资源较少，基本采用人工的方法获取。陈建美等人借助现有的词典和语义网络构建的将情感分为7大类20小类情感词汇本体，共收录17 156个情感词汇[41]；台湾大学的研究人员的工作主要在于简体中文情感极性词典NTUSD的构建[42]，知网（Hownet）则发布“情感分析用词语集”[43]。此外，网络舆情分析领域的特定需求对情感分析提出更高的要求，如对文本中蕴含的思想倾向进行分析（左派/右派），以掌握网民的思想流派等，其作为全新的课题，目前尚未看到公开的成果。

23话题探测与追踪

话题检测与跟踪（Topic Detection and Tracking，TDT）是面向多语言文本和语音形式的新闻报道，完成报道边界自动识别、锁定和收集突发性新闻话题、跟踪话题发展以及跨语言检测与跟踪等相关任务[44]。与EDT不同，TDT检测与跟踪的对象从特定时间和地点发生的事件扩展为具备更多相关性外延的话题，相应的理论与应用研究也同时从传统对于事件的识别跨越到包含突发事件及其后续相关报道的话题检测与跟踪[45]。TDT的任务以及评测体系是由美国国防高级研究计划局（DARPA）、马萨诸塞大学（University of Massachusetts）、卡耐基-梅隆大学（Carnegie Mellon University）和Dragon Systems公司联合制定和设计完成的。话题检测与跟踪技术有助于舆情分析人员把握舆情的源头和演化脉络，为研究如何完成新闻报道中自动收集、识别和锁定特定话题、跟踪话题发展等相关任务，美国国防高级研究计划局等组织举办多次TDT评测比赛并取得一定的成果[46]。而针对网络舆情事件的突发性，研究人员还利用话题检测与跟踪技术来探测新闻中的突发热点事件[47]。

24热点话题识别

网络舆情热点话题是网络舆情深度分析模式和判据中的重要因素，也是社情民意的重要体现[48]。正确识别热点话题对话题识别和趋势预测具有重大影响。目前对热点话题的识别方法可以分为词频分析方法、基于词网络关系的共词分析方法、基于词频变化率的突发监测方法、基于短语差异的分析方法等[49-50]。Kleinberg提出突发监测算法[51]，以重点关注那些相对增长率突然增长的词，并认为话题的报道数量不是平滑增长，而是在不同水平之间跃迁，这种在一段时间内突然增长的词即可能为热点话题的表征词；Zheng等人利用Aging Theory对BBS中的热点话题进行识别，可以快速挖掘任意时间段内的热点话题[52]。

25分类和聚类

文本分类和主题聚类技术也是网络舆情分析中的主要手段。文本自动分类是在预定义的分类体系下，根据文本的特征（词条或短语），将给定文本分配到一个或多个特定类别的过程。文本自动分类技术在信息过滤情报处理数字图书馆等领域已经有着广泛应用。然而，互联网文本数据以指数级增长并呈现出各种新特点，这给文本自动分类技术带来了巨大挑战，如短文本分类、多语言文本分类管理、数据集偏斜、多层分类、标注瓶颈等问题[53]。主题聚类主要通过对文本、查询式等聚类对象进行基于机器学习的主题分析。将聚类对象转换为基于主题的表示形式，以达到降低特征空间维度的目的，然后以主题表示为基础进行对象的聚类分析，最后得到基于主题的聚类结果描述[54]。主题聚类可以对聚类特征进行主题或语义控制，对聚类对象进行维度约简并对聚类的结果进行基于主题的描述。利用主题聚类技术，还可以对属于同一个话题的所有信息进行聚类，以完成新话题的监测，为TDT算法提供支持。

3舆情信息展示及研判平台

31舆情信息展示

信息可视化是指非空间数据的可视化。Card等将信息可视化定义为：“使用计算机支持、交互性的视觉表示法，对抽象数据进行表示，以增强认知”[55]。信息可视化是使用直观的方式展现原始数据间的复杂关系、潜在信息以及发展趋势。其目的是为更好地利用信息资源[56]。当前，舆情信息展示的常用形式主要有标签云和关键词关联网络模型。

标签云是一套相关的标签以及与此相应的权重，用以表示特定内容的标签，并按照内容中的涉及的信息的重要性，确定标签字体的醒目程度，以凸显内容中的重要信息。下面以对“中国政府工作报告”的分析为例介绍，从图2中可以看出，政府工作报告的重点在“社会主义”、“改革开放”、“市场”、“经济”、“人民”、“教育”、“生产”等方面。利用标签云这类信息可视化手段，可以直观的掌握相应信息内容的重点。关键词关联网络模型（图3）也是舆情信息展示的重要手段。通过利用文本信息可视化模型，构建基于新闻文本内容构建专题新闻文本集的关键词关联网络模型，能够直观展示事件动态发展变化过程、各主体的主要行为及其之间的关系以及人们关注点的变化，有利于分析人员快速了解事件动态。

图2基于“中国政府工作报告”分析结果的标签云图3基于“朝鲜”相关信息的关键词关联网络

32网络舆情指标体系的建设

网络舆情指标体系是网络舆情研判的重要参考依据。网络舆情指标体系可以用于衡量和评价网络舆情热度，通过权重计算能够明确各个指标影响力大小，从而明确舆情涨落的深层次影响原因，为政府舆情控制、引导和预案制定提供理论依据[57]。针对舆情指标体系的研究已经产生诸多成果。如李雯静等人根据网络舆情的特点，从指标设计、分类、构建等方面，在网络舆情信息汇集、分析、预警的工作流程中，按照主题将信息分门别类，统计、计算出若干指标值，对舆情进行横向、纵向的监测和评估，筛选出有价值的信息，帮助舆情工作者对舆情突发事件进行研判及态势预测[58]；王青等人对现有网络舆情监测指标体系进行整理与归纳，通过E-R模型系统分析主题舆情的属性特征，构建更为科学系统的网络舆情监测与预警指标体系。该指标体系从舆情热度、舆情强度、舆情倾度、舆情生长度4个维度诠释主题舆情的传播范围及程度、舆情主题内容强度、主题舆情生长规律及状态、舆情受众意见分布等网络舆情监测与预警要素[59]；曾润喜利用层次分析法构建了警源、警兆、警情三类因素和现象的网络舆情突发事件预警指标体系，并对影响这一指标体系的因素和现象进行排序，确定影响权重[60]。综合来看，已有的网络舆情指标体系不同程度上存在部分指标缺乏深度，部分指标难以评估，指标体系不完整以及对受众的倾向关注不够等问题[61]。endprint

4发展趋势

网络舆情参与者的行为建模将成为网络舆情分析系统的重要关注点，以识别目前的意见领袖、网络推手等特殊的舆情参与者。目前随有研究者尝试建立意见领袖识别模型和网络推手识别模型[62-63]，但仅从某些侧面构建模型，而未有较为通用的模型，同时也未于舆情分析系统深度的结合，进而模型的实用性。

网络舆情预测技术已得到研究者的关注，未来可能与舆情分析软件进一步结合。如曾祥平等[64]、Naruse建立情感激励模型来模拟回复量的变化情况，对于预测起到一定的借鉴作用[65]。Zeng等提出了一种基于隐马尔科夫的网络舆情预测模型，但是不能对网络舆情突发事件进行预测[66]。在此基础上，有学者充分嫩考虑到网络舆情具有突现性，以突现计算的观点将发帖人抽象成Agent[67]。因此，网络舆情预测技术的不断成熟将大大提高其在舆情分析系统中的实用性。

舆情预警功能的优化也是未来舆情分析系统研究的重点。网络舆情监管功能的实现有赖于各类敏感事件和舆情预警技术与舆情地图、舆情预判和决策分析模拟系统、舆情隐患库和预案库等的有效结合。目前在预警防控平台方面已有一些研究成果。如文献[68]构建SD因果关系模型，研究了非常规突发事件应急决策系统各子系统间反馈机制和相互耦合机制以及应急决策动态调整机理；文献[69]在平行系统基本思想的基础上，采用多智能体技术构建人工社会以实现模拟仿真的方法，以作为社会问题模拟仿真研究的重要途径。但相关的研究成果如何与舆情分析系统相结合，也是亟须解决的问题。

参考文献

王国华，曾润喜，方付建.解码网络舆情[M].武汉：华中科技大学出版社，2011.

Paolo B.，Bruno C.，Massimo S.et al.UbiCrawler：a scalable fully distributed Web crawler[J].Software：Practice and Experience，2004，34（8）：711-726.

[3]Soumen C.，Martin B.，Byron D.Focused crawling：a new approach to topic-specific Web resource discovery[J].Computer Networks，1999，31（16）：1623-1640.

[4]白鹤，汤迪斌，王劲林.分布式多主题网络爬虫系统的研究与实现[J].计算机工程，2009，35（19）：13-16.

[5]Laender F.，Ribeiro B.，Silva A.et al.A brief survey of Web data extraction tools[C].ACM SIGMOD Record，2002，31（2）：84-93.

[6]Eikvil L.Information Extraction from World Wide Web——A Survey[R].1999.

[7]Wang J.and Lochovsky F.Data-rich section extraction from HTML pages[C].Proc of the 3rd Intl.Conf.on Web Information System Engineering，2002：2313-2322.

[8]Myllymaki J.Effective Web Data Extraction with Standard XML Technologies[J].Computer Networks，2002，39（5）：634-644.

[9]Sahuguet A.and Azavant F.Looking at the Web through XML glasses[C].Proc of the 4th Intl.Conf.on Cooperative Information System，1999：148-159.

[10]Snoussi H.，Magini L.and Nie J.Toward an Ontology-based Web Data Extraction[C].Proc of Intl.Conf.on Business Agents and the Semantic Web，2002.

[11]Embley D.，Campbell Y.，Liddle S.et al.A conceptual-Modeling Approach to Extracting Data from the Web[C].Proc.of the 17th Intl.Conf.on Conceptual Modeling，1998.

[12]Cai D.，Yu S.，Wen J.et al.VIPS：a vision based page segmentation algorithm[R]，2007.

[13]Fetterly D.，Manasse M.and Najork M.On the evolution of clusters of near-duplicate web pages[J].Journal of Web Engineering archive，2003，2（4）：228-246.

[14]Henzinger M.Finding near-duplicate web pages：a large-scale evaluation of algorithms[C].Proc.of the 29th Intl.Conf.on Research and development in information retrieval，2006：284-291.endprint

[15]Manku GS.，Jain A.，Sarma AD..Detecting Near-Duplicates for Web Crawling[C].Proceedings of the 16th International Conference on World Wide Web，2007：141-150.

[16]Li W，Liu J，Wang C.Web document duplicate removal algorithm based on key word sequences[C].Natural Language Processing and Knowledge Engineering，2005：511-516.

[17]黄晓斌，赵超.文本挖掘在网络舆情信息分析中的应用[J].情报科学，2009，27（1）：94-99.

[18]Sproat R.and Emerson T.The First International Chinese Word Segmentation Bakeoff[C].Proc.of the 2nd SIGHAN Workshop on Chinese Language Processing，2003：133-143.

[19]Zhang H.，Yu H.，Xiong D.et al.HHMM-based Chinese lexical analyzer ICTCLAS[C].Proc.of the 2nd SIGHAN workshop on Chinese language processing，2003：184-187.

[20]Florian R.，Ittycheriah A.，Jing H.et al.Named entity recognition through classifier combination[C].Proc.of the 7th Intl.Conf.on Natural language learning at HLT-NAACL，2003：168-171.

[21]Impedovo S，Ottaviano L.，and Occhinegro S.Optical character recognition-a survey[J].International Journal of Pattern Recognition and Artificial Intelligence，1991，5（1-2）：1-24.

[22]Gideon S.and David Y.Unsupervised personal name disambiguation[J].Proc.of the 7th Conf.on Natural language learning at HLT-NAACL，2003：33-40.

[23]Kim S.and Hovy E.Detemining the sentiment of opinions[C].Proc of the 20th Intl.Conf.on Computational Linguistics，2004：1367-1373.

[24]Kim M.and Hovy E.Crystal：Analyzing Predictive Opinions on the Web[C].Proc.of the Joint Conf.on Empirical Methods in Natural Language Processing and Computational Natural Language Learning，2007：1056-1064.

[25]Lin H.，Wilson T.，and Wiebe J.Which Side Are You On？Identifying perspectives at the document and sentence levels[C].Proc.of the Conf.on Natural Language Learning，2006：109-116.

[26]Macdonald C.，Ounis I.，and Soboroff I.Overview of the TREC 2007 Blog Track[C].In TREC 2007 Working Notes，2007：31-43.

[27]Xu X.，Tan S.，Liu Y.et al.Find Me Opinion Sources in Blogosphere：A Unified Framework for Opinionated Blog Feed Retrieval[C].Proc.of the Conf.on Web Search and Data Mining，2012：583-592.

[28]Thelwall M.，Buckley K.，and Paltoglou G.Sentiment Strength Detection for the Social Web[J].Journal of the American Society for Information Science and Technology，2012，63（1）：163-173.

[29]Wilson T，Wiebe J，and Hoffmann P.Recognizing contextual polarity in phrase-level sentiment analysis[C].Proc.of Conf.on Human Language Technologies and Empirical Methods in Natural Language Processing，2005：347-354.endprint

[30]Lu Y.，Zhai C.，and Sundaresan N.Rated aspect summarization of short comments[C].Proc.of the 18th Intl.Conf.on World Wide Web，2009：131-140.

[31]Leung C.，Chan S.，Chung F.et al.A probabilistic rating inference framework for mining user preferences from reviews[J].World Wide Web，2011，14（2）：187-215.

[32]Ganesan K.，Zhai C.，and Han J.Opinosis：A graph-based approach to abstractive summarization of highly redundant opinions[C].Proc.of the 23rd Intl.Conf.on Computational Linguistics，2010：340-348.

[33]Potthast M.and Becker S.Opinion summarization of web comments[C].Proc.of the 32nd European Conference on IR Research，2010：668-669.

[34]Choi Y.，Cardie C.，Riloff E.et al.Identifying sources of opinions with conditional random fields and extraction patterns[C].Proc.of Human Language Technology Conference and Conference on Empirical Methods in Natural Language，2005：355-362.

[35]Cui H.，Mittal V.，and Datar M.Comparative experiments on sentiment classification for online product reviews[C].Proc.of the 21st National Conference on Artificial Intelligence，2006：1265-1270.

[36]Mao Y.and Lebanon G.Isotonic conditional random fields and local sentiment flow[J].Advances in Neural Information Processing Systems，2007，（19）：961-968.

[37]Peter T.Measuring praise and criticism：Inference of semantic orientation from association[J].ACM Transcation on Information Systems，2003，21（4）：315-346.

[38]http：∥www.cs.cornell.edu/People/pabo/movie-review-data[DB/OL].

[39]Athanaselis T.，Bakamidis S.，and Dologlou I.Recognising verbal content of emotionally coloured speech[C].Proc of 14th Intl.Conf.on European Signal Processing Conference，2006.

[40]http：∥www.reelviews.net/[DB/OL].

[41]陈建美，林鸿飞，杨志豪.基于语法的情感词汇自动获取[J].智能系统学报，2009，4（2）：100-106.

[42]Ku L.and Chen H.Mining Opinions from the Web：Beyond Relevance Retrieval[J].Journal of American Society for Information Science and Technology，2006，58（12）：1838-1850.

[43]情感分析用词语集[EB/OL].http：∥www.keenage.com/html/c-index.html.

[44]James A.，Jaime C.，George D.et al.Topic Detection and Tracking Pilot Study Final Report[C].Proc.of the Broadcast News Transcription and Understanding Workshop，1998.

[45]洪宇，张宇，刘挺，等.话题检测与跟踪的评测及研究综述[J].中文信息学报，2007，21（6）：71-87.

[46]He Q.，Chang K.，Lim EP.et al.Keep It Simple with Time：a Re-examination of Probabilistic Topic Detection Models[J].IEEE Transactions Pattern Analysis and Machine Intelligence，2010，32（10）：1795-1808.endprint

[47]Li H.and Wei J.Netnews Bursty Hot Topic Detection Based on Bursty Features[C].Proc.of the Conf.on E-Business and E-Government，2010：1437-1440.

[48]谢海光，陈中润.互联网内容及舆情深度分析模式[J].中国青年政治学院学报，2006（3）：95-100.

[49]魏晓俊.基于科技文献中词语的科技发展监测方法研究[J].情报杂志，2007，（3）：34-39.

[50]Sun Q.，Wang Q.，and Qiao H.The Algorithm of Short Message Hot Topic Detection Based on Feature[J].Information Technology Journal，2009，8（2）：236-240.

[51]Kleinberg J.Bursty and hierarchical structure in streams[J].Data Mining and Knowledge Discovery，2003，7（4）：373-397.

[52]Zheng D.and Li F.Hot Topic Detection on BBS Using Aging Theory[J].Web Information Systems and Mining，2009：129-138.

[53]庞观松，蒋盛益.文本自动分类技术研究综述[J].情报理论与实践，2012，35（2）：123-128.

[54]许鑫，章成志.互联网舆情分析及应用研究[J].情报科学，2008，26（8）：1194-1200.

[55]Robertson G.，Card S，and Mackinlay J.The cognitive core processor for interactive user interfaces[C].Proc.of the ACM SIGGRAPH Symposium on User Interface Soft ware and Technology，1989：10-18.

[56]刘凯.信息可视化概念的深入探讨[J].情报杂志，2004，（12）：20-21.

[57]张一文，齐佳音，方滨兴，等.非常规突发事件网络舆情热度评价指标体系构建[J].情报杂志，2010，（11）：71-75，117.

[58]李雯静，许鑫，陈正权.网络舆情指标体系设计与分析[J].情报科学，2009，（7）：986-991.

[59]王青，成颖，巢乃鹏.网络舆情监测及预警指标体系构建研究[J].图书情报工作，2011，（8）：54-57，111.

[60]曾润喜.网络舆情突发事件预警指标体系构建[J].情报理论与实践，2010，（1）：77-80.

[61]王青，成颖，巢乃鹏.网络舆情监测及预警指标体系研究综述[J].情报科学，2011，（7）：1104-1108.

[62]王君泽，王雅蕾，禹航，等.微博客意见领袖识别模型研究[J].新闻与传播研究，2011，（6）：81-88.

[63]李纲，甘停，寇广增.基于文本情感分类的网络推手识别[J].图书情报工作，2010，54（8）：77-80.

[64]曾祥平，方勇，袁媛，等.基于个体自动机的网络舆论激励模型[J].计算机应用，2007，27（11）：2686-2688.

[65]Naruse K.Lognormal distribution of BBS article and its social and generative mechanism[C].Proc.of Intel.Conf.on Web intelligence，2006：103-112.

[66]Zeng X.，Zhang S.and Wu C.Predictive model for internet public opinion[C].Proc.of Conf.on fuzzy systems and knowledge discovery，2007.

[67]吴渝，杨涛，肖开洲.BBS突发舆情分析及基于小世界网络的预测模型[J].重庆邮电大学学报：自然科学版，2011，（6）：350-354.