基于微博的网络舆情管控技术研究
2014-09-25姚春华王效武
姚春华,王效武,曾 曦
0 引言
近年来,随着互联网的快速发展,互联网已经逐渐成为人们接受信息、发表意见和沟通交流的主要媒介。微博作为近年来最新的互联网应用发展迅速,它是一个基于社交关系的可以相互分享并获取信息、传播观点的社交化网络服务平台,2006年,微博网站Twitter诞生于美国,其后发展迅猛,目前注册用户已超过2亿[1]。在Twitter的示范效应下,微博网站在全球范围内取得了空前的发展,凭借快速传播的优势,可以在极短时间内凝聚网民的意见,形成网络舆情,诱发网民行为并影响着社会。
受益于网络信息技术的迅速发展,微博越来越成为网络舆情爆发的始发地。特别是在重大突发事件中,网络舆情对社会稳定和发展产生威胁时,往往需要采取强制的管控措施才能引导舆情正常的发展。舆情管控重在疏导,通过发送舆情疏导信息,使得网民能了解真实信息,通过正面的信息潜移默化地引导和调节舆情[2]。为了实现微博舆情疏导信息传播的速度及密度、信息投送的精度与力度,增强微博舆情管控的能力,研究基于微博的管控技术十分必要。
1 微博开放平台简介
微博系统的技术架构经历了几次大的变革和改进,从第一版LAMP架构,到第二版的分层架构,到目前的第三版提供API调用的开放平台架构[3],第三版提供API调用的微博系统架构如图1所示。为了提高用户的粘性,目前许多微博网站都采用第三版架构,将自身的资源开放,例如Twitter、Plurk、新浪、腾讯、网易等都对外提供API(应用程序接口),实现微博的第三方开发平台。利用微博开放平台可实现微博数据采集、信息订阅、分享与交流。
图1 提供API调用的微博系统架构Fig.1 Micro - blog system architecture diagram for API
作为第三方应用,要想访问用户的基本信息和数据必须首先获得服务提供商和用户的许可,国际上比较成熟并且为各大微博网站所普遍采用的是Oauth认证授权机制[3]。进行第三方应用开发首先向微博开放平台申请并取得未授权Request Token和Request Token Secret,然后需要获得用户的授权。如果通过验证得到用户正确授权,第三方应用会收到微博开放平台所授予的已授权Request Token及Verifer。在取得了用户授权的Request Token及Verifer之后,第三方应用便可以获得微博开放平台授予的Access Token及Secret。在获取了Access Token及Secret之后,第三方便成功实现了与微博开放平台的信息同步绑定,实现微博的各种应用功能。
2 微博舆情管控实现方法
国内外主流的微博网站日均微博信息量上亿条,通过微博发布的舆论引导信息除了传递给他的朋友和关注他的人外,很难快速地扩大信息受众面。为了使舆情疏导信息效果增强,利用微博开放平台,通过微博群发、批量评论等技术途径,使得舆论导向信息在微博网站上深度渗透,快速夺取舆论优势,抢占舆情管控制高点。能够实现微博舆情疏导信息效果增强的舆情管控软件系统总体设计如图2所示[4]。
如图2所示,微博信舆情管控软件架构从逻辑上划分为表现层、业务层、支撑层、基础层,各层功能如下:
基础层:实现HTTP等基础传送协议,并提供数据库访问适配。
支撑层:完成JSON/XML格式的微博页面内容解析和封装,并通过开放平台 API调用微博服务器的资源。
业务层:实现时独立于具体的协议和微博平台,实现微博微博帐号采集、帐号管理、帐号注册认证、微博采集评论、群发@消息、群发评论、群发微博等功能。
表示层:微博帐号的添加、编辑、删除、导出、导入界面,评论、微博、@消息等内容的编辑界面,参数配置界面等。
图2 微博舆情管控软件架构Fig.2 Software architecture diagram of Micro- blog public-opinion management and control
2. 1 微博信息群发技术
微博信息群发技术主要利用微博网站的用户注册、登录、发布微博信息等API接口,实现一站式管理Twitter、Plurk、新浪、腾讯、网易等多个微博门户网站的多个微博账号,批量发布微博信息,实时关注发布微博信息的评论、转发以及粉丝等关注情况。微博的关注度越高,在网站中就越容易成为“热点话题”而排名靠前,就越容易引起网民的关注。这样通过关注群和粉丝群就会形成“病毒式”传播,进一步放大和膨胀[5]。
为了提高微博舆情疏导信息群发后的舆论影响力,采取的主要技术途径是将信息发布到目标微博网站后,对发布到目标网站的微博状态进行实时监控,主要对微博的排名,点击量、转发数量、评论数量等属性进行统计,如果微博的排名下降,就将预置好的语言、文字、图片、影像等舆情疏导信息通过大规模的“机器人”自动评论来将微博置顶,形成范围较广的关注度,对网民的思想、意志、精神、情感等施加刺激和影响,使得微博舆情朝有利的预定方向变化和发展,微博信息群发的流程示意如图3所示。
图3 微博信息群发示意Fig.3 Micro-blog information -group diagram
2. 2 微博批量评论技术
微博批量评论技术是基于微博用户的粉丝和关注的人进行的,并且对微博主加关注是不需要对方认可确认的,因此,通过分析微博之间的转发,分析微博舆情的传播轨迹图,发现传播规律及信息传播过程中起放大作用的传播主体。同时,分析微博主之间的关系(关注、被关注),生成指定传播主体的人物关系图,通过人际分享,第一时间了解到传播主体的社交属性,挖掘更多重点关注人物。然后对传播主体以及与之相关的重点人物加关注,将预置好的语言、文字、图片、影像等舆情疏导信息作为评论内容,利用微博网站提供的提供标准化的REST API对粉丝和已关注的微博账号发布的微博信息自动批量评论,快速激发与目标网民的互动性,将信息传播给其粉丝,达到爆炸式的传播效果。微博批量评论的流程如图4所示。
图4 微博批量评论示意Fig.4 Micro-blog batch-review diagram
2. 3 微博帐号采集群发@消息技术
微博具有的@功能能够让信息在一对多传播的基础上也能精确传播到个人,信息投放更加精准。微博用户信息主要包括三类:唯一标识信息、基本描述信息和活动信息。唯一标识信息指用户UID或微博昵称,唯一标识了一个用户;地址、个人描述、用户标签和性别属于用户的基本描述信息,显式地表现了用户的特征,其中,用户标签和个人描述对用户特征的刻画最直接。粉丝数、关注数、微博数、创建时间和微博认证是用户的活动信息,间接表现了用户的各种特征,如影响力、活跃程度、兴趣爱好、发言习惯等等,其中,粉丝数、关注数和微博数是微博平台衡量一个用户影响力的核心指标[6]。
根据不同类型用户的特征选择推送不同的微博舆情疏导信息,更能达到舆情疏导信息精准地投送效果。利用微博API接口实现微博用户爬虫程序,随机抽取大量用户信息与设定的关键字一致的目标用户,根据微博舆情疏导信息策略实施精准的@消息投送。微博用户采集群发@消息的流程如图5所示。
图5 微博用户采集群发@消息流程Fig.5 Micro - blog user acquisition and@Information-group diagram
2. 4 微博文章采集评论技术
微博文章容易使网民的认知、态度、情感和行为倾向聚集,产生“群体极化”现象而形成“热点话题”、“热点事件”[7]。利用微博进行网络串联、造谣、煽动等网上活动对国家政治安全和文化安全构成了严重威胁。为了对微博信息进行舆论干预和导向,最直接和有效地方法是直接对微博文章进行评论,对“热点话题”、“热点事件”起到灌水稀释、转移话题以及争夺话语权的作用,有效精准地疏导微博舆情发展方向。
微博文章采集群发评论技术首先是通过网络爬虫技术采集微博文章,并对采集到的信息进行“热点话题”、“热点事件”分析和提取,然后,根据提取到的“热点话题”、“热点事件”关键字采集所有微博文章,利用微博API接口函数,进行批量评论,快速扭转舆论导向,使得网络舆论朝着利己的方向发展。微博文章采集群发评论的流程如图6所示。
图6 微博文章采集群发评论流程Fig.6 Micro-blog article acquisition and batch-review diagram
3 实验效果分析
为了测试微博舆情管控技术的使用效果,通过开发微博舆情管控系统测试软件,搭建如图7所示的实验平台进行验证。其中,微博舆情管控终端软件是基于国内主流的微博网站开发的,我们申请测试授权用户,同时开通2条带宽为2M的ADSL专线,实现两台计算机与互联网的链接。在两台计算机上同时安装测试软件。
图7 实验测试连接Fig.7 Test connection diagram
试验步骤如下:
1)通过终端1、终端2分别注册1个微博用户账号。
2)终端1注册的用户,设定“旅游”关键字搜索相关对旅游感兴趣的微博账号,当搜索到50个用户的时候,停止搜索,并对搜索到的微博用户批量加关注。
3)通过终端1注册的用户,群发评论,统计评论时间,并通过发送评论接口的返回值统计成功率。
4)终端2注册的用户登录,设定“拉萨”关键字搜索属性有“拉萨”的微博账号,当搜索到50个用户的时候,停止搜索。
5)通过终端2对搜索到的微博账号发送@信息,统计发送的时间。
6)终端2注册的用户登录,设定“斯诺登”关键字搜索相关的微博文章,当搜索到50篇文章时,停止搜索。
7)通过终端2对搜索到的微博文章群发评论,统计发送的时间,通过评论接口的返回值统计成功率。
试验结果:
1)步骤3实现对50个关注的帐号群发评论,所需时间≤1小时,成功率为100%。
2)步骤5实现对50个特定的用户群发@消息,所需时间≤1小时,成功率为100%。
3)步骤7实现对50篇微博文章群发评论,所需时间≤1小时,成功率为100%。
试验结果表明,通过微博舆情管控终端,能够在极短的时间对大量关注的人、特定的微博账号以及特定的微博文章群发评论和消息。如果考虑申请高级授权或合作伙伴,同时每个终端用户注册上千个用户,并且配置上百台终端同时进行微博舆论导向信息投送,将形成每小时百万条信息的传播,快速形成舆情管控能力。
4 结语
随着互联网技术的不断深入发展,互联网舆情管控已成为控制舆情动向,对突发事件做出快速响应和处理不可或缺的手段。文中针对微博舆情进行分析研究,通过微博开放平台实现微博舆情管控的技术,较好地满足了舆情工作需要,同时,微博舆情管控技术对于互联网其它的舆情管控同样具有指导作用。
[1] 新浪微博白皮书[EB/OL].(2011-08-03).[2011-09 -09].http://www.sina.com.
Sina Micro-blog White Paper[EB/OL].(2011 -08 -03).[2011 -09 -09].http://www.sina.com.
[2] 李彦丽.高校网络舆情的管理与引导[J].信息系统工程,2011(02):91-92.
LI Yan - li.Management and Guidance of College Network Public Opinion[J].Information System Engineering,2011(02):91 -92.
[3] 宁金鹏,王晓宇.微博营销系统用户分析功能的设计和实现[J].计算机应用,2011(12):233-234.
NING Jin - peng,WANG Xiao - yu.Design and Implementation of User Analysis Function of Micro-blog Marketing System[J].Journal of Computer Applications,2011(12):233-234.
[4] 王效武,刘英.互联网信息发布系统设计[J].通信技术,2013,46(08):77-80.
WANG Xiao - wu,LIU Ying.Internet Information Release System Design[J].Communication Technology,2013,46(08):77-80.
[5] 何韬,胡勇,吴 越.基于影响力形成的论坛意见领袖识别[J].信息安全与通信保密,2012(06):81-82.
HE Tao,HU Yong,WU Yue.Identification of Online Forum Opinion Leaders based on Influence Formation Mode[J].Information Security and Communication Privacy,2012(06):81-82.
[6] 王韬,郭浩,蔡云刚.微博数据采集技术与算法研究[J].中国人民解放军电子工程学院学报,2012(06):52-53.
WANGTao,GUOHao,CAIYun -gang.Research on Data Acquisition and Data Micro -blog Algorithm[J].Chinese Journal of Electronic Engineering Institute,2012(06):52 -53.
[7] 史波.网络舆情群体极化的动力机制与调控策略研究[J].情报杂志,2010,29(07):50 -53.
SI Bo.A Study of the Dynamic Mechanism and Coping Strategies for Group Polarization of Network Public Sentiment[J].Journal of Intelligence,2010,29(07):50 -53.