新时代网络舆情中的大数据使用与管理研究
2021-03-24许志强王雪梅田艺鹏
许志强 王雪梅 田艺鹏
摘要:信息技术的裂变式发展,让更多的个体与技术相连接、与数据相融合,不仅重塑了沟通交流中的时空观念、行为方式与思维特征,而且带来了“人人都有麦克风”的复杂化舆论态势,极易形成网络舆情。那么,如何认知新时代的网络舆情,其又经历了哪些的呈现阶段?如何基于大数据思维提升网络舆情管理能力?这些问题已成为业界和学界密切关注的问题。
关键词:网络舆情 大数据 数字素养
随着以“云大物移智区加”为代表的“智能+”技术的更新迭代、移动智能终端的广泛普及和商业模式的日趋成熟,互联网“地球村”在给人们带来乐趣与便利的同时,也记录着越来越多的个人数据,让包括“网络舆情”在内的网络信息发展也进入到了全新时代,导致管理与解决舆情事件的方法与处理方式呈现出巨大差异。
一、新时代、网络舆情与大数据
每一个时代都有着不同的显著特征,这当然也包括快速变革的互联网社会。因此,认知新时代网络舆情,是做好新时代舆情工作的首要任务。
(一)新时代
我国信息传播方式与消费渠道逐渐转向以互联网为基础的数字媒体平台,大体经过了三次重要变革。Web1.0时代,互联网满足了用户对信息的搜索与聚合,被视为“内容媒体”;Web2.0时代,互联网满足了用户对信息的交互与分享,被视为“关系媒体”;Web3.0时代的核心理念则是以改变与融合为主题的“紧密星球”,不仅满足了用户对信息的参与和众创的深度“碰撞”,而且强调用户的生命体验与用户价值,被视为“服务媒体”。Web3.0时代,得益于技术(云计算、物联网、数据仓库、商业智能等)、参与者(人、物、软件、系统、平台等)、场景、协议与交互等要素的日趋完善和健全,互联网平台已实现从“链接”向“连接”的转变,网络经济与传统经济亦从带动时代迈入了融合时代,并呈现出“通融互联”“数据高速流动”“网状价值结构”与“开放的有机生态圈”等典型特征。
(二)网络舆情
截至2020年12月,我国网民规模达9.89亿,互联网普及率达70.4%;手机网民约9.86亿,网民使用手机上网率达99.7%。伴随着网民数量的持续增长,互联网在社会和经济活动中扮演的角色日趋重要,热点话题丰富,舆情热度高位运行,舆情客体愈加复杂多变,舆情突发引发“破窗效应”,“溢出效应”明显。从本质上看,网民均为独立个体,用户触网时间、方式与方法受到用户主观与客观双重因素的影响,一方面透视着网民主观的现实感受,另一方面反映着网民不可复制的客观因素,如事件本身、个人影响力、社交圈层、技术限制、事件传播方式等。同时,网民均会在网络上留下专属于自己的数字足迹,如浏览轨迹、文字、图片、音频、视频等,而这些足迹均具备影响社会并引发“网络舆情”的潜力。“智能+”技术不断融合创新与聚变发展,产生的数据规模日益庞大、应用日益广泛。但即便某个潜藏的信息(数据)最终发酵为网络舆情的概率仅为亿万分之一,网络舆情因“蝴蝶效应”而被现实生活演绎的风险也将大大提升。
(三)大数据
大数据的出现具有划时代的意义,它是信息时代的必然产物,能带给信息社会极大的便利。大数据作为一种提供知识服务的新工具,具有大量(Volume,数据信息数量大)、高速(Velocity,数据信息传播速度快)、多样(Variety,数据信息传播方式多种多样)、真实(Veracity,数据信息来源不同导致其真实性有待商榷)、价值(Value,数据信息中包含用户某方面的特性)、动态性(Vitality,整个数据体系的动态性,随时可变)、可視性(Visualization,数据的显性化展现)与合法性(Validity,数据采集和应用的合法性,特别是对于个人隐私数据的合理使用)八大特性。用数据说话,除由于数据具备客观性之外,更得益于大数据可以揭示样本数据无法揭示的细节,让我们得以看见纷繁复杂的现象背后的内在逻辑。
二、新时代网络舆情分类与呈现阶段
新时代,舆情的重心不再局限于官方(政府/权威组织),而是逐渐偏向民众。大部分舆情事件的流程通常是:网络上某段信息流出,经过一段时间的发酵,在部分人的社交圈内扩散,继而引起公众/政府/世界的关注。
(一)新时代网络舆情分类
舆情的分类有很多种,通常以事件影响力规模为依据将其分为三类,即国际大型事件(世界杯、奥运会等)、国内大型事件(全国人民代表大会等)、国内小型事件(南昌大学“自主保洁”微博事件等)。而在本研究中,笔者更倾向于以数据为分类依据,将新时代网络舆情分为两类,即碎片化舆情与大型舆情。
笔者认为,碎片化舆情可被视为跨媒介传播环境下用户在网络上有意或无意间留下的一些碎片化信息(数据)。单独来看,数据被查看时间极短且存在时的意义极小,但若经过或多或短时间、多元多个性化的巨量传播之后,便会影响到一定数量的社会群体,加剧公共舆论的“盲从”。
大型舆情中的“大型”,主要是相对于碎片化舆情而言的。在大型舆情中,事件影响的初始人群数量更大,且不论事件性质,影响力和造成的结果均具有深远的意义。大型舆情一般不具备突然性,通常是在国家政府、大型组织等约定日期后举办的会议、赛事后,相关人士(包括关注的人员)利用网络各方平台,持续发表与事件有关的信息,随时间变化不断累积发酵。国际上的大型舆情事件有很多,如奥林匹克运动会、英国脱欧事件等,在国内则包括全国人民代表大会等各类大型会议、春节联欢晚会等大型节目。当然,如“2008汶川大地震”“新冠肺炎疫情”等突发公共事件,也会造成大型舆情。
(二)新时代网络舆情的呈现阶段与应对措施
碎片化舆情与大型舆情在传播流程上有相似之处,均呈现出四个阶段:起始—扩散—发酵—结束,且这四个阶段均与大数据的特征相符。利用大数据思维来分析、监测与管理舆情,可用客观的数据提炼网络舆情事件模型,优化舆情应对方案。
1.起始阶段。碎片化舆情事件,信息虽然可能早在现实生活中传递,却不被官方监测系统所探知,因此很难界定具体的起始点,而被当作起始点往往就是事件引爆前的最后一条相关信息,最终形成舆情。而大部分大型舆情事件的起始占比时间较长,用于早期的宣发,一旦到达事件正式开启的时间点,会瞬间引爆关注此事件的社会圈层。事实上,无论碎片化舆情还是大型舆情,在起始点到传播质变点之间,都有一定的时间长度,若能提前做好监测措施,便能优化并提升应对能力。
舆情起始阶段,可通过建立大数据监测系统,利用MAT-LAB、SPSS等软件进行拟合得到参考模型,对舆情发生、发展、演变的总体态势进行定性定量分析;研究并优化数据监测热点质变点,尽量避免事件的发生,切实不可避免的事件提前引爆,减少损失;对现实中存在的部分不可被网络系统所监测的言论,优化政府及相关部门的监管力度,完善地区监测措施,力所能及的情况下缩小区域,进行定时定点的书面调查或网络调研;对热度“明星”提高关注度,粉丝数量越多者关注度越高,防止因为某些事件的发生或被带节奏,引发舆情事件等。
2.扩散阶段。与新闻传播面向社会全体不一样的是,在舆情传播初期,整个事件的扩散方向是恒定的,首先是在分散化、圈层化传播的有限视野中,随后被圈层的友人持续向外传播,然后是一些陌生人或者媒体,最后才会面向社会全体。不难发现,舆情扩散是逐步的,类似涟漪圈,这是最容易衍生出谣言的阶段。此阶段的用户可划分为五类:一是沉默者,静静查看各类相关信息,但并不会发表任何观点;二是引导者,有一定影响力的人,如明星、营销号等,对事件有所了解之后发表或正面或负面的观点,引导事件舆论的风向;三是跟风者,对事件有所了解后,追随网络上主要的舆论方向发表相似观点,进一步扩大事件影响;四是退出者,对事件有一定程度的了解,发现不再感兴趣,退出整个事件;五是事件主角,他们发表的所有言论是各方评论的基础,也可以说是整个事件的中心。如“肖战227事件”,其起因就是某明星粉丝看不惯同人圈的作品,开始莫名带起节奏,再经过一系列的刻意引导,造成大量无辜群众被引入“战场”,影响巨大。
舆情扩散阶段,可通过大数据监测所有热点信息,在信息传播的黄金时期(24小时)内分析并重组相关信息后,将官方信息及时推送到最感兴趣的人群;可建立安全的网络环境,包括防火墙等防御软件的更新,防止因为各种原因而造成的网络暴力行为,让民众在不乱说的同时敢于发表言论;可基于国内的大数据库建立起完善的文本审阅制度或软件,减少信息质量低下/片面、信息滞后、不确信等情况的发生等。
3.发酵阶段。与起始阶段一样的是,发酵阶段也存在一个时间段,但其又以事件热度峰值为节点,分为前后两段。前一段“引爆”社会,总体时间较长,并极易出现更多超脱于事件本身的观点、言论,最终将事件推向顶峰;而到达峰值之后,热度就开始逐步下降,各类用户群体逐渐退出,不再参与事件的后续发展。此阶段的舆情事件不再停留于事件表面,更多的是探索事件爆发的深层次理由,是最容易衍生出深度观点的时间段。例如,“南昌大学‘自主保洁微博舆情事件”,各类媒体(包括自媒体用户)对事件本身进行深度挖掘,持续讨论大学生对于劳动的思想。但值得注意的是,类似的进程存在于所有舆情事件当中,只是深层意义的探究行为可深可浅而已。
舆情发酵阶段的处理方式与扩散阶段类似,但还可增加如下几个方面:对所有言论信息做好数据储备,一直跟随并监测事件的参与者,在舆情发展到可能失去控制前,向参与者定向推送相关信息,或由有关部门介入当面进行正确引导;利用大数据,对所有发表和即将发表的媒体作品加入“隐私点”监测,增强媒体作品审核力度,规避对所有参与者个人隐私信息的侵犯;利用大数据,搜集舆情事件的所有信息并尽早重组事件本身,将其完整脉络展现給公众,以达到尽量缩短此阶段甚至迈过、直接结束舆情的进程。
4.结束阶段。当舆情事件热度降到某一刻度时,舆情事件便可以宣布结束。但是,虽然这个阶段被称为结束阶段,不过并不代表所有参与者都已彻底退出,只是关注者的总体数量已无法达到继续引发舆情的热度而已。此阶段,大部分参与者已经消失,剩余群体的主要目的就是对事件进行研究,对进程进行完整复刻:将单一进程事件的完整脉络存入数据库,包括所有扩散的节点、所有应对的措施,并将此与基础数据库做出预测、应对措施进行对比,以达到不断优化系统对网络舆情的预见、应对、研判以及决策的能力。而在研究的过程中,也可能再次引发新的舆情事件。例如,娱乐圈中的“421”事件,就是某微博博主将收集到大部分明星的私人轶事(涉及多位明星的大量隐私)发布于网络,引起社会各群体的再次关注,由此爆发了新一轮的舆情。
三、新时代网络舆情管理的提升路径
5G时代,高速舆情与百变舆论将带来众声喧哗,海量信息与灵动视频将带来众说纷纭,谣言传播速度与工作效率将提升10~50倍,必将引发变数更大的网络舆情,业界比以往任何一个时代都更加需要为网络舆情管理提供最大支持,更须积极应对。
(一)全方位提升“数字原住民”的数字素养教育
舆情引导时常处于艰难境地,除事件传播的自身因素外,另外一个主因便是民众自身数字素养不足,因此,提升民众的数字素养教育成为正确引导舆情发展的有效途径。数字素养,不仅是个体在“数字化生存”环境下的一道“必选项”而非“判断题”,更是基础生存技能,其内涵主要包含数字信息的获取与消费能力、整合与沟通能力、创造与解决能力、解读与批判能力等。西方学者霍华德·莱茵戈德认为,培养民众的数字素养,是构建健康的新经济、社会和文化的有效途径之一。但是,民众数字素养的提升需要社会各领域的积极配合,尤其是教育方面,因此,全方位提升“数字原住民”的数字素养教育,可最大程度的减少各种舆情带来的不良影响。当然,“数字原住民”数字素养的提升,自然离不开各相关机构、各阶层领导干部的正确引领,因此还应辅以各级领导干部大数据思维,使其转变对互联网的传统认知,正视新时代信息传播速度与传播规律,以及应对处置网络舆情事件的能力。
(二)利用全数据模式整合舆情
“传递信息”这个游戏曾在很多节目上出现,一句话经过数人的传递后千变万化,将“信息失真”的特点完美展现。游戏在娱乐民众的同时也给予人们思考:消息是怎样变得含糊不清、应该采取怎样的方法改进沟通方式。一旦舆情事件中存在这些情况,便会令很多不明真相的无关群众产生误解,再加上人云亦云的现象,自然会让情况变得更糟——不加思考的言论信息肆意传播,导致进一步的“信息失真”。事实上,大数据是建立在掌握全数据(或尽可能多的数据)的基础上进行的,不仅表现在数据体量巨大,数据采集技术的提高,网络带宽的成倍增加,而且体现出数据的完整性,通过高性能的信息技术工具能实时动态更新数据,全过程地反映舆情的发展状态,可发现抽样样本分析中无法捕捉的微小细节,最大程度地降低“信息失真”所带来的影响。
(三)利用大数据思维提升舆论引导能力
不是所有的言论都是真实且有价值的,掺杂着的部分不实谣言、蓄意起哄的信息数据,必会在舆情向外扩散的过程中混淆视听,让舆情坠入无法遏制的深淵。如何在不影响公民言论自由权利的基础上,对舆情事件进行积极引导成为国内处理舆情事件的一大难点。想要解决此问题,不仅需要公众自身提升数字素养,更需要官方及时做出应对,根据具体现实做出正确引导。最直接的方法就是利用大数据思维,以事件发生时刻作为起点,将事件以时间为序分为两条平行线,直到事件完结。
第一条线是指事件本身在无任何外界干涉情况下的自然衍变,适用于大部分碎片化舆情,对某些事件的深层本质进行讨论,属于理性范畴。用户客体与事件主体随机结合,迸发大量数据信息,收集所有热点信息,与第二条线实时交流。第二条伴随线是指实时监测,其存在的意义有两点:一是利用大数据思维整合舆情信息,第一时间给民众提供对应的专题信息服务;二是监测事件发展过程,包括演变进程,热点信息等,实时反馈官方,由官方决定是否介入。事实上,舆情引导的主要因素就是官方的作为,随着信息技术的不断迭变,引导舆论的方式也有所改变:制定定向的大数据专题服务,通过大数据思维对所有信息进行筛选组合,并针对地域、人群等多方特点提供专项大数据服务。例如,新冠肺炎疫情期间,通过庞大的互联网采集矩阵积聚海量新闻资讯与消息,为各方提供定向的专题数据服务;通过媒体大数据服务的精确筛选与聚合,将事件相关的资讯、热点、信息网、数据、辟谣、媒体排行等信息进行快速组装,形成一个完整的大数据资讯平台,及时对不实信息进行辟谣等。
四、结语
新时代,大数据可以完整记录社会舆情民意,蕴含着丰富的内涵和很多规律性信息,已上升到新的思想与文化内涵的高度,具体可包括:大数据思维、数字素养、数据挖掘、数据重组等,而非局限于技术属性本身。以数据的深度挖掘和融合应用为主要特征的网络舆情管理,在具体的策略上,可充分利用数据检索技术对数据进行信息整合,将复杂的数据转变成为可利用的决策信息,以便在第一时间找到事件的信息源头,帮助有关部门重组完整事件,并提出针对性的预防措施;可在减少对国外数据技术依赖的同时,建立囊括全中国信息流量的大型数据库,加强数据资源整合能力;可利用“数据库+大数据”优化完善国内各方面的监管、监测机制,提高各类信息的热点检测精度等。
作者许志强系成都大学中国-东盟艺术学院教授、硕士生导师
王雪梅系四川传媒学院研究员、硕士生导师
田艺鹏系四川传媒学院2016级数字媒体技术本科生
本文系四川传媒学院“课程思政”示范课程“下一代互联网技术及应用”(项目编号:SCCMKCSZ-19-20-011)的阶段性成果。
参考文献
[1]博文仁,马雪健,杨兼.网络舆情进入“场境时代”——从“春节抢红包”看网络舆论场的变化[J].新闻前哨,2015(04).
[2]许志强,徐瑾钰.基于大数据的用户画像构建及用户体验优化策略[J].中国出版,2019(06).
[3][美]霍华德·莱茵戈德.网络素养:数字公民、集体智慧和联网的力量[M].张子凌,老卡,译.北京:电子工业出版社,2013.
[4]王雪梅.突发事件中新媒体噪音与社会控制[J].青年记者,2013(27).