APP下载

大数据视域下高校网络舆情管理的新模式

2016-04-16赵健

福建工程学院学报 2016年2期
关键词:大数据

赵健

(福建工程学院 人文学院, 福建 福州 350118)



大数据视域下高校网络舆情管理的新模式

赵健

(福建工程学院 人文学院, 福建 福州 350118)

摘要:立足大数据的视野,通过“社会关系网络”和“心理文化地图”阐述高校网络舆情管理的关联度内涵和“减压阀”功效,对覆盖全样本相比较传统抽样的优势进行解读,重点剖析了舆情管理由监测转向预警乃至预测的核心功能,并介绍其专业化要求和集约化发展方向等。在体现大数据视域下高校网络舆情管理新模式的同时,为大数据时代如何建设和谐校园,创造良好的网络舆论环境提出了“相关关系”发掘、“舆情领袖”筛选、“舆情研判”步骤、“数据信息”安全、“数据服务”应用等具体对策。

关键词:大数据; 高校网络;舆情管理

高校网络舆情主要指大学生网民凭借其思想认知和价值判断,通过网络载体自主表达思想观点和态度,较为集中地反映出时下大学生群体的思想动态、心理特征及行为倾向。近年来,随着网络传播媒介的不断发展,尤其是自媒体的全面融合,大学生作为网络世界的主力军,活跃在博客、论坛、易班、微博、微信等各类校内外新兴媒介上,他们经常通过博文、“朋友圈”关注与讨论新闻时政、经济文化、人文社科、校园话题……。突发偶发的事件、国内外热点问题和与学生利益密切相关的事件极易成为高校网络舆情的主体。倘若引导不当,大学生极有可能成为虚假网络信息或不良社会思潮的推手,甚至对自身和他人的人生观、世界观和价值观产生负面的影响。大学生网络舆情的自由性、匿名性、突发性、分散性等特点,决定了其可以作为测试和谐校园建设的风向标和晴雨表。与新兴媒体不断衍生的是数字化时代产生的海量数据,其中经营交易、商流物流以及网络社交等时空信息,成为了大数据的主流并揭开了大数据时代的序幕。随着数据量持续高速的增长,人们也相应地提升了对数据的收集、整理、分析和处理能力,促使海量数据逐渐实现从量变到质变的转化,这为高校网络舆情管理提供了一个前所未有的机遇和挑战。高校应积极顺应大数据的时代背景,通过领会和挖掘高校网络舆情管理的新内涵、明晰样本对象的新变化、把握舆情管理的新核心和新难点、建立积极有效的保障新机制,打造大数据视域下高校网络舆情管理的新模式,不断推进思想政治教育工作的深入开展,进而实现青年大学生健康成长成才的目标。

一、新内涵:体现关联度

高校网络舆情传统的监测模式主要关注大学生的语言文字内容,但对语言或话题之间的关联度,大学生与其网络群体之间或与家庭和社会之间的背景关系则极少关注,甚至忽略。这种舆情监测犹如“素质冰山”模型一般,只能抓取比较表象和浅层次的语义表达,不能准确地把握语言冰山下的心理特征和其所处的社会人际,更不能探析大学生的话语表达与其日常行为、个性特质、文化素养以及喜怒偏好的关联性。

网络舆情大数据的魅力恰恰在于数据之间的关联性,被喻为社会关系的“沉淀池”,这有助于厘清各类表象的脉络根结,也势必改变传统高校网络舆情只见“内容”不见“关系”,只重“个体属性”,不明“社会属性”的境况。大数据不仅能完整地刻录下大学生的网络话题和语言内容,还可以记录下大学生网络社交群体之间的互动及网络族群间的界限和勾连,通过一定的数据分析手段,描绘出大学生的“社会话语表达”,并区分舆情的类别涉日。[1]如:钓鱼岛问题,台海、南海问题、公共安全危机,甚至校内膳食宿管问题等舆情。一些舆情,其诱因和时点具有突发性、偶然性,属于无先兆的网络舆情;与高校学生年级分布特点和教育管理规律相适应的学科竞赛、教学模式、课程设置、培养方案、评先评优、招考收费等事件或话题,大多呈现以学年为单位的循环性特点;与自身利益关系密切的就业、创业等校内外政策或事件,在话题上会始终保持高强度和高关注度,期间可能会呈现出“波浪式”的震荡反复但不会轻易消失,属于长期反复性的网络舆情。通过话语关联分析,区分不同类别的网络舆情有助于针对性地进行疏导和化解。值得一提的是大数据具有类似汽车驾驶舱的“仪表盘”功能,根据过程中记录下的思想、行为乃至情感等海量数据,能够清晰地描绘出大学生的“社会关系网络”和“心理文化地图”。网络舆情的形成中,大学生个体或个人集合体并不足以构成一个群体,其言论的舆情影响力也并不强。而那些通过诸如专业群、社团、家族纽带等各种错综复杂的社会关系聚集成的大学生社交群体,他们的感情和思想相互影响、渗透,加之受到个别活跃的网络“意见领袖”和泛社会思潮的影响,经过类似于无领导小组讨论模式形成群体极化,网络表达语言中的自觉理性和个性会逐渐淡化,形成一种近乎迷失性的集体从众心理。通过大数据“仪表盘”的“关系网络”和“心理地图”,对大学生群体予以行为刻画,细节化,即时化,深层次地发掘、了解相关话题的背景、态度、情绪、心态、追求和行为动向,可展现出个体和群体的心理变化。高校舆情管理不是追求简单的“因果关系”,而是有效地挖掘“相关关系”的新内涵,彻底改变传统的研究视域,做到校方和学生群体之间的充分沟通、平等对话,为大学生及其关联社交群体的非理性舆情提供真实、深度、权威的信息和价值引导,从而消除疑虑,从根本上起到关联性疏导和“减压阀”的功效。

二、新对象:覆盖全样本

传统的抽样研究往往会陷入管中窥豹的误区,有可能出现调查结论的失真。长久以来,高校网络舆情研究正是在对数据信息随机抽样的基础上进行的,目的在于尽可能用最少的数据得到最广义的信息。它看似解决了数字时代之前将大量数据分析变为可能的现实难题,但在时间碎片化、社会多元化的当今,抽样准确性受到了质疑。这好比把一首数码歌曲截成多个小文件,在采样分析的时候,很多信息已经丢失。

当海量数据获取成为现实可能,采样方法自然失去存在的意义。大数据为高校网络舆情的管理和研判提供了一个前所未遇的全样本的机会,这相比较以往基于抽样的各类调查方法会更加客观、强大和准确。需要澄清一个可能在认识上的偏差:使用全样本数据并不意味着工作任务复杂艰巨。大数据中的“大”,是一个相对于所有数据的动态概念,表现在相对意义而非其绝对意义。在当前高校网络舆情管理过程中,大数据的价值表现极为突出,面对全国高校数以千万计的大学生网民和浩如烟海的网络言论,网络舆情的分析和监测对全样本大数据分析技术与平台的依赖将与日俱增。通过全样本数据,首先可以确保对数据信息的了解更加全面、系统和客观,对大学生的思想动态的把握也更加准确,避免出现以偏概全和失真的现象。更为重要的是,通过全样本数据可以发现如若不然则会在大量信息中淹没掉的情况。[2]例如,高校网络舆情中常见的经济诈骗信息就是通过观察异常情况来识别的,异常值是最有用的信息,可以将其与正常的交易信息情况进行比对,只有掌握了全样本的数据才能做到这一点。再如,高校网络舆情管理和应对中往往会培养一批“舆情领袖”,引导学生进行网上理性讨论,针对少数偏激观点,通过互动和朋辈参与的方法,阐释国家法律、政策、学校校情与规章制度,以维护党和中央政府的利益及学校的公众形象,消除不良网络信息的负面影响。全球最权威的复杂网络研究专家艾伯特-拉斯洛·巴拉巴西以下研究很有借鉴意义。艾伯特-拉斯洛·巴拉巴西与同事们匿名调查了四个月内所有的移动通信记录。研究结论非常重要也非常出人意料,如果移除一个与本网络社区众多人群有连接关系的人,这个网络社交关系将会变得运作低效却不会随之解体;如果将一个与所在网络社区之外的很多人有着连接关系的人从该社区网中剔除,整个关系网很快破碎成诸多小块,甚至完全解体。该研究表明在一个关系网内拥有众多好友的人的重要性可能还不及一个只是与很多关系网外有联系的人。这样的研究结果为高校有效拣选社交平台上的大学生“舆情领袖”提供了启示:可充分利用全样本数据重新审视各类论坛吧贴、QQ群、BBS、微博、微信群等社交网络中每位大学生存在的价值。甄选、确定不同关联角色的舆情评论员,在互动交流中影响大学生群体,自觉地达到对舆情的积极有效引导。

三、新重点:凡事预为先

目前高校网络舆情监管主要是对校内用户信息交流平台实名注册管理,对校外用户信息交流平台予以监测,涉及国家政策、社会热点、高校后勤服务、助学贷款、扶贫帮困、评奖评优、入党、就业创业等最容易引发网络舆情危机的相关话题和内容,在传播范围、影响力等方面进行跟踪和研判,必要时候可以采用技术手段将影响控制在最小范围,保证舆论发展的方向遵循积极的价值观和文化形态。[3]如此的监管模式仅能对过往事件予以认知和判断,却无法预测未来事件发展可能。

高校网络舆情大数据的核心功能是使高校网络舆情由监测转向预警乃至预测,不再大量依赖传统的随机采样、内容过滤、识别技术和IP地址跟踪等模式对校园舆情进行安全的监管,而是在分析处理整群数据的基础上,通过自然语言处理、模式识别及机器学习等人工智能技术,结合人工经验,研判未来高校网络舆情发展的态势和影响,并在此基础上实现超出学生思想政治教育工作经验范畴之外的精准化预测。如美国麻省理工学院 Devavrat Shah教授和其学生 Stanislav Nikolov 研究的模型,其预测微博热门话题的准确率可高达95% 以上,且预测结果比微博热门话题官方发布时间平均提前100 min,甚至有些专属热门话题可提前5 h,实现精准预测。新研发的预测模型不受时间限制,可以实时分析出现的任意话题。分析结论不仅可以一目了然地看清热门话题的演变趋势,还可帮助企业市场营销或品牌推广人员准确把握市场潜在客户的未来需求,甚至可作为引导和制造舆论的参考依据。高校网络舆情则可以在大数据的基础上借助百度指数功能实现预警和预测,以大学生对全国人大和政协会议问题的舆情研判步骤为例:一是趋势分析。区别于传统基于样本数据统计采用的时间序列或多元回归方法,通过大学生全样本数据对“两会”这一关键词在桌面或无线两端的搜索指数进行态势分析。二是需求洞察。基于语意挖掘技术测探任意关键词隐藏的关注焦点和话题预期,进而预判“两会”哪些议题将备受关注。三是舆情管家。一站式地呈现“两会”话题中任意关键词最热门的相关微博、QQ群、电子邮件、论坛、贴吧等,进而可以预测和判断“两会”相关主题活动在大学生的各类社交平台上会引起多大的反响,或者一些负面的言论将来自于哪些社交平台。四是人群画像。可以通过任意关键词,如与“两会”相关“创新创业”的大学生网民在年龄、性别、地域、兴趣的分布特点进行分析,反哺对某一类别关键词可能予以关注的大学生特征群体进行预判甚至是预警。五是行业指数。基于百度搜索数据,宏观数据清晰呈现,可查看大学生对特点行业领域搜索指数、需求趋势、人群分布、搜索时间特征等,进而对大学生就业创业的形势和问题进行研判,提出对策。凡事预为先的“预测性舆情”功能是高校网络舆情管理发展的方向,对大学生可能感兴趣的话题或内容进行预测,并针对特定对象或群体个性化、前瞻性地推送正面的与其兴趣内容相关的新闻、历史、文化等方面信息,小则可以帮助大学生网民避开即将到来的网络交通拥堵,大则可以未雨绸缪有效规避大规模的公共危机事件。

四、新要求:凸显专业性

高校网络舆情疏导是高校思想政治教育的重要内容。近年来,高校不断加大网络舆情管理队伍建设的力度,选拔和吸纳了一批政治坚定,业务精通,思想敏锐的思政工作者、学生常任代表、教授、班导师、班主任以及心理健康教育、应急事件管理的专家学者参与网络舆情收集、分析、研判、评论和疏导。同时,高校还充分发挥资源优势,开展网络管理方法技术、网络安全设计规划、舆情预案科学制定、舆论引导专业能力、舆情突发事件处置、“网上网下”互动联动等方面的培训,不断提升舆情管理的工作水平。

然而,在高校网络舆情拥抱大数据的时代背景下,无论是管理变革与观念转变、工作效率与数据管理,还是数据处理与决策水平,对专业化要求都有了极大的提升。高校思政教育工作者,必须在传统舆情管理专业化要求的基础上,进一步凸显应对大数据汹涌来袭的专业性。首先,要强化大数据专业意识。高校各级管理者都要以专业化的态度将大数据概念融入思想意识和实际工作,强化顶层设计和系统规划,将大学生各类相关数据的收集、管理、分析和有效利用提升至打造高校核心竞争力的战略层次。同时,积极打造具有浓郁数据氛围的校园文化,建立可持续性运作的收集、分析、转换、决策、实践的工作机制,真正发挥大数据在高校舆情管理发展中的应用价值。其次,要搭建专业化的大数据信息平台。大数据的数据资源相对驳杂,舆情大数据分析所需要的数据源也应是多元化的,数据收集和管理不再单纯是高校宣传部门或信息部门的任务,需要学工、教务、科研、后勤等相关职能处室和院系各单位的支持与相互配合,不仅要关注综合性数据和关键数据,而且要关注基础数据和非结构化数据,通过由简单的、有限的数据库转向非结构化的大数据库,加快数据系统的建设、公开和整合共享,提高数据挖掘和应用能力、流程再造优化能力、洞察发现及决策力等。此外,高校要加强与社交网络平台和科研院所的合作,依托其先进的云计算、云服务以及专业数据收集、挖掘、分析技术,提高对大数据的收集和存储能力。再次,要建立一支专业化的高校舆情大数据分析队伍。将舆情信息监测、采集转向数据加工、预测预警、可视化等。从我国目前高校舆情队伍结构现状来看,很难在短时间内实现既有大数据知识和技术背景,又熟悉高校思政工作规律的复合型人才储备。[4]因此,要充分发挥大数据在高校网络舆情管理中的运用,较可行的是通过专业培训与专业实践相结合的方法提高现有高校舆情管理工作人员的大数据技术应用能力,以应对大数据舆情管理人才队伍的短缺。最后,要建立专业化的大数据信息安全壁垒。高校大数据信息库,信息内容更加丰富,其中不乏敏感信息和学生隐私信息,传统的硬件和软件技术已经抵挡不住多样化、高级化和快捷化的病毒、黑客攻击,建立数字签名、门限代理签名、防火墙、防水墙等专业化的安全技术壁垒势在必行。另外,高校网络舆情数据收集必须在一定范围内公开告知学生并征得同意,按照专业规范的流程收集数据、分析数据、使用数据和公开信息,避免出现侵犯隐私或其他法律纠纷。所有这些都需要建立专业化的数据信息使用安全管理制度予以保证。

五、新发展:力求集约化

随着社交网络逐渐成熟,移动带宽迅速扩容,云计算、物联网应用更加广泛,大数据将成为未来具有一定价值的信息资产,这已逐步得到公众的认同。目前高校基于大数据的网络舆情研究尚处于起步发展阶段,大数据的分析和对比框架尚未成熟,尤其是缺乏对模块数据进行分析的常模和通用、精确的数据算法,绝大多数高校只能先把相关数据下载暂存,至于如何结合舆情管理开发和应用大数据还在摸索和实践中。

笔者认为,即便大数据的首要特征是“大”,但高校网络舆情管理仍应注重性价比,力求集约化。其原因在于:一是大数据收集在多也在于精。一方面高校舆情信息收集要尽可能多元化,不仅要收集高校现有各类数据库和社交媒体中的数据信息,还要适当采集与高校学生群体密切相关的物联网中异源甚至是异构数据信息并赋予时空标识,在特定条件下与历史数据进行同比或环比,全面、多维度地验证数据的信度和效度。另一方面,如不加识别地将不同数据信息资源吸纳囊中,大学生在社交网站中的广告信息、用户体验、数据库营销等各种行为产生的海量数据必然包括大量无用的垃圾数据,主客观上都对高校数据收集、存储和处理带来了高成本,也必然对资源产生不必要的浪费。因此,在“多”与“精”的博弈中把握平衡,是收集舆情数据信息的精髓。[5]二是大数据存储要节约也要可靠。大数据库可视为母体信息,通常需要若干小数据库作为检索源,这势必要求云计算技术、冗余配置和分布化,在存储时须按照一定规则对数据进行分类节约空间,同时设计多元、立体化的标签标注系统,通过信息噪音过滤消除重复,减少存储量。必须强调的是,植入便于日后检索的标签不应仅考虑存储节约而忽略大数据产生的时空特征,因为数据无法发声表明其社会背景,舆情决策研判是按照时间序列镶嵌在特定情景之中。正像大数据-情景=不良数据一样,大数据若与社会语境相剥离就容易产生严重的失真。三是大数据处理须简约化还须结构化。舆情数据多源异构、多实体和多空间之间的交互动态性,使得数据样本异常复杂,有时需要将高维图像等多媒体数据降维简约化后进行度量处理,利用上下文关联予以语义分析,筛选出可理解的内容,并进行结构化的解读和梳理。如对大数据库的学生自我学习成长满意度测量,在进行相应的社会语义提纯后须进行结构化计算,研究衡量自我学习成长的各类指标之间的相关关系,在此基础上进行赋值计算,从而形成适合衡量成长满意度的大数据结构化算法。[6]四是大数据结果呈现须直观更便于使用。舆情大数据的结果呈现必须要界面友好,识别门槛低,直观可视化,能够直接服务于高校使用。如:英国《卫报》透过机器人“数学眼”来看历史,对阿拉伯之春发展进行的四维报道,采用了立体空间+时间维度的叙事,同一时间+不同国家的动作,不同时间+同一国家的动作,不同颜色代表不同的动作+点击还有深度报道的模式,集可视化、趣味性于一体,极大增加了新闻阅读的感染力。再如:《卫报》对2011年8月伦敦市中心骚乱事件的图样结果呈现,以大数据分析、挖掘为依据,以最直观的方式表明骚乱者居住地址、骚乱发生位置与贫困地区分布存在高度关联性,回应了卡梅伦“骚乱不是由于贫富差距造成”的言论。这些大数据可视化的结果呈现方式值得借鉴、参考。

在大数据时代,不同专业、不同类型的数据都能被广泛获取,大数据相对于高校网络舆情管理就像血液相对于有机体,有了大数据和大数据技术,高校舆情管理工作的变革和创新将超出经验和想像。高校只有进一步强化大数据意识,把握好网络舆情管理的关联度内涵,逐步完善全样本对象的数据采集机制,依托高校既有的数据预测模型研发和应用专业优势,走系统化、专业化和集约化的发展模式,应势而动、顺势而为,不断创新舆情管理工作方式方法,积极应对大数据时代的到来,才能使得具有“和谐校园建设晴雨表”之称的高校网络舆情研究和管理实现根本的改变。

参考文献:

[1] 孙华.大数据视域下网络教育研究新范式[J].中国教育网络,2014(8):63-66.

[2] 王超,王磊,李楠,等.大数据时代高校舆情管理主体的能动性研究[J].管理现代化,2013(6):100-102.

[3] 陈均土.高校网络舆情问题及其破解[J].思想教育研究,2010(11):84-87.

[4] 李尚旗.高校网络舆情的作用及其管理[J].学术论坛,2011(2):183-186.

[5] 蓝荣聪,陈永福.大数据视域下大学生创新能力培养的思考[J].观察与思考,2014(11):70-72.

[6] 段洪涛,于子淼.关于高校网络舆情研判引导方法的思考[J].思想理论教育,2015(9):79-83.

(责任编辑: 许秀清)

A new mode of university network opinions management in the perspective of macro data

Zhao Jian

(School of Humanities, Fujian University of Technology, Fuzhou 350118, China)

Abstract:The connotation of correlation and the effect of depressurized valve of University network opioions management are discussed via “social correlation network” and “psychological cultural map” based on macro data. The advantage of whole specimen coverage to the traditional specimens sampling is interpreted, detailing the core function of the network opinions management that transforms from prewarning to preditting. The special requirements and commercial development direction of the opioions management are introduced. Approaches are proposed to construct a harmonious campus in the macro data times and to create a favourable network opinion environment, which include developing correlation, screening opinions leaders, creating opioions judugement steps, ensuring data information safety and adopting data service.

Keywords:macro data; university network; opinions management

中图分类号:G647.1

文献标志码:A

文章编号:1672-4348(2016)02-0137-05

作者简介:赵健(1975-),男,福建福州人,副研究员,博士研究生,双硕士,研究方向:大学生思想政治教育管理与人力资源管理。

基金项目:福建工程学院学生工作立项课题(XG2015018)

收稿日期:2015-12-03

doi:10.3969/j.issn.1672-4348.2016.02.007

猜你喜欢

大数据
基于在线教育的大数据研究
“互联网+”农产品物流业的大数据策略研究
大数据时代新闻的新变化探究
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索