浅谈网络舆情预测方法

2019-12-19徐红

科技与创新 2019年23期

关键词：舆情灰色神经网络

徐红

浅谈网络舆情预测方法

徐红

（四川警察学院，四川泸州 646000）

随着互联网的不断发展以及网民人数的不断增多，网络舆情对社会的影响越来越大，预测网络舆情的发展趋势对维护社会和谐具有重要的意义。分析了基本的网络舆情预测方法，重点探讨了基于人工神经网络的网络舆情预测方法，并给出了相应的设计和实现方法。

网络舆情；预测方法；ARIMA；灰色预测

1 引言

随着互联网的飞速发展和网民数量的不断增加，网络在中国已经成为一类重要的媒体。由于网络信息发布具有隐匿性等特点，吸引了广大网民不断地通过互联网发表个人的观点和意见，众多网民观点和意见汇聚形成了网络舆情。

近年来，移动互联网的普及使得网民之间能更加方便、快捷地分享自己的思想和进行信息的交互，推动网络舆情产生及快速地扩散，对社会生活产生了更大的影响。如果网络舆情处理不当，就可能诱发民众的过激行为，威胁社会的稳定。因此，必须对网络舆情加以正确应对，以促进社会的和谐发展。

由于网络舆情关系到社会的稳定发展，引起了众多学者的关注，近些年来已成为研究的热点。网络舆情研究涉及面较广，大致包括网络舆情监测、网络舆情分析、网络舆情预测和网络舆情引导等。网络舆情预测是根据当前网络舆情的发展状况对网络舆情的未来发展趋势进行预测。网络舆情预测对于把握网络舆情的发展趋势、指导网络舆情的引导工作、保障社会的和谐稳定非常重要。因此，网络舆情预测在网络舆情工作中具有重要的地位，而预测方法又是网络舆情预测的核心，它直接关系着预测的准确性和稳定性，非常有必要对网络舆情预测方法进行研究。

本文对基本的网络舆情预测方法进行分析，探讨其优缺点，然后以人工神经网络为例阐述网络舆情预测的具体实施步骤和方法。

2 网络舆情预测方法分析

通常而言，网络舆情的发展趋势在互联网上可以通过某个话题的发帖数、回帖数、点击数等数据随时间的变化态势客观地反映出来，即发帖数、回帖数等相关指标对应的时间序列客观上表征了网络舆情的发展趋势。网络舆情预测方法就是基于时间序列的计算和处理，以实现对未来网络舆情走势的预测。基本的网络舆情预测方法分析如下。

2.1 基于ARIMA模型的预测方法

ARIMA模型是自回归移动平均模型的简称，它常被用于短期的时间序列预测。该方法的基本思想是将时间序列视为随机序列，并建立相应的数学模型ARIMA（，，）来近似这个时间序列。然后利用这个模型再进行预测。

假设时间序列1，2，…，n是平稳随机序列，它对应的ARIMA（，，）必须满足式（1）和式（2）：

t1t-1…+pt-p+δ+t（1）

tt+1t-1+…+qt-q（2）

式（1）（2）中：和为系数；为回归阶次；δ为常数；为白噪声；为原时间序列的均值；为移动平均阶次。

如果时间序列不是平稳随机序列时，首先要对它进行差分处理，以转换得到平稳序列，再通过解上述方程建立模型。

ARIMA预测的主要步骤如下：①利用单位根检验法对时间序列进行检验，如果序列存在单位根则不是平稳随机序列，否则就是平稳随机序列；②如果时间序列不是平稳随机序列，则通过差分处理将其转换为平稳随机序列；③将平稳随机序列建立起ARIMA（，，）模型；④对建好的ARIMA（，，）模型进行检验；⑤利用ARIMA（，，）模型进行时间序列预测。

ARIMA预测方法的优点是模型简单，但是它的缺点也很明显，就是它要求时间序列是稳定的，所以该方法的使用有一定的局限性。

2.2 灰色预测方法

灰色系统是用来解决信息不完备系统的数学方法。灰色预测属于灰色系统的内容之一，它通过灰色微分函数对不确定的系统进行分析和预测。而网络舆情具有较强的不确定性，所以可以将灰色预测运用在网络舆情分析中。灰色预测方法通过处理原始时间序列来获取系统的变化规律，生成规律性强的数据序列，再根据数据序列建立微分方程模型并求解，以此来预测系统未来的状态。

为了突出时间序列的规律性，需要对原始时间序列进行运算处理，累加和累减是常用的有效处理方式。

处理后的时间序列可以通过GM（1，1）模型建立如下所示的微分方程：

式（3）中：为处理后的时间序列；为发展灰数；为内生控制灰数。

求解该微分方程即可得到用以预测的模型。灰色预测的优点是简单，不需要大量的数据，在时间序列数据较少时能获得较好地预测效果；它的缺点是当时间序列具有较强的波动性时，其预测效果会受严重影响。

3 基于人工神经网络的网络舆情预测

网络舆情本质上是一个变化发展的动态系统，表征网络舆情发展趋势的时间序列是非线性的序列。网络舆情预测需要做的工作就是通过已知的时间序列1，2，…，n，推导出今后一段时间的时间序列n+1，n+2，…，已知的时间序列和未来的时间序列之间是存在一定非线性关系的。而人工神经网络中的BP神经网络理论上具有无限逼近任何非线性关系的能力，所以可以采用BP神经网络逼近网络舆情的时间序列，进而实现对网络舆情的预测。

基于BP神经网络的网络舆情预测设计和实现方法如下所示。

3.1 网络舆情时间序列预处理

对原始时间序列1，2，…，n进行归一化处理，将所有数据映射到[0，1]区间，可以得到新的时间序列数据´1，´2，…，´n。

3.2 BP神经网络训练集构建

针对网络舆情预测，这里采用单步预测方式，用时间序列中连续的几个数据预测之后的1个数据。即BP神经网络根据之前的个时刻的数据预测当前时刻的数据。根据这个条件，建立BP神经网络的训练集如表1所示。

表1 BP神经网络的训练集

序号输入输出 1x´1，x´2，…，x´k-1x´k 2x´2，x´3，…，x´kx´k+1 ……… n－k+1x´n-k+1，x´n-k+2，…，x´n-1x´n

3.3 BP神经网络结构设计

BP神经网络采用输入层、隐含层和输出层的3层结构，输入层为个节点，输出层为1个节点，分别对应用于预测的个时刻数据以及1个时刻的预测值。根据Kolmogorov定理设置隐含层节点个数。隐含层和输出层各节点的激活函数均选用Sigmoid函数。

3.4 BP神经网络训练

BP神经网络训练过程如下：①初始化相关参数，设置包括学习率、最大迭代次数、误差范围等参数，对BP神经网络连接权值矩阵赋随机值，在训练集中选取一组数据作为训练样本；②将训练样本提供给BP神经网络，BP神经网络计算出隐含层、输出层的输出；③计算模型输出的总误差，再通过求导，计算各层的误差，根据计算得到的误差对网络权值进行修正；④如果全部样本都完成了训练则跳转至步骤⑤，否则选取下一组训练样本，跳转至步骤②；⑤如果BP网络全局误差小于或者训练已达到最大迭代次数，则完成训练。