APP下载

微博维权行为甄别研究
——基于遗传算法优化BP神经网络模型

2022-01-10蔡诗怡

统计理论与实践 2021年11期
关键词:谋利遗传算法维权

王 静 蔡诗怡

(1.江西财经大学 统计学院,江西 南昌 330013;2.江西财经大学 应用统计研究中心,江西 南昌 330013)

一、引言

近年来,公众的维权意识不断增强,维权诉求也不断增加,而传统维权渠道相对有限,这种供求不均衡的外部环境使人们迫切需要新型维权途径,微博维权随之诞生。

微博维权的出现,一定程度上缓解了传统维权成本高、门槛高等问题。它集中了成本低、时效性强、关注度高以及舆论帮助等优势。成本低使每一位公民都可作为维权者或参与者聚集在这一公共话语空间内,倾诉自己的故事或发表观点;时效性强使维权事件能够在大众的密切关注下得到快速发酵,并得到有效解决。在信息纷繁复杂的网络世界中,关注度和舆论帮助作为一种催化剂,使维权者和参与者之间产生了一定程度的情感共鸣,从而促进维权事件成功解决。这也是公民选择微博维权作为寻求权利救济的重要原因。

微博维权的这些优点,也为虚假维权者提供了便捷。虚假维权者只需注册一个微博账号就能在微博上散布虚假信息,假借维权之名,借助舆论武器,对无辜大众或个体进行道德绑架,虚假维权,以达到自己不可告人的目的。这种“以谋利为目的”的维权行为对良好网络环境构建、社会公信度提高以及社会和谐稳定产生恶劣影响。同时,作为一种新兴的社交平台,微博平台的规范使用以及微博维权相关的法律制度不够完善。很多时候,微博平台及政府相关部门难以遏制“以谋利为目的”的虚假维权行为。因此如何准确地判断某一维权事件是否“以谋利为目的”成为关键。

现阶段,不少学者对微博维权行为进行了深入研究。孟诩(2020)认为,微博维权是现阶段维权方式中的新形式,解决问题的概率较高,因此成了热门的维权渠道,但微博维权作为一种新生事物,还处于研究和探索的初步阶段,存在许多问题。对于目前微博维权工作中存在的突出问题,常健和余建川(2018)认为微博维权虽然对社会监督、权益救济等各个方面都起着积极的推动作用,但这种维权方式一定程度上影响着社会秩序,加大了依法维权的难度。蔡彤(2014)将网络维权行为大体分为以下几种类型:合法合理的维权行为、合法但不合理的过度维权行为、已构成敲诈勒索罪的过度维权行为。朱钰婷(2018)根据行为人是否存在维权理由、采用的行为方式是否非法,将维权行为分为四类,本文借鉴这一说法,将微博维权行为分为“以维权为目的”和“以谋利为目的”两类。针对不同形式的维权行为,张玉亮(2021)提出不能采取“一刀切”的单一化评价模式,而应对各类维权行为进行深入细致的分析。长期看,网络社会治理创新要致力于建立稳定的治理秩序,消除网络恐慌,避免“网络起义”。因此为了建立和谐稳定的网络环境,应及时甄别出“以谋利为目的”的虚假微博维权行为,从源头上遏制其传播。

在模型的选择上,一些学者认为采用BP神经网络模型能够对微博中的相关话题内容产生良好的匹配度。张华(2014)以微博新闻事件舆情预测模型为实例,分析研究了微博热点话题,对微博新闻事件舆情预测模型的网络结构参数进行了模型调整和改进,优化了该模型的网络结构参数,并通过微博新闻热点事件分析验证了基于模型优化后的BP模型神经网络的微博新闻事件舆情预测模型的准确度和有效性。该文主要使用BP神经网络算法、遗传算法优化BP拓扑结构以及GSA优化BP网络参数,但BP神经网络模型易受权值、阈值随机生成的影响,文章缺少对这部分内容的改进。对于BP神经网络模型权值、阈值的优化,袁鸣等人(2020)在对全球气温进行预测时,发现遗传算法优化神经网络(GA-BP)能够充分利用遗传算法在进化过程中以最大概率搜索最优解的区域,得到全局性较好的个体,能够提高预测的准确率。Kening Dou和Xiaoqi Sun(2021)在对日照天气进行仿真模拟时,得到了与袁鸣等学者相似的结论,他们发现通过遗传算法对BP神经网络进行优化后得到的预测结果与单一使用BP神经网络相比有较大提升,预测结果的百分比误差与精度均有提高,遗传算法优化后的BP神经网络能够改进单一BP神经网络对权值和阈值不敏感的缺点。

综上所述,从现有研究看,学者在有关微博维权的重要性与不同维权行为的差异性的研究中已取得了较丰硕的研究成果。对于微博维权的发展现状和维权主体的研究表明,微博维权目前在解决维权问题、缓解社会矛盾、助力社会治理等方面发挥着非常重要的作用。但与此同时,对“以维权为目的”的真实维权信息与“以谋利为目的”的虚假维权信息的甄别、对维权主体目的性的分析目前鲜有研究。如何准确地将某一维权事件进行分类,并遏制“以维权为目的”的虚假维权信息的传播,具有重要的现实意义。

本文在前人研究成果的基础上,收集2019—2020年微博上发布的110个典型案例,首先根据微博维权事件的四种类型,将不合理不合法、合理不合法、不合理合法三种类型的维权事件归纳为“以谋利为目的”的虚假维权信息,将合理合法的维权事件归纳为“以维权为目的”的真实维权信息,随后建立遗传算法优化BP神经网络的算法来甄别不同目的的维权行为。然后将甄别结果与传统BP神经网络的甄别进行比较,结果表明,较单一使用BP神经网络而言,优化后的算法预测精度更高,预测结果比较稳定,且不受BP算法权值、阈值随机生成的影响,在甄别过程中,此方法更为有效,能够有效地甄别出“以谋利为目的”的虚假维权信息,从源头上减少微博上此类信息的传播。最后根据实际,结合微博维权的特点,提出相关建议。

二、微博维权行为界定

由于微博维权的便利性,虚假维权者只需注册一个微博账号就能在微博上散布虚假信息,这种“以谋利为目的”的维权行为对良好网络环境构建、社会公信度提高以及社会和谐稳定产生恶劣影响。对于不同原因、目的的微博维权行为,本文借鉴朱钰婷的思路,将其拆分为“目的行为”与“手段行为”的组合,主要有以下四类:

(一)不合理、不合法的维权行为

这种行为主要是指维权者的维权目的、维权手段既不合理也不合法。不合理是指维权者不存在维权依据,通常在网络上表现为仅依靠发布文字微博,无法提供任何与维权事件相关的证据;不合法是指维权者所需的赔偿远远超过维权案例应得的赔偿,通常在网络上表现为维权者存在过激的言论、希望得到远超事件本身价值的赔偿或者以某种不合法手段进行威胁来维护自己的权益。存在这些表现形式的维权事件既不合理也不合法,因此将其纳入“以谋利为目的”的维权行为。

(二)合理、不合法的维权行为

这种行为主要是指维权者的维权目的合理,维权手段不合法。通常表现为维权者能够提供出维权案件相关的证据,如照片、证明等,但在维权过程中存在过激的言论、希望得到远超事件本身价值的赔偿或者以某种不合法手段进行威胁来维护自己的权益。因此虽然维权事件合理,但维权者在维权过程中采取了不当的手段,因此将这种维权行为纳入“以谋利为目的”的维权行为。

(三)不合理、合法的维权行为

这种行为主要是指维权者的维权目的不合理,但维权手段合法。通常表现为维权者不存在维权依据,仅依靠发布文字微博,无法提供任何与维权事件相关的证据,但在申请获得赔偿时,采用合法的方式,不存在过激言论、超额赔偿以及威胁等手段。因此将这种维权行为纳为“以谋利为目的”的维权行为。

(四)合理、合法的维权行为

这种维权行为是本文倡导的维权方式,主要是指维权者的维权目的、维权手段合理、合法。维权者不仅能够提供维权案件相关的证据,且在申请获得赔偿时,采用合法的方式,不存在过激言论、超额赔偿以及威胁等手段。具有这些表现形式的维权事件其目的、手段均合理合法,因此本文将这种维权行为纳为“以维权为目的”的维权行为。

四种类型的维权事件中,合理、合法的维权行为是本文所倡导的,因此本文将其定义为“以维权为目的”的真实维权信息,将剩余三种定义为“以谋利为目的”的虚假维权信息。

三、遗传算法优化BP神经网络模型

BP神经网络虽然能够有效地适用于分类、拟合等任务,但在寻求最优解的时候,很有可能陷入局部最优、预测误差较大的情况;而遗传算法则是一种通过对自然进化过程模拟来寻求最优解的方法。目前有关遗传算法与神经网络相结合的文献主要包括优化连接权、优化结构和优化学习规则三个方面。本文通过对遗传算法和BP神经网络两者优势的结合,构建遗传算法优化BP神经网络模型,对BP神经网络的初始权值、阈值进行优化,使被优化后的BP神经网络可以较好地实现对函数的输出。其流程如图1所示。

图1 遗传算法优化BP算法流程

该流程主要划分为两个部分,分别是BP神经网络部分和遗传算法部分。在该算法的具体工作流程中,首先依据拟合函数输入、输出参数个数确定BP神经网络结构,并初步确定出BP神经网络权值、阈值长度,进而确定遗传算法中每一个个体的长度。遗传算法的优化部分主要利用遗传算法优化BP神经网络模型的初始权值和阈值,首先对初始值进行编码,并据此得到一个初始种群,种群中的每一个体都包含了一个网络权值和阈值,接着通过适应度函数计算每一个初始个体的全部适应度,通过遗传算法的数据选择、交叉和变异这三个操作找到最优适应度值所对应的个体。最后,用遗传算法获取的最优个体对网络初始权值和阈值进行赋值,利用BP神经网络对该网络进行训练并预测其函数输出。

四、数据来源与预处理

(一)数据来源

由于没有现成的数据库,为了避免收集维权数据的主观性,本文按照时间顺序选取2019年1月1日至2020年12月31日两年内发生的微博维权事件,对每一条维权信息进行整理。整理发现,消费者维权案例占绝大多数,在构成数据集时样本重合,因此再按照热度排名,选取热度较高的110件案例(剔除大部分属性相似的消费者维权案例),选取的案例涵盖了两年间的所有维权类型,且在数量分布上合理,满足代表性。经整理后数据集共有110条记录,共分为8个属性,分别是:维权者类型、维权者是否实名制、维权者是否被纳入失信名单、维权者是否列出证据、维权是否损害他人利益、维权过程中是否恐吓辱骂殴打被维权对象、是否有多方介入、维权出发点。

(二)归一化处理

由于本文数据中的量纲单位并不完全相同,为了消除数据由于不同量纲导致的偏差,首先对其进行归一化处理,将所有具备量纲的数据转化为[0,1]区间的无量纲单位数据。最后,再对这些数据进行反归一化还原处理。本文采用的是mapminmax()函数对数据进行归一化处理,用ymax、xmax、xmin分别表示每一列数据中的最大值和最小值,计算方式是:

(三)参数设定

在关于BP神经网络各种参数的选择中,本文采用最基本的三层BP神经网络,即由输入层、隐含层和输出层三个部分组成。根据该微博维权数据集的特点,输入层选取8个神经元;输出层选取1个神经元。隐含层个数的选择上,考虑既要满足精度要求,又要尽可能减少训练学习的时间,故本文设定一个隐含层。对于隐含层节点数的选择,本文参考公式:

确定隐含层节点数的范围,最终确定为10个节点数。其中m表示隐含层节点数,n表示输入层节点数,l表示输出层节点数,α为1—10之间的常数。

遗传算法优化BP网络模型的参数设定主要包括了种群规模数、进化次数、交叉概率和变异概率。在参数的选择上,若种群规模过于小,则会出现近亲交配,产生一个病态的基因;而规模过大,又会出现难以收敛且稳健性下降的问题。种群进化的次数过少,算法不易收敛,种群尚未成熟;进化次数过大,算法已经熟练或者种群过于早熟,继续进化则没有意义。交叉概率过大容易破坏已有的有利模型,随机性增大,容易造成最优个体的错失;而交叉概率过小无法有效地更新种群。变异概率过小,会使种群中的多样性减少太快,容易造成有效基因的迅速丢失且不容易被修补;而变异概率过大时,又可能会增加高阶模式被破坏的概率。本文通过多次试验,设置网络甄别模型参数如下:种群规模为3,进化次数为10,交叉概率为0.9,变异概率为0.2。

五、实证结果与分析

(一)不同属性分类的描述性统计

观察表1可知,本文所用的110个案例均为实名发布,实名性使在微博上随意发布虚假维权信息的网民会有所忌惮,因此在公民发布维权信息时,可将实名制列为必要条件;在失信名单一行中,3个维权者纳入失信名单的案例均为“以谋利为目的”,因此检测出维权者被纳入失信名单后,微博平台须加大审核力度,再予以发布;在是否列出证据一行中,其中有17个案例没有给出证据,仅有3个案例为“以维权为目的”,故微博平台可将需要证据列为必要条件,如相关照片、购物凭证、与相关人员聊天记录、报警回执单等,而不是一味地只看维权者的叙述;从维权出发点一行来看,自身利益未受损的案例个数有19条,但其中仅有36.84%为“以维权为目的”,因此当维权者表达自身利益未受损时,微博平台亦应加大审核力度,再予以发布。

表1 “以维权为目的”案例个数在不同类别中占比情况

(二)遗传算法优化BP计算结果

遗传算法优化过程中个体适应度值变化如图2所示。进化过程中,随着进化代数的增加,平均适应度与最佳适应度呈现出增长的趋势,能够对原算法进行优化。结果表明,当进化次数达到6时,个体达到最佳适应度。

图2 个体适应度值变化

图3中,(a)为训练集预测结果,(b)为测试集预测结果,记“以维权为目的”的维权事件为1,以“谋利为目的”的虚假维权事件为0。从88个训练集样本的预测结果来看,76个样本被判定为“以维权为目的”的真实维权信息,12个样本被判定为“以谋利为目的”的虚假维权信息,与运用“目的行为”及“手段行为”的判断相一致,预测准确率达到100%;从22个测试集样本的预测结果来看,18个样本被判定为“以维权为目的”的真实维权信息,4个样本被判定为“以谋利为目的”的虚假维权信息,与运用“目的行为”及“手段行为”的判断对比,其中有两个样本被误判为“以谋利为目的”的虚假维权信息,预测值的准确率为90.91%。但预测准确率仍达到90%以上,预测结果较好。

图3 训练集、测试集预测结果

重复五次实验得到的各次准确率及平均准确率如表2所示,该结果预测精度较高,训练集样本的准确率均达到90%以上,测试集样本的准确率均在90%以上,且预测结果比较稳定,波动不大。实验结果证明,该方法在对两种不同目的的微博维权行为的甄别上具有可行性。

表2 五次重复准确率结果

六、传统算法与优化算法的甄别效果对比

(一)BP神经网络甄别结果

抽取数据集的80%,共计88条数据进行训练,将剩下的20%,共计22条数据作为测试集。运用BP神经网络算法进行五次重复实验,得到结果如表3所示。

表3 五次训练参数结果

根据表中结果,可计算得到甄别正确平均准确率为80.91%,虽然平均准确率较高(大于80%),但甄别的精度不高,准确率最高时能达到90.91%,但最低时只有68.18%,原因可能是甄别结果易受BP神经网络初始生成的权值、阈值的影响,因此BP神经网络不太适合对不同目的微博维权行为的甄别。

(二)两种算法甄别结果对比

对于甄别两种不同目的微博维权类型,BP神经网络算法的五次网络训练结果均能达到收敛。但比较五次结果的准确率,结果相差较大,精度和稳定性不高。由于BP神经网络网络初始化时权值和阈值是随机生成的,这个结果对收敛的影响比较大,且可能在训练过程中找不到解,陷入局部较小的情况。本案例中,BP神经网络对不同目的微博维权类型的甄别精确度波动太大,因此不太适合甄别不同目的的维权信息。而本文研究设计的遗传算法优化BP算法,将遗传算法与BP神经网络结合,能够有效地优化BP神经网络的结构和参数,以便于得到最佳的网络结构以及该结构对应的初始权值、阈值和学习速率,甄别结果的准确率与精度也更高。

在两种算法得到的五次结果中随机抽取一次甄别结果,如表4所示,其中1代表“以维权为目的”的维权事件,0代表“以谋利为目的”的虚假维权事件。结果显示,遗传算法改进后的算法与原始BP神经网络算法相比较,甄别精度更高。且根据上文中的五次实验结果,比较两种算法的稳定性,改进后的算法优于原算法。因此该算法是一种更优的算法,可运用此算法来甄别“以谋利为目的”的虚假维权信息。

表4 实际值与两种算法甄别结果对比

七、结论与政策建议

(一)结论

微博维权案例日益普遍,本文将微博维权案例的四种基本类型(不合理不合法的维权事件、合理不合法的维权事件、不合理合法的维权事件、合理合法的维权事件)最终归结为“以谋利为目的”的虚假维权事件以及“以维权为目的”的真实维权事件两大类。目前鲜有对“以谋利为目的”的虚假维权信息的甄别及遏制,导致“以谋利为目的”的虚假维权信息盛行。由于目前对于BP神经网络结构和权值、阈值的选取没有一套完整确定的理论,一般都是凭借人们的经验去选择,因此本文借助于遗传算法,优化了BP神经网络的结构和参数,在一定程度上弥补了BP神经网络随机生成权值、阈值的不足,使甄别机制更加适合。

通过运用优化后的算法甄别,结果显示训练集样本中,甄别结果的准确率均在95%以上,测试集样本甄别结果的准确率都大于90%。甄别的精度、稳定性均高于BP神经网络的甄别结果,能够稳定、有效地甄别出“以谋利为目的”的虚假维权事件。因此遗传算法优化BP神经网络在对于不同目的维权事件的甄别,是比较有效的。

综上所述,本文在甄别微博维权事件的目的性问题上具有较强的甄别能力,有效地弥补了前人研究的不足,能够在初期就遏制“以谋利为目的”的虚假维权信息的发布。

(二)政策建议

本文根据数据集的8个属性,为微博平台及维权者提供以下建议:

1.完善实名制度,让“虚假”现形

本文搜集到的数据中,维权者均为实名维权,但微博上仍有匿名发布维权信息的情况。匿名发布者易因为匿名而随意发布或真或假的言论,导致虚假言论难以溯源。微博虽然是虚拟空间,但每个人都应对自己的网络言论、行为负责。若微博平台实施强制实名制,可以约束网民行为,在微博上随意发布虚假维权信息的人会有所忌惮。

2.强化执法力度,维护网络秩序

若通过甄别过程,确定某个账号发布的是“以谋利为目的”的虚假维权信息,微博平台应及时清理虚假信息,并按照传播影响,轻则对该账号进行禁言、封号等处理,重则通过司法程序对发布者进行处罚,同时应降低该用户的信用等级,在该用户下一次发布维权信息时着重审查。

3.上传有效证据,供网友辨别

根据本文建立的甄别机制,在维权过程中如若一味地叙述,没有列出证据,很有可能被列为“以谋利为目的”的虚假维权而不予发布。因此维权者在发布维权信息时应尽可能多地列出证据,如贴出相关照片、购物凭证、与相关人员聊天记录以及报警回执单等。

4.合理合法维权,勿让维权成侵权

维权过程中,不少维权者会有恐吓、辱骂、殴打被维权对象,损害他人正当利益的行为,这种行为一般是处于强势方才会采取的措施,因此在甄别过程中也很有可能被列为“以谋利为目的”的虚假维权而不予发布。故维权者在维权时要注意控制情绪,保证维权用词、维权方法得当,勿让维权成侵权。

猜你喜欢

谋利遗传算法维权
维权解难题,英烈归陵园
维权去哪里?
基于遗传算法的高精度事故重建与损伤分析
基于遗传算法的模糊控制在过热汽温控制系统优化中的应用
基于遗传算法的智能交通灯控制研究
组织外汇帮助相关单位虚假验资进行谋利的行为应如何定性
上市银行海外“谋利”
又来了个打算维权的
论受贿犯罪的域外考察与取消为他人谋利的要件
基于改进多岛遗传算法的动力总成悬置系统优化设计