APP下载

基于认知过程的网络谣言综合分类方法研究

2016-10-21张鹏兰月新李昊青

图书与情报 2016年4期
关键词:矩阵谣言分类

张鹏 兰月新 李昊青

摘 要:对网络谣言进行合理综合分类是科学管理网络谣言的一项重要工作。文章从人们对网络谣言认知过程出发,采用Hayashi数量化理论III,对49种网络谣言的7种属性给以评分,通过对得到的属性矩阵进行计算,最终得到不同网络谣言的相对位置图,通过聚类发现49种网络谣言可根据阈值的调节,调整网络谣言的类型数量,从认知的角度可分为简单谣言、复杂谣言、不明确谣言(模糊谣言)3种类型。

关键词:网络谣言;谣言认知;舆情管理 ;Hayashi数量化理论III

中图分类号: G203 文献标识码: A DOI:10.11968/tsyqb.1003-6938.2016069

Research of the Comprehensive Classification Method of Internet Rumors Based on the Cognitive Process

Abstract Reasonable comprehensive classification of internet rumors is an important work of the scientific management of Internet rumors. This article, from the perspective people's cognitive process of internet rumors, uses the Hayashi quantification theory III to score on the seven attributes of 49 kinds of Internet rumors. Through the calculation on the attribute matrix, the resulting relative locations of different Internet rumors are eventually obtained. Through clustering, rumors can be adjusted according to the threshold of the rumor type and from the perspective of cognition, the 49 kinds can be divided into simple rumors, complex rumors, and indistinct rumors.

Key words Internet rumor; rumor cognition; public opinion management; Hayashi quantification theory III

进入21世纪,随着社会经济文化的快速发展,中国处于社会调整转型期的各类问题不断涌现。据2016年1月的统计数据,截至2015年12月,中国网民规模已达6.88亿,互联网普及率达到50.3%,其中手机端用户规模在2015年12月达6.20亿,有90.1%的人通过手机上网[1-2]。互联网技术的进步,不仅使信息传播效率和生活便捷度提高,也极大增强了网络信息的流动性和扩散性。现实世界中的各类问题都会迅速转移到网络上,以网络平台为阵地,快速爆发、繁殖、酝酿的各类舆情中,有些由于信息的异化而成为谣言。在手机网民中,年轻和低收入群体所占比重较高,上网人群特点直接反映出网络谣言的主要影响对象,而这些人群反映的舆情信息将对整个网络正常的舆情生态平衡起到一定的冲击作用,其中的一些冲击会导致信息异化从而演变成网络谣言。各类突发事件导致的网络舆论经过酝酿、发酵,在传播中由于增加了传播人的大量个人情感,尤其是新媒体和自媒体时代,人人都是舆情的制造者和传播者,当把突发事件放到整个媒体的聚光灯下时,每个人都拿着放大镜看网络舆情,在讨论和解读舆情的同时改造着舆情,其中有一部分因信息传递过程中失真异化成为网络谣言。异化的舆情往往增加了信息的倾向性,因而,整个互联网世界乃至现实社会蕴含的潜在不稳定因素风险也逐渐增加,网络谣言作为互联网典型的信息异化型的网络舆情在规范管理方面的重要性不言而喻。在应对网络异化的信息时,我们必须要建立合理有效的网络识别体系。同时建立社会转型期间的综合网络谣言管理体系,从而增强网络舆情管理能力,这是维护健康有序的公共秩序的内在要求。网络谣言产生的原因多种多样,有的是蓄意为之歪曲事实真相,也有的是无心而为,但就其实质而言仍然是包含若干内在特征的信息,这些信息均有其独特的属性,通过这些属性可以从网络谣言的本身对其进行识别和分类[3]。

严格来说,网络谣言就是一种正常的文化现象,其实质是传统谣言通过网络媒介进行的信息交流,但其具有传播效率高,扩散范围广特点,并且可以进行跨平台、跨区域的传播,降低了传统谣言传播的成本和时间限制[4]。由于这种文化现象是随着人际交流而自然产生的,带有普遍性且不以人的主观意志为转移。因此,我们要承认谣言的这种客观存在的长期性,并清醒的认识到谣言的危害性。网络谣言侵害的对象不仅包括政治、经济,同时其对文化生活也都有影响。从网络谣言造成的损失看,其可造成经济损失、名誉损失、精神损失、不良政治影响、降低政府公信力,还会扰乱人们的思想,干扰人们的生活。那么将不可控的网络谣言,通过谣言风险管理进行评估,同时将网络谣言案例加以定量计算,对今后管理实践中隐藏的更大或可控性差的网络谣言以及可控或随着时间或舆情规律日趋弱化的网络谣言采取不同的引导措施,进行分类管控。

科学的分类工作能够提供更为高效的管理服务,更是理论和科学研究的基础(Blumer,1931)。研究表明分类是对科学问题中需要界定对象进行选择和处理的必须的概念性工作。分类尽管可能并无法提供一个共同的概念标准,但能够提供比较或者对谣言间概念的框架进行区分界定。网络谣言在不同的原则和标准之下,分类形式也不相同。类型不同实则代表人对谣言不同的认知角度。而不同的认知则代表着不同的理解深度和管理方式,进而影响着管理水平。国内外有关学者均对网络谣言的分类工作予以重视,国内学者通过对网络谣言案例进行分析,将网络谣言事件诱因分成自然灾害类、社会伤害类、食品安全类、意外伤害类、政府行动等类型[5];而从传播心理状态进行分析,可将网络谣言分为期望型、恐惧型、怨恨型、阴谋型等6类[6];若依据造谣者的目的, 可将网络谣言划分为信息求证型、情绪宣泄型、利益攫取型和娱乐恶搞型4种类型[7]。但从整体上看,现有文献中对谣言的分类形式仍以定性描述为主,主要从谣言反应的原因或背景角度出发,而缺乏从网络谣言认知和传播过程的本身特性角度进行量化分类的研究。而描述网络谣言量化分类过程的矩阵需要数据支持,考虑到谣言分类的相关要素均需是一个明确的值,简单的说就是“是”或“非”的单一判断,故构建的数量化矩阵是“0-1”型。而Hayashi数量化理论Ⅲ(“H理论III”)的特点是能将网络谣言要素的定性概念转化为“0-1”型矩阵同时进行聚类[8]。

综上,对网络谣言进行综合分类是为了进一步识别网络谣言风险,并对不同类型网络谣言采取不同的引导和控制。同时,网络谣言分类是进行网络舆情监控和风险管理以及建立网络谣言风险信息共享平台的基础,是进一步识别新网络谣言的基础。

本文拟通过对网络谣言自身的特性进行分析,从人类认知过程的角度通过数量化的方法对网络谣言进行定性与定量相结合的分析,得到从谣言自然认知角度分析的网络谣言类型,以期得到便于分类管理的方法。“H理论III”在涉及到分类方法方面有独特优势,不仅可以进行人为和客观相结合的分类,更可较大程度的减少人为干预,便于计算机模糊识别网络谣言的特征属性,实现自动化识别。

1 网络谣言数量化分类实践

1.1 Hayashi数量化理论简介

Hayashi数量化理论是由日本的林知己夫教授在1950年首先提出[9-10],它根据不同的研究目的,在方法上可分为数量化理论I、II、III和IV。其中可以同时对定性和定量变量进行处理的多元分析的是第III类方法。与其他数量化方法相比,“H理论III”的优点在于,反应矩阵可以既包含定量变量,同时也包含定性变量,通过计算可将定性变量转化为定量变量。“H理论III”所要解决的问题是以反应矩阵为基础,对各类目和各样品赋予适当的得分,使得反应情况接近时,样品和类目有相近的得分[11]。其基本原理是基于“0-1” 属性判断矩阵的构建和向量值的计算,从而得到样本的得分。通过这种原理可将网络谣言的属性规范化、数量化,获得更便于计算机进行计算分析的基础数据结构,因此,Hayashi数量化理论不仅在理工类的地质、气象、环保、生物、医学、产品设计方面适用,也在管理类的人力资源管理、企业管理、灾害和风险管理中得到应用[12-14]。

本文通过对网络谣言的内容、传播特点等一系列特性进行分析,从对网络谣言综合认知的角度考虑,选取数量化的方法进行定性与定量相结合的分析。最终得到网络谣言从认知角度分析的类型和分类管理的方法。

1.2 网络谣言的特性

网络谣言是虚假的舆论信息,每个谣言都具有独特性的属性,不同属性谣言所表现的影响结果不同。这种特性类似于每个人的特质,如善意性、敏锐度、观察力、忠诚度、攻击性、模仿能力等特质,通过这些属性我们才能确定一个具体的立体的人。以统一标准对每个人进行赋值,其得分很难相同。这些潜在特质将决定在特殊情况的激发下,每个人的表现结果不同。与前例类似,不同网络谣言的特性也不同,从人类认知的角度,可对每种网络谣言通过几个问题进行区分,如网络谣言的代表性、危害程度、影响力、攻击性、传播性、生命力和辨识度如何。具此可以根据谣言的相关属性研究谣言的潜在发展程度和造成的影响,便于进行网络谣言管理。

1.3 网络谣言维度与判断标准

网络谣言属性的适当描述与对网络谣言自身的认知特点直接相关,进一步决定着网络谣言矩阵的形态。有研究表明网络谣言的影响力因素有扩散广度、内容热度和态度倾向,这些因素又包括若干种二级指标,这一系列二级指标是较好的刻画谣言造成影响的关键因素[15]。奥尔波特认为谣言传播能力主要在于事件的重要性、模糊程度和信息的不对称,网络谣言的特性可以包括这些。传统观点认为,谣言模糊性越强越容易传播,而网络谣言在传播过程中为增强可信度配以相关细节描述和相应资料,同时网络的匿名性也增加了谣言传播的可能性[16]。

网络谣言矩阵的构建基础是对矩阵属性赋值。本文的谣言矩阵构建原则是基于谣言认知模式和认知过程选择谣言属性,由此构建谣言识别属性(见表1),表1列出了网络谣言的7种属性及其判断标准。构建矩阵时,如对谣言案例的某属性有反应就认为是“l”,否则是“0”。即看谣言属性更接近哪种判断标准,依据判断标准定为“1”或“0”。

1.4 谣言判断矩阵的构建

网络谣言矩阵的构建是对网络谣言进行分类的关键,它关系到最终结果与现实的贴近程度,判断的矩阵越客观,最终图像越能正确反应客观实际。考虑到“H理论III”是一种可同时对定性和定量变量进行处理的多元分析方法。其基本原理是基于“0-1” 属性判断矩阵的构建和向量值的计算,从而得到样本的得分。该基本原理符合以上网络谣言属性的基础数据结构。选择“H理论III”,将每个网络谣言样本的7个属性指标转换成“0-1”属性的二维判断矩阵,通过编程运算,将样本得分在示意图中与原点距离作为样本聚类分析的输入数据,实现对所考察风险样本的分类目的。因此,科学构建网络谣言判断矩阵是得到客观结果的基础。汪青云和童玲[17]从社会心理学和谣言传播学的角度,将网络谣言分为利他性谣言、利己性谣言和无利性谣言。

在构建网络谣言判断矩阵时,本文选取了互联网关注度较高的49个谣言案例,选取过程要求案例来源丰富、类型多样,涉及名人类、腐败类、自然灾害类、事故灾难类、公共卫生类、社会安全类等多种类型的网络舆论,网络谣言的选取具有典型性[3]。并尽可能根据网络谣言的题目和基础内容对谣言属性进行判断矩阵构建,构建适用于每种可能出现的谣言属性矩阵(见表2)。

2 网络谣言计算及结果

受篇幅所限,本文介绍的“H理论III”的基本原理和计算方法参考文献[11,14,18]。通过Matlab软件支持的程序计算构造得到特征根,并利用矩阵的前两个最大特征根(见表4)对应的特征向量所表示的坐标进行描点。

2.1 特征向量的求取

经过计算,谣言样本得分每个样本得到所选的7个属性的得分,矩阵特征向量为(0.3229,0.0579,

0.0419,0.0056,0.0281,0.0135,0.0195)。

2.2 特征根的有效性检验

为了解每个特征根对总体特征向量的贡献程度,需计算各特征根占特征向量的信息比重(见表3)。

前第一、第二特征根包含的信息比共占77.81%,满足“H理论III”对分类的量化精度要求[11]。因此,选取第一、第二特征根作为表述谣言得分的主要指标(见表4),在得分坐标图上用第1特征根b1表示横坐标,第2特征根b2表示纵坐标。

2.3 网络谣言分布示意图

在二维坐标图上将各谣言的得分进行描点记录,并将坐标原点移到左下角进行坐标变换(见图1),图中横坐标代表网络谣言对第一特征值得分y1,纵坐标代表网络谣言对第二特征值得分y2,各点表示谣言样本基于其7种属性的相互位置关系。图中横坐标表示谣言传播性从弱到强的变化,纵坐标表示谣言的生命力从小到大的变化。从认知角度,传播性小且生命力弱的可认为是简单谣言,与之相对的传播性大且生命力强的可认为是模糊、不明确的谣言,介于两者之间的被称为复杂谣言。

表3中第一、第二特征根向量的最大值对应的是传播性和生命力,说明这两个属性是网络谣言最具代表性的特征,与我们对网络谣言本身特征的理解相吻合。

3 计算结果分析

为便于观察各网络谣言分布规律,我们将(0,-0.2)作为原点,计算每种谣言与原点的距离。通过计算得到远离原点的谣言的生命力和传播能力比较强。根据距离的网络谣言聚类图见图2。

通过SPSS13.0软件,使用离原点的距离进行聚类操作,当阈值L1=(2,3)可以将49种谣言分为5类;当阈值L2=(4,5)时可以将49种谣言分为3类;当阈值L3=(5,23)可以将49种谣言分为2类;当阈值>23时,谣言可分为1类(见图2)。

3.1 分类结果

通过软件聚类将网络谣言从总体趋势上分为简单谣言、复杂谣言、模糊(不明确的)谣言三种。当阈值为(2,3)时,49种网络谣言从区域上可分为A-E五种类型。体现了从简单到复杂的过渡形态。当阈值(4,5)时,从认知的角度认为网络谣言也可以分为简单、复杂、模糊三种类型(见表5)。

三种类型网络谣言的侧重点不同,政府对应的管理方式也不相同。49种网络谣言综合分类类型,和每类谣言的解读方式以及个人和政府的应对方法(见表6)。

3.2 聚类法分类的解读和政府应对办法

距离原点的远近确定了谣言生命力和传播能力两种属性可以表现为从简单到复杂的性质。因此,网络谣言通过距离上判断,可给出不同类型谣言的总体分类建议(见图1)。表6从人类认知的谣言属性角度,给出网络谣言聚类的相关距离,并对这3种类型谣言进行定性描述及提供政府和公众的应对办法解读。

从图1和图2中的分类与聚类结果看,以距离为聚类元素具有参考意义。但其中也有若干谣言分类错位的情况,如D40并未在E类型中,而是在D类型中;D34的位置表现似乎与聚类结果相差较大。可知图1仅作为谣言相互位置间的参考,具体谣言类型还可根据使用需要与常识结合进行判断,同时谣言分类结果还与构建谣言矩阵的人的知识结构有直接关系。同时每个人由于知识结构不同,谣言风险抵御能力有差异,因此,对于谣言的辨识能力有差别,进而导致谣言对生活造成的影响也不同。

3.3 网络谣言应对策略

不同类型的谣言传递的最重要的信息其所携带的内容是不同的,这些内容所传递的信息量对于每个人影响是不同的,区别在于每个人掌握真实信息的程度,如:“地震谣言”往往影响的是青少年、妇女等特殊敏感人群;而“房地产税征收”对家中有一定财产,对自身固定资产关注较高的人的影响较大,所以,谣言影响的多为受众内心的潜意识。同样对谣言关注点的不同人群是由知识文化水平差异决定的。每个人知识水平结构不同,对于知识认可度也存在差距,对于网络谣言的敏感性和可接受程度也不同。有的人接受谣言程度高,对谣言识别度低,易受谣言欺骗。知识结构的差异性是相对而非绝对的。总体来说,知识文化水平较高的人群识别网络谣言的能力较强。

因此,政府在针对网络舆论或者网络谣言管理过程中,在对不同谣言分组,进行区别引导的同时,更应重视对弱势群体网络谣言引导。从整体上提高个人的文化普及程度和辨识能力,同时提高政府对特殊网络谣言的引导能力(如涉及公共安全类)。另外,对于某些不置可否的谣言,只要不威胁到公众安全和影响市场秩序,可以允许谣言在一定可控范围内的发酵,同时引导群众进行广泛的争论,从而实现群众认知的再教育、再提高,这相当于提高个体对谣言风险的掌控程度,谣言解释的过程也是民众思想意识进步的过程。从基础上提升民众素养的根本之道,仍然是文化教育和尊重科学,用文化和科学的力量启发民智。

在网络谣言风险管理的过程中,需要建立谣言案例库和谣言处置应对方案库,当有新谣言出现时可以轻松进行分类比对,按照已有谣言成功的处理方式,采取自由发酵或专业部门进行干预的方式——涉及到各专业领域谣言,如经济类谣言由银行、财政、税务等官方机构进行解释。具体对策主要包括:(1)增强民众判断力,增强政策解读,增加官方答疑平台;(2)提高互联网环境的科学性,从技术手段打击恶意造谣者;(3)各地、各级政府应秉持科学、公开、公正的态度对待网上质疑的声音;(4)官方建立统一辟谣平台,及时辟谣,跟踪信息走向,掌控舆论走向。

4 讨论

本文虽然实现了基于认知过程的网络谣言的数量化分类,但仍存在如下问题需进一步讨论:

(1)本文分类结果有待改进,个别谣言的类别归属与大众认知存在一定差距。究其原因,本文仅从理论方法上对网络谣言分类进行了研究,并未对与认知不符的谣言类别从认知角度对判断矩阵进行修正。因此对于与认知有一定差距的谣言可通过对属性判断矩阵值加以调整,重新构造矩阵并计算,调整分类结果。通过调整各个谣言属性的模糊评分可提高分类结果的精度,但模糊化会使判断矩阵更加复杂,在谣言属性判断的权重方面也会有较大的模糊性,不适用于谣言的快速分类定位。

(2)谣言的产生和演变有其自身规律。随着人类社会生产关系和科技应用水平的不断提高,谣言的产生和演变也会随着改变。辨识谣言的能力因个人或群体的认知水平不同而有差异。认知水平受从事职业、教育水平、知识文化背景的影响很大。不同的人看待同一种谣言的角度与对不同谣言特征的把握水平差距造成对谣言的感知结果也不同。因此,在本文的探索过程中,对谣言矩阵的判断仍然存在一定人为因素,但随着对谣言产生的社会背景理解进一步深入,判断矩阵的指标定义的进一步明确,这个问题最终会得以解决。

(3)本文通过“H理论III”将定性描述科学的转化为定量的值,利用计算机程序处理大型矩阵的方便性,使得原需人工处理矩阵的数量化理论得以应用。针对网络谣言分类方法的探索是在研究网络谣言属性的基础上进行的,实验选取的网络谣言样本虽然只是近几年才在网络上流行的事件,但现代典型谣言所具有的反复性和传播效应的相似性,可为今后谣言分类研究做基础数据库。同时,本文所研究的分类方法是基于大众视角关注的谣言的通用分类,与具体部门、行业的喜好一定有区别,但可从方法上为其他学科谣言的专业分类提供思路。

5 结论

本文通过基于网络谣言的认知过程进行判断得到的矩阵,采用“H理论III”方法计算得到不同谣言的相对得分以及在网络谣言管理图谱中的相对位置差异,通过距离聚类将不同的网络谣言通过阈值选取分为不同的谣言类别,为定量化谣言识别提供了一种具体可实现的方法。通过研究得到了以下主要结论:

(1)“H理论III”对于谣言分类是适合的。分类方法以构建反应谣言主要属性的矩阵为基础,不仅能够分出合理的类别,还可随需求变化阈值调节类型数量。同时,将谣言问题中定性描述转为定量的研究谣言属性,比只用定性描述进行分类更具说服力,更易于谣言自动化管理,为多特征属性的网络谣言分析进行有益的探索。

(2)通过对阈值的变化,可将谣言分为需要的数量类型。通过调整阈值,谣言可在1类到5类之间进行分类调整。本文建议个人和行业可采用简单、复杂,模糊/不明确这三类区分法,便于从认知的角度对网络谣言进行管理。

(3)从人类认知的角度看,只有提高每个人的文化素养和科学水平,改变自身的知识结构,才是有效辨识谣言,抵制谣言,引导谣言的最佳途径。本文为网络谣言认知从人类自身知识水平结构属性分析的角度进行了有益的探索。

参考文献:

[1] 中国互联网络信息中心.CNNIC发布第37次《中国互联网络发展状况统计报告》[EB/OL].[2016-04-20].http://www.cnnic.cn/gywm/xwzx/rdxw/2016/201601/t20160122_53283.htm.

[2] 陈滢.浅析移动时代下的“互联网碎片经济”[J].未来与发展,2015(7):49-52.

[3] 张鹏,兰月新,李昊青,等.基于Hayashi数量化理论的网络谣言分类应对策略分析[J].情报杂志,2016,35(1):110-115.

[4] 周裕琼.当代中国社会的网络谣言研究[M].北京:商务印书馆,2012.

[5] 王国华,汪娟,方付建.基于案例分析的网络谣言事件政府应对研究[J].情报杂志,2011(10):72-76.

[6] 张钦朋.网络谣言的传播机理及其治理路径:基于传播心理的分析[J].中共天津市委党校学报,2013(2):87-90,96.

[7] 孙丽.网络谣言的类型与特征[J].电子政务,2015(1):18-23.

[8] 林知己夫.数量化の方法[M].东京:东洋经济新报社,1972.

[9] Hayashi C.On the quantification of qualitative data from the mathematic- statistical point of view[R].Annals of the Institute of Stat Math,1950:12-57.

[10] Hayashi C.On the prediction of phenomena from qualitative data and the quantification of qualitative data from the mathem

atico statistical point of view[R].Annals of the Institute of Stat.Math,1952:69-98.

[11] 董文泉,周光亚,夏立显.数量化理论及其应用[M].长春:吉林人民出版社,1979.

[12] Li N,Gu W,Okada N,et al.The utility of Hayashis quantification theory for assessment of land surfaceindices in influence dust storm- a case study in Inner Mongolia China[J].Atmospheric Environment,2005,39(1):119-126.

[13] 李宁,张鹏,胡爱军,等.从风险认知到风险数量化分类[J].地球科学进展,2009,24(1):43-49.

[14] 张鹏,李宁,吴吉东,等.基于风险认知过程的综合风险分类方法研究[J].安全与环境学报,2010,10(5):221-226.

[15] 兰月新.突发事件网络谣言传播规律模型研究[J].图书情报工作,2012,56(14):57-61.

[16] 王小雨,李自,刘子菱.网络谣言的特点、传播原因及应对策略[J].法制博览旬刊,2013(6):44.

[17] 汪青云,童玲.突发事件中的网络谣言特征分析——基于2010-2014年间网络谣言的研究[J].新闻知识,2015,7(6):6-8.

[18] 张鹏.基于Hayashi数量化理论III的综合风险分类研究[D].北京:北京师范大学,2009.

作者简介:张鹏(1981-),男,中国人民武装警察部队学院消防指挥系讲师,博士,研究方向:网络舆情、网络谣言研究;兰月新 (1981-), 男,中国人民武装警察部队学院基础部讲师, 硕士研究生,研究方向:网络舆情研究;李昊青(1983-),男,中国人民武装警察部队学院训练部讲师,研究方向:网络舆情研究;瞿志凯(1987-),男,中国人民武装警察部队学院研究生部硕士研究生,研究方向:网络舆情研究。

猜你喜欢

矩阵谣言分类
中国使馆驳斥荒谬谣言
不信谣言 科学防“疫”
你被养生谣言忽悠过吗?
按需分类
多项式理论在矩阵求逆中的应用
教你一招:数的分类
谣言π=4!
说说分类那些事
矩阵
矩阵