大数据视域下网络舆情的治理困境及应对策略
2019-02-10
(西北政法大学 新闻传播学院,陕西 西安 710122)
道格·莱尼将大数据定义为“3V”,即“多样性”“大量”以及“高速处理”,维克托·迈尔-舍恩伯格将大数据的特征概括为“混杂性而非准确性”“相关性而非因果性”,后来“价值密度”“可变性”“真实性”等概念也逐渐深入人心。在互联网社会中,数据的重要性越来越显现。从网络政治传播的角度来说,大数据视域下的网络舆情成为当前研究的重要内容。
网络舆情是舆情的一种表现形式,所指的是网络中的社情民意,是民众通过网络进行参与,对社会公共事务或一段时期内的热点问题所呈现的观点和态度,也是网民现实的价值观念及政治态度在互联网上的反映。谭雪晗等分析了网络舆情传播的广泛性、非理性、偏差性,以及意见表达的趋于集体、高突发性与低记忆性等特点。[1]大数据视域下网络舆情研究的关注点集中于对数据进行搜集、储存、分析,抓取出有效信息,对所呈现出的舆情态势进行研究。在海量数据下,网络舆情产生了一系列的新特点,对这些新特点进行分析,发挥大数据治理的优势,正确应对存在的治理困境,实现网络舆情的善治,具有重要的意义。
一、大数据背景下网络舆情呈现出的新特点
在大数据背景下探讨网络舆情,不能仅仅将关注点集中于数据本身,应重点考察数据的来源、应用以及关系,对大数据特征的描述是数据技术及所涉及的社会关系的多维度的统一。大数据是一种重要的信息资源,除了繁多的类型、庞大的体量、高时效追求和低价值密度这一系列特性之外,也意味着能力的提高和利益的重构,是技术、思维、关系等多个维度的集合体。大数据利用先进的数据系统开展数据的采集、判断工作,从而最终对现实进行量化分析,达到预测效果,使网络舆情的产生和呈现方式发生转化,使之产生区别于传统舆情的新特点。
(一)舆情的相关性
大数据具有即时和海量的特点,当对数据进行收集和分析时,会把广泛的社会议题纳入其中,即大数据技术所指向的客体是一切可以被数据化的事物而非孤立的事件客体。数据的产生是实时的、动态的,当个人作为社会传播中的一个节点存在时,只要行动,就会产生数据,对数据的管理不是静止而孤立的。产生的数据会在不同的地域、领域之间交流,正如尼古拉·尼葛洛庞帝指出的:“数字化生存能使每个人变得更容易接近”[2]。当数据呈现时,会展现出动态事件的变化以及该事件与周围事件的联系,对这种联系不仅可以纵向分析事件的脉络,还可以横向分析事件之间的关系。社会事务具有繁杂性和多变性,以往传统的舆情事件集中指向于某一具体事件时,会忽略事件与事件之间的关系,导致舆情研究倾向于关注舆情主体间的互动,忽略这些主体与平台、节点等要素的互动。[3]大数据来源的客体之间和所指向的客体之间也各自存在着利益联系,利益的变动会改变舆情主体的属性和状态,导致基于此的舆情产生变动,包括舆情的指向、态势及衰退周期等一系列表征,所以舆情会呈现出更加相关的特性。
这种整体把控的模式让基于事件联系、利益联系之上的舆情联系开始展现在公众面前,网民对于社会事务的态度不是以事件为单位孤立存在的,而是有机的集合体。2018年3月,中国在北京召开了全国人民代表大会和中国人民政治协商会议。“两会”之后,通过大数据的信息汇总平台,可以看出不仅关于“两会”召开本身的政策改革话题出现了爆点,关于倡导主旋律、韩国访朝、美国涉台议案等一系列讨论也大幅上涨,并围绕“两会”话题共同变化。在大数据的分析平台上可以看出关于医疗、教育、农业、国防安全、民族荣誉等话题呈明显的相关性,公众在讨论不同的事件时表达出共同的诉求,反映了这些舆情背后公民诉求的相关性,整个舆情呈现出联合变动的特点。
(二)舆情的客观性
大数据时代,舆情具有产生层面和技术层面双重的客观性。在舆情的产生上,大数据是高时效性的,每个人的行为都可以实时产生数据,这种数据体现的是公民的生活轨迹和生活形态。网民在电子媒体终端上进行直接的意见表达也能够被数据软件抓取、汇总,数据的产生和表达鲜受其他因素的干扰。大数据依托电子技术而产生,具有科学性和技术理性,能够利用技术手段将现实世界进行量化,把公民所展现出的意见和态度进行数理层面上的还原,让治理者看到公众对某一事件所呈现出来的态度及相关的情绪分布。客观意味着相对的真实,大数据具有一定的质量标准,比如,政府及第三方提供的数据的准确性、中立性及实时性,算法和方法的科学性、合理性和可靠性。这实际上就意味着保障客观的能力。
在数据库中抓取的网络舆情信息会在整体上展现出客观性的表征,避免监测到的舆情态势因信息不足、提供偏好而出现偏差。比如,在济南疫苗事件中,网民在网络上积极发表观点,将自身的诉求显性化,这些讨论被大数据平台抓取呈现在终端后,系统分析出了舆情的焦点,代表民意最直接的表达。政府将网络行动和实际处置结合起来,针对公众所关注的焦点问题及时出手,批捕了涉案人员,处置了相关工作人员,使公众的诉求得到满足。
(三)舆情的可预测性
网络舆情会随事件的发展而即时产生变化,甚至会随事件的反转而发生急剧的转向。事件的不可控性会直接导致舆情的监测者对舆情态势的预估不明,但大数据对网络舆情的收集、分析和处理,会将一段时期内公民对某一社会热点事件及其相关事件的观点、意见集结起来,利用数据处理技术进行量化分析,掌握网民的意见走向。新媒体时代里的网络舆情传播会呈现出非线性的散播路径,产生交叉、重复、叠加式传播覆盖。[4]在此基础上,通过定量的分析方法对舆情的态势、趋向进行整合和处理,对事件可能发生的变化和舆情可能出现的转向进行预判,能够使舆情呈现出可预测性。这种可预测性的基点是对大方向的整体把控,是海量数据基础上的统筹,依赖于对全局的方向性掌握,所以舆情呈现出的可预测性是相关的甚至准确的。通过数据分析,监测者可以把事件发展中的关键节点呈现出来,通过把控关键节点来更加具有针对性地推测事件的可能性,预测舆情的下一步走向。
大数据分析还能够还原过去的自然灾害、恐怖袭击等事件的发生过程;可以对正在发生的灾后救援、游行示威、交通运转等进行实时监控;可以预测未来,为制定有效的预防政策奠定基础。比如,于欢案和成都女司机被打事件中,舆论出现了多次反转,通过大数据平台呈现出的搜索曲线图不难发现,两个事件的共同点在于均出现了几次峰值,且峰值之间相距不远。舆情会在某一阶段内持续更长时间。大数据技术可以基于此进行建模,挖掘出舆情反转的深层规律,提炼事件的关键节点,对舆情走向进行预测,这是传统手段所不能实现的。
二、大数据网络舆情治理的困境及原因
传统媒体时代的舆情环境是单一化的,治理者可以通过把控舆论话语权进行引导,但在大数据时代里,传统的舆情传播结构发生了颠覆。利用大数据进行治理是必要的,能够避免陷入集体选择的悖论,促进信息的流动和共享,打造整体治理的局面,提高治理的精度和效度,有利于公众进行自我约束,产生“圆形监狱”效应。[注]“圆形监狱”是英国哲学家杰里米·边沁在18世纪80年代构想的一个监狱模式,即圆形监狱由一个中央塔楼和周围的囚室组成,所有囚室前后分别有一扇窗户,其中一扇正对塔楼,另一扇则用来采光。按照圆形监狱的构想,中央塔楼的监视者可以随时监视囚犯的活动,囚犯却看不到中央的监视者,他们不知道自己何时被监视,心理上始终处在被监视的恐慌中,从而对自己进行“自我监禁”,不敢轻举妄动。(参见周建明、马璇:《个性化服务与圆形监狱:算法推荐的价值理念及伦理抗争》,《社会科学战线》2018年第10期,第168-173页)在大数据时代,数据每时每刻都在被记录,治理者像中央塔楼的监视者一样,可以收集到所有舆情的信息,网民不确定自己产生的数据何时会被记录,会以怎样的方式被记录以及会产生什么样的影响,有利于网民进行自我约束,实现一种“自发的监禁”,增强民众参与治理的积极性,提高网络舆情的治理效率。但新技术也会产生新问题,正确认识大数据治理网络舆情的困境及原因,成为正确治理网络舆情的重要前提。
(一)大数据治理存在风险性
利用大数据进行网络舆情治理,容易产生公民隐私泄露的风险。数据是即时产生的,只要处在网络社会中,公众的行为就会被记录,一举一动都会在数据意义上留下痕迹,但目前对于数据的监测和管理,却难以覆盖如此庞大的体量。网络舆情被数据化后,收录在数据库中的信息可以被政府、商业机构所使用,市场上的互联网经营者和达到一定规模的企业都拥有属于自己的数据库,以期实现对消费者的精准定位,但这些数据背后所包含的是公民的隐私,一旦出于商业目的被买卖或进行公开分析,就会侵害公民的合法权益。个人的银行卡信息、姓名、住址、社会关系、电话号码和身份证号码被数据公司搜集和利用,会引发推销、诈骗等行为,转移获取信息的初始目的,发生功能潜变。[5]如果全面实行监管,也存在监管成本过高、技术水平不足等制约因素。一旦出现数据滥用的情况,就会危害网民个人甚至整个国家的信息安全。而大数据治理目前尚缺乏相关法律的规制,侵害隐私的现象频频发生。
大数据自身的可靠性不足,过于依赖技术会使舆情治理出现偏差。国内处于大数据应用的初级阶段,技术能力和思维模式不能满足海量数据开发及处理的需求,在信息的抓取、分析、监控等方面仍存在需要改进的地方。目前国内使用的信息采集算法效率不高,信息存在浅层化、重复化、相关性低等特点,PageRank算法、C4.5算法和K-Means算法自身的发展也不够完善。大数据技术支持下的信息多为统计意义上的数据,可以反映现实的变动,但如果缺乏定性分析,过多依赖数据,就会导致决策偏差。大数据体量的巨大性会淹没信息的价值,带来信息的失真,使舆情治理出现错位。数据量的大幅增加意味着错误的增加和结构的混乱,这种混乱会带来关系的隐蔽以及信息内在规律的失真,造成结果的不准确。在海量的数据中寻找真正有价值的信息,认识信息背后存在的联系成为一件困难的事情,政府利用数据分析的结果制定治理策略时,会出现治理方向失焦的问题。
(二)大数据治理存在歧视性
大数据有可能增加偏见,加剧或复制人类的错误。研究数据即研究人类本身,人类文化存在偏见,大数据算法会把这种偏见进行归纳。[6]“GIGO定律(Garbage In, Garbage Out)”指出,在数据运算时,若输入垃圾数据,则输出也会是垃圾数据,《自然》杂志的社论中用“偏见进,则偏见出”来阐述这一观点。[7]大数据是社会的镜像,进行样本选取时,多数样本会掩盖少数样本的声音,优势群体会抢占弱势群体的地位,公民自身所产生的数据必须得到显性表达才能引起重视,从而为自身争取社会资源。在数据抓取的环节中,数据存在视觉盲点,具有不均衡性。主体对网络的使用情况、表达欲望不同,优势意见的背后是具有话语权的优势群体,在产生数据的“量”上具有绝对优势,在政府治理舆情的过程中,这些群体的利益更容易得到维护,诉求更容易被满足。被驱赶在大数据之外的群体,发声的路径和表达的机会将会大大减少,甚至受到严重的限制,这种数据表达难以代表真正的、确切的民意。中国互联网络信息中心发布的第42次《中国互联网络发展状况统计报告》显示,截至2018年6月30日,我国网民规模达到了8.02亿的体量,互联网普及率已占比57.7%。在数据采集的层面上,一些尚未使用互联网的群体的信息还不能纳入大数据系统的收集范围,导致这些群体的意见和诉求被忽略。
大数据将信息源具体到个人,会直接消除早期网络中存在的匿名感,导致一种具体的、当下的、个体的歧视,每个人的行为和过往被数据永远记录下来,使个人失去被遗忘的权利。遗忘是社会更新的机制,是个人尊严和自我人格发展的基础。全方位的数字化痕迹会抹杀个体当下的平等,限制人类的发展和学习,使个人的生活受到过多历史痕迹的侵扰,产生个人歧视,严重违背社会公正的逻辑。大数据运用数理统计的方式进行信息汇总,网络舆情的治理最终落脚在现实生活中,所以这种强弱群体之分和个人歧视会对社会政策产生影响。在政府治理能力稳定和治理资源均衡的情况下,这会导致政策倾斜化,拉大社会的差异性和不平等性。
(三)大数据治理存在价值缺失性
罗尔斯指出:公平正义是制度的首要价值。实现善治就是要保障社会公平正义的实现,这种公平正义必须要与社会现实结合,不能脱离人文关怀的土壤。平等和自由要得到发展,大数据治理的背后就要存在价值导向。在当下网络舆情的舆论场中,民族主义、自由主义、民粹主义和保守主义等意识形态纷繁并行,呈现出众声喧哗的状态,多种价值观的冲突会导致主流价值观弱化,大数据的技术理性所存在的缺失也会被凸显。大数据涉及的主要决策规则,排序、分类、关联和过滤与设计者自身的考虑难以分割,本质上也是算法设计者意识形态和价值取向的再现,这种潜在的价值决策也正是算法设计者的责任所在。数据与大数据都是人类看待世界、观察世界的一种方式,对数据的研究,从根本上来讲依然是对人的研究。大数据的价值缺失体现在技术与人文的分离,导致技术在认识和改造世界的方面朝着极端化方向发展,目前对大数据技术价值的讨论聚焦于商业价值,对人文价值的挖掘不够,导致大数据网络舆情治理缺乏价值引导,技术发生异化。[8]
算法依赖于技术,但舆情是有温度的,网络舆情本质上是网民的价值诉求和意识形态的反映,大数据平台直接把这些诉求进行量化,缺乏价值导向和人文关怀。数据信息爆炸式增长,选择的可能性大幅提高,人们会用“数据决断”代替自己的选择,丧失自我判断的能力。这种决策范式意味着人们丧失自己的意志、德性和情感,尤其是批判、反思的能力和自主意识,成为数据的奴隶。[9]价值缺失使人对大数据的使用片面追求利益最大化,产生极端功利主义,忽视潜在的负面作用和长远的利益。技术发展要促进人的全面发展和协调发展,不能否定人的价值,但大数据本身存在的工具理性使得治理伦理缺乏哲学层面上的价值取向。这种技术治理要进行角色转变,承担相应的社会责任,从而进行数据的善治。
三、大数据网络舆情治理的应对策略
在大数据的时代背景下治理网络舆情已然成为了一种趋势,基于网络舆情呈现出的新特点和由此产生的治理困境,治理主体应该转变传统的治理策略和治理方法,深入了解网络舆情发展存在的规律,运用大数据技术进行网络舆情的收集、分析和引导,在治理的思维、法律、伦理等方面着手,重新建构治理主体与网络舆情之间存在的关系,增强舆情治理的效率。
(一)坚持客观性治理
治理所指的是进行政治管理的过程,政府的治理是一种行为方式,其规范了政治权威,定义了对公共资源的管理。客观性治理是相较于传统的治理方法而提出的,传统对于舆情的治理强调政府的经验及习惯,经验分析的思维模式短时间内难以转化,具有思维惰性和传统依赖。在大数据时代里,网络热点事件、焦点事件频现,网民每时每刻都参与事件发生、扩散、演进的过程。虽然数据的体量变大,但数据的单位在缩小,政府获得的数据以及提供的数据更具有真实性和原生性。政府相关部门对舆情的分析和治理在技术的保障和制约下呈现出了更加高效、更加有据可依的特点。
舍恩伯格指出:“有了所有看似客观的数据,对我们的决策过程去情绪化和去特殊化,以运算法则取代审判员和评价者的主观评价,不再以追究责任的形式表明我们决策的严肃性,而是将其表述成更客观的风险和风险规避,听起来都是不错的主意。”[10]227要加强客观性治理,打破传统的经验模式和固化思路,转变网络舆情治理的方式。要强调标准化治理,为政府的大数据质量管理提供遵从依据,建立可以共享的政府大数据质量标准,提出大数据标准化的运行机制,建立政府大数据质量管理流程。[11]客观性治理既要对数据进行分析,依照数据做出科学决策,又要认识到数据局限性,避免出现过分的技术导向。
(二)坚持法治治理
在大数据时代的进程中,涉及到多方的法律关系,除人格权和财产权的问题外,还涉及到国内的网络空间主权。治理主体应秉持科学引导、协同合作及依法治理的原则,完善网络舆情依法治理体制和网络信息大数据管理机制。[12]2017年6月1日,《网络安全法》和最高人民法院、最高人民检察院发布的司法解释同日实施,首次对侵犯公民个人信息的行为和适用法律进行了更清晰的界定,同时也对网络运营者的网络安全管理义务作出规定。虽然国内互联网相关的法律法规囊括了不同层级,但仍未形成全面的法律体系。大数据是一门新兴技术,仍处在发展变化中,许多平台的违规行为依然难以判断,加之缺少证据支持,个人的维权依然任重而道远。我国与网络舆情相关的法律也多以政策性法规为主,对责任的追究和惩处鲜有涉及。
在法治治理中,数据开发者要承担保护个人隐私的责任,要保证网民的数据权利及其自身的信息安全,在治理时定位好相关主体的权利和义务之间的关系,始终把权利的保护放在中心,对数据的收集、分析、使用等方面做出明文规定。政府应根据数据对个人隐私的影响程度不同而进行分类管理,划分不需要隐私权保护的数据和可能会侵犯隐私权的数据之间的界限,并设立适当的标准以免除法律责任。在这种情况下,人们可以评估不同的数据带来的法律风险,保护个人隐私,依照标准直接使用数据,不必取得隐私权人的明确同意。[10]222现行法律需要对互联网平台的责任、义务等方面做出概念明晰的界定,对互联网平台与其他主体进行划分,明确“什么可以做,什么不能做”“承担多少责任”“怎么承担责任”,将大数据与网络舆情之间的监测关系纳入法律保护,明晰双方之间存在的关系,以免侵权事件发生时出现抗辩相关的问题。法律是进行社会治理最强有力的约束,对于新兴领域、操作空间大的领域及界限不明晰的领域要靠法律加以规制才不会陷入混乱。
(三)坚持多中心治理
多中心治理理论是一种表现权力和民主“多中心化”的理论,体现了当代社会治理中国家、市场和公民三者之间关系的重构和调整。其为更有效率的社会协作方式和公民共同所有的社会利益而努力,本质上是政府分权于民众的问题,强调弱化政府的权力。在社会公共事务的治理中,公民应全程参与,提高自觉管理、主动管理的能力,在市民社会与国家之间搭建互动的网格。多中心治理的特色在于互动性、流通性和多元性,需要协商、合作等因素加入,增加选择的多样性,从而追求决策的合理化。以多中心治理理论的观点,国家和市场在治理社会公共事务中并不具有唯一性,即便是对于特定事物,解决方案也并不唯一。“人们无需要求一个唯一的权力中心来控制其余部分。相反,在没有一个唯一的权力中心控制下,在潜在的否决位置范围内可以存在一种平衡,而在权力系统内也能保持一种法律秩序。只要将所有权力中心限制在一个可实施的宪法范围内操作,那么就能保持一个多中心的秩序。”[13]国家和市场之间必须实现各自的优势资源互补,达到这一前提,才能够实现更好的资源配置,进行公共治理。
大数据为政府和社会提供了治理的渠道,一方面改变了政府的治理模式,一方面为社会人士参与舆情治理提供了路径,这意味着政府、社会和公民之间存在着互相监督、制约的关系。数据库的主体具有天然的多中心性,国家、非官方社会组织和大型营利性企业都有自己的数据库,享有自己的数据资源,相应的就会产生不同主体的“技术赋权”。除监督之外,对大数据的多中心治理也意味着需要达到政府、社会和公民之间的权利平衡,划清、理顺不同主体之间存在的权责界限,明确不同主体所享有的权利与应承担的义务,形成政府监管、媒体负责、公民自律的良性生态局面。
(四)坚持伦理治理
伦理学的两个主要概念是“正当”和“善”,罗尔斯认为,正当是对善的优先,其期望达到一种“事实上的平等”,这种平等需要以一种不平等作为前提,即对先天不利者和有利者使用不同的尺度,打破形式上的平等。在大数据治理过程中,要解决“谁说了算”“谁受到了侵害”等基本问题,治理主体必须遵循技术治理的正当性,达到对社会公平正义的保障。在大数据的治理中,必须体现人的价值。价值缺失容易使技术出现异化,技术不是原罪,其中隐含着人的伦理观念,政府应该推动伦理对技术进行介入,避免出现“不作为”。网络舆情是人的观点及态度,治理主体要对大数据技术的发展所带来的伦理问题进行相应的规制,避免对网络舆情的治理陷入异化;要对大数据算法进行约束,把算法的运行及设计限定在伦理允许的范畴内;要纳入道德规范,使算法在帮助人们进行决策时发挥正面作用,实现积极的伦理价值。
解决这些问题,核心在于坚持“以人为本”的理念,以促进人的生活水平和全面发展为目标,不能把人限定在数据之中,忽视人的意志和个体差异性,成为技术的奴隶。要尊重人的自由,提倡人本主义数据伦理,提倡人的权利,维护人的尊严,尊重人的自由,主张有规范的数据共享,反对以数据权力为本。[14]针对数据使用所存在的风险,需要让数据使用者有红线意识和底线思维,让数据抓取者承担责任。要针对数据与算法的可理解性、透明性以及可追责等问题进行算法伦理和数据伦理的研究,重点关注数据遗忘权、解释权,算法的透明性、公正性和算法的伦理审计问题。[15]要平等对待社会成员,尊重每个人的价值形态,避免歧视的产生,避免治理中社会资源的倾斜。要尊重数据产生者的权利,尊重“被遗忘权”,在数据的删除、储存、知情等层面上尊重公民的合法权利和意愿,保障社会的公平正义。
大数据时代对网络舆情造成了一系列的改变,分析治理困境的同时,要积极寻找应对策略,发挥大数据技术本身的优势。治理主体要利用技术背后的价值,加强社会全方位协调,积极应对,保障在舆情治理中享有主动权,助力社会秩序良性发展。