网络民意的表达路径与收集机制研究
2019-01-07何志武陈呈
何志武 陈呈
摘 要:网络民意影响政策议程和政策内容已成社会共识,而如何收集网络民意、让公共政策更充分地体现最广泛的民意则是亟待研究的问题。网络民意表达具有集聚和分散的双重特点:在政府动议的政策议程模式中,网络民意表达呈现出定向集聚的态势,短时间内集中于特定的网络平台之上;在公众动议的政策议程模式中,网络民意表达呈现出分散性和碎片化的特点,无固定的平台和时间点。与之相对应,网络民意收集可以从两个维度展开:一方面,政府可主动设置网络平台,吸引网民通过制度性渠道集中反馈,可以方便、快捷、有针对性地收集网络民意;另一方面,借助大数据技术进行全网式的广泛搜索,可以在全样本数据基础上展现民意全像。
关键词:政策议程;网络民意表达;网络民意收集
中图分类号:G206.3 文献标识码:A
文章编号:1003-0751(2019)11-0165-08
聽民意、汇民智已成为各级政府制定公共政策的重要依据,民意表达的路径和方式就成为一个重要的研究课题。随着媒介技术的发展,民意表达的路径得到进一步拓展,互联网成为新时代民意表达的主要渠道和平台,民意表达的方式也随之发生了根本变化。这种借助互联网表达的民意,被称为网络民意。网络民意作为一个集合概念,反映的是公众对于某一事件或社会问题的意见和态度,它不是单个网民的意见,也不是个体意见的简单相加,而是不同意见“在人数、强度和稳定性的比率”①。
决策者要利用和吸纳网络民意,其前置环节是对网络民意进行全面科学的分析,而分析的前提和基础是对网络民意进行收集。只有收集到足够充分和翔实的民意信息,才能对其进行筛选和分析。与传统的民意表达方式不同,网络民意表达呈现出多样化和易变性,时而众声喧哗、沸沸扬扬,时而星飞云散、匿影藏形。而网络平台又是无处不在、没有边界的,网民的任何意见可能出现在任何一个或多个知名或不知名的网络空间中。由此,就出现了分散且多变的网络民意能否完全收集、如何科学收集的问题。本文拟从政策议程设置的视角,结合网络民意表达的特点,探讨网络民意收集的机制。
一、网络民意表达的双重特征:集中反馈与分散言说
美国知名政策科学家约翰·W.金登认为,政策议程“就是对政府官员以及与其密切相关的政府外人员在任何给定时间认真关注的问题进行的编目”②。金登将政策议程视为摆在政府决策者面前的一个问题清单。政策议程实际上就是决策者认为某些至关重要的问题到了非解决不可的程度,有了制定相关政策的计划。政策议程的形成过程就是社会问题转化为政策问题的过程。“政策议程创建就是在多元利益相关者互动的基础上,公共权威(特别是执政党与政府)通过一定的选择与过滤机制确定社会问题的轻重缓急,并将其提上政府议事日程、纳入决策领域的过程。”③
1972年,麦库姆斯和肖提出了议程设置理论,认为大众传播具有一种形成社会“议事日程”的功能,传播媒介以赋予各种议题不同程度“显著性”的方式,影响着公众瞩目的焦点和对社会环境的认知。④议程设置理论很快发展成为大众传播效果研究的重要理论之一。迪林和罗杰斯在传统议程设置理论基础上做了扩展,将“媒体议程”(The Media Agenda)、“公众议程”(The Public Agenda)、“政策议程”(The Policy Agenda)纳入“议程设置过程”这一统一的框架中进行研究。⑤媒体议程是指大众媒体频繁报道和讨论的事项,公众议程则是社会公众广泛关注的议题。
香港中文大学教授王绍光依据议程提出者的身份和民众参与程度的不同,区分出了六种政策议程设置模式:关门模式、动员模式、内参模式、借力模式、上书模式、外压模式。关门模式、内参模式和上书模式中都没有公众参与,议程提出者分别是决策者、政府智囊团和具有一定社会地位及话语权的个人或小团体;在借力模式中,政府智囊团希望与公众联手,借助舆论的压力来扫除决策者接受自己建议的障碍;在动员模式中,议程由决策者提出,但决策者会设法争取公众对该议程的支持,即先有政策议程,后有公众议程;在外压模式中,议程发展的动力来自体制之外,更注重诉诸舆论、争取民意支持,从而对决策者形成强大的压力,迫使其改变已有议程,接受新的议程。⑥上述六种模式的划分较为全面地概括了我国政策议程形成的过程及其类型。
随着社会政治生活的发展,政策议程设置越来越强调公众参与,传统的政策议程设置模式也发生了变化,网络民意成为影响政策议程设置的重要力量。托马斯·戴伊认为,在美国的政治生活中,存在两种政策议程设置模式,即自上而下的精英驱动型和自下而上的大众驱动型。⑦新媒体时代,我国政治生活中占主导地位的政策议程设置模式也可以概括为两种:由政府动议的自上而下的“动员模式”和由社会公众动议的自下而上的“外压模式”。当然,网络民意的出现也赋予了动员模式和外压模式新的内涵和表现形式。在上述两种模式中,网络民意表达的路径和方式也呈现出较大差异。
(一)基于动员模式的网络民意表达:自主式的集中反馈
动员模式通常是由政府主动发起议程。在确定一项政策议程后,政府会借助媒体进行宣传报道,试图通过媒体议程影响公众议程,同时决策者也会通过各种体制性渠道和方式来传达政令,动员民众参与其中。政府之所以想吸引公众参与政策议程,是出于政策合法化的需要。“政策合法化不仅要求政策制定主体、政策出台程序以及公共政策内容合乎法律规定,同时也要求将公共政策实施的过程内化为政策主客体的自觉行动,即获取社会的普遍认同。”⑧政府决策获得社会认同的关键是要将公众参与纳入政策制定过程,从而将决策过程演绎为“自主式的公共意志表达活动”,让社会公众在多元利益群体的互动协商中达成共识。
图1 基于动员模式的网络民意表达
这种自主式的公共意志表达活动实质上是社会公众针对公共政策进行的有目的性的主动反馈。民意表达的动力在于对政策议程的价值判断,包括对政策方案的意见和建议、政策制定程序规范与否的评价。政策议程的发布意味着政府将着手解决某一公共问题,无论是政府主动提出政策动议还是回应公众诉求而制定政策,公众都会表达对政策议程的期待、意见和建议。由于已有政策议程作为先导,公众的意见主要集中于政策内容是否公平和科学、政策程序是否规范和公正。虽然其中不乏站在自身立场考量政策内容与个人和群体利益的一致性,但也必然以公共利益的面目实现意见的表达。网络民意的表达意在影响政策内容。若是政策议程尚处于政府提出动议征集民意阶段,民意表达的目标在于意见和建议能影响到即将出台的政策,最好能体现在政策方案之中;若是政策方案已定,人们则更关注政策是否满足了自身的利益期待,民意表达的目标在于意见和建议能影响到政策的修订和完善。
在动员模式中,网络民意表達主要是通过特定的制度性渠道进行集中反馈,呈现出定向聚集化的趋势。一方面,政府主动征集民意往往会选择一两个公开的政府网络平台作为定向的民意收集渠道,这些网络平台包括政府网站、网络问政平台、政务微博、政务微信等体制性政民互动渠道。有些传统主流媒体网站的评论板块和网络论坛也会设置相关主题的专栏,吸引多元意见的表达。另一方面,政府主动征集民意的时段较为集中,往往会设定一个时限,网民的建言献策都将集中于官方公布的时限内。这种集中时间和集中平台的动员和征集,有利于民意的集中迸发与迅速汇集。
(二)基于外压模式的网络民意表达:自发式的自由释放
外压模式是由体制外力量主动发起的,是一种自下而上的议程设置模式,公众参与成为推动政策议程形成的重要力量,也就是先有公众议程,后有政策议程。在这一过程中,公众议程的形成通常由两个因素决定:一是由“微议程”持续发酵而形成公众议程;二是媒体议程影响公众议程。不论公众议程是如何形成的,它一旦形成,其指向都是政策议程,目标在于政府制定公共政策解决相关问题。进入新媒体时代,尽管许多政策议题仍由政府主导,但网民主动讨论公共问题,通过网络民意施压“倒逼”政府将其列入政策议程的可能大大增加。
图2 基于外压模式的网络民意表达
公众议程首先会受到网络“微议程”的影响。“微议程”可以理解为公众议程的萌芽状态,是指“特定个体和社群通过新媒介技术平台传播、扩散形成的对特定事件、人物等较为一致的意见倾向,这种个体和社群互动过程中形成的倾向体现出其内在的特征,它是新媒介嵌入到人们日常生活后产生的融合了虚拟和真实个体及社群混合意见倾向的议程”⑨。微议程往往是特定个体和群体的立场、态度和利益的表达,其形成也会受到个体情感和社会群体心理的影响。网民个体通过上传信息就可能直接激发微议程,或者是信息在特定网络社群里经过加工整合后再形成微议程。微议程还只是小范围内网民关注的事件和焦点,尚没有引起大范围的网络围观,而要想使“一个国家里有大批的民众沿着某些共同的路线思考”,还必须满足一个重要前提,即“该事件能迅速有效、恰到好处地激起作为普通民众的网民的情感共鸣和共同体验,挑拨他们脆弱敏感的神经和心智,并将隐藏于他们内心深处的社会记忆和集体意识唤醒和提取起来”⑩。如此,小范围的微议程很快就会以燎原之势发展为广受关注的公众议程,社会公众的共同体验被激活,社会情绪被调动。
此外,媒体议程对公众也具有“渗透性”的影响力。大众媒体深谙公众的兴趣议题,常常能够把那些重要的、迫切需要解决的社会问题,以能够引起公众兴趣的方式报道出来,进而引导公众关注和讨论这些重要的社会问题。这就是罗杰·柯比和查尔斯·艾德所说的“唤醒”,“拜传媒之赐,将(问题)传播到更广大的公众之中,使冲突的范围变得更广……‘唤醒本身是自足的,容易滚成雪球。当传媒对一个情况感兴趣时,它们通常盯住不放,使越来越多的重视和关注产生”(11)。媒体发现和报道社会问题,引起公众讨论,公众的意见表达又成为媒体报道的内容。公众对媒体报道的议题处于持续不断的互动过程,形成“你中有我,我中有你”的互嵌格局,媒体议程与公众议程的边界开始模糊。尤其是网络新媒体广泛使用之后,公众参与公共话题讨论的平台大为拓宽,网络民意表达的充分性和丰富性为媒体议程的设置和推进、媒体议程与公众议程的互动提供了强有力的支撑。
一般来说,外压模式中的网络民意表达往往呈现出自发性和分散性的特征。网民关注的议题不仅包括大众传媒经常报道的重大社会事务、国家事务,还包括琐碎的民生话题、个体公民的具体遭遇等。网络空间的无限性与延伸性增强了网络议题的选择性,“公众更倾向于自发参与以生活经验为表达基础的议程”(12)。网民通常会以日常生活中的个人经历和切身体验为基础,就一些关乎民生的社会问题发表看法和意见,比如医疗改革、收入分配、食品药品安全、教育公平、环保问题、司法公正、就业问题等。除了博客和论坛等传统互联网平台,大量的网络民意分散在微博、微信以及各种短视频社交媒体平台上。由于身处其中,对一些社会问题的感受更深,网民的意见和建议也就更有针对性。这些包罗万象、散落于互联网各个角落的网络言论,其背后都可能涉及某项公共政策的重要命题。
二、网络民意收集的双重维度:定向收集与全网搜集
传统的民意收集方式可以称之为“打捞民意”,官方主导了话语权,政府官员、人大代表、政协委员、专家学者等主持或参加的民意调研和座谈会成为政府收集民意的主要渠道。对于公众而言,这种民意收集方式既不便捷,又不能全面、真实地反映民意。公众的观点多数只能停留在“茶馆式的窃窃私语”和“街头巷尾的议论”之中。
在新媒体时代,网络技术改变了民意主体的地位,民意主体成了民意表达的主体。在动员模式和外压模式中,网络民意表达分别呈现出集聚和分散的双重特征,网络民意的内容指向、表达渠道以及呈现密度都有所不同。与之相应,网络民意的收集可以从两个维度展开:一是集中式的定点定向收集,二是分散式的全网广泛搜集。
(一)定向收集:设置平台“广开言路”
定向收集网络民意适合由政府主动发起、动员公众积极参与的政策议程模式。在这一过程中,网络民意表达通常较为集中,有明确的目标和议题,政府可以主动设置网络平台,通过制度化的信息传输渠道来收集网民对公共政策的意见和建议。定向收集的方式具有针对性强、方便快捷的优点,政府首先要提供公众参与的网络平台和渠道,并且做好平台管理和运营,才能广开言路,发动网民建言献策,真正将网络民意“请进门来”。政府主动设置的网络平台大致可以分为两个层级:一是全国性的网络民意收集平台,主要负责发起短期的大范围专项网络民意征集和调查;二是地方性的常设网络参与平台,动员公众日常参与,为地方治理建言献策。
1.全国性的网络民意收集平台:不定期发起专项民意征集
当一项公共政策或政治活动涉及社会上大多数人的利益时,决策者就需要了解大部分民众的意见和态度,并将其合理吸纳进决策过程和政策内容。大范围的专项网络民意征集活动通常是由国家層面组织发起的,比如,每年全国人民代表大会和中国人民政治协商会议召开前后都会面向社会公开征集议题和建言。这类民意收集平台往往只在短期内向全社会开放,主要是通过互联网在线收集民意,具有方便、快捷、针对性强、效率高的特点,但对组织和资源的依赖性较高,无法长时间开展。
2018年6月19日,《中华人民共和国个人所得税法》(下文简称“个人所得税法”)修正案草案提交全国人大常委会会议审议。草案一审稿拟将个人所得税起征点由每月3500元提至每月5000元,首次增加子女教育等专项附加扣除。6月22日的全国人大常委会会议上,委员们进行了激烈讨论,未对草案进行表决,建议汇总意见修改后再审。6月29日,个人所得税修正案草案在中国人大网上公布,面向社会征求意见,为期一个月。中国人大网数据显示,截至7月28日,收到的征求意见超过13万条。(13)网民意见集中在个人所得税基本减除费用标准和首次增加的专项扣除标准方面,主要意见包括起征点偏低、应考虑赡养老人和照顾婴幼儿、专项扣除操作难度大等。综合网民及各方意见,8月27日草案二审稿再次提请全国人大常委会会议审议,并顺利通过。二审稿新增了多项内容,包括将赡养老人支出纳入专项附加扣除,稿酬、报酬、特许权等三类收入拟享受双重减征优惠,专项附加扣除实施标准具体化等。二审稿中个人所得税起征点仍然维持了5000元的全国标准,但考虑到网民的意见建议,还是新增了不少内容。政府开门立法不仅是收集民意、发挥民智的良策,也是尊重民意的体现。
一年一度的全国“两会”也是政府集中收集民意的好时机。从2018年12月20日开始,中国政府网联合人民网、新华网等20家网络媒体平台,共同发起了2019“我向总理说句话”网民建言征集活动。截止到2019年3月4日,共收到了33万多条建言,其中网民关注最多的五类话题包括经济政策、营商环境、办事服务、教育和社会保障等。中国政府网梳理筛选并精选出了700多条最有代表性的建言逐条进行分析、整理。2019年《政府工作报告》起草组负责人指出:有些网民反映的问题其实已经有了相关政策,关键是抓好落实,有的是地方的具体政策。扣除这些,网民建议90%以上都在《政府工作报告》中得到了体现,真正将这些问题纳入政策议程范围内。(14)
由政府主动发起的大范围网络民意征集活动往往集中在特定的时段针对特定议题面向全社会进行,需要政府做好充分的准备工作:首先,要做好前期的宣传造势,借助新闻媒体等各类传播平台告知公众即将进行的民意征集活动,并做好政策讲解工作,让公众对相关议题有充分的了解和认知。其次,要联合有影响力的多家网络平台,做好网络民意收集工作,力求网民反馈渠道的多元化、便捷化和快速化。最后,面对短时间内网络民意迸发之势,政府决策部门要做好收集、分类和整理工作,梳理出最具代表性和建设性的网民意见,以供后续决策参考。
2.地方性的网络民意收集平台:动员公众日常参与
地方性的网络民意收集平台可以作为官民沟通的常设机制,通过动员公众的日常政治参与来实现多元主体的共同治理。在民主社会,日常生活与政治生活是密切联系的。日常生活不仅是指百姓的衣食住行,它还包括与政权合法性相关联的存在,政府管理者必须重视民众的日常生活感受,并将其作为衡量执政能力的重要标准。政治沟通的日常化应当成为政治生活的常态。“政治沟通日常化指政府在日常形态下与公众进行相对微观、直接的交流的一种状态或趋势,或指政治信息传播重视日常生活表达与公共领域对话的某种动态交往过程。”(15)地方政府与公众进行日常政治沟通的网络平台主要包括政府网站、网络问政平台、政务新媒体等,这些网络平台也是政府日常收集网络民意的重要渠道。
政府网站是各级政府机关履行职能、面向社会提供服务的官方网站,也是政府机关实现政务信息公开、与公众互动交流的重要渠道。政府网站的首要功能是公开政务信息,确保公众可以及时获取最新最权威的政策信息。其次,政府网站要开设多样化的民意征集栏目和网民反馈通道,如开设网上民意调查、公开领导电子信箱、公示项目决策、开通网上投诉平台等,确保公众可以随时向政府表意建言。
网络问政平台一般是由政府行政机构直接主持创建或联合管理的网络公共论坛。与一般网络论坛不同,它是政府通过行政手段推动论坛的日常运营和维护,网络问政平台的栏目和主题基本都是关涉地方民生和地区发展的相关议题。与政府网站相比,论坛形式更加活泼和随意,网民互动讨论的积极性更高,参与的人数更多、讨论的议题更广泛,也更加关注地区性和地方性的议题。网络论坛的栏目形式和议题内容应立足于日常生活世界,贴近百姓生活实践,让公众有感而发。日常生活中的真情流露往往更能反映真实的民意态度和倾向,政府要善于通过网络公共论坛来收集真实民情民意。
政务微博与政务微信是政务新媒体的两大公共服务手段,也是政府借助新媒体收集民意的主要渠道和方式。政务新媒体具有大众传播的特征和优势,在网络民意收集方面,可以充分发挥媒体的议程设置功能,积极引导网络议题讨论,将公众的注意力转移到社会问题和公共议题上来。政务新媒体是政府职能机构进行社会治理的重要手段,在内容发布上要特别注意与其所属部门的职能定位相匹配。与政府网站和网络问政平台相比,政务新媒体的互动性和即时性特征更突出,政府应利用好这一优势,及时更新信息,增强与网民互动,增加粉丝黏性。
地方性的网络民意收集是建立在官方主导的常设网络参与平台基础上的。这一收集方式能否发挥作用,关键在于能否确保平台的实际运作落到实处。首先,回应公众诉求要及时。这样才能聚集人气,吸引网民的积极参与。其次,确保回应有质量。对于公众反映的情况要给出具体的处理意见,对于不能及时处理的情况也需要有详细的解释和说明,这样才能得到公众的信任,平台才会有影响力。
(二)全网搜集:借力大数据进行民意采集和深度挖掘
自下而上的外压模式中相对分散的网络民意需要借助大数据技术进行广泛的全网搜集。这里之所以说“搜集”而不是“收集”,是因为“搜集”更强调到处寻找,将分散的、隐匿的言论意见聚集起来,比“收集”要更加复杂和费时费力。自发式的网络民意表达通常没有固定的平台和渠道,网民往往是随时随感而发,以碎片化的形式散落在互联网的各个角落。在外压模式中,政策议程形成的主要推动力是由网络民意聚合而成的公众议程,什么样的网络民意能够聚合形成公众议程是决策者需要考虑的。散布于网络的民意碎片太过庞杂,很多有价值的民意被淹没在众多无效信息中,通过人工收集显然是不可能的,而大数据技术可以很好地解决这一难题。大数据技术具备信息整合和数据挖掘的功能,可以将碎片化的民意信息整合成系统性、动态化和可视化的整体民意图像,同时还可以对数据进行深度挖掘和提炼,揭示隐含的网络民意深层结构,预测民意发展的趋势,为科学决策提供充分的民意基础。
1.大数据环境下的网络民意认知转向
大数据环境下,网络民意表达的形式更加多样化,除了文本形式,还有图片、音频、视频、网络表情等多种非结构化的数据形态。传统的网络民意调查方式往往局限于对结构化数据的收集和分析,很少采集和利用数量更大更具价值性的非结构化数据,不足以展现整体性的网络民意形态,可能会造成决策者对民意评估出现偏差。“大数据时代背景下民意形态悄然发生了三重变迁:民意结构由原子化转化合成化;民意测量由样本民意转向总体民意;民意分析由小数据分析转向大数据分析与可视化。”(16)大数据改变了人们对待数据的传统思维模式,数据统计和分析不再依赖小样本而强调全体样本,放弃追求数据的精准性和事物之间的因果关系,转而关注数据之间的相关关系和最终结果。
大数据技术虽然兴起不久,却很快进入了应用市场,形成了数据生产、数据采集和数据分析等多个环节的产业链。中国网络舆情市场在短短数年间形成了政府、媒体、教育科研、商业应用并行而立的行业格局。(17)专业的网络舆情监测机构相继成立,如人民舆情监测室、新华网网络舆情监测分析中心、清博大数据舆情系统等。此外,还有一些市场化的网络舆情监测平台,如新浪舆情通、红麦舆情监测等。政府部门虽然握有大量的公共数据信息,但是缺少对网民日常上网活动和网络行为数据的实时记录储存。运用大数据技术搜集网络民意的前提就是拥有全面真实的数据源,政府可以和市场上各类舆情服务机构进行合作,从而实现对多种信息源的实时监测和信息搜集,及时了解网络民意动态。
2.显性网络民意搜集:基于主题内容的数据采集与挖掘
有学者曾将网络舆情划分为“显性舆情”和“隐性舆情”。前者是指网民在网络上发表的言论信息,后者是指能够从侧面客观反映网民关注点和舆情主体之间关系的舆情数据。(18)根据网络民意的呈现形式,也可以分为显性网络民意和隐性网络民意。以文字、图片、音频、视频、表情符号等形象直观的方式呈现网民意见态度的信息,可称为显性网络民意。网民在上网活动中,除了发表言论,还会留下阅读、搜索、分享等其他痕迹,这些痕迹虽然没有以文字、图片等形式显现出来,却是真实存在并能够反映网民的兴趣和行为趋向,可称为隐性网络民意。对于显性网络民意的搜集,可以基于主题内容进行数据采集与挖掘。
基于主题内容的数据挖掘方法主要包括信息采集、信息预处理和语义分析三个层次。目前信息采集主要是利用网络爬虫软件对门户网站、论坛、社交媒体等网络平台上的言论信息进行抓取。网络爬虫又称网页蜘蛛,是一种按照一定规则自动抓取网络信息的程序或者脚本,它可以遍历互联网以抓取用户需要的数据信息,进而实现数据分析功能。技术人员可以根据主题内容自定义搜索“关键词”,然后依需要设定搜索范围,可以进行全网爬梳,也可以定点爬梳言论较为集中的网络社区,比如天涯、知乎、猫扑等知名网络论坛。对于微博微信等社交媒体平台的信息搜集,可以与相关数据运营商进行合作,共享数据信息。比如,以新浪微博数据为支撑的新浪舆情通,借助微博爬虫程序,抓取用户发布的微博内容、评论信息、转发情况及传播路径等数据,已经为3000多家政府机构提供网络舆情服务。此外,对于新闻类和博客类网站等更具结构性的数据源,也可以利用RSS抓取数据信息。(19)RSS的全称是简易内容聚合,是一种消息来源格式规范,用以聚合订阅网站的更新数据,包括标题和部分内容。通过对某一主题内容相关的多个RSS种子进行聚合,可以在第一时间、全方位地了解相关主题的发展动态。
利用大数据抓取大量的原始数据信息后,需要对数据进行清洗和处理。首先是对数据进行过滤和消重,去除无效和重复信息,然后再对数据进行分类和聚类处理。聚类是按照相似性将集中的数据划分为多个子集,每个子集之间互斥不相交,子集內部高度相似。比如可以根据网民就某公共话题的观点进行聚类,把相同或相似的网民言论汇集起来,这样就可以呈现出整体网络民意的观点分布情况。分类是按照给定的分类体系,根据文本内容特征划分到指定的类别中去,比如将网络民意划分为教育、医疗、养老、就业等若干类别,然后对各类别的信息再进行数据挖掘。
利用大数据技术获取网络民意的关键是数据挖掘,即从海量的、零碎的网络民意数据中拼凑出系统性网络民意图像,主要技术手段包括话题识别、意见挖掘和情感分析。话题识别和意见挖掘是对目标文本进行主题和观点提取,分析网民言论的语义指向和观点分布。目前常用的话题识别技术主要有两种:基于LDA(Latent Dirichlet Allocation)算法的主题词挖掘和基于K-means算法的主题词聚类技术。(20)情感分析是基于语义分析技术展开的,常用的方法也有两种:一种是建构情感倾向词典,通过提取关键词与词典进行对比,得出关键词的情感倾向;另一种是建立语义模式库,语义模式库一般包含若干个丰富完备的情感词库,不仅是已有的一些基础情感词典,还包括研究者根据不同主题设计的情感词库,比如建构表情符词典和网络用语情感词典,来增强微博情感分类的效果。(21)
大数据思维中,每个数据都是一个节点,可以向外延伸,与其他数据节点发生关联,最终形成一个整体数据链。网民发表的每一个言论和观点也都是一个数据节点,大数据技术可以抓取和储存这些海量数据,并对其进行结构化处理和重新组合,从多重维度描摹网络民意图景。大数据既可以精准定位个体网民言论及言论主体间的社会关系图像,也可以分析挖掘网民整体的意见分布、情感倾向以及群体之间的界限和勾连,点线面结合、立体呈现网络民意全景。这里有两点需要注意:一是关于主题内容的描述与定义要准确。它是制订具体算法策略的基础,主题描述和关键词定义要能够准确反映搜索目标要求。二是要加强语义分析技术的改进和运用。对于一些复杂的语言表达和不断更新的网络流行语,现有语义分析技术的处理能力较弱,需要进一步优化升级语义分技术以及语义资源建设。
3.隐性网络民意搜集:基于相关关系的数据采集与挖掘
网民日常上网活动中留下的各种痕迹都被网站日志完整地记录下来。网站日志又称服务器日志,是记录web服务器接受处理请求以及运行时各种原始数据的文件,通过网站日志可以查看用户访问某网站的IP地址、访问时间、浏览时长等信息。这些隐藏的网络痕迹可以反映网民个体和群体的行为习惯、兴趣喜好以及潜在的心理和行为状态。网站日志和网络民意是具有相关关系的关联物,可以借助网站日志技术来搜集网民行为数据并分析网络民意的趋势和走向。比如,可以通过网民的阅读内容和分享链接来评估其对某项议题的观点和态度倾向。
大数据预测的关键就是相关性分析。相关关系的核心是量化两个数据值之间的数理关系。相关关系强是指当一个数据值增加时,另一个数据值很有可能也会随之增加。反之,相关关系弱就意味着当一个数据值增加时,另一个数据值几乎不会发生变化。(22)搜索引擎后台的网站日志,通过统计某一时段内网民搜索关键词和搜索频率的变化,可以发现网民关注点和话题热度的变化。目前主流的日志分析系统是ELK,由三个开源软件组建构成的一个实时日志分析平台,包括Elasticsearch(日志检索)、Logstash(日志收集、过滤、格式化)和Kibana(统计查询、可视化展示)。(23)网站日志分析一般是先利用网站日志获取网民的访问资源信息,根据用户行为特征指标对数据进行分析,发现网民行为规律。然后,在此基础上进行深层次的推断性分析,也就是相关性分析,比如数据的探索性分析、二维相关、秩相关、偏相关、因子分析等。(24)目前,已经有一些互联网公司开始研发网站日志挖掘技术,比如谷歌公司开发的“谷歌趋势”,能统计某个关键词在一定时段内某个地区被搜索的次数,将其与谷歌上的搜索总量和当地的搜索总量相比较,就可以得出该关键词的“相对搜索指数”,从而预测未来发展的趋势。
大数据的重要功能之一是挖掘数据中隐含的关联性,以相关性高低来预测事物的发展变化。网站日志分析技术可以捕捉某段网络内产生的所有信息,然后对数据信息进行相关性分析处理,预测某一事件或话题未来发展趋势。当前网络民意搜集工作主要还停留在对显性网民言论的量化描述,缺乏对网民其他网络行为信息的搜集和分析,而这些隐性的数据背后蕴含着巨大的信息价值。我们在利用大数据搜集网络民意时,要加强对网民的访问、阅读、分享等行为数据的搜集和深度挖掘,从而描画出网民群体的社会心理地图,预测网络民意发展趋势。
三、结语
网络民意收集可以从“定向收集”和“全网搜集”两个维度展开,同时需要注意不同政策议程模式下网络民意表达的特点,合理应用和调整网络民意的收集方法和策略。对于网络参与平台,政府必须提供制度性保障,确保这些收集网络民意的途径成为制度化的长效机制。对于大数据技术的应用,要重点发挥其强大的信息搜索和整合功能,实现网络民意的全网搜集,同时要加强隐性网络民意的搜集,预测网络民意发展趋势。
利用大数据技术搜集网络民意时,要注意扩大信息源,包括物联网、传感设备、购物平台等非传统数据源的信息采集,尽可能搜集异质性、异构性以及异源性的数据。大数据在抓取包含复杂情感和价值取向的意见时,仍有很大的困难,还需依赖人工处理。同时,也要看到大数据技术的局限,即数据结果与现实世界之间存在差距。数据只能向我们呈现网络民意的结果,而无法描绘网络民意形成的缘由。在后续对网络民意进行分析的过程中,研究者“必须更进一步强化量化数据与生活世界背景的结合,关注公众如何从情境互动中习得、修正行动模式,进而深入探讨舆情形成的结构动因”(25)。由此,衍生出一些值得我们思考的问题:在公共决策过程中,如何利用收集到的这些网络民意?也就是如何分析吸纳网络民意,比如网民的建议是否具有可行性?判断的标准是什么?公共决策应当在多大程度上吸纳网民的意见……这些都将是需要进一步研究的问题。
注释
①何志武:《网络民意与公共政策的“民间智库”》,《现代傳播》2012年第11期。
②[美]约翰·W.金登:《议程、备选方案与公共政策》(第二版·中文修订版),丁煌等译,中国人民大学出版社,2017年,第3页。
③刘伟、黄健荣:《当代中国政策议程创建模式嬗变分析》,《公共管理学报》2008年第3期。
④Maxwell E. McCombs, Donald L. Shaw. The Agenda-Setting Function of Mass Media. Public Opinion Quarterly, 1972, Vol.36, No.2, pp.176-187.
⑤[美]詹姆斯·迪林(James Dearing)、[美]埃弗雷特·罗杰斯(Everett Rogers):《传播概念·Agenda-Setting》,倪建平译,复旦大学出版社,2009年,第6—7页。
⑥王紹光:《中国公共政策议程设置的模式》,《中国社会科学》2006年第5期。
⑦[美]托马斯·戴伊:《理解公共政策》(第十二版),谢明译,中国人民大学出版社,2011年,第29—30页。
⑧张则行、陶庆:《论法治政府的价值内核渗透与实践机制重构——以公共政策过程为观察领域》,《广东行政学院学报》2016年第1期。
⑨高宪春:《微议程、媒体议程与公众议程——论新媒介环境下议程设置理论研究重点的转向》,《南京社会科学》2013年第1期。
⑩费久浩:《政策议程设置中网民触发模式的基本要素分析》,《四川师范大学学报》(社会科学版)2015年第5期。
(11)[美]拉雷·N·格斯顿:《公共政策的制定——程序和原理》,朱子文译,重庆出版社,2001年,第60页。
(12)万方:《自媒体议程设置的行动特征与政府角色定位——基于整体性视角的分析》,《中国行政管理》2017年第10期。
(13)《个税草案关注度高 收到意见超13万条》,人民网,http://finance.people.com.cn/n1/2018/0730/c1004-30176678.html,2018年7月30日。
(14)《黄守宏:梳理后的网民建议90%以上在〈政府工作报告〉中都得到了体现》,中国政府网,http://www.gov.cn/xinwen/2019-03/06/content_5371102.htm,2019年3月6日。
(15)何震:《交往行为视角下政治沟通日常化研究》,《国际新闻界》2016年第7期。
(16)汪波:《大数据、民意形态变迁与数字协商民主》,《浙江社会科学》2015年第11期。
(17)李黄村:《网络舆情服务前景几何》,《人民日报》2012年1月31日。
(18)唐涛:《基于大数据的网络舆情分析方法研究》,《现代情报》2014年第3期。
(19)刘峰等:《基于RSS的分布式新闻博客搜索引擎设计》,《现代图书情报术》2007年第1期。
(20)黄微等:《网络舆情信息语义识别关键技术分析》,《图书情报工作》2015年第21期。
(21)杨佳能等:《基于语义分析的中文微博情感分类方法》,《山东大学学报》(理学版)2014年第11期。
(22)[英]维克托·迈尔-舍恩伯格、[英]肯尼思·库克耶:《大数据时代》,盛杨燕等译,浙江人民出版社,2013年,第71页。
(23)陈楠等:《基于ELK的用户访问行为分析技术》,《气象科技进展》2018年第1期。
(24)陆和建、李祝启:《基于网络舆情日志挖掘的政府公众信息行为研究》,《图书情报知识》2014年第5期。
(25)邵培仁、王昀:《触碰隐匿之声:舆情认知、大数据治理及经验反思》,《编辑之友》2016年第12期。
责任编辑:沐 紫
Research on the Expression Path and Collection Mechanism of Internet Public Opinion
— Based on the Perspective of the Policy Agenda-setting
He Zhiwu Chen Cheng
Abstract:It has become a social consensus that online public opinion influences policy agenda and content. However, how to collect online public opinion and make public policy fully reflect the widest public opinion is an urgent issuse to be studied. The expression of online public opinion has the dual characteristics of agglomeration and dispersion: in the policy agenda mode proposed by the government, the expression of online public opinion shows a trend of directional agglomeration and focuses on a specific network platform within a short time. In the policy agenda mode proposed by the public, the expression of online public opinion shows the characteristics of dispersion and fragmentation, with no fixed platform and time point. For one aspect, the government can take the initiative to set up a online platform to attract netizens to give centralized feedback through institutional channels, so as to collect online public opinions conveniently, quickly and pertinently. For the other aspect, with the help of big data technology, a wide range of search can be carried out on the whole network, which can show the whole image of public opinion on the basis of the whole sample data.
Key words:policy agenda; expression of online public opinion; collection of online public opinion