基于模糊综合评价法的食品安全网络舆情预警研究
2018-06-22杜明英杨珊珊高向辉吴倩
杜明英 杨珊珊 高向辉 吴倩
内容摘要:根据食品安全网络舆情的影响因素,本文从舆情关注度、舆情活跃度、舆情受众、舆情传播4个角度构建食品安全网络预警指标体系,利用八爪鱼采集软件从百度和新浪微博抓取舆情指标数据。基于熵值法和层次分析法(AHP)构建模糊综合评价模型,并且以“福喜过期肉事件”为例进行实证分析,确定了该事件各阶段的舆情预警等级。实例表明该模型合理有效,具有可操作性,为政府部门食品安全网络舆情的预警研究提供了理论基础。
关键词:食品安全 网络舆情 模糊综合评价 熵值法 层次分析法
引言及文献综述
随着互联网的普及,中国网民人数不断上升,网络信息时代己经到来,互联网凭借其自身的开放性、即时性与交互性等特征已成为公众获取、发布和分享信息的重要平台。近年来我国食品安全事件频发,食品质量安全问题已引起越来越多的社会关注,食品质量安全网络舆情成为公众追捧热议、政府高度关注的焦点,相关政府部门将加强食品网络舆情预警和信息发布工作放在了较为突出的位置。
国内学者从食品安全网络舆情预警的指标和方法方面进行研究。林文声(2016)等通过问卷调查和客观指标统计相结合的方式,构建了4个一级指标、9个二级指标和22个三级指标的食品安全事件网络舆情热度评价指标体系。冯姝慧(2015)从舆情来源指标、传播扩散指标、公众关注指标、发展倾向指标4个维度构建食品安全网络舆情的监测与预警体系。王铁套(2012)利用模糊综合评价法的威胁估计样本训练方法,设计了一种基于BP神经网络的网络舆情威胁估计模型,为食品安全网络舆情预警方法研究提供了参考依据。陈恺(2015)提出了基于改进关联规则-改进熵权AHP-BP神经网络的预警分析研究方法。
国外从预警模型等方面对食品安全网络舆情进行相关研究。Geng(2017)利用层次分析法的极限学习机(AHP-ELM)预警建模来处理食品安全中复杂的食品检验数据方面的问题。Wang(2017)提出的一种改进的基于模糊分类和神经网络的食品安全预警系统,采用挖掘技术和互联网技术及时监控整个供应链的所有检测数据并自动预警。国外政府也相当重视食品安全问题,欧洲食品安全局(EFSA)(2014)发布了食品安全交流战略,确定了风险交流的工具、渠道以及评估方法。
国内研究主要集中在网络舆情预警方法的研究,部分文献对食品安全预警进行了实证研究,国外主要从食品检验、食品安全、网络安全等其他方面建立舆情预警模型,从而应用于食品安全网络舆情预警。综合国内外研究,对食品安全网络舆情指标设计、评价及预警直接研究较少,本文运用模糊模型对食品安全网络舆情指标评价及预警进行理论与实证研究。
食品安全网络舆情预警指标体系构建
(一)指标体系构建
建立舆情预警指标体系,需要遵循可行性、准确性、整体性、定性和定量并行的原则,并分析影响食品安全网络的因素。因此,本文依据以上设计指标原则和食品安全舆情的特点,构建4个一级指标和15个二级指标的食品安全网络舆情预警体系,如图1所示。
本文从舆情关注度、舆情活跃度、舆情受众、舆情传播等角度建立食品安全网络舆情预警指标体系:
舆情关注度包括新闻媒体来源数和新闻搜索量。新闻搜索量是指各新闻媒体在相应时间段内发布相关食品舆情的新闻数量;新闻媒体来源数是指对百度新闻标题搜索结果进行分词,与权威(食品)新闻网站进行匹配,计算此舆情事件出现在这些网站的次数。
舆情活跃度包括原创微博发布、评论、点赞条数和微博转发数,是指相应时间段内在微博上发布、转发、评论、点赞的相关食品舆情的微博數量。通过新浪微博搜索食品舆情事件关键词,利用高级搜索工具,自定义搜索时间段,抓取所需要的微博内容。
舆情受众包括参与频度、受众倾向和受众影响力。参与频度是指网民参与讨论某一食品舆情事件的程度,发布、转发、评论、点赞此舆情的总次数;受众倾向是指网民对某一食品舆情事件的正面、中性、负面的情感倾向程度;受众影响力是指网民对食品舆情事件发布的信息所引发的共鸣程度。
舆情传播包括舆情演化程度、新闻搜索量变化率、微博数量变化率和解析度。舆情演化程度是指此食品舆情事件可能引发相关食品相关问题被讨论的新闻数;微博(新闻)数量变化率是指发布、转发、评论的微博(新闻)舆情在两个连续统计时间段内舆情差值之比。解析度是指网民对食品质量安全舆情事件呈现出来的信息的思考情况,反映网民对微博参与的意愿程度,是微博总点击量与微博评论数的比值。
(二)数据获取
食品安全事件每年都有发生,2014年发生的“福喜过期肉事件”涉及面较广、影响较恶劣,成为食品质量安全热点事件之一,因此本文以“福喜过期肉事件”为例进行数据处理与模型分析。2014年7月20日,据东方卫视晚间新闻报道,曝光了麦当劳、肯德基等洋快餐供应商上海福喜食品公司使用过期劣质肉而被调查,福喜将加工的过期肉制品销售给肯德基、麦当劳等大部分快餐店,同时也引发了人们对“过期肉”、“劣质肉”等一系列食品问题的讨论。
根据建立的食品安全网络舆情指标体系,利用八爪鱼采集软件(http://www.bazhuayu.com/)从百度和新浪微博抓取了“福喜过期肉事件”的舆情数据。由于食品安全网络舆情事件有其特定的生命周期,网络舆情事件也有其时间点,首先依据“生命周期理论”确定网络舆情的发生周期,结合食品安全网络舆情的发展特点确定了抓取数据的整体时间段为1个月,以2天为一个小节点来抓取,每个事件包含15个采集时间节点;其次根据“蝴蝶效应”理论分别确定了这10个事件的演化词,抓取演化词的数据得到演化程度的舆情数据;最后食品安全网络舆情指标数据均可通过直接抓取和进行处理得到,得到“福喜过期肉事件”的舆情指标数据,如表1所示。
食品安全网络舆情预警模型构建
本文所建立的是模糊综合评价模型,即在模糊数学理论的基础上,对多个因素进行定量化综合评价,需要对多个因素计算其隶属于被评估事物等级的情况,从而对多个因素对被评价事物隶属等级状况进行综合评价。
(一)确定指标集
根据影响食品质量安全网络舆情发展的因素构建指标集,指标集也就是因素集。设U={u1,u2,…,um}为所有评价因素组成的指标集合,其中m代表评判指标个数。本文需要对舆情事件各阶段舆情等级进行评定而不是对舆情事件整体评价,主要使用二级指标进行评价,因此m=15。
(二)确定评语集
评语集是评判者对评判对象可能做出各种总的评判结果所组成的集合,设V={v1,v2,…,vn}为所有评语组成的集合,其中n表示可能的评判结果个数。根据《国家突发公共事件总体应急预案》将预警级别划分为四级(Ⅰ、Ⅱ、Ⅲ、Ⅳ),预警状态分别为特别严重、严重、较重、一般,n=4,定义为V={v1,v2,v3,v4},即V={特别严重,严重,较重,一般}。采用等级评分制,以对应的预警评价分值区间对应于各等级,根据相关资料查阅和相关专家咨询建议,评分区间为[0,100],如表2所示。
(三)建立权重集
在食品安全网络舆情预警的研究中,各指标重要程度不一样,需要对各评价指标赋予一定权重,为了更合理准确得出评价结果,本文采用主观赋权法和客观赋权法的混合赋权法进行赋权,而主观赋权法采用AHP法(层次分析法)进行指标赋权,客观赋权法采用熵值法进行赋权。
利用熵值法确立权重。熵值法的基本思路是根据指标变异性的大小来确定客观权重,是一种客观赋权法。熵值法赋权步骤如下:
数据归一化。将各个指标数据进行归一化处理。假定给了k个指标X1,X2,…,Xk,其中Xi={x1,x2,…,xn},k为指标个数,假设各指标数据标准化后的值为Y1,Y2,…,Yk,那么。
计算各指标的信息熵。根据信息熵的定义,得出信息熵的公式为,其中。
计算信息熵冗余度。冗余度的公式为dj=1-ej。
计算各指标权重。将dj归一化处理,指标权重为,最后权重向量为Wa=(w1,w2,…,wk)。
根据以上步骤得到二级指标A1-D15的权重:Wa=(0.0251、0.0444、0.0605、0.1235、0.0838、0.0647、0.2614、0.0238、0.0245、0.0404、0.0381、0.0384、0.0747、0.0570、0.0397)
利用层次分析法(AHP)赋权。对于指标集中赋权时可以利用层次分析法的1-9标度法,在两两元素进行判断的基础上写出判断矩阵,然后通过计算判断矩阵的最大特征根及其对应的特征向量,计算表示指标相对重要性的权值。
建立递阶層次结构模型。层次结构模型是类似于决策目标体系的结构,对于简单的问题一般可以分为三层结构,第一层为目标层(T),第二层为准则层(G),第三层为方案层(P),本文构建的层次结构模型如图2所示。
建立两两比较的判断矩阵。为了便于将比较判断定量化,层次分析法采用1-9比率标度方法,如表3所示,对不同情况的评比给出数量标度进行两两比较,得到判断矩阵(T-G,G-P),判断矩阵表示针对上一层次某元素,本层次与它有关元素之间相对重要性的比较。
为了比较食品安全网络舆情各指标之间的重要程度,设计问卷邀请研究食品安全网络舆情方面的专家进行打分,指标体系共设计了两层指标,各专家根据经验对每一层次指标相对它所属上一级指标的重要程度进行两两比较,然后结合1-9标度的分级比例参考表由低到高进行打分。本次调查共向10位专家发放问卷,回收有效问卷9份,在合理的问卷调查范围内,首先计算各个专家的判断矩阵,分别得到其权重,然后对所有专家对应的各个判断矩阵权重进行几何或算术平均,得到一套多个判断矩阵的权重,最后进行组合权重计算。
计算各矩阵的最大特征值λmax及其对应的特征向量。根据建立的判断矩阵A,使用求和法得到特征向量wT,wA,wB,wC,wD和最大特征值,其中n为判断矩阵阶数。
矩阵的一致性检验。层次分析法保持判断思维的一致性是非常重要的,引入判断矩阵一致性指标CI(Consistency Index)和随机一致性检验CR(Consistency Ratio)。对于多阶判断矩阵,则引入平均随机一致性指标RI(Random Index),随机一致性CR=CI/RI,RI值如表4所示。
当阶数n≤3时,判断矩阵永远具有完全一致性。当阶数n>3,CR<0.10时,便认为判断矩阵具有可以接受的一致性;当CR≥0.10时,就需要调整和修正判断矩阵,使其满足CR<0.10,从而具有满意的一致性。
组合权重计算。经过计算得到准则层权重向量为wT=(0.1871、0.2418、0.2182、0.3529),方案层初始权重向量分别为wA=(0.7351、0.2649),wB=(0.2173、0.2536、0.3790、0.1501),wC=(0.3842、0.2534、0.3624),wD=(0.1009、0.1193、0.1758、0.1748、0.2170、0.2121),基于此,得到方案层A1-D15各评价指标的组合权重计算结果Wb=(w1,w2,…,wk),如表5所示。
混合赋权法。混合赋权法的计算公式为W=σWa*?Wb,其中Wa为客观权重向量,Wb为主观权重向量,0 (四)计算隶属度并构造评价矩阵 计算隶属度。根据已获得的食品安全舆情指标数据并利用隶属函数计算各指标舆情隶属度。通过分析指标数据,比较各隶属度函数分布规律,发现各指标的隶属函数的大致曲线与半梯形偏大型分布相似,所以采用半梯形偏大型分布作为各指标的隶属函数。各指标的隶属函数为: